2021年“泰迪杯”数据分析技能赛A题

2021年“泰迪杯”数据分析技能赛A题

通讯产品销售和盈利能力分析

摘要

进入本世纪以来,我国通讯产品得到了飞速发展,其技术先进,价格便宜,深受世界各国和地区尤其是非洲国家的欢迎。某通讯公司在非洲的多个国家深耕多年,产品与服务遍布整个非洲大陆。为了更好地了解公司的销售情况,采用产品的销售额和利润数据,对其盈利能力进行分析和预测,给决策人员提供分析报告,以便为非洲各国提供更好的产品销售策略和服务。

针对任务一,数据分析与预测:

根据附件“非洲通讯产品销售数据”中的数据,分别实现以下任务:

任务 1.1 统计各个年度/季度中,地区、国家、服务分类的销售额和利润数据,并计算各国、各服务分类销售额和利润的同比增长率。

任务 1.2 统计各地区、国家有关服务分类销售额和利润数据。

任务 1.3 统计各个销售经理的成交合同数和成交率。

任务 1.4 分别预测各个地区、国家、服务分类 2021 年第一季度销售额和利润。

针对任务二,可视化展示和撰写分析报告:

对各地区、国家、服务分类的产品销售额和利润等数据,以及销售经理的业绩数据,进行同比、类比、相关性等分析或预测,发现趋势。根据分析和预测结果,设计一个数字大屏,根据目标,合理布局,展示能够代表产品销售情况和盈利能力的数据指标和可视化图表等。

在下面任务不同的维度分析中,必要时,可以设置选择框,使用联动的方式,根据选择框,查看和展示该选择框范围的数据和可视化图表。例如,设立国家选择框,选项包括“全部”和国家名称,可以查看全部或某个国家的指标数据和可视化图表。其他类推。

数字化大屏至少包括以下任务:

任务 2.1 绘制非洲各国产品的销售地图,并能够查看该国的销售额和利润。根据销售额的降序排列,绘制非洲各国产品销售额和利润数据的图表。

任务 2.2 根据地区、国家等维度,绘制各服务分类的销售额和利润的年增长率及各季度同比增长率的图表。

任务 2.3 根据地区、国家等维度,绘制 2021 年第一季度各服务分类的销售额和利润预测值的图表。

任务 2.4 绘制销售经理的销售合同数前 5 名排行榜。

任务 2.5 绘制销售额后 10 名的国家排行榜。

任务 2.6 分析数字大屏的指标数据和图表,撰写公司产品的销售情况和盈利能力的分析报告。

Abstrack

Since the beginning of this century, China’s communications products have been rapid development, its advanced technology, cheap, by the world and regions, especially African countries welcome. A communications company has been working in several countries in Africa for many years, with products and services throughout the continent. In order to better understand the company’s sales, product sales and profit data are used to analyze and forecast its profitability and to provide decision makers with analytical reports in order to provide better product sales strategies and services to African countries.

For Task One, Data Analysis and Forecasting:

Based on the data in annex “African Communications Product Sales Data”, the following tasks are implemented separately:

Task 1.1 Calculate sales and profit data for regions, countries, and service classifications for each year/quarter, and calculate year-over-year growth rates for sales and profits for each country and service category.

Task 1.2 Statistics of sales and profit data for the relevant service classifications for regions and countries.

Task 1.3 Counts the number of contracts and turnover rates for each sales manager.

Task 1.4 forecasts sales and profit for the first quarter of 2021 for each region, country, and service classification, respectively.

For Task 2,visualize presentations and write analysis reports :

Analyze or forecast year-on-year, analogy, correlation, etc. on data such as product sales and profits by region, country, service classification, and sales manager’s performance data to identify trends. Based on analysis and forecasts, design a large digital screen that displays data metrics and visualizations that represent product sales and profitability, based on goals, rational layouts, and more.

In the different dimension analyses of the following tasks, you can set up a selection box, use linkage, view and present the data and visualization charts for that selection box range, depending on the selection box. For example, set up a country selection box with options including All and country names to view metrics data and visual charts for all or one country. Other analogies.

The digital large screen includes at least the following tasks:

Task 2.1 Map the sales of products in African countries and be able to view sales and profits in that country. Chart product sales and profit data for African countries in descending order of sales.

Task 2.2 Chart the annual growth rate of sales and profits for each service classification and the year-on-year growth rate for each quarter based on regional, country, and other dimensions.

Task 2.3 Chart sales and profit forecasts for each service category for the first quarter of 2021 based on region, country, and other dimensions.

Task 2.4 Draws the top 5 rankings of sales contracts for sales managers.

Task 2.5 Draws a list of the top 10 countries in sales.

Task 2.6 Analyze metrics data and charts on large digital screens and write analysis reports on sales and profitability of the company’s products.

目录

摘要

1、问题分析

2、任务一

2.1数据处理

2.1.1缺失值处理

2.2统计数据、计算同比增长率

2.2.1统计年度数据

2.2.2统计季度数据

2.2.3销售额同比增长率、利润同比增长率

2.3统计数据

2.3.1销售额

2.4成交合同分析

2.4.1成交合同数和成交率

2.5预测分析

2.5.1销售额预测

2.5.2利润预测

3、任务二

3.1销售分析

3.1.1产品销售地图

3.2.3季度同比增长率

3.3预测分析

3.3.1销售额预测值

3.3.2利润预测值

3.4销售合同Top5

3.4.1销售合同数排行

3.5销售额Last10

3.5.1销售额后10国家排行

3.6分析报告

3.6.1数字大屏指标

4、 参考文献

*1、问题分析*

1.统计产品在当地的销售数据,预测未来的销售情况。

2.设计可视化数字大屏,展示产品的销售情况,分析产品的盈利能力。

*2、任务一*

*2.1数据处理*

2.1.1缺失值处理

根据图1可知,经过对所给数据集的查看和分析发现该数据集中无缺失值且没有重复值。第一个表中共1056行10列,经过查看其中一些利润值,只有$无数值,但数量很少故不做处理。

图1 缺失值处理

*2.2统计数据、计算同比增长率*

2.2.1统计年度数据

统计的各个年度,地区、国家、服务分类的销售额和利润数据如下所示,首先使用pandas下的to_datetime函数更改日期格式,再分别使用dt.year、dt.month、dt.quarter将其分别转化为年、月、季度三列,便于后续进行时间维度的分析,结果如图2所示。

图2 时间维度转换

使用pivot_table函数创建国家年度销售额和利润透视表,如图3所示。

图3 年度国家销售额和利润透视表

同理分别制作出地区和服务分类的年度销售额和利润的透视表,如图4图5所示


图4 地区透视
图5 服务分类透视

2.2.2统计季度数据

统计的各个季度,地区、国家、服务分类的销售额和利润数据如下图所示

图6 国家季度销售额和利润


图7 地区季度销售额和利润

图8 服务分类季度销售额和利润

2.2.3销售额同比增长率、利润同比增长率

图9 增长率图

*2.3统计数据*

2.3.1销售额

统计各地区利润和销售额数值,使用groupby函数进行分组,并使用sum函数求其总和,如图10所示。

图10 地区利润和销售额

统计各国家利润和销售额数值 ,如图11所示 。

图11 各国家销售额和利润

统计各服务分类利润和销售额数值,如图12所示。

图12 各服务分类利润和销售额

*2.4成交合同分析*

2.4.1成交合同数和成交率

统计各个销售地成交合同数和成交率,通过groupby函数进行分组将销售经理和销售合同及成交率分为一组,并使用sum函数将各经理的销售数据汇总, 并通过图13展示。

图13 销售经理的销售数据

通过对上图的分析可得:Audrey Baker的销售合同数最多,Micheal Smith的销售合同数最少;Marianne James的成交率最高,Micheal Smith的成交率最低。

*2.5预测分析*

2.5.1销售额预测

Prophet是一种基于加性模型(additive model)预测时间序列数据的方法,其中非线性趋势与年、周、日的季节性变化以及假日效应相吻合。它适合具有强烈季节性影响和多个季节历史数据的时间序列。Prophet对于丢失数据和趋势变化具有较强的鲁棒性,并且通常能够很好地处理异常值。它的优点有:

准确快速。Prophet在Facebook的许多应用程序中用于生成可靠的计划和目标设定预测。在大多数情况下,它的性能要优于其他方法。

全自动。无需人工干预即可获得有关杂乱数据的合理预测。Prophet对异常值,丢失的数据以及时间序列中的急剧变化具有鲁棒性。

可调整。Prophet为用户提供了许多调整和调整预测的可能性。可以使用一些参数来添加自己研究领域的相关知识,从而改善预测效果。

图14 销售额预测图

2.5.2利润预测

图15 利润预测图

3、任务二

*3.**1**销售分析*

3.1.1产品销售地图

根据销售热力地图可以知道,南非、尼日利亚、刚果、苏丹等国家的销售额较高,居民对通讯产品的需求量较大,发展前景好;相较而言,西北地区的销量较低,通讯产品没有普遍化,虽利润可观,但是市场还有很大的拓展空间。

图16 销售地图

3.1.2产品销售额\利润图表

通过利润和销售额的相互关联,两者没有较为明显的线性关系,相较高销售高利润的国家,低利润国家的销售经理应调整销售策略,降低成本,提高利润。

图17 销售额、利润数据图

3.2增长率分析

3.2.1销售额年增长率

从图中的增长率可以看出,服务类别中的Commercial类在非洲中部地区18到19年增长最快,但是19年到20年持续下跌;南部地区销售额呈缓慢增长状态;东部地区销售额呈下跌状态,西部地区在17年到19年增长率呈先涨后跌状态。

Public类,西部地区和南部地区增长率起伏较大,销售市场不稳定;其他地区虽有浮动,但整体较为稳定。

Residential类,北部和南部地区19年到20年增长率呈下跌趋势,市场需求减小;其他地区18年到20年呈先跌后涨趋势,到20年市场需求增大。

图18 销售额年增长率

3.2.2利润年增长率

根据利润增长率图表可以看出,Commercial类的利润增长率在中部、北部、西部地区波动较大。Public类在东部地区利润增长率呈上涨趋势,其余地区均有波动,其中西部和中部波动较大。Residential类在18年增长率均为正值,19年到20年呈下跌趋势,且南部地区下跌较大。

图19 利润年增长率

3.2.3季度同比增长率

从季度销售额同比增长率可以看出,第一、四季度的public类从18年到20年呈先跌后涨再趋于稳定状态,第二、三季度虽有涨幅,但整体较为平缓。

从季度利润同比增长率可以看出,第一、四季度的Commerical类在18年呈上涨趋势,但在2020年第四季度利润同比增长率大幅下跌,第二季度的Residential类在18年上涨明显,但在19年到20年呈缓慢下跌状态。

图20 季度销售额同比增长率

图21 季度利润同比增长率

*3.3预测分析*

3.3.1销售额预测值

通过对销售额的预测进行分析,每个地区的销售额都较为稳定,其中西部地区和东部地区销售额依旧领先。

图22 销售额预测值图

3.3.2利润预测值

根据利润预测可以看出,在2021年,Commercial类在西部地区利润大概率呈现负值,Residential类在南部地区利润也可能为负;其余地区均有利润。

图23 利润预测值图

*3.4销售合同Top5*

3.4.1销售合同数排行

销售合同数排在前五的销售经理,说明这五个经理对合作项目更认真负责,当然也不能排除地域、政策等其他因素的影响。

图24 销售合同Top5图

*3.5销售额Last10*

3.5.1销售额后10国家排行

销售额低可能因为人们生活水平不高,购买力较低,可以适当销售中低端产品。

图25 销售额后10的国家排行

*3.6分析报告*

3.6.1数字大屏指标

通过对下图数字可视化大屏可得:南非的销售额最大,市场前景极好;其他大部分地区销售额较低,建议降低成本引进产品,使产品普遍化,扩大市场,激发市场需求。西北地区部分国家销售额低但盈利能力强,建议投入资金扩大市场。利润低或为负的,应减少产品投入。从预测数据可以看出东部、西部、中部地区的消费能力依然很强所以应加大东部、西部、中部地区的产品输入,进一步占领市场。根据季度增长率图表可以知道第一、四季度的销量及利润相较第二、三季度更好,建议在第一、四季度多投入产品。

图26 数字仪表盘图

4、*参考文献*

[1]邢江宽,王海鸥,罗坤,等 . 预测生物质热解动力学参数的随机森林模型 [J]. 浙江大学学报(工学版),2019,53(3):605-612.

[2]郝海妍 , 潘萍 .Python 技术在数据分析中的应用 [J]. 电子技术与软件工程,2020(12):179-181.

[3]刘艳玲 , 姚建盛 .Python 在数据可视化中的应用 [J]. 福建电脑 ,2020, 36(3):68-70.

[4]吕云翔 , 李伊琳 , 王肇一 .Python 数据分析实战 [M]. 北京 : 清华大学出版社 ,2019.

[5]张艳分 , 卢小清 , 刘禹 , 刘臻 . 基于大数据平台的大学生校园行为探析 [J]. 中国教育信息化 ,2019(01):39-42+46.

[6]谢文广,刘 军,陈同喜,等. 铁路安全大数据分析平台研究 [J]. 铁路计算机应用,2020,29(9):21-25

[7]刘志军,张杰,许广义 .基于自适应快速决策树的不确定数据流概念漂移分类算法[J]. 控制与决策,2016,31(9):1609-1614.

[8]韩红桂 , 赵子凡 , 伍小龙 , 等 . 基于改进随机森林的城市污水处理过程运行数据清洗方法 [J]. 北京工业大学学报 ,2021,47(5):421-430.

20(12):179-181.

[3]刘艳玲 , 姚建盛 .Python 在数据可视化中的应用 [J]. 福建电脑 ,2020, 36(3):68-70.

[4]吕云翔 , 李伊琳 , 王肇一 .Python 数据分析实战 [M]. 北京 : 清华大学出版社 ,2019.

[5]张艳分 , 卢小清 , 刘禹 , 刘臻 . 基于大数据平台的大学生校园行为探析 [J]. 中国教育信息化 ,2019(01):39-42+46.

[6]谢文广,刘 军,陈同喜,等. 铁路安全大数据分析平台研究 [J]. 铁路计算机应用,2020,29(9):21-25

[7]刘志军,张杰,许广义 .基于自适应快速决策树的不确定数据流概念漂移分类算法[J]. 控制与决策,2016,31(9):1609-1614.

[8]韩红桂 , 赵子凡 , 伍小龙 , 等 . 基于改进随机森林的城市污水处理过程运行数据清洗方法 [J]. 北京工业大学学报 ,2021,47(5):421-430.

[9]段红秀,周灵 . 基于大数据应用背景的网络流量监控系统设计 [J]. 电脑知识与技术,2020,16(5):37-38.

物联沃分享整理
物联沃-IOTWORD物联网 » 2021年“泰迪杯”数据分析技能赛A题

发表评论