中华视窗是诚信为本,市场在变,我们的诚信永远不变...
分析报告撰写步骤一般是提出问题——分析问题——解决问题。同样的数据分析的步骤也是:提出问题——理解数据——数据清洗——分析数据——构建模型——呈现可视化结果。
本次学习想要看看A股上市公司有哪些特点?
纵向时间轴数量增长趋势?
横向各省市分布情况?哪些行业上市公司多?哪些行业市值比较高?
(1)从同花顺网站获取A股上市公司全部数据,理解所下载的数据:上市公司唯一标股票代码(3557个数据),保留总市值、省份,上市日期,同花顺所属行业几个指标作为分析范围。
(2)数据清洗:一共3557个A股数据,其中4个ST的上市公司没有市值进行删除,无重复数据。
(3)数据抽取:
a.同花顺给的行业为三级详细行业数据,使用LEFT和FIND函数抽取一级行业作为行业标签:此处注意FIND函数要区分大小写!
备注:由于数据格式较为统一,也可以进行分裂保留第一列数据作为一级行业标签。
b.时间格式做统一修改。上市日期先通过分裂和更改单元格式变为统一日期格式。
(4)使用数据透视和描述统计构建简单的分析模型:
1.对市值进行描述统计分析:A股上市公司之间市值差异较大,平均市值141亿元,但是中位数则为42亿元。主板上市的股票占A股的一半江山,主板平均市值为202亿元,中小板平均市值81亿元,创业板为57亿元。
2.上市公司增长趋势:
在数据透视表中,对时间进行分组,以年为单位,我们发现2010年开始迎来上市的爆发期,除了2013年IPO暂停外,2010--2017年,每年A股上市公司总数都在百家以上。2017年达到最高峰为438个上市。
3.上市公司地域行业分布:
从1990年至2018年11月7日,广东、浙江、江苏拥有的A股上市公司数量大于传统上的一线城市北京和上海。我的老家河南省位于10名处于中不溜程度。
行业分布:
根据数据透视,我们发现机械设备行业上市公司最多,其次是信息服务和化工。在市值方面化工、餐饮旅游行业市值表现较好。
作为河南人,还想看看本地和A股上市公司最多的广东省的差异,所以就又透视了一下:
对比明显可以看出行业差别:广东排在前三位的是电子、机械、信息行业
河南排在前三位的是:机械设备、化工、有色金属。我们不能武断的说化工和有色金属行业不好,但是广东的电子信息产业绝对是一个发展方向。所以我们和一线的差距还是需要继续努力啊!突然明白为啥郑大的化学专业是双一流了,嘿嘿。
最后忽然发现还有一个函数没有用,因为日常工作中要分析建筑行业的上市情况,这里就选取建筑装饰行业A股进行简单市值分析,: