🎈🎈大概要求:
1、数据库,是给定的原始数据集合;
2、挖掘数据库“关系详情”中的“夫妻/配偶、兄弟姐妹、父子、父女、母子、母女”具体信息;
3、挖掘后的信息整理成【示例】中的格式;
注意:
1)一个证券代码对应多个年份;
2)该证券代码下的公司存在某种类型的关系标记为1,不存在对应关系标记为0。
3)按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现-自由选择方式】。
👓👓数据:
我看了一下大概十几万条!😫😫😫
原本想简单用Python跑了一下,看看效果,但是几分钟也没出结果就放弃了!(原因自己技术不到家)
于是就用Excel表做数据挖掘。
🎡🎡方法:
🥇第一步:提取年份。
新建一个年份列,点击年份下的空格,输入函数
=YEAR(B2)
提取统计截止日期中的年份
下面的十字快速双击就行了,年份这一列就完成了!
🥈第二步,判断持股人之间的关系
在关系列下的空格中输入函数
=IF(OR(ISNUMBER(FIND({"哥","弟","兄","姐","妹"},J2))),1,0)
判断关系详情中是否包含哥或第或姐或妹等字符,如果包含就为1,不包含就为0
其他的类似分别输入对应的函数
=IF(OR(ISNUMBER(FIND({"夫妻","丈夫","妻子"},J2))),1,0)
夫妻
=IF(AND(ISNUMBER(FIND({"父","子"},J2))),1,0)
父子
=IF(AND(ISNUMBER(FIND({"父","女"},J2))),1,0)
父女
=IF(AND(ISNUMBER(FIND({"母","子"},J2))),1,0)
母子
=IF(AND(ISNUMBER(FIND({"母","女"},J2))),1,0)
母女
因为数据量大,没有一一看,可能有些类似谁是谁的长子,谁是谁的女婿等未提取出
这样持股人之间的关系就提取出来了。
🥉第三步,制作统计表
同样我们也用函数!
按照年份统计每一年持股人不同的关系的总数
在每一列关系下的第一个空,分别输入以下函数
=SUMIF(C2:C199673,T2,L2:L199673)
=SUMIF(C2:C199673,T2,K2:K199673)
=SUMIF(C2:C199673,T2,M2:M199673)
=SUMIF(C2:C199673,T2,N2:N199673)
=SUMIF(C2:C199673,T2,O2:O199673)
=SUMIF(C2:C199673,T2,P2:P199673)
函数功能,判断年份列中的年份是否等于对应的年份,如果等于就将对应行中的关系相加求和
🏆🏆🏆结果:
🏅第四步,制作图表
原本到这里就完成,不过觉得如果做成动态的会更加有趣!
但是用代码敲的话,有些麻烦,并需要一些编程基础。
🎯🎯推荐一个在线制作动图网站
Flourish
无需编程基础就可以做出漂亮的动态图表🎉🎉🎉
🚩🚩首先准备一个Excel表,输入统计表
🗺🗺进入网站
股权关系动态图表
上传数据即可!
也可以根据自己的喜好调整颜色,大小等🎆🎆
是不是很方便,我朋友觉得很酷!很满意!
并且可以发布!可以让别人下载和访问!
总结:
虽然没有用Python做出来,不过也掌握了Excel的方法!💯💯💯💯