分析百万条推特 看看究竟谁关心比特币

本文涉及的产品
文本翻译,文本翻译 100万字符
图片翻译,图片翻译 100张
语种识别,语种识别 100万字符
简介:

综述:为了了解比特币这一全球现象,我分析了二月份共计约130万条关于比特币的推特。以下是关于推文发布者、发布地和具体信息的分析。

最近我分析了今年二月份的共计约130万条关于比特币或其创始人Satoshi Nakamoto的推文。我希望从这些信息中了解那些真正对比特币感兴趣的人(至少他们的兴趣足以推动他们发这推特),并了解推特上的活动是如何追踪大事件的。

以下是我得到的信息。点击图片阅读更详细的信息。

(免责声明:我既不是统计学家,也不是程序员,因此我使用的是比较简单的统计工具,并和其它领域的公司合作。Gnip——现在是Twitter的一部分——提供了这些数据。我借助Chartio提供的的基于云计算的分析服务进行大部分的定量分析和部分的可视化。我通过Google Fusion Tables实现Marc Andreessen图,通过Tableau进行新闻内容的分析,通过Alchemy API分析Mt.Gox的微博人气。

是谁在推特上谈论比特币

共计333,144个推特账户发布过有关比特币的推文。但各账户发布的推文数量大不相同。有些账户明显是垃圾邮箱账户或其它类型的机器人账户——数千个账户仅仅发布过一条推文或者干脆没有发布过推文——其余的持续的关注着比特率和比特币的新消息。下图是2月份最活跃的十个账户。

下图是被@次数最多的十个用户。毫无意外的比特币的新闻专家Coindesk占据了榜首。实际上大部分数字还要更高(有些甚至会高出许多),因为推文经常会引用多个推特账户,但是因为数据格式的原因,我们很难计算那些推文。

有些账户只是“昙花一现”,某条推文突然被大量转发,如脱口秀主持人Conan O’Brien的这条推文。

和一位名叫Bacon Bangkok.的用户的这条推文。

加V用户中,Marc Andreessen最活跃,并备受关注

我认为也有必要分析加V用户的情况来了解都有哪些知名人士在推特上探讨比特币。下图是2月最活跃的加V用户,风险投资家Marc Andreessen(@pmarca)位居榜首。

Andreessen也被提到了很多次,这也在意料之中——他被提到了3600多次(包括被其它用户提到)——考虑到他只发布了145条推特,这个数字很庞大。我们通过一个交互式表格(点击这里)展示他创建的庞大的网络。小黄点代表提及Andreessen和其他人的推文,蓝色点代表发表推文的推特账户。Andreessen是一个大黄点,他连接了提到他的人和他提到的人。

你可以发现,Andreessen直接回复或直接推的网络用户数目很小。

比特币(可能)在哪里流行

下图统计了发布推文数目最多的时区,考虑到垃圾账户的存在和一些账户没有明确的时区或者时区错误,这是一个大概的结果。此外,这个统计是针对单条推文的,不是面向不同时区中的不同推特账户的。例如,ALLThingsBTC账户所发布的15,000条推文中的20%是来自伦敦时区的。

如果通过用户定义的地点来分析,问题会大不相同。例如,你会发现有成千上万种说法来指代纽约,而且Cryptogeeks代表#Bitcoin #Litecoin #Altcoins。

如果你想看这些数据的视觉效果图,下图是使用Google Fusion Tables对小样本用户位置映射得到的效果图。这并不完全精确——Fusion Tables视图将每个事物定位,即使有些没有真正的位置——但它大致描述了全球比特币的现状。

Mt.Gox垮台

上述的图表描述都是谁在发布推文,但为了完整的分析二月比特币的形式,我们还需要分析比特币交易服务Mt.Gox的消亡。

Mt.Gox的垂死挣扎见下图时间轴。2月7日是一个大跌,当天Mt.Gox官方宣布暂停比特币的取款。2月10日,Mt.Gox延长了对取款的禁令,比特币价格大跌。2月24日晚,Mt.Gox已经‘丢失’了750,00比特币,市值3.75亿美元,隔日早晨,推文数目猛增。2月28号,Mt.Gox申请破产保护。

下图以小时为单位进行分析。注意从2月8日开始,垃圾账户数飙增。

Mt.Gox于2月6号深夜发布了通告后,当媒体开始讨论Mt.Gox的垮台时,推特上关于提款问题的抱怨、宣称Mt.Gox即将灭亡的言论也越来越多。2月5日Mt.Gox上比特币大约贬值100美元的也是原因之一。

2月4日,瑞典海盗党创始人Rick Falkvinge宣称,Mt.Vox已经积累了高达3千8百万的未提款(即,比特币离开用户账户但并未支付给用户)。

总之,关于Mt.Gox的言论紧随最新消息。在下图表中,蓝线代表态度消极的推文,黄线代表态度积极的推文,紫线代表当天所有关于比特币的推文。2月25日,提及Mt.Gox的消极推文数量占据了所有关于比特币推文数量的四分之一。

将记者算进来

当记者了解一个故事后,他们的文章往往传播广泛。2月,共计247,000个不同的连接被分享,共被分享102万次。我分析了被分享次数最多的前10,705条连接,这些链接最少被分享了12次。其中,1328(不足总链接数目的1%)——程度上、形式上——来自25个技术和通用新闻网站。他们被分享了121.931次,占据了2月份分析活动总次数的12%。

(关于链接的一点说明:考虑到RSS、Google或其它社交媒体在分享链接时会修改链接,我们很难获得针对每个链接的确切数字。通过Excel我将单元格们缩短为100个特征,这是一种对付有多个链接单元格的好办法。)

长话短说:评估出版物的普及度时,使用总分享量比使用单一链接得到的结果更精准。对前44,810个链接使用这种分析方式,我们将得到针对每个出版物的多个链接,最低限度的更高分享数。

现在来看看当我们加入Coindesk,这个关注货币流通的新闻站点时,我们将得到什么。点击这里查看这个图表的交互式版本。

同样,新闻站点与垃圾信息、比特币钱包链接、交易所、监视器或其它非新闻站点并不匹配。分享次数最多的前15个链接正是如此的站点,共计76,534次分享。你可以点击这里查看。这篇来自Wired的文章(这个版本似乎取代了早期的版本)是分享次数最多的链接,被分享了1404次。

原文发布时间为:2014年04月30日
本文作者:Derrick Harris
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
目录
相关文章
|
机器学习/深度学习 人工智能 安全
平均每天有一个隐私计算专利在提交,他们是怎么做到的?
平均每天有一个隐私计算专利在提交,他们是怎么做到的?
198 0
|
机器学习/深度学习 数据采集 存储
2022!影响百万用户金融信用评分,Equifax被告上法庭,罪魁祸首——『数据漂移』!⛵
数据随着时间变化,会导致已有模型的准确度大打折扣,这就是数据漂移问题。本文讲解数据漂移问题的诸多实际案例、检测方法、基于evidently库的代码实现。
654 2
2022!影响百万用户金融信用评分,Equifax被告上法庭,罪魁祸首——『数据漂移』!⛵
|
安全 前端开发 网络安全
《人民的名义》告诉我们:媒体安全不能少
在自传播时代中,不管是官方媒体、直播平台还是自媒体,都能以超高速的方式传播社会事件和政治热点,引导舆论,并让能解决问题的人迅速听到风吹草动。
8100 0
|
区块链
区块链每日一问 | 数字货币的场内交易和场外交易各指什么?各有哪些特点?
数字货币的场内交易和场外交易各指什么?各有哪些特点?
1171 0
|
区块链
【观点】比特币并非完全去中心化,连总量都可以改
关于区块链去中心化的说法,都是两个核心逻辑的延伸、假设甚至误解。
1359 0
下一篇
无影云桌面