看婚前婚后,短信词频分析

简介:

你可曾为结婚纪念日送礼而一筹莫展?看看人家的创意!


Alice Zhao小姐是美国西北大学出身的数据科学家,她丈夫的职业虽然不明,但据她自豪地形容,至少也是一位nerd,因为当年他送给她的恋爱一周年礼物实在太棒了——一个包含这一年里他们所有短信内容的word文档,他称之为数据礼物。

于是,为了纪念他们恋爱六周年,Zhao小姐决定把新婚后这一年里的短信拿出来和2008年的进行数据对比,看看婚前婚后的短信有什么不同。


经过词频分析,最明显的就是Zhao先生无论婚前婚后都特别喜欢说“家”这个词,而Zhao小姐当初总是以Hey开场的习惯消失了,代之以越来越多的OK

她接着对比了短信中一些常用词的出现频率,这也反映了他们之间亲密程度的变化,比如对话从最初生疏的“Hey,过得怎么样?”到后来更随意的“OK,听起来不错。”


他们不再称呼对方的名字,也不再像以前一样经常说“爱”了(尤其是Zhao先生婚前婚后说love的频率变化……),不过Zhao小姐的解释是他们在一起之后不需要通过短信表达爱意了。

再来看具体的出现场合,Zhao小姐发现谈恋爱时love通常用来表达“I love you”,到了后来就变成“Hahaha, love it!”。


还有一些词的使用频率没有多大变化,但内容指代却不一样了,比如“晚餐”和“家”,以前问dinner是为了约出来吃饭,现在是直接问晚上吃啥,而home以前是各回各的家,现在是指他们共同的房子。

Zhao小姐对他们发短信的时间变化也很感兴趣。她发现刚开始约会时,他们会从下午三点一直聊到凌晨三点,但是自从订婚开始,他们半夜都选择了还是睡觉吧,而结婚以后发短信就只限于白天上班的时间了。


认为这也反映了情侣之间的普遍情况,因为刚开始时,双方大部分时间都不在一起,所以需要经常查岗看对方在干什么,跟谁在一起,尤其是晚上!


最后,Zhao小姐总结道,刚开始我们总是想方设法确保自己发的内容好玩有趣,随着关系的进展,短信内容变得越来越可预测,但这是因为不可预测的内容都当面说了。


以上就是Zhao小姐回馈给对方的新婚纪念礼物——2014年最新版的#thegiftofdata。


原文发布时间为:2014-10-25

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号



相关文章
|
算法 搜索推荐 计算机视觉
图片相似度计算及检索调研
图片相似度计算和相似图片搜索,是图片识别领域两个常见的应用场景。例如搜索相似商品,和相似的图片,在百度、淘宝中都有应用。在某些业务中,也存在对图片相似度的计算和判断。因此,在这里简单介绍一下相关算法。
783 0
|
8月前
|
机器学习/深度学习 数据采集 算法
基于贝叶斯算法的手机垃圾短信过滤
基于贝叶斯算法的手机垃圾短信过滤
|
5月前
|
数据采集 搜索推荐 算法
基于B站视频评论的文本分析,采用包括文本聚类分析、LDA主题分析、网络语义分析
本文通过Python爬虫技术采集B站视频评论数据,利用LDA主题分析、聚类分析和语义网络分析等方法,对评论进行深入的文本分析,挖掘用户评论的主题、情感倾向和语义结构,旨在为商业决策提供支持,优化内容创作和用户满意度。
613 2
基于B站视频评论的文本分析,采用包括文本聚类分析、LDA主题分析、网络语义分析
|
8月前
|
数据采集 XML 自然语言处理
R语言汽车口碑数据采集抓取、文本数据分词和词云可视化实现
R语言汽车口碑数据采集抓取、文本数据分词和词云可视化实现
|
8月前
|
机器学习/深度学习 数据可视化
【视频】N-Gram、逻辑回归反欺诈模型文本分析招聘网站欺诈可视化讲解|附数据代码2
【视频】N-Gram、逻辑回归反欺诈模型文本分析招聘网站欺诈可视化讲解|附数据代码
【视频】N-Gram、逻辑回归反欺诈模型文本分析招聘网站欺诈可视化讲解|附数据代码2
|
8月前
|
机器学习/深度学习 自然语言处理 数据可视化
【视频】N-Gram、逻辑回归反欺诈模型文本分析招聘网站欺诈可视化讲解|附数据代码1
【视频】N-Gram、逻辑回归反欺诈模型文本分析招聘网站欺诈可视化讲解|附数据代码
|
8月前
|
分布式计算 搜索推荐 MaxCompute
基于OpenSearch向量检索版的多主体识别最佳实践
本文将介绍如何通过OpenSearch向量检索版,在图像搜索服务中进行多主体识别。
136277 9
|
8月前
|
人工智能 API 数据处理
阿里云向量检索服务评测报告
本评测报告对阿里云向量检索服务进行了全面而深入的分析,包括最佳实践探索、产品体验评测以及与其他向量检索工具的对比。评测结果显示,阿里云向量检索服务在语义检索、知识库搭建、AI多模态搜索等场景中表现出色,具有高效、易用、可扩展等优点。同时,该服务还提供了丰富的功能和优化选项,满足了复杂业务需求。然而,也存在一些可以改进的地方,如优化大规模数据处理性能、提供更多自定义配置选项等。总体而言,阿里云向量检索服务是一款值得推荐的向量检索解决方案。
|
机器学习/深度学习 存储 开发框架
推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结【冷启动召回、复购召回、用户行为召回等算法实战】
推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结【冷启动召回、复购召回、用户行为召回等算法实战】
推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结【冷启动召回、复购召回、用户行为召回等算法实战】
|
机器学习/深度学习 人工智能 缓存
搜狗知音引擎再进一步,实现语音实时翻译
搜狗在乌镇互联网大会上发布了实时翻译技术,此后,搜狗语音交互中心技术负责人陈伟详细介绍了背后的技术框架和搜狗的多项核心技术。
537 0
搜狗知音引擎再进一步,实现语音实时翻译