看婚前婚后,短信词频分析

简介:

0

你可曾为结婚纪念日送礼而一筹莫展?看看人家的创意!


Alice Zhao小姐是美国西北大学出身的数据科学家,她丈夫的职业虽然不明,但据她自豪地形容,至少也是一位nerd,因为当年他送给她的恋爱一周年礼物实在太棒了——一个包含这一年里他们所有短信内容的word文档,他称之为数据礼物。

0

于是,为了纪念他们恋爱六周年,Zhao小姐决定把新婚后这一年里的短信拿出来和2008年的进行数据对比,看看婚前婚后的短信有什么不同。


经过词频分析,最明显的就是Zhao先生无论婚前婚后都特别喜欢说“家”这个词,而Zhao小姐当初总是以Hey开场的习惯消失了,代之以越来越多的OK

0

她接着对比了短信中一些常用词的出现频率,这也反映了他们之间亲密程度的变化,比如对话从最初生疏的“Hey,过得怎么样?”到后来更随意的“OK,听起来不错。”


他们不再称呼对方的名字,也不再像以前一样经常说“爱”了(尤其是Zhao先生婚前婚后说love的频率变化……),不过Zhao小姐的解释是他们在一起之后不需要通过短信表达爱意了。

0

再来看具体的出现场合,Zhao小姐发现谈恋爱时love通常用来表达“I love you”,到了后来就变成“Hahaha, love it!”。


还有一些词的使用频率没有多大变化,但内容指代却不一样了,比如“晚餐”和“家”,以前问dinner是为了约出来吃饭,现在是直接问晚上吃啥,而home以前是各回各的家,现在是指他们共同的房子。

0

Zhao小姐对他们发短信的时间变化也很感兴趣。她发现刚开始约会时,他们会从下午三点一直聊到凌晨三点,但是自从订婚开始,他们半夜都选择了还是睡觉吧,而结婚以后发短信就只限于白天上班的时间了。


认为这也反映了情侣之间的普遍情况,因为刚开始时,双方大部分时间都不在一起,所以需要经常查岗看对方在干什么,跟谁在一起,尤其是晚上!


最后,Zhao小姐总结道,刚开始我们总是想方设法确保自己发的内容好玩有趣,随着关系的进展,短信内容变得越来越可预测,但这是因为不可预测的内容都当面说了。


以上就是Zhao小姐回馈给对方的新婚纪念礼物——2014年最新版的#thegiftofdata。


原文发布时间为:2014-10-25

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号



相关文章
|
2月前
|
机器学习/深度学习 数据采集 算法
基于贝叶斯算法的手机垃圾短信过滤
基于贝叶斯算法的手机垃圾短信过滤
|
2月前
|
数据采集 XML 自然语言处理
R语言汽车口碑数据采集抓取、文本数据分词和词云可视化实现
R语言汽车口碑数据采集抓取、文本数据分词和词云可视化实现
|
Python
python实现短信发送
python实现短信发送,近期老收到自称自己是京东金融的私人电话,骗取钱财,我直接一顿臭骂,他还还口,所以就有了这个短信息发给他。。、。
22101 48
|
10月前
|
关系型数据库 分布式数据库 数据库
沉浸式学习PostgreSQL|PolarDB 8: 电商|短视频|新闻|内容推荐业务(根据用户行为推荐相似内容)、监控预测报警系统(基于相似指标预判告警)、音视图文多媒体相似搜索、人脸|指纹识别|比对 - 向量搜索应用
1、在电商业务中, 用户浏览商品的行为会构成一组用户在某个时间段的特征, 这个特征可以用向量来表达(多维浮点数组), 同时商品、店铺也可以用向量来表达它的特征. 那么为了提升用户的浏览体验(快速找到用户想要购买的商品), 可以根据用户向量在商品和店铺向量中进行相似度匹配搜索. 按相似度来推荐商品和店铺给用户. 2、在短视频业务中, 用户浏览视频的行为, 构成了这个用户在某个时间段的兴趣特征, 这个特征可以用向量来表达(多维浮点数组), 同时短视频也可以用向量来表达它的特征. 那么为了提升用户的观感体验(推荐他想看的视频), 可以在短视频向量中进行与用户特征向量的相似度搜索.
268 0
|
机器学习/深度学习 存储 开发框架
推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结【冷启动召回、复购召回、用户行为召回等算法实战】
推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结【冷启动召回、复购召回、用户行为召回等算法实战】
推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结【冷启动召回、复购召回、用户行为召回等算法实战】
|
数据采集 算法框架/工具
关键词搜索商品(精准控价)
关键词搜索商品(精准控价)
140 0
|
数据采集 算法 大数据
爬虫识别-打分| 学习笔记
快速学习爬虫识别-打分
74 0
爬虫识别-打分| 学习笔记
|
存储 Web App开发 人工智能
快递单信息抽取【三】--五条标注数据提高准确率,仅需五条标注样本,快速完成快递单信息任务
快递单信息抽取【三】--五条标注数据提高准确率,仅需五条标注样本,快速完成快递单信息任务
|
数据采集 消息中间件 大数据
爬虫识别-不同行程统计-需求及实现思路|学习笔记
快速学习爬虫识别-不同行程统计-需求及实现思路
58 0
|
JSON 安全 搜索推荐
利用搜索指数窥探舆情
利用搜索指数窥探舆情
417 0
利用搜索指数窥探舆情