看婚前婚后,短信词频分析

简介:

0

你可曾为结婚纪念日送礼而一筹莫展?看看人家的创意!


Alice Zhao小姐是美国西北大学出身的数据科学家,她丈夫的职业虽然不明,但据她自豪地形容,至少也是一位nerd,因为当年他送给她的恋爱一周年礼物实在太棒了——一个包含这一年里他们所有短信内容的word文档,他称之为数据礼物。

0

于是,为了纪念他们恋爱六周年,Zhao小姐决定把新婚后这一年里的短信拿出来和2008年的进行数据对比,看看婚前婚后的短信有什么不同。


经过词频分析,最明显的就是Zhao先生无论婚前婚后都特别喜欢说“家”这个词,而Zhao小姐当初总是以Hey开场的习惯消失了,代之以越来越多的OK

0

她接着对比了短信中一些常用词的出现频率,这也反映了他们之间亲密程度的变化,比如对话从最初生疏的“Hey,过得怎么样?”到后来更随意的“OK,听起来不错。”


他们不再称呼对方的名字,也不再像以前一样经常说“爱”了(尤其是Zhao先生婚前婚后说love的频率变化……),不过Zhao小姐的解释是他们在一起之后不需要通过短信表达爱意了。

0

再来看具体的出现场合,Zhao小姐发现谈恋爱时love通常用来表达“I love you”,到了后来就变成“Hahaha, love it!”。


还有一些词的使用频率没有多大变化,但内容指代却不一样了,比如“晚餐”和“家”,以前问dinner是为了约出来吃饭,现在是直接问晚上吃啥,而home以前是各回各的家,现在是指他们共同的房子。

0

Zhao小姐对他们发短信的时间变化也很感兴趣。她发现刚开始约会时,他们会从下午三点一直聊到凌晨三点,但是自从订婚开始,他们半夜都选择了还是睡觉吧,而结婚以后发短信就只限于白天上班的时间了。


认为这也反映了情侣之间的普遍情况,因为刚开始时,双方大部分时间都不在一起,所以需要经常查岗看对方在干什么,跟谁在一起,尤其是晚上!


最后,Zhao小姐总结道,刚开始我们总是想方设法确保自己发的内容好玩有趣,随着关系的进展,短信内容变得越来越可预测,但这是因为不可预测的内容都当面说了。


以上就是Zhao小姐回馈给对方的新婚纪念礼物——2014年最新版的#thegiftofdata。


原文发布时间为:2014-10-25

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号



相关文章
|
7月前
|
自然语言处理 分布式计算 Java
基于OpenSearch向量检索版和智能问答版搭建企业专属对话搜索系统
本文将介绍如何使用OpenSearch向量检索版和智能问答版,搭建灵活自定义的企业专属对话搜索系统。
1888 1
|
7月前
|
算法 搜索推荐 计算机视觉
图片相似度计算及检索调研
图片相似度计算和相似图片搜索,是图片识别领域两个常见的应用场景。例如搜索相似商品,和相似的图片,在百度、淘宝中都有应用。在某些业务中,也存在对图片相似度的计算和判断。因此,在这里简单介绍一下相关算法。
321 0
|
2月前
|
数据采集 监控 供应链
shopee商品列表数据接口丨关键词搜索shopee商品数据采集
shopee商品列表数据接口丨关键词搜索shopee商品数据采集
35 5
|
3月前
|
自然语言处理 开发工具 索引
向量检索服务——关键词感知检索详解
向量检索服务DashVector同时支持Dense Vector(稠密向量)和Sparse Vector(稀疏向量),前者用于模型的高维特征(Embedding)表达,后者用于关键词和词频信息表达。DashVector可以进行关键词感知的向量检索,即Dense Vector和Sparse Vector结合的混合检索。
|
6月前
|
机器学习/深度学习 自然语言处理 数据挖掘
向量召回:深入评估离线体系,探索优质召回方法
向量召回:深入评估离线体系,探索优质召回方法
向量召回:深入评估离线体系,探索优质召回方法
|
7月前
|
关系型数据库 分布式数据库 数据库
沉浸式学习PostgreSQL|PolarDB 8: 电商|短视频|新闻|内容推荐业务(根据用户行为推荐相似内容)、监控预测报警系统(基于相似指标预判告警)、音视图文多媒体相似搜索、人脸|指纹识别|比对 - 向量搜索应用
1、在电商业务中, 用户浏览商品的行为会构成一组用户在某个时间段的特征, 这个特征可以用向量来表达(多维浮点数组), 同时商品、店铺也可以用向量来表达它的特征. 那么为了提升用户的浏览体验(快速找到用户想要购买的商品), 可以根据用户向量在商品和店铺向量中进行相似度匹配搜索. 按相似度来推荐商品和店铺给用户. 2、在短视频业务中, 用户浏览视频的行为, 构成了这个用户在某个时间段的兴趣特征, 这个特征可以用向量来表达(多维浮点数组), 同时短视频也可以用向量来表达它的特征. 那么为了提升用户的观感体验(推荐他想看的视频), 可以在短视频向量中进行与用户特征向量的相似度搜索.
228 0
|
10月前
|
存储 数据采集 人工智能
重磅再推 | 基于OpenSearch向量检索版+大模型,搭建对话式搜索
阿里云OpenSearch再推面向企业开发者的PaaS方案:基于OpenSearch向量检索版,为企业开发者提供性能表现优秀、性价比优异的向量检索服务,并提供与大模型结合脚本工具,用户可在使用能力可靠的向量检索服务的同时,自由选择文档切片方案、向量化模型、大语言模型。
15035 1
重磅再推 | 基于OpenSearch向量检索版+大模型,搭建对话式搜索
|
10月前
|
数据采集 算法框架/工具
关键词搜索商品(精准控价)
关键词搜索商品(精准控价)
|
11月前
|
前端开发 API 开发工具
批量提取某音文案
本文介绍了批量提取文案的思路, 以及操作过程中的问题的处理方法, 并给了详细的参考代码, 以及对应的文档.
215 0
|
机器学习/深度学习 存储 开发框架
推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结【冷启动召回、复购召回、用户行为召回等算法实战】
推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结【冷启动召回、复购召回、用户行为召回等算法实战】
推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结【冷启动召回、复购召回、用户行为召回等算法实战】