开发者社区> 玄学酱> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

能理解聊天记录的微信机器人 (一)

简介:
+关注继续查看

能理解聊天记录的微信机器人 (一)

TL; DR: 做了个在两个群中间互相转发消息的机器人 (github),对聊天机器人的一些思考,可以把文本理解加进来做有意思的应用。

最近看到了一些基于微信机器人的有意思的应用,比如用微信汇报模型的训练状态(TensorFlowKeras)。这个是个很好的出发点。聊天机器人 (chatbot) 这个概念在 slack, telegram, skype 甚至最早的 google wave 上面流行已经有一段时间了。大家主要用它来:

进行一些推送服务 。一个例子就是上面的模型训练。还有持续集成(continuous integration)上也有一些 bot 可以让你知道软件编译,测试和部署的状态。

提供简单的信息服务,比如可以查天气,查 github issue 的 bot。

提供一些基于指令的服务。比如扎克伯格做的 bot,输入开门的指令可以把门打开。

用一定程度的自然语言理解来陪聊.

但我觉得这些并没有体现聊天机器人的核心优势。仔细看这四个方面的应用,它们其实都可以不通过聊天来完成,甚至不通过聊天可能会更方便。比如推送服务有系统信息推送(pushbullet, IFTTT notification等), 查天气系统就有app,智能家居我更希望点点按钮而不是打字,陪聊这个必须要聊天没办法。大家愿意把它做到聊天程序里面去,主要是因为用户实在是太话唠了,很多时间都花在聊天程序里面,这样做成bot等于多了一个入口,何乐而不为?但这样做并不代表这个入口是最优的或者无可取代的。

那聊天机器人适合什么场景呢?要思考这个问题必须首先要明确聊天机器人和其他平台的区别在什么地方。除了 UX 层面必须基于文字,用户经常在用以外,还有一个核心区别是这个机器人其实是可以拿到聊天记录的(当然还取决于隐私设置 )。在这个前提下可以做很多很多有意思的应用。一个例子是我们有个科大校友 AI 群,里面大多数情况都是在认真讨论AI相关的话题。但微信群是为了聊天设计的,讨论上毕竟不比基于主题的 BBS,没有主题,没有回复,没有话题(hashtag),整个信息流非常杂乱。但人类懒的天性又决定了,这种讨论更多的是在微信(或者其他即时通信软件)上完成的,不太可能把它搬到 BBS 上去——每次填个主题,点个回复太麻烦了。有没有可能用微信机器人,一方面又保持这种基于聊天软件的便捷的特性,一方面又能整理整个信息流,让信息变得有组织?比如一个人一天没看群了,晚上跑来看看机器人整理的总结,就一目了然。以后搜索也方便。这是个很有意思的问题。

“让信息有组织”还是太笼统了。具体地说,可以从以下几个方面进行:

跨群转发。这是个非常实用的功能。对群来说,因为微信一个群最多 500 人, 跨群转发可以有效地把两个群拼到一起,实现更广泛的讨论。对个人来说,也可以用有选择的转发来把信息归档。比如看老板或者妹子在你加的几个群里每天都说了啥等等。

聊天消息的主题归并,分析和搜索。微信聊天的基本单位是消息,但消息本身是非常碎片化的,很不适合搜索和分析。机器人可以把相关主题的消息归并起来,一方面可以大幅减小信息过载,一方面也可以从中得到更有价值的信息(类似视频分析里面把帧变成镜头)。这样分析以后可以做知识归档,用OneNote/印象笔记甚至公众号把讨论的成果沉淀下来。

聊天脉络的梳理。群里的人一多,经常会出现几个话题并行出现的情况。这种情况对于理解和搜索都是非常不利的。机器人也需要把聊天的脉络进行梳理,在同一时间,把不同主题分别开。

基本的统计数据。比如发言时间的分布,群的活跃度,成员的活跃度等等。做成漂亮的可视化,用户应该也会喜欢,给产品加分。 

在可行性方面这个也是可能的。比如有基于 python 的 itchat 和基于 typescript 的 wechaty。但稳定性可能是个问题,因为它们都不是微信官方支持的 SDK,而是从 Web 微信的接口中抓包得到的 API。基于 itchat,我做了一个在两个群之间无脑转发消息的机器人 (github),应该蛮有用的,希望能抛砖引玉。

在前面的知乎中的近义词系列里(),我们介绍了一些基于文本理解的小应用,比如自动辨别近义词,文章的分类,索引和搜索。那么这个微信机器人系列,就会尝试把这些技术用到聊天群里面去,看能不能做出一个真正有用的智能机器人。

*题图 credit: Palto / Shutterstock

编者注:关于本文的后续内容,我们后面几天将在雷锋网陆续刊登,敬请关注。




本文作者:AI研习社
本文转自雷锋网禁止二次转载,原文链接

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
超简单:mac导出微信聊天记录(附上粉丝群全部聊天记录)
今天再给大家讲解一下如何直导出mac版本微信的聊天记录,当然如果你没有mac,那可以直接关闭这篇文章了。
1611 0
6.8【微信小程序全栈开发课程】清空所有记录
在个人中心页面有一个清空记录的功能,点击清空记录,会提示是否确认清空记录提示框。用户点击确认后,删除该用户所有的历史record记录数据
31 0
#yyds干货盘点# 【React工作记录四十四】react中filter数组的使用
#yyds干货盘点# 【React工作记录四十四】react中filter数组的使用
35 0
微信修复聊天记录,可惜99%的人都不知道!
微信修复聊天记录,可惜99%的人都不知道!
57 0
[转载]Hyperledger超级账本推出认证服务供应商计划,以提高企業区块链部署速度和效率
Hyperledger超级账本推出认证服务供应商计划,以提高企業区块链部署速度和效率 。首批超级账本认证服务供应商包括埃森哲,蚂蚁金服,北京众享比特 ,Chainyard和IBM。
1703 0
微信WeUI入门
为帮助网页开发者实现与微信客户端一致的视觉体验,并降低设计和开发成本,微信团队推出了网页设计样式库:WeUI。 该样式库目前包含 button (按钮)、cell (单元格)、toast (浮层提示)、dialog (对话框)等网页常用的各式元素,并已在 GitHub 上开源 开发者只需三步,就能在自己的网页上轻松实现按钮、浮层提示等功能:1. 根据文档说明,下载 WeUI 库。
2691 0
搭建 Http Dynamic Streaming 点播/直播服务器
1.        HTTP Origin Module的处理数据流: a)         客户端发送媒体索引请求到Apache。例如: http://www.example.com/media/ sample.f4m b)        Apache处理请求到HTTP OriginModule c)         HTTP Origin Module返回 F4M文件到客户端 d)        客户端接收F4M,根据 bootstrap中的信息中的传送时间,组成一个segment#/fragment#对。
1814 0
树莓派 之 微信聊天机器人(ItChat)
wget https://github.com/littlecodersh/ItChat/archive/robot.zip unzip ItChat* cd ItChat* 可以修改 /ItChat-robot/plugin/config/autoreply.
2327 0
怎样把微信聊天记录导出备份到电脑【微信公众平台技巧】
  微信公众平台上的微信聊天记录可以保留5天,但公众平台回复用户消息时限将从24小时延长为48小时,所以我们有必要进行及时回复、微信聊天记录导出备份。及时回复微信消息是体现你的服务水平,做好微信聊天记录备份到电脑能让你知晓客户的过往情况从而更好地为他们服务。
1736 0
+关注
玄学酱
这个时候,玄酱是不是应该说点什么...
20683
文章
438
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载