阿里工程师养了只“二哈”,专治讨厌的骚扰电话

简介: 前两天3.15晚会上曝光了利用智能机器人,一天打4万个骚扰电话,从而赚取利润的黑色产业链。

前几天的3.15晚会上曝光了利用智能机器人,一天打4万个骚扰电话,从而赚取利润的黑色产业链。

阿里的工程师恼了,技术是用来让人们生活变美好的,不是被利用来走向阴暗的。

机器人的问题交给机器人!

工程师们用业余时间开发的AI机器人——“二哈”要登场了~

视频感受一下咱们“二哈”,连女推销员都丝毫没有察觉。

1、 别惹程序员,用机器人对付机器人

研发“二哈”,其实就是阿里的技术人,对日益普遍的骚扰电话很头疼,而且更可气的是,大量骚扰电话是机器自动拨出的,成本越来越低。

这些骚扰电话,甚至还影响到日常工作,会议开着开着,经常被各类电话打断导致会议终中断。于是阿里AI实验室的同学们开始思考着如何用技术的方式解决问题。

阿里AI实验室天猫精灵算法团队,聚集着语音识别、NLP、知识图谱……全链条的技术人才,当技术人聚在一起,那就能搞事情了。

于是他们先以“课余”项目开始,参与的同学都很开心。一方面是解气,另一方面更清楚背后带来的意义。

没想到在今年3.15晚会上,机器人骚扰电话引起如此大关注。

于是团队决定公开最新研发成果,“二哈”也正式从幕后走到台前,一炮而红。

2、 我们要做到真假难辨

“二哈”是这个智能防骚扰电话技术的项目代号。当用户在手机上开通了这项服务,在接到骚扰来电时,用户可以直接转接给机器人接听。

我们都知道哈士奇之所以被喊作“二哈”,就是它欢乐多,工作起来又相当认真。阿里的程序员们,就是希望这个“课余”爱好的项目,给自己带来快乐,也能帮主人扫除骚扰电话的焦虑。

而“二哈”背后,其实主要使用了智能聊天技术。

所谓“智能聊天”,就是要理解用户请求,同时用强大的知识图谱制作聊天的知识点,通过跟用户对话,把知识图谱里的知识灌输给用户,同时也引导用户反馈。

听起来,简单的一段话,要真正实现聊天聊得“真假难辨”却十分不容易。

于是,我们特地请教了阿里达摩院AI实验室语音助手首席科学家聂再清。

image

他告诉大家,要做到真假难辨,最核心的是以下3点:

第一,接住用户的每一句话。

因为用户的输入空间非常大,要理解和聪明的回复来电者的每一句话很有难度。

对于一些不是“二哈”知识领域的问题,阿里AI目前采用了闲聊(ChitChat)的技术,从互联网上公开的人类对话库中来找到最适合回复。目标是让来电者看不出“二哈”可能的知识缺乏。

第二,主动提出一个相关问题。

这更多是一个对话策略学习的工作,需要让来电者知道“二哈”真能理解他们的话,并提出只有理解了对话上下文,才能提出的好问题。

一味被动接话,很容易被识破。

该项挑战非常大,核心就是一套聊天机器人对话策略学习框架,让“二哈”这样的聊天机器人在不同的场景下都可以持续学习。

通过和人类不断对话,“二哈”AI会通过深度强化学习越来越好地知道如何提问才能更好地达成他的目标。

image

最后,像真人一样的语音语调以及停顿。

如果推销广告的骚扰电话,通过声音判断初接电话的是个机器人,他们就不会继续聊下去了。

所以“二哈”在语音合成方面做了很多工作。

阿里AI最新算法利用Tacotron加上基于神经网络的声码器算法,合成出极其逼真的人声,但还有很大比例情况不能通过图灵测试。于是“二哈”现在采取了过渡性方案,把非常高频的回复借用真人录播。

image

感受一下“二哈”真声和“二哈”的互相调戏学习,竟然没有一点违和感呢。

3、 不止用来对付骚扰电话

“二哈”就只是帮对付骚扰电话而已嘛?

当然不是咯。

项目组的工程师说,“二哈”的进一步的目标是成为每个人的AI电话秘书,除了帮主人应付骚扰电话,还可以在主人繁忙的时候询问来电的主要意图,也能帮主人预约议程。

在你不方便接电话时帮接听来电,并转换成文字向你“汇报”。

image

“二哈”这样的AI电话秘书,可以利用个性化TTS,模仿出跟主人声音极尽逼真的声音。可以把它看作是你的‘声替’,也可以用任何喜欢的声音替你接打电话。

阿里工程师还在畅想,是否有一天,它还还可以帮助聋哑人打电话?技术的进步可以延伸人的能力,也可以弥补人的缺陷。

阿里人常说,所有的异想天开,终究化为寻常。希望这样的“寻常”能早点到来!

讲真,这样的私人秘书,你期不期待?

最后告诉你一个小技能:在支付宝搜索天猫精灵,或直接打开天猫精灵App,就可以调戏这只二哈!

原文发布时间为:2019-03-19
本文作者:代码橙
本文来自云栖社区合作伙伴“ 阿里味儿”,了解相关信息可以关注“ 阿里味儿”。

相关文章
|
5月前
|
机器学习/深度学习 存储 缓存
阿里云服务器最新租用价格:2核4G、2核8G、4核8G、4核16G不同实例与带宽活动价格参考
阿里云服务器2核4G配置中,通用算力型u1实例年费199元起,经济型e实例和u2a实例价格分别为599.93元/年、504.60元/年起;4核16G配置u2a实例年费1291.80元起。不同实例类型适用场景各异:经济型e实例适合轻负载场景,通用算力型u2a实例性价比突出,九代实例(c9i/g9i/r9i)专为高性能场景设计。用户需结合预算、业务类型及性能需求选择,通过活动优惠、优惠券达到成本最优化。
753 6
|
8月前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的台风灾害分析及预测系统
针对台风灾害预警滞后、精度不足等问题,本研究基于Python与大数据技术,构建多源数据融合的台风预测系统。利用机器学习提升路径与强度预测准确率,结合Django框架实现动态可视化与实时预警,为防灾决策提供科学支持,显著提高应急响应效率,具有重要社会经济价值。
|
2月前
|
人工智能 API Apache
31B 干掉 405B:Google Gemma 4,正在终结参数军备竞赛
一个 31B 参数的模型,在全球开源大模型排行榜上排名第三。它身前倒下的,是 Qwen 3.5 的 397B,是 Llama 的 405B。
614 2
|
8月前
|
人工智能 搜索推荐 数据安全/隐私保护
AI检测技术:如何识别机器生成内容?
AI检测技术:如何识别机器生成内容?
524 0
|
10月前
|
图形学
【Unity3D实例-功能-拔枪】角色拔枪(二)分割上身和下身
本文介绍如何在Unity3D中实现角色“上身动画”与“下身动画”的分离控制,使角色在执行拔枪、射击等动作时,下身可独立进行移动动画,提升游戏动画灵活性与玩家体验。内容包含创建动画器、配置动画、设置Avatar Mask等步骤,并附测试效果。后续将讲解IK使用,使角色持枪更自然。
345 9
|
JavaScript 前端开发 Java
编程语言中的常见Bug及解决方案
本文总结了主流编程语言中的常见Bug及其解决方案,涵盖JavaScript、Python、C/C++、Java和Go。例如,JavaScript中小数相加精度不准确,可通过`toFixed()`解决;Python 2中整数除法向下取整,改用浮点数除法;C/C++内存管理与缓冲区溢出,使用安全函数如`snprintf`;Java空指针异常,使用非空判断或`Optional`类;Go并发编程中的竞态条件,采用互斥锁或原子操作。了解这些Bug及解决方案有助于提高编程质量。
436 9
|
供应链 算法 搜索推荐
从公布的前十一批其他算法备案通过名单分析
2025年3月12日,国家网信办发布算法备案信息,深度合成算法通过395款,其他算法45款。前10次备案中,深度合成算法累计3234款,其他类别647款。个性化推送类占比49%,涵盖电商、资讯、视频推荐;检索过滤类占31.53%,用于搜索优化和内容安全;调度决策类占9.12%,集中在物流配送等;排序精选类占8.81%,生成合成类占1.55%。应用领域包括电商、社交媒体、物流、金融、医疗等,互联网科技企业主导,技术向垂直行业渗透,内容安全和多模态技术成新增长点。未来大模型检索和多模态生成或成重点。
从公布的前十一批其他算法备案通过名单分析
|
人工智能 监控 搜索推荐
智能管理日常花销 — AI Coze打造个人财务小助手的全新体验(初版)(一)
智能管理日常花销 — AI Coze打造个人财务小助手的全新体验(初版)
968 0
|
存储 算法 索引
python dict字典
python dict字典
409 0
|
人工智能 算法 BI
【经典问题】给两个文件,分别有100亿个整数,我们只有1G内存,如何找到两个文件交集?
【1月更文挑战第26天】【经典问题】给两个文件,分别有100亿个整数,我们只有1G内存,如何找到两个文件交集?