阿里工程师养了只“二哈”,专治讨厌的骚扰电话

简介: 前两天3.15晚会上曝光了利用智能机器人,一天打4万个骚扰电话,从而赚取利润的黑色产业链。

前几天的3.15晚会上曝光了利用智能机器人,一天打4万个骚扰电话,从而赚取利润的黑色产业链。

阿里的工程师恼了,技术是用来让人们生活变美好的,不是被利用来走向阴暗的。

机器人的问题交给机器人!

工程师们用业余时间开发的AI机器人——“二哈”要登场了~

视频感受一下咱们“二哈”,连女推销员都丝毫没有察觉。

1、 别惹程序员,用机器人对付机器人

研发“二哈”,其实就是阿里的技术人,对日益普遍的骚扰电话很头疼,而且更可气的是,大量骚扰电话是机器自动拨出的,成本越来越低。

这些骚扰电话,甚至还影响到日常工作,会议开着开着,经常被各类电话打断导致会议终中断。于是阿里AI实验室的同学们开始思考着如何用技术的方式解决问题。

阿里AI实验室天猫精灵算法团队,聚集着语音识别、NLP、知识图谱……全链条的技术人才,当技术人聚在一起,那就能搞事情了。

于是他们先以“课余”项目开始,参与的同学都很开心。一方面是解气,另一方面更清楚背后带来的意义。

没想到在今年3.15晚会上,机器人骚扰电话引起如此大关注。

于是团队决定公开最新研发成果,“二哈”也正式从幕后走到台前,一炮而红。

2、 我们要做到真假难辨

“二哈”是这个智能防骚扰电话技术的项目代号。当用户在手机上开通了这项服务,在接到骚扰来电时,用户可以直接转接给机器人接听。

我们都知道哈士奇之所以被喊作“二哈”,就是它欢乐多,工作起来又相当认真。阿里的程序员们,就是希望这个“课余”爱好的项目,给自己带来快乐,也能帮主人扫除骚扰电话的焦虑。

而“二哈”背后,其实主要使用了智能聊天技术。

所谓“智能聊天”,就是要理解用户请求,同时用强大的知识图谱制作聊天的知识点,通过跟用户对话,把知识图谱里的知识灌输给用户,同时也引导用户反馈。

听起来,简单的一段话,要真正实现聊天聊得“真假难辨”却十分不容易。

于是,我们特地请教了阿里达摩院AI实验室语音助手首席科学家聂再清。

image

他告诉大家,要做到真假难辨,最核心的是以下3点:

第一,接住用户的每一句话。

因为用户的输入空间非常大,要理解和聪明的回复来电者的每一句话很有难度。

对于一些不是“二哈”知识领域的问题,阿里AI目前采用了闲聊(ChitChat)的技术,从互联网上公开的人类对话库中来找到最适合回复。目标是让来电者看不出“二哈”可能的知识缺乏。

第二,主动提出一个相关问题。

这更多是一个对话策略学习的工作,需要让来电者知道“二哈”真能理解他们的话,并提出只有理解了对话上下文,才能提出的好问题。

一味被动接话,很容易被识破。

该项挑战非常大,核心就是一套聊天机器人对话策略学习框架,让“二哈”这样的聊天机器人在不同的场景下都可以持续学习。

通过和人类不断对话,“二哈”AI会通过深度强化学习越来越好地知道如何提问才能更好地达成他的目标。

image

最后,像真人一样的语音语调以及停顿。

如果推销广告的骚扰电话,通过声音判断初接电话的是个机器人,他们就不会继续聊下去了。

所以“二哈”在语音合成方面做了很多工作。

阿里AI最新算法利用Tacotron加上基于神经网络的声码器算法,合成出极其逼真的人声,但还有很大比例情况不能通过图灵测试。于是“二哈”现在采取了过渡性方案,把非常高频的回复借用真人录播。

image

感受一下“二哈”真声和“二哈”的互相调戏学习,竟然没有一点违和感呢。

3、 不止用来对付骚扰电话

“二哈”就只是帮对付骚扰电话而已嘛?

当然不是咯。

项目组的工程师说,“二哈”的进一步的目标是成为每个人的AI电话秘书,除了帮主人应付骚扰电话,还可以在主人繁忙的时候询问来电的主要意图,也能帮主人预约议程。

在你不方便接电话时帮接听来电,并转换成文字向你“汇报”。

image

“二哈”这样的AI电话秘书,可以利用个性化TTS,模仿出跟主人声音极尽逼真的声音。可以把它看作是你的‘声替’,也可以用任何喜欢的声音替你接打电话。

阿里工程师还在畅想,是否有一天,它还还可以帮助聋哑人打电话?技术的进步可以延伸人的能力,也可以弥补人的缺陷。

阿里人常说,所有的异想天开,终究化为寻常。希望这样的“寻常”能早点到来!

讲真,这样的私人秘书,你期不期待?

最后告诉你一个小技能:在支付宝搜索天猫精灵,或直接打开天猫精灵App,就可以调戏这只二哈!

原文发布时间为:2019-03-19
本文作者:代码橙
本文来自云栖社区合作伙伴“ 阿里味儿”,了解相关信息可以关注“ 阿里味儿”。

相关文章
|
算法 物联网 开发者
【手把手教程】无限场景风格LoRA与固定人物LoRA的融合-酷蛙FaceChain0826周记(GitHub已4K Star!)
酷蛙FaceChain项目计划后续联合社区的力量不断打磨该开源项目,解锁更多高阶玩法(比如人物表情包、人物连环画故事、虚拟试衣间……),并进行更深层次的算法创新,发表相应顶会论文。
|
机器学习/深度学习 自然语言处理 算法
调研180多篇论文,这篇综述终于把大模型做算法设计理清了
《A Systematic Survey on Large Language Models for Algorithm Design》综述了过去三年大型语言模型(LLMs)在算法设计中的应用。LLMs通过自然语言处理技术,助力生成、优化和验证算法,在优化、机器学习、数学推理等领域展现出广泛应用前景。尽管存在资源需求高、结果不确定等挑战,LLMs仍为算法设计带来新机遇。论文地址:https://arxiv.org/abs/2410.14716。
437 14
|
9月前
|
定位技术 开发者
HarmonyOS实战:高德地图自定义定位图标展示
本文详细介绍了在鸿蒙系统中实现地图定位功能的开发流程与注意事项。首先,开发者需要申请两个必要的定位权限,并确保用户手动开启系统设置中的位置权限。接着,通过高德定位获取用户位置信息,并使用自定义图标替代默认的定位箭头。文章特别强调了经纬度数据必须为float类型,否则可能导致定位不准确。此外,还需检查系统的GPS定位按钮是否开启,以确保定位功能正常使用。通过本文的指导,开发者可以避免常见的定位问题,顺利完成地图定位功能的开发。
360 2
HarmonyOS实战:高德地图自定义定位图标展示
|
11月前
|
存储 人工智能 算法
通过Milvus内置Sparse-BM25算法进行全文检索并将混合检索应用于RAG系统
阿里云向量检索服务Milvus 2.5版本在全文检索、关键词匹配以及混合检索(Hybrid Search)方面实现了显著的增强,在多模态检索、RAG等多场景中检索结果能够兼顾召回率与精确性。本文将详细介绍如何利用 Milvus 2.5 版本实现这些功能,并阐述其在RAG 应用的 Retrieve 阶段的最佳实践。
2083 1
通过Milvus内置Sparse-BM25算法进行全文检索并将混合检索应用于RAG系统
|
11月前
|
传感器 机器人 Android开发
卓伊凡怒揭真相:鸿蒙自研铁证如山,岂容无端抹黑?
卓伊凡怒揭真相:鸿蒙自研铁证如山,岂容无端抹黑?
235 16
卓伊凡怒揭真相:鸿蒙自研铁证如山,岂容无端抹黑?
|
Windows
一枚弃子打破80年黎曼猜想纪录!菲尔兹奖得主MIT大拿联手
【8月更文挑战第2天】菲尔兹奖得主詹姆斯·梅纳德与MIT数学家合作,在arXiv发布关于黎曼猜想的新论文。该猜想关联质数分布,自19世纪起挑战数学界。研究聚焦狄利克雷多项式的特性,证明其值可达N的3/4次方,推进了对黎曼ζ函数的理解。此外,论文提出了零点密度的新估计及质数短区间分布的渐近公式,为密码学等领域带来潜在影响。值得注意的是,这些成果仍待同行评审确认,并非黎曼猜想的最终解答。
550 7
|
10月前
|
人工智能 自然语言处理 安全
Deepseek 的 “灵魂”,宇树的 “躯体”,智能机器人还缺一个 “万万不能”
法思诺创新探讨智能机器人产业的发展,指出Deepseek的AI“灵魂”与宇树的机器人“躯体”虽技术先进,但缺乏关键的商业模式。文章分析了两者在硬件和软件领域的困境,并提出通过软硬一体化结合及明确商业模式,才能实现真正实用的智能机器人。未来,需聚焦高频刚需场景、优化付费体验、推动技术创新,让智能机器人走进千家万户。法思诺提供相关课程与咨询服务,助力行业突破。
259 0
|
机器学习/深度学习 人工智能 安全
千问团队开源会思考的QwQ模型,这模型成精了!
QwQ是由Qwen团队开发的大型语言模型,专注于增强AI的推理能力。此预览版本在数学和编程领域表现出色,但在其他领域仍有提升空间。模型具备深度自省和自我质疑的能力,通过逐步推理和假设检验,能够在复杂问题上取得突破性进展。QwQ不仅支持本地推理和Ollama直接运行,还提供了详细的微调指南,助力开发者根据特定需求定制模型。尽管QwQ在推理过程中存在语言切换和安全性等方面的局限性,Qwen团队仍致力于不断优化,推动模型向更高层次的智能迈进。[了解更多](https://modelscope.cn/studios/Qwen/QwQ-32B-preview)
3998 0
千问团队开源会思考的QwQ模型,这模型成精了!
|
测试技术 API Python
Python中requests、aiohttp、httpx性能对比
这篇文章对比了Python中三个流行的HTTP客户端库:requests、aiohttp和httpx,在发送HTTP请求时的性能,并提供了测试代码和结果,以帮助选择适合不同应用场景的库。
1468 2