天气炎热等公交,实时查询动口不动手|语音AI在高德

简介: 近日,高德地图发布新版本,由达摩院语音实验室提供全链路技术支持的“小德”智能语音助手实现了业内首家支持实时公交查询和播报的功能。公交车到哪儿了,动动嘴即可实时掌握。目前,该语音助手已实现地点查询、驾车导航、公交地铁查询、实时公交、打车等全出行场景的语音操控。
来源 阿里语音AI 公众号

image.png

近日,高德地图发布新版本,由达摩院语音实验室提供全链路技术支持的“小德”智能语音助手实现了业内首家支持实时公交查询和播报的功能。公交车到哪儿了,动动嘴即可实时掌握。目前,该语音助手已实现地点查询、驾车导航、公交地铁查询、实时公交、打车等全出行场景的语音操控

现在用户打开最新版高德地图APP,说“小德小德”,或点击麦克风,就可以将语音助手唤醒,然后直接询问“xxx路到哪了”或“xxx路还有多久到”,无须手指输入,“小德”就会通过语音和卡片呈现的方式,快速反馈查询结果,使用起来更加便捷。

640.gif

据了解,高德地图实时公交服务现已覆盖北京、上海、广州、深圳、杭州等全国40多个重点城市,帮助用户了解公交车实时位置、距离当前站点还有几站及几分钟到达。用户也可将通勤常坐的公交路线设置“公交闹钟”,设置后,高德地图就会定点推送实时公交信息,无须专门操作查询。在出行过程中,高德地图还可提供上车提醒、下车提醒等贴心服务,有效避免错过车、坐过站,大幅提升公交出行体验。

作为更智能简便的交互方式,高德“小德”语音助手如今已支持地点查询、路线查询、驾车导航、更改目的地、增加和删除途经点、沿途搜索、限行查询、公交地铁查询、实时公交到站时间、打车、旅途景点播报、更换明星语音包等众多功能,基本实现了常见出行场景的全面覆盖。尤其是在驾车时,语音助手可极大地解放用户双手,出行导航更加高效和安全

同时得益于达摩院语音实验室强大的智能语音技术,在一些嘈杂的环境下,小德亦可随叫随到,还能分辨多种方言口音,即使面对一些较重的南方口音,小德也能准确识别用户的指令。

同时,高德地图也使用了达摩院语音AI技术生产了多款明星导航语音,比如林志玲、小团团、李佳琦、朱广权、欧阳娜娜、郭德纲、岳云鹏、黄晓明、马丽、高晓松、黄健翔、罗永浩、周星星等。用户不仅可以听到明星的导航播报,也可通过语音助手与她/他互动,而且语音助手还能表现出这位明星的讲话风格,让对话更加生动有趣。

相关文章
|
16天前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
109 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
24天前
|
SQL 存储 人工智能
Vanna:开源 AI 检索生成框架,自动生成精确的 SQL 查询
Vanna 是一个开源的 Python RAG(Retrieval-Augmented Generation)框架,能够基于大型语言模型(LLMs)为数据库生成精确的 SQL 查询。Vanna 支持多种 LLMs、向量数据库和 SQL 数据库,提供高准确性查询,同时确保数据库内容安全私密,不外泄。
92 7
Vanna:开源 AI 检索生成框架,自动生成精确的 SQL 查询
|
6天前
|
人工智能 Serverless 视频直播
活动实践 | AI智能体实时语音互动
AI智能体实时语音互动方案提供端到端的实时音频交互,用户通过终端SDK与云端AI智能体进行音频通话。AI智能体接收音频输入,依据预定义工作流处理并生成响应,通过ARTC网络推送结果。该方案支持灵活编排AI组件如语音转文字、大语言模型等,确保高可用、低延迟的通信体验。用户可轻松创建和管理智能体及实时工作流,实现高效对话,并可通过示例网站体验功能。
|
1月前
|
人工智能 机器人 Shell
AI语音机器人安装方法 AI机器人安装代码
AI语音机器人安装方法 AI机器人安装代码
34 2
|
1月前
|
人工智能 自然语言处理 机器人
手把手带你搭建一个语音对话机器人,5分钟定制个人AI小助手(新手入门篇)
本文介绍了如何从零开始搭建一个语音对话机器人,涵盖自动语音识别(ASR)、自然语言处理(NLP)和文本到语音合成(TTS)三大核心模块。通过使用开源工具如FunASR、LLaMA3-8B和ChatTTS,以及FastAPI和Gradio等技术,详细指导读者轻松实现个人AI小助手的构建,适合技术新手快速上手。
285 1
|
2月前
|
人工智能
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
75 1
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
|
2月前
|
数据采集 人工智能 自然语言处理
AI Agent 金融助理0-1 Tutorial 利用Python实时查询股票API的FinanceAgent框架构建股票(美股/A股/港股) AI Finance Agent
金融领域Finance AI Agents方面的工作,发现很多行业需求和用户输入的 query都是和查询股价/行情/指数/财报汇总/金融理财建议相关。如果需要准确的 金融实时数据就不能只依赖LLM 来生成了。常规的方案包括 RAG (包括调用API )再把对应数据和prompt 一起拼接送给大模型来做文本生成。稳定的一些商业机构的金融数据API基本都是收费的,如果是以科研和demo性质有一些开放爬虫API可以使用。这里主要介绍一下 FinanceAgent,github地址 https://github.com/AI-Hub-Admin/FinanceAgent
|
2月前
|
存储 人工智能 开发者
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
135 0
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
|
2月前
|
人工智能 语音技术 数据格式
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
52 0
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
|
2月前
|
人工智能 NoSQL 机器人
MongoDB Atlas与YoMio.AI近乎完美适配:推理更快速、查询更灵活、场景更丰富
随着MongoDB的新发布和革新,YoMio.AI的“闪电式发展”值得期待。