语音识别构思

简介: 语音识别构思

布鲁克应该具备的功能

1.1 建议功能

在我复习java的方法的时候,public static void 能够提示我把数据的类型也进行复习。

1.2 基本沟通功能

开始时语句:

您好,master,我有什么能够帮助你的。

当我说了某些话:例如...,你可以邀请这位女生吃饭,完成一句话的逻辑沟通。

1.3 万物互联,设备迁移

设计的布鲁克,采用的语音识别系统,初步想法是能够听我说的话,自己记录打印出文字来,能够在记事本中记录下来。: 布鲁克 ————逻辑思维,结果评估,逻辑结果修正,引入变量:计划(完成事情的某一步骤),计划剩余比例=总计划度-当前计划度/总计划度。 计划将要完成时间 = 总计划度-当前计划度/ 单日完成比例。 终点:自身预期完成。 当前逻辑完成点

2、语音翻译

1、弄一个搜索框

2、输入之后,能够得出指定数据

3、弄一个英语单词的数据库

3、美国航空机票官网,aa.com有语音种类

4、删除内容的页面

5、视频转文字的布局

6、

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
6月前
|
机器学习/深度学习 自然语言处理 算法
未来语音交互新纪元:FunAudioLLM技术揭秘与深度评测
人类自古以来便致力于研究自身并尝试模仿,早在2000多年前的《列子·汤问》中,便记载了巧匠们创造出能言善舞的类人机器人的传说。
12437 116
|
4月前
|
机器学习/深度学习 自然语言处理 搜索推荐
深度学习的人机情感交互
基于深度学习的人机情感交互是一个迅速发展的领域,旨在使计算机系统能够理解和响应人类的情感状态,从而实现更自然、更富有表现力的人机互动。
83 3
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
"FunAudioLLM震撼来袭!重塑语音交互新纪元,让每一次对话都充满魔法与情感共鸣!"
【8月更文挑战第11天】随着AI技术的发展,语音交互正经历革新。阿里巴巴推出的FunAudioLLM是一款先进的语音技术框架,包含SenseVoice和CosyVoice两大核心模型。SenseVoice擅长多语言语音识别与情感分析;CosyVoice则专精于自然语音生成,支持多语言、音色与情感控制。这两个模型结合,能实现在语音翻译、情绪对话等场景下的广泛应用,为人机交互带来更加真实与丰富的体验。通过开源社区的支持,FunAudioLLM将持续进化,成为语音技术领域的重要推手。
88 5
|
6月前
|
自然语言处理 测试技术 API
探索通义语音团队的创新之作 —— FunAudioLLM模型评测
随着人工智能技术的飞速发展,语音识别和语音合成技术在各个领域得到了广泛应用。阿里云推出的“通义语音大模型FunAudioLLM”作为最新的语音处理技术,备受业界关注。本次评测将深入探讨通义语音大模型的功能、性能及其在实际应用中的表现。
|
6月前
|
人工智能 自然语言处理 语音技术
FunAudioLLM:探索音频基座大模型在AI应用中的新境界
FunAudioLLM:探索音频基座大模型在AI应用中的新境界
130 0
|
7月前
|
人工智能 算法 搜索推荐
AI能否理解音乐情感?
【6月更文挑战第1天】AI能否理解音乐情感?
95 4
|
人工智能 算法
让AI画美女,到底会不会翻车?AI能理解人的审美取向吗?AI绘画会对写真圈有影响吗?
先说结果,我个人认为AI绘画美女存在一定的翻车的情况。比如手指,身体轮廓的粗细,可能还不是很完美。如果AI绘画生成的结果我们不能一眼的分辨出来,那就意味着AI绘画已经能和真实的照片平起平坐了。
372 2
|
8月前
|
机器学习/深度学习 存储 人工智能
AI绘画——了解AI绘画爆火原因与工具,并生成几个端午绘画小作品
AI绘画——了解AI绘画爆火原因与工具,并生成几个端午绘画小作品
186 0
|
机器学习/深度学习 人工智能 自然语言处理
听懂未来:AI语音识别技术的进步与实战
听懂未来:AI语音识别技术的进步与实战
900 0
|
机器学习/深度学习 数据采集 人工智能
零门槛玩转AI声音定制,3分钟即可复刻你的发音模型
零门槛玩转AI声音定制,3分钟即可复刻你的发音模型