语音技术的搜索结果_第11页-阿里云开发者社区

1918010837065910

|

6月前

|

博文

本案例展示了一个基于AI语音服务的实时语音转文字功能，通过麦克风采集音频并转换为文本。主要步骤包括：申请麦克风权限、初始化语音识别引擎、设置识别回调、配置音频参数及实现UI交互（长按按钮控制录音启停）。代码使用TypeScript编写，涵盖权限管理、引擎生命周期、异常处理等核心环节，确保功能稳定运行。适用于需要实时语音转写的场景，如会议记录、语音输入等。

# 语音服务 # 人工智能 # JavaScript # 语音技术 # 数据安全/隐私保护 # UED

1918010837065910

|

6月前

|

博文

HarmonyOS NEXT AI基础语音服务-文章播报

这是一篇关于基于AI文字转语音（TTS）服务的案例解析，展示了如何通过 `textToSpeech` 模块实现语音播报功能。代码中定义了一个名为 `CoreSpeechKit` 的组件，包含文本内容、TTS引擎初始化、播放控制及界面构建等功能。核心步骤包括引入必要模块、定义组件生命周期方法（如 `aboutToAppear` 和 `aboutToDisappear`）、设置播放逻辑以及构建UI界面。此案例适用于学习文字转语音技术的实际应用与开发流程。

# 语音服务 # 存储 # 人工智能 # 语音技术

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

Video-T1：视频生成实时手术刀！清华腾讯「帧树算法」终结闪烁抖动

清华大学与腾讯联合推出的Video-T1技术，通过测试时扩展（TTS）和Tree-of-Frames方法，显著提升视频生成的连贯性与文本匹配度，为影视制作、游戏开发等领域带来突破性解决方案。

# 视觉智能开放平台 # 人工智能 # 算法 # 语音技术 # 异构计算

游客a4oswvtctqbx6

|

6月前

|

博文

生成式AI掀起职业革命：哪些工作的门槛越来越低？与生成式人工智能（GAI）认证的兴起

本文探讨生成式AI如何改变职场生态，降低内容创作、数据分析和客户服务等领域的专业门槛，并分析GAI认证的兴起与意义。生成式AI通过自然语言处理、图像生成等技术提升效率，而GAI认证则为企业和个人提供技能标准，助力职业发展。两者结合将塑造未来职场新生态，推动社会进步与技术创新。

# 人工智能 # 自然语言处理 # 搜索推荐 # 数据挖掘 # 语音技术

游客a4oswvtctqbx6

|

6月前

|

博文

2025人工智能职场报告：57.2%的职场人考虑从事AI类职业，生成式人工智能（GAI）认证如何重构职业价值坐标系

人工智能（AI）已成为21世纪最具变革性的力量之一，尤其生成式人工智能（GAI）认证正重构职业价值坐标系。数据显示，57.2%的职场人愿从事AI相关职业，凸显其吸引力。GAI认证不仅提升个人竞争力、拓宽职业道路，还增强职业认同感，助力企业在人才选拔中更精准高效。面对机遇，职场人需明确目标、结合实践、持续学习，以适应快速发展的AI领域，为企业与个人发展奠定坚实基础。

# 机器学习/深度学习 # 人工智能 # 自然语言处理 # 语音技术

bruce_xiaowei

|

6月前

|

博文

HarmonyOS Next～鸿蒙AI功能开发：Core Speech Kit与Core Vision Kit的技术解析与实践

本文深入解析鸿蒙操作系统（HarmonyOS）中的Core Speech Kit与Core Vision Kit，探讨其在AI功能开发中的核心能力与实践方法。Core Speech Kit聚焦语音交互，提供语音识别、合成等功能，支持多场景应用；Core Vision Kit专注视觉处理，涵盖人脸检测、OCR等技术。文章还分析了两者的协同应用及生态发展趋势，展望未来AI技术与鸿蒙系统结合带来的智能交互新阶段。

# 云解析DNS # 人工智能 # API # 语音技术 # 开发者 # 计算机视觉

阿里云-云栖战略参考

|

6月前

|

博文

创新场景丨下一个iPhone 时刻，AI+AR 加速虚实融合世界的到来

仅仅以大模型通用能力帮助 AR 眼镜实现了多个场景下的交互还不够，关键在于大模型没有针对 AR 眼镜的需求做深度的定制和匹配。

# 人工智能 # 自然语言处理 # 语音技术 # vr&ar # iOS开发

阿里云-云栖战略参考

|

6月前

|

博文

创新场景丨大模型时代，重塑智能终端新体验

大模型为智能终端带来的变革是全方位的，但挑战也同样显而易见。云侧部署的大模型加端侧应用的大模型是综合平衡性能、成本、功耗、隐私、速度之下的最佳选择。

# 人工智能 # 自然语言处理 # 机器人 # 人机交互 # 语音技术

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

GPT-4o mini TTS：OpenAI 推出轻量级文本转语音模型！情感操控+白菜价冲击配音圈

GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型，支持多语言、多情感控制，适用于智能客服、教育学习、智能助手等多种场景。

# 智能语音交互 # 人工智能 # 自然语言处理 # 语音技术 # 开发者

nefelibata

|

6月前

|

博文

AI技术如何重塑客服系统？解析合力亿捷AI智能客服系统实践案例

本文探讨了人工智能技术在客服系统中的应用，涵盖技术架构、关键技术和优化策略。通过感知层、认知层、决策层和执行层的协同工作，结合自然语言处理、知识库构建和多模态交互技术，合力亿捷客服系统实现了智能化服务。文章还提出了用户体验优化、服务质量提升和系统性能改进的方法，并展望了未来发展方向，强调其在客户服务领域的核心价值与潜力。

# 客服工作台 # 云解析DNS # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 搜索推荐 # 语音技术