人机交互的搜索结果_第6页-阿里云开发者社区

阿里云

|

7月前

|

博文

|

来自：通义大模型

雷鸟创新X阿里云：AR眼镜接入通义大模型！

# 大模型服务平台百炼 # 传感器 # 人工智能 # 算法 # 人机交互 # vr&ar

技术员阿伟

|

7月前

|

博文

《揭秘AI语音助手：从“听”到“说”的智能之旅》

在数字化时代，AI语音助手如Siri、Alexa、小爱同学等成为生活中的得力伙伴。它们通过自动语音识别（ASR）将语音转换为文本，利用自然语言处理（NLP）理解语义并生成回应，再通过文本到语音转换（TTS）输出自然语音。ASR捕捉、预处理和分析语音信号；NLP解析文本、理解意图；TTS合成流畅语音。这三项技术协同工作，使语音助手能听懂、理解并回应用户，为人机交互带来便利与创新。

# 机器学习/深度学习 # 人工智能 # 自然语言处理 # 人机交互 # 语音技术

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

TIGER：清华突破性模型让AI「听觉」进化：参数量暴降94%，菜市场都能分离清晰人声

TIGER 是清华大学推出的轻量级语音分离模型，通过时频交叉建模和多尺度注意力机制，显著提升语音分离效果，同时降低参数量和计算量。

# 智能语音交互 # 机器学习/深度学习 # 人工智能 # 机器人 # 人机交互 # 智能硬件

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

Social Media Agent：告别文案焦虑！AI自动生成高转化帖子，输入URL快速生成爆款文案

Social Media Agent 是一款由 LangChain 推出的 AI 社交媒体内容管理工具，支持 Twitter 和 LinkedIn 平台，能快速生成高质量的帖子。

# 云原生数据仓库 AnalyticDB PostgreSQL版 # 自然语言处理 # 人工智能 # 自然语言处理 # 人机交互 # API # 调度

阿里云开发者

|

7月前

|

博文

重磅发布的「AI视频通话」如何10分钟就实现？

2024年，OpenAI发布GPT-4o，支持文本、音频和图像的组合输入与输出，使交互更接近自然交流。传统语音助手需经历多阶段处理，容易出现延迟或误解，体验感差。本文介绍如何在阿里云上快速创建可视频通话的AI智能体，实现拟人化交互、精准感知、情绪捕捉等功能，提供高质量、低延时的音视频通话体验。通过简单的部署流程，用户可以轻松创建并体验这一先进的人机交互技术。点击“阅读原文”参与活动赢取惊喜礼物。

# 人工智能 # 安全 # 机器人 # 人机交互 # 语音技术

游客yoh4w6jvuxebs

|

7月前

|

博文

|

来自：大数据与机器学习

产品经理-交互设计 - AxureMost

交互设计（Interaction Design，简称IXD）专注于创建人与产品、系统或服务之间的互动过程。其核心是通过界面操作帮助用户高效达成目标，提升用户体验。交互设计需考虑最佳展现形式、交互轮廓、文化背景及用户习惯。设计流程包括需求分析、概念设计、信息架构、原型验证和数据分析。未来，交互设计将更注重多平台和服务设计，要求设计师具备产品思维和用户心理理解能力。

# 搜索推荐 # 人机交互 # UED

Paraverse平行云

|

8月前

|

博文

汽车品牌选择使用VR虚拟现实技术展示汽车

虚拟现实汽车展厅利用VR技术，为客户提供生动、便捷的在线购车体验。用户通过佩戴VR设备，可在虚拟环境中全方位观察汽车外观、内饰，了解功能并定制颜色和配置。此外，还可与虚拟工作人员互动，获取更多信息和建议。该展厅不仅节省了客户的时间和精力，也为经销商降低了展示成本，提升了销售效率。未来，随着VR技术的进步，展厅将更加智能和普及，进一步融合线上线下购车流程，提供更丰富的互动体验。

# 人机交互 # 语音技术 # vr&ar # 图形学 # 开发者

楠竹11

|

8月前

|

博文

穹彻智能-上交大最新Nature子刊速递：解析深度学习驱动的视触觉动态重建方案

上海交大研究团队在Nature子刊发表论文，提出基于深度学习的视触觉动态重建方案，结合高密度可拉伸触觉手套与视觉-触觉联合学习框架，实现手部与物体间力量型交互的实时捕捉和重建。该方案包含1152个触觉感知单元，通过应变干扰抑制方法提高测量准确性，平均重建误差仅1.8厘米。实验结果显示，其在物体重建的准确性和鲁棒性方面优于现有方法，为虚拟现实、远程医疗等领域带来新突破。

# 云解析DNS # 机器学习/深度学习 # 传感器 # 人工智能 # 人机交互 # vr&ar

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Emotion-LLaMA：用 AI 读懂、听懂、看懂情绪，精准捕捉文本、音频和视频中的复杂情绪

Emotion-LLaMA 是一款多模态情绪识别与推理模型，融合音频、视觉和文本输入，通过特定情绪编码器整合信息，广泛应用于人机交互、教育、心理健康等领域。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 人机交互

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

ViTPose：最小只有100M的身体姿态估计模型，精确识别人体关节、手、脚等关键点

ViTPose 是基于 Transformer 架构的人体姿态估计模型，能够精准定位人体关键点，支持多种规模版本，适用于运动分析、虚拟现实等场景。

# 视觉智能开放平台 # 人工智能 # 编解码 # 测试技术 # 人机交互 # vr&ar

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

人机交互