备案控制台

开发者社区人工智能文章正文

语音情感计算理论基础

2019-02-24 1806

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 持续更新情感计算相关

1.语音情感计算中情感的建模方法有哪些？有什么区别？情感计算主要应用于哪些领域？

支持向量机（SVM）、隐马尔可夫模型（HMM）、人工神经网路（NN）等。
- SVM：基音+SVM算法=统计特征→识别语音状态；
- HMM：输入特征矢量序列+训练=统计信号→识别语音状态；
- NN：多层神经网路+训练=模拟人脑组织→识别语音状态。
虚拟人物、身份验证、智能用户界面、交互式感性图像检索、多功能机、语音识别、面部识别、军用可穿戴计算机等等。

2.列举三种以上的用于语音情感计算的声学特征，并解释其物理含义。

声学特征：

音色。发音体形状、质地、构造不同，决定了音色的不同。
音调。发音体声音频率的高低。
音强。发音体振动的幅度特征。
音长。发音体振动延续的时间特征。

语句特征：

基频。基音的频率，决定了音高。在不同情感状态说，说同一段话，基频是不同的。一般研究基频的峰值、均值、方差等特征。
低于250HZ的谱能量。根据parseval定理，信号傅氏变换模平方被称为谱能量。带有情绪的状态下谱能量和低于250HZ的谱能量时的存在一些规律。
语速。讲一个语句的速度。不同情绪下的语速有规律性差异。
能量。生气和高兴时能量高，其次平静，悲伤最低。

文章标签：

算法

语音技术

机器学习/深度学习

fan2xw

目录

相关文章

艾派森_

|

3天前

|

机器学习/深度学习人工智能算法

搞懂大模型的智能基因，RLHF系统设计关键问答

搞懂大模型的智能基因，RLHF系统设计关键问答

艾派森_

70 0 0

天玑y

|

3天前

情感理论模型

情感理论模型

天玑y

127 0 0

阿里开发者

|

3天前

|

机器学习/深度学习人工智能自然语言处理

当大火的文图生成模型遇见知识图谱，AI画像趋近于真实世界

本文介绍了阿里云机器学习PAI团队开发的名为ARTIST的中文文图生成模型，该模型融合了知识图谱信息，能够生成更加符合常识的图像。ARTIST基于Transformer架构，将文图生成任务分为图像矢量量化和文本引导的图像序列生成两个阶段。在第一阶段，模型使用VQGAN对图像进行矢量量化；在第二阶段，通过GPT模型并结合知识图谱中的实体知识来生成图像序列。在MUGE中文文图生成评测基准上，ARTIST表现出色，其生成效果优于其他模型。此外，EasyNLP框架提供了简单易用的接口，用户可以基于公开的Checkpoint进行少量领域相关的微调，实现各种艺术创作。

阿里开发者

58 0 0

楠竹11

|

3天前

|

人工智能自然语言处理语音技术

ZeroSwot：零数据训练，成功突破语音翻译难题

【2月更文挑战第16天】ZeroSwot：零数据训练，成功突破语音翻译难题

楠竹11

20 1 1

ZeroSwot：零数据训练，成功突破语音翻译难题

技术小达人

|

语音技术

三分钟视频｜看懂多情感语音合成模型训练过程

三分钟视频｜看懂多情感语音合成模型训练过程

技术小达人

109 0 0

-开发达人-

|

算法测试技术数据安全/隐私保护

模型进化狂飙，DetectGPT能否识别最新模型生成结果？（2）

模型进化狂飙，DetectGPT能否识别最新模型生成结果？

-开发达人-

97 0 0

-开发达人-

|

机器学习/深度学习人工智能

模型进化狂飙，DetectGPT能否识别最新模型生成结果？（1）

模型进化狂飙，DetectGPT能否识别最新模型生成结果？

-开发达人-

126 0 0

-开发达人-

|

机器学习/深度学习人工智能算法

如何用Transformer分清12位女排运动员？这个「时空双路」框架刷群体行为识别SOTA

如何用Transformer分清12位女排运动员？这个「时空双路」框架刷群体行为识别SOTA

-开发达人-

80 0 0

egptee

语音识别（ASR）基础介绍第二篇——万金油特征MFCC

上一章提到了整个发声与拾音及存储的原理。但是在了解ASR的过程中，发现基本上遇到的资料都避不开MFCC特征。整个ASR的处理流程大致可以分为下图：左侧是经典的处理流程，右侧是近期流行的流程。发生的变化是，将语言模型以下的部分变成端到端的了。我们将语言模型以下的部分统一看成是声学模型就好。而MFCC主要用在左侧的处理流程中，即“特征处

egptee

7127 0 0

-开发达人-

|

机器学习/深度学习存储数据采集

机器学习时代，神经科学家如何阅读和解码人类的思想

作者：Jiying 编辑：Joni 这篇文章围绕机器学习（ML）和功能性磁共振成像（fMRI）的应用问题，以三篇最新的研究型论文为基础，探讨基于统计学中 ML 的 fMRI 分析方法。

-开发达人-

299 0 0

机器学习时代，神经科学家如何阅读和解码人类的思想

热门文章

最新文章

流言终结者- Flutter和RN谁才是更好的跨端开发方案？

PostgreSQL 聚合函数讲解 - 3 总体|样本方差, 标准方差

袋鼠云数据中台专栏（五）：数栈，企业级一站式数据中台PaaS

CentOS7(6.5)升级docker到较新版

利用Serverless Kubernetes和Kaniko快速自动化构建容器镜像

javascript 正则表达式

前 Kubuntu 领袖发起了新的 KDE 项目

关于PLC高速计数器使用

redhat openstack 一些说明

jbpm4.4遇到的问题

《MySQL 入门教程》第 05 篇账户和权限，Java高并发编程详解深入理解pdf

C++|运算符重载（1）|为什么要进行运算符重载

实时计算 Flink版产品使用合集之支持 MySQL 的并行复制吗

Java的前景如何，好不好自学？，万字Java技术类校招面试题汇总

Android中的多线程及AsyncTask的引入，最终入职阿里

实时计算 Flink版产品使用合集之作业原本只配置了采集一张表，现在想增加一张表，这张新增的表将会增量采集还是重新全量采集

es集群安装，邮储银行java面试

实时计算 Flink版产品使用合集之处理数据同步时出现异常，想要在遇到异常时发送邮件通知，如何捕获并处理这些异常

Android 11 中的存储机制更新，面试心得体会

数据结构~缓存淘汰算法--LRU算法（Java的俩种实现方式，万字解析

相关课程

更多

南瓜书《机器学习公式推导》

人机对话技术浅析

【算法实战】1. 机器学习基础

机器学习基础与回归算法

语音识别原理与应用

声纹识别技术

相关电子书

更多

阿里千亿特征深度学习算法XNN实践

知识图谱中推理技术进展及应用

阿里云千亿特征深度学习算法XNN实践

相关实验场景

更多

如何快速体验知识检索增强应用

函数计算部署AI艺术字应用，生成新春文字头像

使用函数计算部署通义千问大模型实现AI对话

使用PAI-DSW x EasyPhoto快速完成AIGC人物写真生成

使用计算巢AI应用，轻松定制个人数字形象

Lindorm AIGC：十分钟搞定智能问答 + 多模态检索

下一篇

2024年阿里云免费云服务器及学生云服务器申请教程参考