程序中的语音实现

简介:

如果在程序中播放语音,该怎么实现呢?(下需代码是在VS2012中实现)


第一个我想到的是用语音文件,可以引用播放器插件到应用中,再调用这些插件的API来实现。

首先创建一个控制台应用,在解决方案中添加引用,选中com选项,找到Windows Media Player,然后添加到引用中,在引用中,这个插件的命名空间是WMPLib。接下来就可以用这个插件来实现语音的播放了。

选来引用加入的命名空间:

using WMPLib;

然后在Main方法中写入

WindowsMediaPlayer player = newWindowsMediaPlayer();//实例化播放器类型

player.URL = "F:/test/a.wma";//把语音文件路径赋给播放器

Console.Read();//暂停程序,不至于退出

用播放器插件实现起来非常简单,其实插件功能还很强大,可能理进一步研究player的成员。


第二个,用vbs脚本文件,首先创建一个记事本文件,打开记事本,在里面写入下面代码:

CreateObject("SAPI.SpVoice").Speak"测试语音文件.",然后保存并把扩展名改为.vbs,这时,文件的图标就发生了变化,然后双击该vbs文件,就会听到语音朗读。

这好像与程序无关,不急,接下来要在C#中,利用IO来处理该文件,并实现对他的调用。

先引入命名空间

using System.IO;

然后生成并调用脚本代码如下:

string path = @"F:/test/a.vbs";//定义脚本路径

string content = "CreateObject(\"SAPI.SpVoice\").Speak\"{0}\"";//定议脚本内容框架

content= string.Format(content, "你好,这是一段测试语音!");//合并生成脚本内容

File.WriteAllText(path,content,Encoding.Default);//把内容写入脚本文件

Process.Start(path);//调用脚本文件

用机器去读语音,是个好主意,但还要生成脚本文件,就显的有些业余了,有没有不生成语音文件的呢,那就是第三种情况。


第三种,用微软的Speech Platform

要开发Microsoft Speech Platform应用,首先要整理好开发环境

需要下载四个文件

1SpeechPlatformRuntime.msi

2MSSpeech_TTS_zh-CN_HuiHui.msi

3MSSpeech_SR_zh-CN_TELE.msi

4MicrosoftSpeechPlatformSDK.msi

文件1的下载地址为:http://www.microsoft.com/en-us/download/details.aspx?id=27225

文件23的下载地址为:http://www.microsoft.com/en-us/download/details.aspx?id=27224

文件4的下载地址为:http://www.microsoft.com/en-us/download/details.aspx?id=27226

这些文件有x86,有64位的,要依自己的OS而定。

下载安装完这些文件后,可以在解决方案中引用安装的SDK,默认安装在C:\Program Files\Microsoft SDKs\Speech\v11.0\Assembly\ Microsoft.Speech.dll(要依据系统的路径确定根目录)

在代码中引用命名空间

usingMicrosoft.Speech.Synthesis;

实现播放语音代码如下:

SpeechSynthesizer ss = newSpeechSynthesizer();//实例化播放语音类型

ss.SetOutputToDefaultAudioDevice();//设置播放语音设备,为当前默认

ss.Volume= 10;//设置音量

ss.Speak("这是一个测试语音!");//读语音

这样就实现了简单的语音而不产生语音文件


后两种基实都是利用了微软的TTS功能来实现的,第三种更为专业一些。


下面简单比较几种方式的优缺点:

播放器插件

vbs

Speech Platform


优点

音质效果好,和语音文件相关。

使用简单。

只需要录入语音文字就可以,语音信息灵活

不需要安装文件

不需要或产生任何文件

语音功能更强大

缺点

需要录制语音,不灵活。

音质死板,单调

需要生成脚本文件

音质死板,单调

需要安装包
















本文转自桂素伟51CTO博客,原文链接:http://blog.51cto.com/axzxs/1243632,如需转载请自行联系原作者







相关文章
|
安全 网络协议 网络安全
网站被攻击了该怎么办?如何恢复网站,如何避免网站被攻击?
网站被攻击了该怎么办?如何恢复网站,如何避免网站被攻击?
|
缓存 并行计算 C++
实践教程|旋转目标检测模型-TensorRT 部署(C++)
实践教程|旋转目标检测模型-TensorRT 部署(C++)
399 0
|
安全 Linux 数据安全/隐私保护
国内外四款强大的远控使用体验:ToDesk、向日葵、AnyDesk、Microsoft 远程桌面横向比较
国内外四款强大的远控使用体验:ToDesk、向日葵、AnyDesk、Microsoft 远程桌面横向比较
2037 0
|
6月前
|
存储 安全 C++
Odoo 安装方式选择:源码安装 vs Docker
Odoo部署常采用源码编译或Docker容器化,但分别面临依赖复杂、版本风险和服务化难题,以及镜像臃肿和扩展受限的问题。Websoft9提出混合方案,融合两者优势:通过智能环境适配、三阶段部署流程(环境预检、混合模式选择、持久化配置)及声明式YAML配置,实现高效、灵活的双模运行时。此方案显著降低依赖冲突解决时间(从83分钟至0),生产环境构建耗时缩短至8分钟,并达100% CVE漏洞修复率,适合ERP定制开发与规模化部署的企业需求。
|
3月前
|
数据采集 监控 安全
拼多多API价格战预警:竞品监控不落人后!
在电商竞争激烈的当下,拼多多凭借低价策略迅速崛起,但也给商家带来定价挑战。本文解析如何利用API技术,构建实时价格预警与竞品监控系统,助力商家在价格战中抢占先机,实现智能调价与策略应对。
359 0
|
6月前
|
前端开发 Java PHP
开发体育赛事直播系统:实现聊天交友的私聊功能技术实现全方案解析
本文基于体育赛事直播系统,详细介绍了用户间私聊功能的完整实现方案。技术栈涵盖后端(PHP ThinkPHP)、前端(Vue.js)、移动端(Android Java、iOS OC),并结合MySQL数据库与WebSocket+Redis实现实时通信。功能包括一对一私聊、聊天记录显示、未读消息提示、消息免打扰、聊天置顶、删除/清空聊天记录等。文章提供了数据结构设计、接口代码示例及前后端关键实现细节,适合开发者学习参考。
|
9月前
|
Dart 前端开发 JavaScript
springboot自动配置原理
Spring Boot 自动配置原理:通过 `@EnableAutoConfiguration` 开启自动配置,扫描 `META-INF/spring.factories` 下的配置类,省去手动编写配置文件。使用 `@ConditionalXXX` 注解判断配置类是否生效,导入对应的 starter 后自动配置生效。通过 `@EnableConfigurationProperties` 加载配置属性,默认值与配置文件中的值结合使用。总结来说,Spring Boot 通过这些机制简化了开发配置流程,提升了开发效率。
193 17
springboot自动配置原理
|
8月前
|
搜索推荐 数据挖掘
优质网络舆情监测系统大盘点
一款出色的网络舆情监测系统,不仅能够助力相关主体迅速捕捉舆情信息,有效应对危机,还能够助力其更好地把握舆论动态,维护自身形象。那么,市场上有哪些比较好的网络舆情监测系统呢?这里,本文有为各位整理了一些好用的舆情检测系统,以供各位参考!
322 0
|
10月前
|
XML 算法 自动驾驶
使用URDF和Xacro构建差速轮式机器人模型
前言 本篇文章介绍的是ROS高效进阶内容,使用URDF 语言(xml格式)做一个差速轮式机器人模型,并使用URDF的增强版xacro,对机器人模型文件进行二次优化。 差速轮式机器人:两轮差速底盘由两个动力轮位于底盘左右两侧,两轮独立控制速度,通过给定不同速度实现底盘转向控制。一般会配有一到两个辅助支撑的万向轮。 此次建模,不引入算法,只是把机器人模型的样子做出来,所以只使用 rivz 进行可视化显示。 机器人的定义和构成 机器人定义:机器人是一种自动化的机器,所不同的是这种机器具备一些与人或生物相似的智能能力,如感知能力、规划能力、动作能力和协同能力,是一种具有高级灵活性的自动化机器
283 15
|
机器学习/深度学习 人工智能 自然语言处理
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践(Python3.10)
诸公可知目前最牛逼的TTS免费开源项目是哪一个?没错,是Bert-vits2,没有之一。它是在本来已经极其强大的Vits项目中融入了Bert大模型,基本上解决了VITS的语气韵律问题,在效果非常出色的情况下训练的成本开销普通人也完全可以接受。
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践(Python3.10)