PHP对接百度语音识别技术

简介: PHP对接百度语音识别技术

引言

在目前的各种应用场景中,语音识别技术已经越来越常用,并且其应用场景正在不断扩大。

百度提供的语音识别服务允许用户通过简单的接口调用,将语音内容转换为文本。

本文将通过PHP语言集成百度的语音识别服务,并分享一些实施过程中的技巧和需要注意的问题。

准备工作

1.注册百度开放平台账号

在百度官网open.baidu.com/ 注册一个账号

2.创建应用并获取API Key和Secret Key

注册完毕后,登录百度开放平台;

点击左侧菜单栏中的"AI开放平台";

然后选择"语音技术",再选择"语音识别"。

在语音识别页面中,点击"创建应用",填写相关信息并提交。

创建成功后,我们可以在应用管理页面中获得API Key和Secret Key;

这两个密钥将在后续中使用。

image.png

3.运行命令安装Laravel框架百度平台扩展包

composer require zhangyu-cq/laravel-baidu-aip

发布配置

php artisan vendor:publish --provider="ZhangyuCq\LaravelBaiduAip\BaiduAipServiceProvider"

配置对应的密钥

return [
        'app_id' => env('BAIDU_APP_ID',''),
        'app_key' => env('BAIDU_APP_KEY',''),
        'app_secret' => env('BAIDU_APP_SECRET','')
    ];

封装百度语音识别接口

百度语音转文字

public function asrChar(Request $request)
    {
        $this->validate($request, [
            'file' => 'required',
        ]);
        $file = $request->file('file');
        $name = $file->getClientOriginalName();
        $file_info = pathinfo($name);
        $file = file_get_contents($file);
        $data = AipSpeech::asr($file, $file_info['extension'], 16000, ['dev_pid' => 1537]);
        if ($data['err_no'] == 0) {
            $text = $data['result'][0];
            echo $text;
        } else {
            echo '转译失败:'.$data['err_msg'];
        }
    }

百度文字转语音

public function synthesis(Request $request)
    {
        $this->validate($request, [
            'content' => 'required',
        ]);
        $content = $request->get('content');
        $data = AipSpeech::synthesis($content, 'zh', 1, array(
            'vol' => 5,
        ));
        $time = date('YmdHis') . rand(111111, 999999);
        //设置上传到哪个目录下
        $path = '/uploads/synthesis';
        $file_name = "/$time.mp3";
        //没有则创建
        if (!file_exists(public_path() . $path)) {
            mkdir(public_path() . $path, 0755, true);
        }
        file_put_contents(public_path() . $path . $file_name, $data);
        echo '文件路径如下:'.$path . $file_name;
    }

踩坑日记

百度语音识别接口对音频文件有特定的要求:它仅接受16KHz采样率的wav格式文件。

如果需要识别的音频文件不符合这些要求,必须先转换成合适的格式和采样率。

此外,接口对音频的长度也有限制,单次识别不能超过60秒,因此长音频需要被分割成多个短片段。

在使用接口时,还需要注意错误处理:

通过检查返回结果中的err_no来判断识别是否成功,并根据err_msg字段来处理识别失败的情况。

结论

我们已经能够成功地集成PHP与百度语音识别接口,并根据接口返回的数据执行相应的操作。

在实际的开发过程中,我们还可以进一步扩展功能,例如实现实时的语音识别服务或语音合成技术,以满足更广泛的业务需求。


相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
23天前
|
缓存 程序员 PHP
为什么说 Swoole 是 PHP 程序员技术水平的分水岭?
【9月更文挑战第8天】Swoole 被视为 PHP 程序员技术水平的分水岭,因为它要求程序员深入理解底层原理(如网络编程、异步和并发模型),具备性能优化能力(如高效服务器开发、数据库连接池管理),拥有架构设计能力(如微服务架构、项目复杂度管理),并具备持续学习和自我提升意识。熟练掌握 Swoole 的程序员在技术能力和综合素质方面更具优势。
|
19天前
|
缓存 NoSQL PHP
使用PHP-redis实现键空间通知监听key失效事件的技术与代码示例
通过上述方法,你可以有效地在PHP中使用Redis来监听键空间通知,特别是针对键失效事件。这可以帮助你更好地管理缓存策略,及时响应键的变化。
53 3
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
PHP编程中的面向对象基础利用AI技术提升文本分类效率
【8月更文挑战第28天】在PHP的编程世界中,面向对象编程(OOP)是一块基石,它不仅塑造了代码的结构,也影响了开发者的思考方式。本文将深入探讨PHP中面向对象的基础概念,通过浅显易懂的语言和生动的比喻,带领初学者步入这个充满魅力的世界。我们将一起探索类与对象的秘密,理解构造函数和析构函数的重要性,以及继承和多态性的魔法。准备好了吗?让我们开始这段激动人心的旅程!
|
3月前
|
设计模式 安全 关系型数据库
PHP开发涉及一系列步骤和技术
【7月更文挑战第2天】PHP开发涉及一系列步骤和技术
131 57
|
25天前
|
缓存 网络协议 程序员
为什么说 Swoole 是 PHP 程序员技术水平的分水岭?
【9月更文挑战第7天】Swoole 因其异步非阻塞编程模式、高性能服务器开发能力、性能优化工具及拓展技术视野等特点,被视为 PHP 程序员技术水平的分水岭。它要求程序员掌握异步编程、协程、网络协议等知识,并具备性能优化和系统管理能力,从而全面提升技术水平。
|
25天前
|
消息中间件 NoSQL Go
PHP转Go系列 | ThinkPHP与Gin框架之Redis延时消息队列技术实践
【9月更文挑战第7天】在从 PHP 的 ThinkPHP 框架迁移到 Go 的 Gin 框架时,涉及 Redis 延时消息队列的技术实践主要包括:理解延时消息队列概念,其能在特定时间处理消息,适用于定时任务等场景;在 ThinkPHP 中使用 Redis 实现延时队列;在 Gin 中结合 Go 的 Redis 客户端库实现类似功能;Go 具有更高性能和简洁性,适合处理大量消息。迁移过程中需考虑业务需求及系统稳定性。
|
2月前
|
机器学习/深度学习 人工智能 语音技术
使用深度学习进行语音识别:技术探索与实践
【8月更文挑战第12天】深度学习技术的快速发展为语音识别领域带来了革命性的变化。通过不断优化模型架构和算法,我们可以期待更加准确、高效和智能的语音识别系统的出现。未来,随着技术的不断进步和应用场景的不断拓展,语音识别技术将在更多领域发挥重要作用,为人类带来更加便捷和智能的生活体验。
|
2月前
|
人工智能 算法 人机交互
FunAudioLLM技术深度测评:重塑语音交互的未来
在人工智能的浪潮中,语音技术作为人机交互的重要桥梁,正以前所未有的速度发展。近期,FunAudioLLM以其独特的魅力吸引了业界的广泛关注。本文将以SenseVoice大模型为例,深入探索FunAudioLLM在性能、功能及技术先进性方面的表现,并与国际知名语音大模型进行对比分析,同时邀请各位开发者共同参与,为开源项目贡献一份力量。
62 4
|
2月前
|
安全 中间件 网络安全
深入浅出PHP框架之Laravel的优雅云计算与网络安全:探索云服务、网络安全和信息安全的技术领域
【8月更文挑战第29天】在编程的世界里,PHP以其灵活性和易用性广受欢迎。本文将深入探讨PHP的一个流行框架——Laravel,揭示它如何以简洁、高雅的解决方案满足复杂的开发需求。我们将一起走进Laravel的世界,探索其背后的哲学,以及它如何让代码变得更加动人和富有韵律。
|
2月前
|
SQL 安全 PHP
探寻PHP的现代演进之路:从Web开发到框架创新——揭秘PHP语言如何引领技术潮流
【8月更文挑战第2天】探索PHP的现代演进:从Web开发到框架创新
47 1
下一篇
无影云桌面