【微软 Azure 认知服务】零基础搭建微软 Azure AI 认知服务实验分享(下)

简介: 【微软 Azure 认知服务】零基础搭建微软 Azure AI 认知服务实验分享

8、获取人脸特性。


若要提取人脸属性,请再次调用检测 API,但将 detectionModel 设置为 detection_01。 同时,添加 returnFaceAttributes 查询参数。 该命令现在应如下所示。 与之前一样,请插入你的人脸订阅密钥和终结点。



[
    {
        "faceId": "3307d715-c326-4c11-98a4-f46ce9ab9ad3",
        "faceRectangle": {
            "top": 78,
            "left": 57,
            "width": 55,
            "height": 55
        },
        "faceAttributes": {
            "smile": 0.751,
            "headPose": {
                "pitch": 7.1,
                "roll": 7.2,
                "yaw": -18.3
            },
            "gender": "female",
            "age": 22.0,
            "facialHair": {
                "moustache": 0.0,
                "beard": 0.0,
                "sideburns": 0.0
            },
            "glasses": "NoGlasses",
            "emotion": {
                "anger": 0.0,
                "contempt": 0.001,
                "disgust": 0.002,
                "fear": 0.002,
                "happiness": 0.751,
                "neutral": 0.022,
                "sadness": 0.22,
                "surprise": 0.001
            },
            "blur": {
                "blurLevel": "high",
                "value": 1.0
            },
            "exposure": {
                "exposureLevel": "overExposure",
                "value": 1.0
            },
            "noise": {
                "noiseLevel": "low",
                "value": 0.0
            },
            "makeup": {
                "eyeMakeup": true,
                "lipMakeup": true
            },
            "accessories": [],
            "occlusion": {
                "foreheadOccluded": false,
                "eyeOccluded": false,
                "mouthOccluded": false
            },
            "hair": {
                "bald": 0.05,
                "invisible": false,
                "hairColor": [
                    {
                        "color": "black",
                        "confidence": 1.0
                    },
                    {
                        "color": "brown",
                        "confidence": 0.79
                    },
                    {
                        "color": "other",
                        "confidence": 0.47
                    },
                    {
                        "color": "gray",
                        "confidence": 0.17
                    },
                    {
                        "color": "blond",
                        "confidence": 0.07
                    },
                    {
                        "color": "red",
                        "confidence": 0.05
                    },
                    {
                        "color": "white",
                        "confidence": 0.0
                    }
                ]
            }
        }
    }
]


二、认知搜索


参考链接:Azure认知搜索是什么?


Azure 认知搜索(以前称为“Azure 搜索”)是一个云搜索服务,它为开发人员提供基础结构、API 和工具,用于基于 Web、移动和企业应用程序中的专用异类内容构建丰富的搜索体验。


搜索是任何向用户展示文本内容的应用的基础,其常见方案包括目录或文档搜索、在线零售或数据科学知识挖掘等。



Ⅰ、在 Azure 门户中创建 Azure 认知搜索索引


前提条件:


  • 具有活动订阅的 Azure 帐户。


  • Azure 认知搜索服务(任意层,任意区域)。可以使用本快速入门的免费服务。


1、创建认知搜索服务。



2、点击“更改定价层”,选择免费层。



3、点击“查看+创建”。



4、部署完成。转到资源。




Ⅱ、创建索引并加载数据


1、启动“导入数据”向导和创建数据源。


这里选择导入数据源的类型为“示例”。





2、选择“跳到:自定义目标索引”。



3、配置索引。


对于内置的酒店示例索引,系统会为你定义一个默认的索引架构。 除了一些高级筛选器示例之外,针对酒店示例索引的文档和示例中的查询将会根据此索引定义运行:




保持默认,继续下一页操作。


4、配置索引器。



查看索引器。



查看索引。



查看数据源。




5、使用搜索浏览器查询。


参考链接:使用搜索浏览器查询



在“索引”下拉列表中,选择“hotels-sample-index”。 单击“API 版本”下拉列表,查看有哪些 REST API 可用。 对于以下查询,请使用正式发行版 (2020-06-30)。


在搜索栏中粘贴以下查询字符串,并单击“搜索”。


search=beach&$filter=Rating gt 4&$count=true



  • 自由文本搜索


Seattle apartment "Lake Washington" miele OR thermador appliance



  • 匹配文档字数



6、查询示例。


参考链接:查询示例


提供 top N 结果的简单查询


  • 字符串查询


search=spa



  • 筛选查询


  • search=beach&$filter=Rating gt 4



  • 分面查询


  • 突出显示搜索结果


  • 试用模糊查询


  • 查实地理空间搜索


三、语音服务


参考官方链接:什么是语音服务?


语音服务在单个 Azure 订阅中统合了语音转文本、文本转语音以及语音翻译功能。 使用语音 CLI语音 SDK语音设备 SDKSpeech StudioREST API 可以轻松在应用程序、工具和设备中启用语音。


Ⅰ、创建语音服务


1、创建语音服务




2、部署完成。





3、查看密钥以及终结点。



Ⅱ、语音转文本——REST API


参考链接:语音转文本 REST API


语音转文本有两个不同的 REST API。 每个 API 都有其特殊用途,并使用不同的终结点集。


1、构建http请求的注意事项:


  • 音频格式


在 HTTP POST请求的正文中发送音频。 它必须采用下表中的格式之一:


格式 编解码器 比特率 采样率
WAV PCM 256 kbps 16 kHz,单声道
OGG OPUS 256 kpbs 16 kHz,单声道


  • 请求标头


该表列出了语音转文本请求的必需和可选标头。


标头 说明 必需/可选
Ocp-Apim-Subscription-Key 语音服务订阅密钥。 此标头或 Authorization 是必需的。
Authorization 前面带有单词Bearer`的授权令牌。 此标头或 Ocp-Apim-Subscription-Key是必需的。
Pronunciation-Assessment 指定用于在识别结果中显示发音分数的参数,这些参数评估语音输入的发音质量,并具有准确性、流畅性、完整性等指标。此参数是 Base64 编码的 json,其中包含多个详细的参数。 可选
Content-type 描述所提供音频数据的格式和编解码器。 接受的值为 audio/wav; codecs=audio/pcm; samplerate=16000 和 audio/ogg; codecs=opus。 必需
Transfer-Encoding 指定要发送分块的音频数据,而不是单个文件。 仅当要对音频数据进行分块时才使用此标头。 可选
Expect 如果使用分块传输,则发送 Expect: 100-continue。 语音服务将确认初始请求并等待附加的数据。 如果发送分块的音频数据,则是必需的。
Accept 如果提供此标头,则值必须是 application/json。 语音服务以 JSON 格式提供结果。 某些请求框架提供不兼容的默认值。 最好始终包含 Accept。 可选,但建议提供。


2、获取访问令牌——postman


使用Postman获取Token 参考如下:


若要获取访问令牌,需使用 Ocp-Apim-Subscription-Key 和订阅密钥向 issueToken 终结点发出请求。


issueToken 终结点具有以下格式:


https://<REGION_IDENTIFIER>.api.cognitive.azure.cn/sts/v1.0/issueToken


将 <REGION_IDENTIFIER>替换为与下表中的订阅区域匹配的标识符:


地理位置 区域 区域标识符
中国 中国东部 2 chinaeast2
中国 中国北部 2 chinanorth2



3、post请求https如下。具体参数说明如下。


https://chinaeast2.stt.speech.azure.cn/speech/recognition/conversation/cognitiveservices/v1?initialSilenceTimeoutMs=15000&language=zh-CN


适用于短音频的 REST API 的终结点具有以下格式:


https://<REGION_IDENTIFIER>.stt.speech.azure.cn/speech/recognition/conversation/cognitiveservices/v1


将 <REGION_IDENTIFIER>替换为与下表中的订阅区域匹配的标识符:


地理位置 区域 区域标识符
中国 中国东部 2 chinaeast2
中国 中国北部 2 chinanorth2


  • InitialSilenceTimeout——音频流的开始仅包含静音,并且服务在等待语音时超时。(此标头或 Authorization 是必需的)


  • language——标识所要识别的口语。(必需)


4、查询参数以及请求标头内容如下。



5、请求标头设置如下。



6、上传音频并成功地将语音内容转化成文本内容。如图所示。



Ⅲ、以SDK的方式将语音文件转换成文本(Python示例)


参考链接:语音转文本入门


四、自定义视觉


参考官方链接:什么是自定义视觉?


Azure 自定义视觉是一种图像识别服务,可用于构建、部署和改进你自己的图像标识符模型。 图像标识符根据其检测到的视觉特征将标签(表示分类或对象)应用于图像。 与计算机视觉服务不同,自定义视觉允许你指定自己的标签并训练自定义模型以对其进行检测。

相关文章
|
3月前
|
人工智能 自然语言处理 安全
用AI重构人机关系,OPPO智慧服务带来了更“懂你”的体验
OPPO在2025开发者大会上展现智慧服务新范式:通过大模型与意图识别技术,构建全场景入口矩阵,实现“服务找人”。打通负一屏、小布助手等系统级入口,让服务主动触达用户;为开发者提供统一意图标准、一站式平台与安全准则,降低适配成本,共建开放生态。
360 31
|
3月前
|
人工智能 供应链 搜索推荐
拔俗AI 智能就业咨询服务平台:求职者的导航,企业的招聘滤网
AI智能就业平台破解求职招聘困局:精准匹配求职者、企业与高校,打破信息壁垒。简历诊断、岗位推荐、技能提升一站式服务,让就业更高效。
|
3月前
|
人工智能 Cloud Native 自然语言处理
拔俗AI智能体服务开发:你的7x24小时数字员工,让企业效率飙升的秘密武器
在“人效为王”时代,企业面临服务响应慢、成本高、协同难等痛点。阿里云AI智能体以自主决策、多模态交互、持续学习三大引擎,打造永不疲倦的“数字员工”,实现7×24小时高效服务,助力企业降本增效、驱动创新增长。(238字)
|
3月前
|
人工智能 供应链 算法
AI 产业服务平台:打造产业智能化的“加速器”与“连接器”
AI产业服务平台整合技术、数据、算力与人才,为中小企业提供低门槛、一站式AI赋能服务,覆盖研发、生产、营销、管理全链条,助力产业智能化转型。
|
3月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
715 48
|
4月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1030 54
|
3月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
499 30
|
3月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
479 1
|
3月前
|
消息中间件 人工智能 安全
构建企业级 AI 应用:为什么我们需要 AI 中间件?
阿里云发布AI中间件,涵盖AgentScope-Java、AI MQ、Higress、Nacos及可观测体系,全面开源核心技术,助力企业构建分布式多Agent架构,推动AI原生应用规模化落地。
362 0
构建企业级 AI 应用:为什么我们需要 AI 中间件?
|
3月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。