8、获取人脸特性。
若要提取人脸属性,请再次调用检测 API,但将 detectionModel 设置为 detection_01。 同时,添加 returnFaceAttributes 查询参数。 该命令现在应如下所示。 与之前一样,请插入你的人脸订阅密钥和终结点。
[ { "faceId": "3307d715-c326-4c11-98a4-f46ce9ab9ad3", "faceRectangle": { "top": 78, "left": 57, "width": 55, "height": 55 }, "faceAttributes": { "smile": 0.751, "headPose": { "pitch": 7.1, "roll": 7.2, "yaw": -18.3 }, "gender": "female", "age": 22.0, "facialHair": { "moustache": 0.0, "beard": 0.0, "sideburns": 0.0 }, "glasses": "NoGlasses", "emotion": { "anger": 0.0, "contempt": 0.001, "disgust": 0.002, "fear": 0.002, "happiness": 0.751, "neutral": 0.022, "sadness": 0.22, "surprise": 0.001 }, "blur": { "blurLevel": "high", "value": 1.0 }, "exposure": { "exposureLevel": "overExposure", "value": 1.0 }, "noise": { "noiseLevel": "low", "value": 0.0 }, "makeup": { "eyeMakeup": true, "lipMakeup": true }, "accessories": [], "occlusion": { "foreheadOccluded": false, "eyeOccluded": false, "mouthOccluded": false }, "hair": { "bald": 0.05, "invisible": false, "hairColor": [ { "color": "black", "confidence": 1.0 }, { "color": "brown", "confidence": 0.79 }, { "color": "other", "confidence": 0.47 }, { "color": "gray", "confidence": 0.17 }, { "color": "blond", "confidence": 0.07 }, { "color": "red", "confidence": 0.05 }, { "color": "white", "confidence": 0.0 } ] } } } ]
二、认知搜索
参考链接:Azure认知搜索是什么?
Azure 认知搜索(以前称为“Azure 搜索”)是一个云搜索服务,它为开发人员提供基础结构、API 和工具,用于基于 Web、移动和企业应用程序中的专用异类内容构建丰富的搜索体验。
搜索是任何向用户展示文本内容的应用的基础,其常见方案包括目录或文档搜索、在线零售或数据科学知识挖掘等。
Ⅰ、在 Azure 门户中创建 Azure 认知搜索索引
前提条件:
- 具有活动订阅的 Azure 帐户。
- Azure 认知搜索服务(任意层,任意区域)。可以使用本快速入门的免费服务。
1、创建认知搜索服务。
2、点击“更改定价层”,选择免费层。
3、点击“查看+创建”。
4、部署完成。转到资源。
Ⅱ、创建索引并加载数据
1、启动“导入数据”向导和创建数据源。
这里选择导入数据源的类型为“示例”。
2、选择“跳到:自定义目标索引”。
3、配置索引。
对于内置的酒店示例索引,系统会为你定义一个默认的索引架构。 除了一些高级筛选器示例之外,针对酒店示例索引的文档和示例中的查询将会根据此索引定义运行:
保持默认,继续下一页操作。
4、配置索引器。
查看索引器。
查看索引。
查看数据源。
5、使用搜索浏览器查询。
参考链接:使用搜索浏览器查询
在“索引”下拉列表中,选择“hotels-sample-index”。 单击“API 版本”下拉列表,查看有哪些 REST API 可用。 对于以下查询,请使用正式发行版 (2020-06-30)。
在搜索栏中粘贴以下查询字符串,并单击“搜索”。
search=beach&$filter=Rating gt 4&$count=true
- 自由文本搜索
Seattle apartment "Lake Washington" miele OR thermador appliance
- 匹配文档字数
6、查询示例。
参考链接:查询示例
提供 top N 结果的简单查询
- 字符串查询
search=spa
- 筛选查询
- search=beach&$filter=Rating gt 4
- 分面查询
- 突出显示搜索结果
- 试用模糊查询
- 查实地理空间搜索
三、语音服务
参考官方链接:什么是语音服务?
语音服务在单个 Azure 订阅中统合了语音转文本、文本转语音以及语音翻译功能。 使用语音 CLI、语音 SDK、语音设备 SDK、Speech Studio 或 REST API 可以轻松在应用程序、工具和设备中启用语音。
Ⅰ、创建语音服务
1、创建语音服务
2、部署完成。
3、查看密钥以及终结点。
Ⅱ、语音转文本——REST API
参考链接:语音转文本 REST API
语音转文本有两个不同的 REST API。 每个 API 都有其特殊用途,并使用不同的终结点集。
1、构建http请求的注意事项:
- 音频格式
在 HTTP POST请求的正文中发送音频。 它必须采用下表中的格式之一:
格式 | 编解码器 | 比特率 | 采样率 |
WAV | PCM | 256 kbps | 16 kHz,单声道 |
OGG | OPUS | 256 kpbs | 16 kHz,单声道 |
- 请求标头
该表列出了语音转文本请求的必需和可选标头。
标头 | 说明 | 必需/可选 |
Ocp-Apim-Subscription-Key | 语音服务订阅密钥。 | 此标头或 Authorization 是必需的。 |
Authorization | 前面带有单词Bearer`的授权令牌。 | 此标头或 Ocp-Apim-Subscription-Key是必需的。 |
Pronunciation-Assessment | 指定用于在识别结果中显示发音分数的参数,这些参数评估语音输入的发音质量,并具有准确性、流畅性、完整性等指标。此参数是 Base64 编码的 json,其中包含多个详细的参数。 | 可选 |
Content-type | 描述所提供音频数据的格式和编解码器。 接受的值为 audio/wav; codecs=audio/pcm; samplerate=16000 和 audio/ogg; codecs=opus。 | 必需 |
Transfer-Encoding | 指定要发送分块的音频数据,而不是单个文件。 仅当要对音频数据进行分块时才使用此标头。 | 可选 |
Expect | 如果使用分块传输,则发送 Expect: 100-continue。 语音服务将确认初始请求并等待附加的数据。 | 如果发送分块的音频数据,则是必需的。 |
Accept | 如果提供此标头,则值必须是 application/json。 语音服务以 JSON 格式提供结果。 某些请求框架提供不兼容的默认值。 最好始终包含 Accept。 | 可选,但建议提供。 |
2、获取访问令牌——postman
使用Postman获取Token 参考如下:
若要获取访问令牌,需使用 Ocp-Apim-Subscription-Key 和订阅密钥向 issueToken 终结点发出请求。
issueToken 终结点具有以下格式:
https://<REGION_IDENTIFIER>.api.cognitive.azure.cn/sts/v1.0/issueToken
将 <REGION_IDENTIFIER>替换为与下表中的订阅区域匹配的标识符:
地理位置 | 区域 | 区域标识符 |
中国 | 中国东部 2 | chinaeast2 |
中国 | 中国北部 2 | chinanorth2 |
3、post请求https如下。具体参数说明如下。
https://chinaeast2.stt.speech.azure.cn/speech/recognition/conversation/cognitiveservices/v1?initialSilenceTimeoutMs=15000&language=zh-CN
适用于短音频的 REST API 的终结点具有以下格式:
https://<REGION_IDENTIFIER>.stt.speech.azure.cn/speech/recognition/conversation/cognitiveservices/v1
将 <REGION_IDENTIFIER>替换为与下表中的订阅区域匹配的标识符:
地理位置 | 区域 | 区域标识符 |
中国 | 中国东部 2 | chinaeast2 |
中国 | 中国北部 2 | chinanorth2 |
- InitialSilenceTimeout——音频流的开始仅包含静音,并且服务在等待语音时超时。(此标头或 Authorization 是必需的)
- language——标识所要识别的口语。(必需)
4、查询参数以及请求标头内容如下。
5、请求标头设置如下。
6、上传音频并成功地将语音内容转化成文本内容。如图所示。
Ⅲ、以SDK的方式将语音文件转换成文本(Python示例)
参考链接:语音转文本入门
四、自定义视觉
参考官方链接:什么是自定义视觉?
Azure 自定义视觉是一种图像识别服务,可用于构建、部署和改进你自己的图像标识符模型。 图像标识符根据其检测到的视觉特征将标签(表示分类或对象)应用于图像。 与计算机视觉服务不同,自定义视觉允许你指定自己的标签并训练自定义模型以对其进行检测。