Azure人工智能认知服务实验
Azure认知服务(语音合成产品系列)是微软云服务里面的明星产品,基于行业领先的Hifi-net语音模型打造,可以提供高质量神经网络版声音,发音更准确、韵律更自然、高保真并支持多种风格情感自然切换,该项产品已落地在各大媒体、短视频平台,以及智能汽车、智能手机与设备等诸多领域。
认知服务让每个开发人员都能使用 AI,而无需机器学习专业知识。只需 API 调用,即可将查看、收听、朗读、搜索、理解和加速决策的功能嵌入到应用中。
一、计算机视觉
参考链接:什么是计算机视觉?
Ⅰ、图像分析
参考链接:什么是图像分析?
计算机视觉图像分析服务可以从图像中提取各种视觉特征。 例如,该服务可以确定图像是否包含成人内容、查找特定的品牌或对象,或查找人脸。
实验操作步骤
:
1、在Azure上创建Computer Vison API。点击“认知服务”进行创建。
2、找到“计算机视觉”,点击“创建”。
3、若事前未新建资源组。在这里点击“新建”。
4、输入要创建新的资源组的名称。
5、选择实例所在的区域,以及要创建的名称。
6、下拉到底部,勾选许可条框。
7、配置虚拟网络信息。根据需要自行更改设置。
8、点击“查看+创建”。
9、验证通过,点击“创建”。
10、等待部署完成。
11、部署完成。点击“转到资源”。
12、查看相关信息。
13、点击“单击此处管理密钥”。
14、打开API参考链接。
15、选择“打开API测试控制台”。
16、使用示例测试展现效果。
本文演示如何调用图像分析 API 以返回有关图像的视觉特征的信息。
(1)特征选择:Categories(类别)
csp-billing-usage: CognitiveServices.ComputerVision.Categories=1,CognitiveServices.ComputerVision.Landmarks=1,CognitiveServices.ComputerVision.Transaction=1 x-envoy-upstream-service-time: 16354 apim-request-id: 6b83e60b-81aa-4fd7-abd4-bef0892f389d Strict-Transport-Security: max-age=31536000; includeSubDomains; preload x-content-type-options: nosniff Date: Fri, 22 Oct 2021 16:31:12 GMT Content-Length: 260 Content-Type: application/json; charset=utf-8 { "categories": [{ "name": "building_street", "score": 0.40234375, "detail": { "landmarks": [] } }, { "name": "outdoor_", "score": 0.00390625, "detail": { "landmarks": [] } }], "requestId": "6b83e60b-81aa-4fd7-abd4-bef0892f389d", "metadata": { "height": 4224, "width": 5632, "format": "Jpeg" } }
(2)特征选择:Description(描述)
csp-billing-usage: CognitiveServices.ComputerVision.Description=1,CognitiveServices.ComputerVision.Landmarks=1,CognitiveServices.ComputerVision.Transaction=1 x-envoy-upstream-service-time: 12654 apim-request-id: b4c07513-3b10-40b9-858b-d5dc525d5d0b Strict-Transport-Security: max-age=31536000; includeSubDomains; preload x-content-type-options: nosniff Date: Fri, 22 Oct 2021 16:35:57 GMT Content-Length: 591 Content-Type: application/json; charset=utf-8 { "categories": [{ "name": "建筑_街道", "score": 0.40234375, "detail": { "landmarks": [] } }, { "name": "户外_", "score": 0.00390625, "detail": { "landmarks": [] } }], "description": { "tags": ["户外", "草", "城市", "大", "体育", "田地", "男人", "站", "球", "绿色", "播放器", "橙子", "公园", "阴天", "空气", "飞行", "轨道", "骑", "飞机", "水", "火车", "街道", "人们", "播放", "院子", "风筝", "蓝色", "巴士"], "captions": [{ "text": "城市的风景", "confidence": 0.6212207909539402 }] }, "requestId": "b4c07513-3b10-40b9-858b-d5dc525d5d0b", "metadata": { "height": 4224, "width": 5632, "format": "Jpeg" } }