开发者学堂课程【高校精品课-河海大学-云计算技术与应用:云计算人工智能服务(阿里)】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/9/detail/15878
云计算人工智能服务(阿里)
内容介绍:
一、阿里云人工智能服务-智能语音交互
二、阿里云人工智能服务-内容安全
三、阿里云人工智能服务-印刷文字识别
四、阿里云人工智能服务-自然语言处理
五、阿里云人工智能服务-机器学习 PAI
六、阿里云人工智能服务-机器学习 PAI 优势
七、阿里云人工智能服务-机器学习 PAI 产品架构
一、阿里云人工智能服务-智能语音交互
前面介绍了人工智能及服务的提出背景以及国际主流的云厂商 IBMcloud 以及亚马逊的 AWS、微软提供的云计算人工智能服务。本讲简单介绍中国主流云平台阿里云提供的人工智能服务。
阿里云人工智能服务的网站链接为:https://ai.aliyun.com/,可以看到阿里云提供的大部分人工智能服务。
阿里云的口号是数据更智能,业务才能更智能,可以看出像亚马逊的 AWS 和微软的 asian 一样,阿里云提供了智能语音交互、人脸识别、图像识别、图像搜索、内容安全、印刷字体识别、自然语言处理、机器翻译、机器学习 PAI 、大数据计算、大数据搜素与分析、数据开发、数据可视化、大数据应用等等。
下面简单介绍几种有特色功能。
主要提供以下服务:录音文件识别,提供的是将语音转写成文字的服务。
实时语音转录,对音频流做实时转写,达到“边说边出文字”的效果。一句话识别,对时长较短(一分钟以内)的语音进行转写。语音合成:语音合成服务(TTS)就是将文本转成语音的服务。语音合成声音定制,为企业提供深度定制TTS声音的能力。语言模型自学习工具,通过文本数据自学习训练语音模型,以达到定制效果。
二、阿里云人工智能服务-内容安全
内容安全主要提供以下服务:图片涉黄,图片涉政暴恐识别,图片 LOGO 商标检测:精准识别图片、直播画面和视频中出现的各种 logo,图片垃圾广告识别:通过判断图片中文字是否经过后期处理来有效识别广告图片,图片不良场景识别,图片风险人物识别,视频风险内容识别,文本反垃圾识别,语音垃圾识别,这些功能特别适合信息安全领域当中对内容审核的时候使用。
三、阿里云人工智能服务-印刷文字识别
印刷文字识别主要提供以下服务:通用型卡证类、汽车相关识别、行业票据识别、资产类识别、通用文字识别、行业类文档识别、视频类文字识别、自定义模板识别。这些功能特别适合电子商务、金融领域使用。
四、阿里云人工智能服务-自然语言处理
自然语言处理主要提供以下服务:NLP 自学习平台、多语言分词、词性标注、命名实体、情感分析、中心词提取、智能文本分类、文本信息抽取、商品评价解析。这些功能与其他云平台非常相似
五、阿里云人工智能服务-机器学习 PAI
阿里云人工智能服务机器服务 PAI 是重点要学习的,它是 Platform of Artificial Intelligence 的简称,是阿里云提供的人工智能学习平台,为传统机器学习和深度学习提供了从数据处理、模型训练、服务部署到预测的一站式服务。提供了构建在阿里云 MaxCompute 计算平台之上,集数据处理、建模、离线预测、在线预测为一体的机器学习平台。阿里云机器学习封装了阿里巴巴集团内成熟的算法,向机器学习用户提供了更简易的操作体验,真正做到让人工智能触手可及。详细的介绍可以看阿里云提供的介绍视频:https://cloud.video.taobao.com/play/u/3246756297/p/1/e/6/t/1/218463193120.mp4。
视频内容如下:
PAI-一款云端机器学习工具,包含 PAI-STUDIO、PAI-DSW、PAI-EAS,PAI-STUDIO 通过封装机器学习算法组件,无需编写代码直接通过拖拽的方式快速搭建实验,使得机器学习算法门槛大大降低,一个商品推荐的实验搭建只需要5分钟即可实现。内置的算法组件都经受过阿里巴巴集团EP级别数据的锤炼支持百亿特征、千亿样本的超大规模矩阵训练。PAI-DSW 一款云端高效交互式机器学习代码开发工具,内含PAI团队深度优化的深度学习框架以及高性能的 GPU 计算引擎,同时提供资源可视化,自定义安装算法包等建模服务。从执行效率以及开发效率两方面加速机器学习开发。PAI-EAS 一款模型服务工具,无论 PAI-STUDIO 或 PAI-DSW 常规机器学习模型或深度学习模型,一键部署到EAS上形成 Restful 服务打通 PAI 生成的模型与用自身业务。PAI 自2016年上线以来已经服务了超过5万的个人开发者以及企业用户,被国际权威机构评为国内领先的云端机器学习平台工具。
六、阿里云人工智能服务-机器学习 PAI 优势
接下来学习阿里云 PAI 的优势,首先是良好的交互设计,通过对底层分布式算法的封装提供托拉拽的可视化环境,让数据挖掘的可视化过程像搭积木一样简单,缩短了与数据的距离,真正的实现了数据的触手可及。同时提供了命令行工具,方便将算法嵌入到工程中,下图当中给出了可视化环境的界面。
其次是优质、丰富的机器学习算法,图中给出了 PAI 提供的丰富的算法,这些算法都是经过阿里大规模业务锤炼而成的,从算法的丰富性角度来看,阿里云机器学习平台不仅提供了基础的聚类、回归等机器学习的算法,也提供了文本分析、特征处理等比较复杂的算法。
再次是 PAI 与阿里产品完美的配合,如下图可以看出使用阿里云机器学习平台计算模型直接存储在 MaxCompute 上,可以配合其他阿里云产品的组建加以利用,还有很多优势就不再进行介绍。可以参考阿里云提供的 PAI 文档.
七、阿里云人工智能服务-机器学习 PAI 产品架构
图中给出了 PAI 的产品架构,可以看出产品有四层主层,最下面的层是基础设施层即 CPU 计算集群。
其次是计算框架层包括 SQL、MapReduce、MPI 等计算的方式。分布式计算架构主要执行并行化计算分发任务。
在上面是模型与算法层包含数据与处理,特征工程、机器学习算法等基本的组件。所以算法组件全部脱胎于阿里巴巴内部成熟的算法体系,并且经受过 PB 级业务数据的锤炼。最上面的是业务应用层,阿里巴巴内部的搜索系统、推荐系统蚂蚁金服等项目。在进行数据挖掘工作时都是依赖机器平台的产品,机器学习平台的业务场景包含了金融、医疗、教育、交通、安全等各个领域。
阿里巴巴内部的搜索系统、推荐系统、蚂蚁金服等项目在进行数据挖掘工作的时候都是依赖机器学习平台,机器学习平台的业务场景包含了金融、医疗、教育、交通、安全等各个领域,本讲到此结束。