NLP自学习平台,我们首先要了解一下这是做什么的,和python爬虫获取信息有什么区别,带着问题去测评产品。
首先我们先看一下简介:NLP自学习平台支持文本实体抽取、文本分类、关键短语抽取、情感分析、关系抽取、商品评价解析、简历抽取和合同要素抽取等NLP定制化算法能力,用户无需拥有丰富的算法背景,仅需标注或上传适量文档数据,即可通过平台快速创建算法模型并使用,简单的讲就是大数据NLP模型搭建,把数据获取后,进行处理分析,然后呈现出来,不过这个不用再招一个NLP大数据开发师,只需要在平台上就能享有相关的服务结果,属于paas平台。
我从业的行业涉及这一块还挺多的,对于文本实体抽取,文本分类,招标信息抽取,废话不多说,我们先来领一个月试试,NLP自学习平台属于自然语言处理,说白了是对信息的二次处理分析,目前只是提供接口,调用返回信息。
我先创建一个项目,选择项目类型,填写关键信息,包含类型,名称行业,项目描述等等创建标注任务,这里需要添加标注数据,我们可以通过示例下载json,导入上去,然后再确认,完成标注任务创建,需要等待两分钟的解析。
接下来就是比较复杂的信息标注阶段了,这个标注完是对信息的分类,我这只设置了一个类别,不再展示,只是告诉大家信息是如何被定义和归类的,剩下的就是它自己的训练学习过程。
重头戏:接口测试,首先我们需要知道怎么在开通后去调用它,看一下api参考,其实跟正常的接口调用没太大区别,唯一就是body信息不一样:https://help.aliyun.com/document_detail/144931.html。NLP自学习平台API调用是通过向NLP自学习平台服务的服务端地址发送HTTP GET请求,并按照接口说明在请求中加入相应请求参数,调用后系统会返回处理结果。请求及返回结果都使用UTF-8字符集进行编码。可以在OpenAPI Explorer中直接运行该接口,免去计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试网址:https://next.api.aliyun.com/api/nlp-automl/2019-11-11/RunPreTrainService?lang=JAVA
最后我们再试一下预训练模型,目前我这里的模块有近三十个,可以在OpenAPI开发者门户中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI开发者门户可以自动生成SDK代码示例,调用接口非常方便,参考这个可以试一下,我还是比较喜欢python的,比较简洁,依赖也少。
Python代码示例
#安装依赖
pip install aliyun-python-sdk-core
pip install aliyun-python-sdk-nlp-automl