面向算法小白的 NLP 自学习平台介绍|学习笔记

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: 快速学习面向算法小白的 NLP 自学习平台介绍

开发者学堂课程【达摩院自然语言处理 NLP 技术和应用:面向算法小白的 NLP 自学习平台介绍】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/41/detail/957


面向算法小白的 NLP 自学习平台介绍


内容介绍:

一、平台使用介绍

二、平台的使用流程

三、平台使用及操作演示


一、平台使用介绍

NLP 自学习平台是面向算法小白用户设计的 NLP 定制化训练和服务平台,用户无需拥有丰富的算法背景,仅需标注或上传适量文档数据,即可通过平台快速创建算法模型并使用。预计500份以上的标注数据时,模型准确率就可以达到85%以上。

image.png

目前已支持文本实体抽取、文本分类的定制化,之后会逐步上线更多的NLP算法能力。


二、平台的使用流程

使用流程一共分为四部:

1.新建项目

2.标注数据

3.一件室内模型

4.评估并使用


三、平台使用及操作演示

1.创建数据

点击我的项目业,可以在这里创建并管理自己的项目,目前支持两种项目类型: ①.文本实体抽取 ②.文本分类

image.png

以文本实体抽取项目为例,右上角点击创建项目,输入项目名称,项目描述,选择项目类型,设置项目管理员,注意一个项目可添加多个项目管理员,管理员拥有这个项目下所有权限,可以通过输入阿里云账号添加,创建项目后,操作区点击进入项目。进入项目后,可以在数据中心中管理数据。

有两种方式可以创建数据: ①.创建标注任务 ②.上传数据集

image.png

2.如何创建标注任务

右上角点击创建标注任务,输入标注任务的基本信息,上传带标注文档。设置抽取字段,例如期望在拍卖公告的网页信息抽取拍卖车辆的结构化信息、汽车品牌、车牌号码、行驶里程。

image.png

完成标注任务的创建后,可以点击标注,进入标注中心,进行文档的标注。此处省略更多文档的标注过程,标注完成后,可以质检已经标注好的文档,以确保良好的标注质量,

image.png

除了创建标注任务外,也可以上传本地以标注好的训练数据,按示例文件的格式归整后直接上传。

3.创建并管理模型

标志完数据后,可以进入模型中心创建并管理模型,点击右上角创建模型,在创建模型列中输入模型基本信息。

image.png

选择已标注完的数据,一键训练模型,需0.5~1小时。模型训练完成后可以查看评估指标,主要有精确率、召回率和 F1 级值同时也可以新增模型版本进行版本管理。同一个模型可以同时发布两个版本。模型发布后,可以直接在平台上进行测试,测试满意后,可以根据文档调用该模型。

相关文章
|
6天前
|
算法 JavaScript 前端开发
第一个算法项目 | JS实现并查集迷宫算法Demo学习
本文是关于使用JavaScript实现并查集迷宫算法的中国象棋demo的学习记录,包括项目运行方法、知识点梳理、代码赏析以及相关CSS样式表文件的介绍。
第一个算法项目 | JS实现并查集迷宫算法Demo学习
|
11天前
|
机器学习/深度学习 人工智能 算法
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
文本分类识别系统。本系统使用Python作为主要开发语言,首先收集了10种中文文本数据集("体育类", "财经类", "房产类", "家居类", "教育类", "科技类", "时尚类", "时政类", "游戏类", "娱乐类"),然后基于TensorFlow搭建CNN卷积神经网络算法模型。通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型,并保存为本地的h5格式。然后使用Django开发Web网页端操作界面,实现用户上传一段文本识别其所属的类别。
23 1
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
【自然语言处理】TF-IDF算法在人工智能方面的应用,附带代码
TF-IDF算法在人工智能领域,特别是自然语言处理(NLP)和信息检索中,被广泛用于特征提取和文本表示。以下是一个使用Python的scikit-learn库实现TF-IDF算法的简单示例,并展示如何将其应用于文本数据。
215 65
|
10天前
|
XML JavaScript 前端开发
学习react基础(1)_虚拟dom、diff算法、函数和class创建组件
本文介绍了React的核心概念,包括虚拟DOM、Diff算法以及如何通过函数和类创建React组件。
15 2
|
11天前
|
机器学习/深度学习 人工智能 算法
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台。果蔬识别系统,本系统使用Python作为主要开发语言,通过收集了12种常见的水果和蔬菜('土豆', '圣女果', '大白菜', '大葱', '梨', '胡萝卜', '芒果', '苹果', '西红柿', '韭菜', '香蕉', '黄瓜'),然后基于TensorFlow库搭建CNN卷积神经网络算法模型,然后对数据集进行训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地文件方便后期调用。再使用Django框架搭建Web网页平台操作界面,实现用户上传一张果蔬图片识别其名称。
30 0
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
10天前
|
自然语言处理 算法
NLP之距离算法Levenshtein
NLP之距离算法Levenshtein
|
2月前
|
存储 SQL 消息中间件
B端算法实践问题之设计一套实时平台能力如何解决
B端算法实践问题之设计一套实时平台能力如何解决
29 1
|
2月前
|
机器学习/深度学习 人工智能 资源调度
【博士每天一篇文献-算法】连续学习算法之HAT: Overcoming catastrophic forgetting with hard attention to the task
本文介绍了一种名为Hard Attention to the Task (HAT)的连续学习算法,通过学习几乎二值的注意力向量来克服灾难性遗忘问题,同时不影响当前任务的学习,并通过实验验证了其在减少遗忘方面的有效性。
49 12
|
2月前
|
算法 Java
掌握算法学习之字符串经典用法
文章总结了字符串在算法领域的经典用法,特别是通过双指针法来实现字符串的反转操作,并提供了LeetCode上相关题目的Java代码实现,强调了掌握这些技巧对于提升算法思维的重要性。
|
2月前
|
编解码 算法 Linux
Linux平台下RTSP|RTMP播放器如何跟python交互投递RGB数据供视觉算法分析
在对接Linux平台的RTSP播放模块时,需将播放数据同时提供给Python进行视觉算法分析。技术实现上,可在播放时通过回调函数获取视频帧数据,并以RGB32格式输出。利用`SetVideoFrameCallBackV2`接口设定缩放后的视频帧回调,以满足算法所需的分辨率。回调函数中,每收到一帧数据即保存为bitmap文件。Python端只需读取指定文件夹中的bitmap文件,即可进行视频数据的分析处理。此方案简单有效,但应注意控制输出的bitmap文件数量以避免内存占用过高。
下一篇
无影云桌面