自然语言处理-阿里云开发者社区-阿里云

开发者社区> ModelScope模型即服务> 自然语言处理

自然语言处理

关注

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

0
今日
1610
内容
0
活动
352
关注
|
1月前
|
存储 机器学习/深度学习 人工智能
|

RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术

RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术

207 8
|
1月前
|
机器学习/深度学习 人工智能 JSON
|

LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关

LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关

245 0
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
|

LLM 大模型学习必知必会系列(一):大模型基础知识篇

LLM 大模型学习必知必会系列(一):大模型基础知识篇

337 2
|
1月前
|
自然语言处理 物联网 API
|

检索增强生成(RAG)实践:基于LlamaIndex和Qwen1.5搭建智能问答系统

检索增强生成(RAG)实践:基于LlamaIndex和Qwen1.5搭建智能问答系统

335 6
|
1月前
|
自然语言处理 API 开发工具
|

基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手(检索增强生成(RAG)大模型)

基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手(检索增强生成(RAG)大模型)

355 0
|
1月前
|
人工智能 开发工具 网络架构
|

魔哈:Grok国内镜像

xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「Grok-1」,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。

163 0
|
1月前
|
人工智能 自然语言处理 API
|

DashVector&千问7B模型,打造极简RAG 之 基于专属知识的问答服务实践

参考官方教程和代码,以一个0基础学习者的角色,用DashVector&千问7B模型,打造极简RAG-基于专属知识的问答服务实践,也带入了自己的一些理解。

366 0
|
1月前
|
人工智能 数据挖掘 CDN
|

魔哈镜像迄今最大合成数据集 Cosmopedia

Cosmopedia 是一个由Mixtral-8x7B-Instruct-v0.1生成的合成教科书、博文、故事、帖子和WikiHow文章的数据集。该数据集包含超过3000万个文件和250亿个tokens,是HuggingFace用了10k张H100生成的迄今为止最大的开放合成数据集。

101 0
|
1月前
|
测试技术 AI芯片
|

ModelScope X 昇腾910快速上手

一个简单的基于国产昇腾硬件的ModelScope适配攻略

257 0
|
7月前
|
自然语言处理
|

如何定义标签词映射

如何定义标签词映射

336 1
|
7月前
|
Docker 容器
|

求助: 运行模型时报错module 'megatron_util.mpu' has no attribute 'get_model_parallel_rank'

运行ZhipuAI/Multilingual-GLM-Summarization-zh的官方代码范例时,报错AttributeError: MGLMTextSummarizationPipeline: module 'megatron_util.mpu' has no attribute 'get_model_parallel_rank' 环境是基于ModelScope官方docker镜像,尝试了各个版本结果都是一样的。

312 5
|
8月前
|
自然语言处理
|

求助:需要训练一个行业模型,用来批量写文章。有酬谢

本人从事环保行业,比较专业的领域,有语料。想训练一个行业模型,然后用来批量写专业原创文章。有那个高手可以实现,来洽谈合作。

470 0
|
9月前
|
存储 前端开发 安全
|

高通量基因测序在药物研发和靶向治疗中的应用(一)

高通量基因测序在药物研发和靶向治疗中的应用(一)

755 0
|
9月前
|
人工智能 算法 前端开发
|

高通量基因测序在药物研发和靶向治疗中的应用(二)

高通量基因测序在药物研发和靶向治疗中的应用(二)

500 0
|
9月前
|
人工智能 算法 大数据
|

AI制药工业落地的痛点与前进方向(三)

AI制药工业落地的痛点与前进方向(三)

386 0
|
9月前
|
机器学习/深度学习 人工智能 大数据
|

AI制药工业落地的痛点与前进方向(二)

AI制药工业落地的痛点与前进方向(二)

571 0
|
9月前
|
人工智能 云计算
|

AI制药工业落地的痛点与前进方向(一)

AI制药工业落地的痛点与前进方向(一)

588 0
|
9月前
|
人工智能 算法 Windows
|

AI + 分子模拟,赋能药物发现新源头(三)

AI + 分子模拟,赋能药物发现新源头(三)

519 0
|
9月前
|
机器学习/深度学习 人工智能 算法
|

AI + 分子模拟,赋能药物发现新源头(二)

AI + 分子模拟,赋能药物发现新源头(二)

479 0
|
9月前
|
人工智能 算法 数据库
|

AI + 分子模拟,赋能药物发现新源头(一)

AI + 分子模拟,赋能药物发现新源头(一)

384 0
|
9月前
|
自然语言处理 Python
|

中文大模型评测

中文大模型评测

764 3
|
9月前
|
自然语言处理 数据挖掘
|

我们要对齐什么——从人类反馈数据收集过程中分析语言模型的对齐任务类型与对齐目标

在Modelscope活动中,主办方欲通过模型盲测收集并整理一批人类反馈数据。因为曾经使用直接偏好优化(Direct Preference Optimization)作为课程的小论文而对此领域有所了解,本次我在数据的收集过程之外,根据问答与模型的输出,结合论文From Instructions to Intrinsic Human Values A Survey of Alignment Goals for Big Models,具体探究了本次实验过程中的对齐目标。

307 0
|
9月前
|
存储 自然语言处理 数据可视化
|

自然语言入门:NLP数据读取与数据分析

本章主要内容为数据读取和数据分析,具体使用`Pandas`库完成数据读取操作,并对赛题数据进行分析构成。

334 0
|
9月前
|
机器学习/深度学习 自然语言处理 安全
|

中文竞技场(MS)大模型评测

分别从写作创作、代码相关、知识常识、中文游戏、人类价值观、NLP专业领域6大领域测评不同模型的效果。

97029 2
|
9月前
|
人工智能 程序员 Python
|

AI智能写作工具-代码处理

随着AI的巨大发展,AI将走进我们的生活的各个方便。使用AI工具将变的非常迫切,因为AI可以提升人们的生活效率,提升生活的品质。 体验ModelScope中的代码处理功能,来一场程序员体验之旅。

554 2
|
9月前
|
人工智能
|

AI智能写作工具

随着AI的巨大发展,AI将走进我们的生活的各个方便。使用AI工具将变的非常迫切,因为AI可以提升人们的生活效率,提升生活的品质

771 1
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
|

模型的价值观需重视,文本理解与文本生成能力有待提高

随着算力的不断提高,NLP成为新时代人工智能的突破点——“大模型”。大模型之大不仅在于模型的大小之大,而且所用的训练数据集之大。如今,大模型在各行各业中逐渐落地,实现多场景应用。人们比较注重于LLM模型的语言文本理解、文本生成能力。在使用了阿里云多个模型的评测当中,有一些思考与建议。

669 1
|
10月前
|

中文大模型体验

中文大模型体验

573 0
|
10月前
|
自然语言处理 知识图谱
|

中文竞技场模型体验

中文竞技场模型体验

334 0
|
10月前
|
自然语言处理
|

中文大模型评测

中文大模型评测

663 0
|
10月前
|
自然语言处理 知识图谱
|

中文大模型体验

中文大模型体验

332 0
|
10月前
|

Modelscope 中文竞技场大模型评测

本次评测我选得三个类别分别是:写作创作相关、中文游戏、知识常识三个类别。

394 1
|
文字识别 计算机视觉 Python
|

使用ModelScope社区搭建OCR应用

简介: 本文介绍通过ModelScope来完成光学字符识别(OCR)这一应用,该应用使用两个模型: ● 文本检测(ocr_detection) ● 文本识别(ocr_recognition)

1239 0
|
机器学习/深度学习 自然语言处理 JavaScript
|

用modelscope分析了百万字的《天龙八部》,原来金庸大师最偏爱的是TA

用modelscope分析了下百万字的《天龙八部》,摸清楚了金庸大师的取名智慧

2086 1
|
机器学习/深度学习 人工智能 自然语言处理
|

如何向大模型注入知识?达摩院通义对话模型SPACE系列探索

如何将人类先验知识低成本融入到预训练模型中一直是个难题。达摩院对话智能团队提出了一种基于半监督预训练的新训练方式,将对话领域的少量有标数据和海量无标数据一起进行预训练,从而把标注数据中蕴含的知识注入到预训练模型中去,打造了SPACE 1/2/3 系列模型,在11个国际公开对话数据集取得SOTA。

792 0

预训练对话

预训练对话简介

179 1
|
人工智能 自然语言处理
|

中文自然语言理解

中文自然语言理解简介

226 0
|
人工智能 自然语言处理
|

文本生成

文本生成简介

425 0
|
自然语言处理 BI
|

分词

中文分词介绍

170 0
|
SQL 自然语言处理 搜索推荐
|

表格问答

表格问答模型介绍

563 0
|
自然语言处理 搜索推荐
|

文本分类

文本分类模型介绍

217 0
|
自然语言处理
|

信息抽取

命名实体识别

234 0
我要发布