自然语言处理-推荐-第5页-阿里云开发者社区-阿里云

蚝油菜花

|

10月前

|

人工智能自然语言处理调度

|

博文

Casevo：开源的社会传播模拟系统，基于 AI 模拟人类认知、决策和社会交互，预测社会传播现象

Casevo 是中国传媒大学推出的开源社会传播模拟系统，结合大语言模型和多智能体技术，支持复杂社会网络建模与动态交互，适用于新闻传播、社会计算等领域。

413 22 22

蚝油菜花

|

11月前

|

人工智能自然语言处理

|

博文

Promptriever：信息检索模型，支持自然语言提示响应用户搜索需求

Promptriever 是一种新型信息检索模型，由约翰斯·霍普金斯大学和 Samaya AI 联合推出。该模型能够接受自然语言提示，并以直观的方式响应用户的搜索需求。通过在 MS MARCO 数据集上的训练，Promptriever 在标准检索任务上表现出色，能够更有效地遵循详细指令，提高查询的鲁棒性和检索性能。

215 6 6

蚝油菜花

|

7月前

|

人工智能自然语言处理测试技术

|

博文

能够双向推理的LLM！Dream-7B：港大联合华为开源的扩散推理模型，能够同时考虑前后文信息

Dream-7B是由香港大学与华为诺亚方舟实验室联合研发的开源扩散大语言模型，采用独特的掩码扩散范式，在文本生成、数学推理和代码编写等任务中展现出卓越性能。

323 3 3

蚝油菜花

|

8月前

|

人工智能边缘计算自然语言处理

|

博文

DistilQwen2.5-R1：蒸馏黑科技！32B推理能力塞进3B小模型，推理速度狂飙300%

阿里巴巴最新发布的DistilQwen2.5-R1系列模型通过知识蒸馏技术，在保持高性能的同时大幅降低计算资源需求，7B模型性能甚至可媲美32B大模型。

267 11 11

蚝油菜花

|

8月前

|

人工智能缓存自然语言处理

|

博文

TokenSwift：90分钟生成10万Token！文本生成提速3倍，无损加速黑科技

TokenSwift 是北京通用人工智能研究院团队推出的超长文本生成加速框架，能在90分钟内生成10万Token的文本，速度提升3倍，生成质量无损，支持多种模型架构。

242 16 16

蚝油菜花

|

11月前

|

人工智能自然语言处理前端开发

|

博文

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

CodeArena 是一个在线平台，用于测试和比较不同大型语言模型（LLM）的编程能力。通过实时显示多个 LLM 的代码生成过程和结果，帮助开发者选择适合的 LLM，并推动 LLM 技术的发展。

264 7 7

1719835218626060

|

11月前

|

黑灰产治理

|

问答

为啥都不能很好的处理文本鉴黄

129 1 0

蚝油菜花

|

11月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

FullStack Bench：字节豆包联合M-A-P社区开源的全新代码评估基准

FullStack Bench是由字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准，专注于全栈编程和多语言编程能力评估。该基准覆盖超过11种真实编程场景，包含3374个问题，涉及16种编程语言，旨在更有效地衡量大模型在现实世界中的代码开发能力。

307 5 5

蚝油菜花

|

12月前

|

人工智能数据处理异构计算

|

博文

LongRAG：智谱联合清华和中科院推出的双视角鲁棒检索框架

LongRAG是由智谱、清华大学和中国科学院联合推出的双视角鲁棒检索增强生成框架，专为长文本问答设计。该框架通过混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM增强生成器等组件，有效解决了长文本问答中的全局上下文理解和事实细节识别难题。LongRAG在多个数据集上表现优异，提供了自动化微调数据构建管道，增强了系统的“指令跟随”能力和领域适应性。

344 1 1

游客pklednr3ea35k

|

10月前

|

Python 人工智能

|

问答

Unichat - qwen2.5 - 32B - c1 模型已经下载下来在运行python报错

207 1 0

蚝油菜花

|

12月前

|

人工智能搜索推荐 API

|

博文

Perplexica：开源 AI 搜索引擎，Perplexity AI 的开源替代品，支持多种搜索模式、实时信息更新

Perplexica 是一款开源的 AI 驱动搜索引擎，支持多种搜索模式和实时信息更新，适用于个人、学术和企业等不同场景。

1155 6 6

游客y2etiigytptbm

|

5月前

|

Java Spring 人工智能

|

问答

Adobe Research 推出的 DynaSaur 是一个突破性的大语言模型代理框架，它允许代理动态创建和组合动作，通过生成和执行 Python 代码与环境互动，从而实现更灵活的问题解决。DynaSaur 不仅在 GAIA 基准测试中表现出色，还具有动态动作创建、动作积累与复用、环境互动等主要功能，适用于多种应用场景。

150 2 2

pklim101

|

4月前

|

问答

加载Qwen/Qwen-7B-Chat模型报错

192 0 0

游客pw4uyj7ukrvgo

|

6月前

|

容器 Docker

|

问答

FunASR docker部署后，服务崩掉自动重启时，还是会下载模型

286 0 0

蚝油菜花

|

7月前

|

机器学习/深度学习人工智能数据可视化

|

博文

智谱AI新突破！GLM-Z1-Rumination：新一代沉思模型，推动AI助手进入"高智商+高自主"的新阶段

GLM-Z1-Rumination是智谱推出的新一代沉思模型，通过扩展强化学习训练实现长程推理能力，支持动态工具调用与自我验证机制，显著提升AI自主研究能力。

336 13 14

黄小贵2021

|

11月前

|

自然语言处理

|

问答

简单的基于LLM的RAG程序，对问题的回答不符合逻辑，请问是哪里出了问题？

134 1 0

31044233

|

11月前

|

问答

FAQ模型输出的label代表什么意思，在哪里查看label的中文名称呢？

116 1 1

蚝油菜花

|

11月前

|

人工智能关系型数据库数据库

|

博文

Perplexideez：开源本地 AI 搜索助手，智能搜索信息来源追溯

Perplexideez 是一款开源的本地 AI 搜索助手，旨在通过智能搜索和信息来源追溯功能，提升用户的搜索体验。它支持多用户、单点登录（SSO），并提供美观的搜索结果展示。Perplexideez 基于 Postgres 数据库，集成了 Ollama 或 OpenAI 兼容的端点，使用 SearXNG 实例进行网络搜索。

306 14 14

1507395097940844

|

10月前

|

Python 开发工具 git

|

问答

魔搭平台FastChat搭建Qwen-1_8B模型报错求怎么解决？

245 1 0

aliyun4664677311-39277

|

11月前

|

API 人工智能

|

问答

使用魔搭社区的创空间建立了一个APP后，想通过API访问该APP，总是报错。

471 1 0

蚝油菜花

|

11月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

Granite 3.1：IBM 开源新一代可商用大语言模型，支持 128K 上下文长度、多语言和复杂任务处理

IBM 推出的 Granite 3.1 是一款新一代语言模型，具备强大的性能和更长的上下文处理能力，支持多语言和复杂任务处理。

534 0 0

蚝油菜花

|

12月前

|

人工智能

|

博文

LongAlign：港大推出的提升文本到图像扩散模型处理长文本对齐方法

LongAlign是由香港大学研究团队推出的文本到图像扩散模型的改进方法，旨在提升长文本输入的对齐精度。通过段级编码技术和分解偏好优化，LongAlign显著提高了模型在长文本对齐任务上的性能，超越了现有的先进模型。

162 1 1

Tr1umph

|

12月前

|

数据库 SQL Python

|

问答

基于SQL数据库的RAG的若干疑问

153 1 0

pklim101

|

4月前

|

编解码

|

问答

使用modelscope、Qwen1.8B-chat 模型推理时报错编码错误

126 0 0

22r2esrjmupyy

|

8月前

|

问答

您好，我在使用ModelScope的训练服务的时候，总是出现这个异常，请问这是什么问题？

141 0 0

游客zfcooaevjenbu

|

11月前

|

问答

微调llama3时报modelscope - ERROR错，能帮忙看一下什么问题吗

217 1 0

蚝油菜花

|

11月前

|

人工智能安全测试技术

|

博文

EXAONE 3.5：LG 推出的开源 AI 模型，采用 RAG 和多步推理能力降低模型的幻觉问题

EXAONE 3.5 是 LG AI 研究院推出的开源 AI 模型，擅长长文本处理，能够有效降低模型幻觉问题。该模型提供 24 亿、78 亿和 320 亿参数的三个版本，支持多步推理和检索增强生成技术，适用于多种应用场景。

315 9 9

蚝油菜花

|

11月前

|

机器学习/深度学习人工智能

|

博文

Micro LLAMA：教学版 LLAMA 3模型实现，用于学习大模型的核心原理

Micro LLAMA是一个精简的教学版LLAMA 3模型实现，旨在帮助学习者理解大型语言模型的核心原理。该项目仅约180行代码，便于理解和学习。Micro LLAMA基于LLAMA 3中最小的8B参数模型，适合对深度学习和模型架构感兴趣的研究者和学生。

252 18 18

自然语言处理

最新

文章

视频

问答

推荐

精华

Casevo：开源的社会传播模拟系统，基于 AI 模拟人类认知、决策和社会交互，预测社会传播现象

Promptriever：信息检索模型，支持自然语言提示响应用户搜索需求

能够双向推理的LLM！Dream-7B：港大联合华为开源的扩散推理模型，能够同时考虑前后文信息

DistilQwen2.5-R1：蒸馏黑科技！32B推理能力塞进3B小模型，推理速度狂飙300%

TokenSwift：90分钟生成10万Token！文本生成提速3倍，无损加速黑科技

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

为啥都不能很好的处理文本鉴黄

FullStack Bench：字节豆包联合M-A-P社区开源的全新代码评估基准

LongRAG：智谱联合清华和中科院推出的双视角鲁棒检索框架

Unichat - qwen2.5 - 32B - c1 模型已经下载下来 在运行python报错

Perplexica：开源 AI 搜索引擎，Perplexity AI 的开源替代品，支持多种搜索模式、实时信息更新

关于MCP在业务场景的使用，如何让大模型懂得业务逻辑，可以按照业务逻辑调用多个tools来完成对话。

MiniRAG：迷你 RAG 系统加成小型语言模型，爆发出与大型语言模型相当的性能

Amurex：开源AI会议助手，提供实时建议、智能摘要、快速回顾关键信息

O1-CODER：北交大推出的O1代码版开源项目，专注于编码任务

BALROG：基准测试工具，用于评估 LLMs 和 VLMs 在复杂动态环境中的推理能力

DynaSaur：Adobe 推出的大语言模型代理框架

加载Qwen/Qwen-7B-Chat模型报错

FunASR docker部署后，服务崩掉自动重启时，还是会下载模型

智谱AI新突破！GLM-Z1-Rumination：新一代沉思模型，推动AI助手进入"高智商+高自主"的新阶段

简单的基于LLM的RAG程序，对问题的回答不符合逻辑，请问是哪里出了问题？

FAQ模型输出的label代表什么意思，在哪里查看label的中文名称呢？

Perplexideez：开源本地 AI 搜索助手，智能搜索信息来源追溯

魔搭平台FastChat搭建Qwen-1_8B模型报错 求怎么解决？

使用魔搭社区的创空间建立了一个APP后，想通过API访问该APP，总是报错。

Granite 3.1：IBM 开源新一代可商用大语言模型，支持 128K 上下文长度、多语言和复杂任务处理

LongAlign：港大推出的提升文本到图像扩散模型处理长文本对齐方法

基于SQL数据库的RAG的若干疑问

使用modelscope、Qwen1.8B-chat 模型推理时报错编码错误

您好，我在使用ModelScope的训练服务的时候，总是出现这个异常，请问这是什么问题？

微调llama3时报modelscope - ERROR错，能帮忙看一下什么问题吗

EXAONE 3.5：LG 推出的开源 AI 模型，采用 RAG 和多步推理能力降低模型的幻觉问题

Micro LLAMA：教学版 LLAMA 3模型实现，用于学习大模型的核心原理

活跃用户

相关产品

Unichat - qwen2.5 - 32B - c1 模型已经下载下来在运行python报错

魔搭平台FastChat搭建Qwen-1_8B模型报错求怎么解决？