EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
简介: EXAONE 3.5 是 LG AI 研究院推出的开源 AI 模型,擅长长文本处理,能够有效降低模型幻觉问题。该模型提供 24 亿、78 亿和 320 亿参数的三个版本,支持多步推理和检索增强生成技术,适用于多种应用场景。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 模型版本:提供 24 亿、78 亿和 320 亿参数的三个版本,适应不同应用场景。
  2. 长文本处理:支持长达 32K tokens 的上下文处理,有效降低模型幻觉问题。
  3. 多步推理:结合检索增强生成技术,提升模型在复杂场景中的准确性。

正文(附运行示例)

EXAONE 3.5 是什么

公众号: 蚝油菜花 - EXAONE-3.5

EXAONE 3.5 是 LG AI 研究院推出的开源 AI 模型,包含 24 亿、78 亿和 320 亿参数的三个版本。该模型擅长长文本处理,在基准测试中表现优异,特别是在实际应用、长文本处理和数学方面。

EXAONE 3.5 采用检索增强生成技术和多步推理能力,有效降低错误信息,提高准确性。LG 计划进一步扩展其 AI 能力,并推出企业级 AI 智能体服务 ChatEXAONE,具备复杂的查询分析和用户自定义搜索功能,配备加密和隐私保护技术,确保在公司内部安全使用。

EXAONE 3.5 的主要功能

  • 多版本模型支持:提供三种不同参数规模的模型,适应不同的应用场景和计算资源限制。
  • 指令遵循能力:在实际场景中具有卓越的指令遵循能力,在多个基准测试中取得最高分。
  • 长上下文理解:在长文本处理方面表现出色,有效理解和处理长达 32K tokens 的上下文。
  • 双语能力:优秀的韩语和英语双语能力,特别是在韩国和英语的基准测试中表现突出。
  • 检索增强生成技术:基于参考文档或网络搜索结果生成答案。
  • 多步推理能力:具备多步推理能力,有效降低“幻觉”现象,提高答案的准确性。

EXAONE 3.5 的技术原理

  • Transformer 架构:基于最新的仅解码器(decoder-only)Transformer 架构,用于处理序列数据。
  • 长上下文处理:采用长上下文微调技术,将最大上下文长度从 EXAONE 3.0 的 4,096 tokens 扩展到 32,768 tokens。
  • 预训练和后训练
    • 预训练:第一阶段用大型训练语料库进行预训练,第二阶段针对需要加强的领域进行数据收集和预训练,特别是增强长上下文理解能力。
    • 后训练:包括监督式微调(SFT)和偏好优化,加强模型的指令遵循能力和与人类偏好的一致性。
  • 数据合规性:在数据收集、模型训练和信息提供过程中进行 AI 合规性审查,最小化法律风险。
  • 检索增强生成(RAG)技术:结合检索和生成,让模型能处理更长的上下文,在复杂场景中应用。

如何运行 EXAONE 3.5

以下是一个简单的 Python 示例,展示如何使用 EXAONE 3.5 模型:

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "LGAI-EXAONE/EXAONE-3.5-7.8B-Instruct"

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype=torch.bfloat16,
    trust_remote_code=True,
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# 选择你的提示
prompt = "Explain how wonderful you are"  # 英文示例
# prompt = "스스로를 자랑해 봐"       # 韩文示例

messages = [
    {
   "role": "system", "content": "You are EXAONE model from LG AI Research, a helpful assistant."},
    {
   "role": "user", "content": prompt}
]
input_ids = tokenizer.apply_chat_template(
    messages,
    tokenize=True,
    add_generation_prompt=True,
    return_tensors="pt"
)

output = model.generate(
    input_ids.to("cuda"),
    eos_token_id=tokenizer.eos_token_id,
    max_new_tokens=128,
    do_sample=False,
)
print(tokenizer.decode(output[0]))
AI 代码解读

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

目录
打赏
0
9
9
0
356
分享
相关文章
TDengine 发布时序数据分析 AI 智能体 TDgpt,核心代码开源
2025 年 3 月 26 日,涛思数据通过线上直播形式正式发布了其新一代时序数据分析 AI 智能体——TDgpt,并同步开源其核心代码(GitHub 地址:https://github.com/taosdata/TDengine)。这一创新功能作为 TDengine 3.3.6.0 的重要组成部分,标志着时序数据库在原生集成 AI 能力方面迈出了关键一步。
29 0
ReasonGraph:别让AI成黑箱!这个开源工具把大模型的脑回路画给你看
ReasonGraph是一款开源的可视化分析工具,能将大语言模型的复杂推理过程转化为直观图表,支持50+主流模型和多种推理方法,帮助开发者快速理解AI思考逻辑并优化模型表现。
68 0
TripoSR:开源3D生成闪电战!单图0.5秒建模,Stability AI颠覆设计流程
TripoSR是由Stability AI和VAST联合推出的开源3D生成模型,能在0.5秒内从单张2D图像快速生成高质量3D模型,支持游戏开发、影视制作等多领域应用。
38 13
TripoSF:3D建模内存暴降80%!VAST AI新一代模型细节狂飙82%
TripoSF 是 VAST AI 推出的新一代 3D 基础模型,采用创新的 SparseFlex 表示方法,支持 1024³ 高分辨率建模,内存占用降低 82%,在细节捕捉和复杂结构处理上表现优异。
39 10
TripoSF:3D建模内存暴降80%!VAST AI新一代模型细节狂飙82%
模型即产品:万字详解RL驱动的AI Agent模型如何巨震AI行业范式
未来 AI 智能体的发展方向还得是模型本身,而不是工作流(Work Flow)。像 Manus 这样基于「预先编排好的提示词与工具路径」构成的工作流智能体,短期或许表现不错,但长期必然遇到瓶颈。这种「提示驱动」的方式无法扩展,也无法真正处理那些需要长期规划、多步骤推理的复杂任务。下一代真正的LLM智能体,则是通过「强化学习(RL)与推理(Reasoning)的结合」来实现的。
40 10
模型即产品:万字详解RL驱动的AI Agent模型如何巨震AI行业范式
Cosmos-Reason1:物理常识觉醒!NVIDIA 56B模型让AI懂重力+时空法则
Cosmos-Reason1是NVIDIA推出的多模态大语言模型系列,具备物理常识理解和具身推理能力,支持视频输入和长链思考,可应用于机器人、自动驾驶等场景。
31 8
Cosmos-Reason1:物理常识觉醒!NVIDIA 56B模型让AI懂重力+时空法则
36.7K star!拖拽构建AI流程,这个开源LLM应用框架绝了!
`Flowise` 是一款革命性的低代码LLM应用构建工具,开发者通过可视化拖拽界面,就能快速搭建基于大语言模型的智能工作流。该项目在GitHub上线不到1年就斩获**36.7K星标**,被开发者誉为"AI时代的乐高积木"。
【AI落地应用实战】大模型加速器2.0:基于 ChatDoc + TextIn ParseX+ACGE的RAG知识库问答系统
本文探讨了私有知识库问答系统的难点及解决方案,重点分析了企业知识管理中的痛点,如信息孤岛、知识传承依赖个人经验等问题。同时,介绍了IntFinQ这款知识管理工具的核心特点和实践体验,包括智能问答、深度概括与多维数据分析等功能。文章还详细描述了IntFinQ的本地化部署过程,展示了其从文档解析到知识应用的完整技术闭环,特别是自研TextIn ParseX引擎和ACGE模型的优势。最后总结了该工具对企业和开发者的价值,强调其在提升知识管理效率方面的潜力。
AI训练师入行指南(三):机器学习算法和模型架构选择
从淘金到雕琢,将原始数据炼成智能珠宝!本文带您走进数字珠宝工坊,用算法工具打磨数据金砂。从基础的经典算法到精密的深度学习模型,结合电商、医疗、金融等场景实战,手把手教您选择合适工具,打造价值连城的智能应用。掌握AutoML改装套件与模型蒸馏术,让复杂问题迎刃而解。握紧算法刻刀,为数字世界雕刻文明!
27 6
AI职场突围战:夸克应用+生成式人工智能认证,驱动“打工人”核心竞争力!
在AI浪潮推动下,生成式人工智能(GAI)成为职场必备工具。文中对比了夸克、豆包、DeepSeek和元宝四大AI应用,夸克以“超级入口”定位脱颖而出。同时,GAI认证为职场人士提供系统学习平台,与夸克结合助力职业发展。文章还探讨了职场人士如何通过加强学习、关注技术趋势及培养合规意识,在AI时代把握机遇。

热门文章

最新文章