DRT-o1:腾讯推出专注于文学翻译的 AI 模型,擅长理解比喻和隐喻等修辞手法,在翻译时保留原文的情感色彩

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
简介: DRT-o1 是腾讯研究院推出的文学翻译系列 AI 模型,通过长链思考推理技术显著提升翻译质量,特别擅长处理比喻和隐喻等修辞手法。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

原文链接:https://mp.weixin.qq.com/s/n0vICWNvxP6Vq46SDIjxkw


🚀 快速阅读

  1. 功能:DRT-o1 通过长链思考推理技术提升文学翻译质量,特别擅长处理比喻和隐喻。
  2. 技术:采用多智能体框架,包含翻译员、顾问和评估员三个角色,通过迭代优化提升翻译质量。
  3. 应用:适用于文学翻译、跨文化交流、教育领域和多语言内容创作。

正文(附运行示例)

DRT-o1 是什么

公众号: 蚝油菜花 - DRT-o1

DRT-o1 是腾讯研究院推出的一系列 AI 模型,旨在通过长链思考推理(CoT)技术显著提升文学作品的翻译质量。该模型特别擅长处理比喻和隐喻等修辞手法,能够更深入地理解文本,保留原文的情感色彩和文化内涵。

DRT-o1 系列包括 DRT-o1-7B 和 DRT-o1-14B 两个规模版本,BLEU 分数提高了 7.33 至 8.26,CometScore 提高了 1.66 至 3.36。DRT-o1-7B 的性能甚至超过了更大的模型 QwQ-32B,展现了在处理复杂语言结构方面的强大能力。

DRT-o1 的主要功能

  • 长链思考推理(CoT):通过长思维链技术,提高对文学作品中比喻和隐喻等修辞手法的理解能力,提升翻译质量。
  • 多智能体框架:模型采用了包含翻译员、顾问和评估员三个角色的多智能体框架。翻译员负责初步翻译,顾问提供修改建议,评估员根据预设指标对翻译质量进行评分。
  • 翻译工作流程:工作流程包括关键词翻译、初步翻译和翻译精炼循环三个主要步骤。在精炼循环中,顾问评估前一步的翻译并提供反馈,评估者根据预定义的评分标准给出整体评分,翻译者根据反馈和评分提供新的翻译。
  • 迭代优化:通过反复迭代,模型不断提升翻译质量,直至达到预定义的阈值或迭代次数达到最大值。
  • 性能提升:实验结果表明,BLEU 分数和 CometScore 均有显著提高。
  • 处理复杂语言结构:DRT-o1 在处理复杂语言结构方面表现出色,性能超过了更大的模型 QwQ-32B。

DRT-o1 的技术原理

  • 深度思考训练:研究人员从古腾堡计划中选取了 400 本公共领域英文书籍,提取了 577600 个句子,并筛选出 63000 个包含明喻和隐喻的句子,用于训练模型进行“深度思考”。
  • 可解释性:由于 CoT 提供了推理过程的可见性,有助于提高模型决策的可解释性。
  • 逻辑推理与上下文利用:CoT 可以帮助模型进行复杂的逻辑推理,利用上下文信息,通过逐步推理来解决问题。

如何运行 DRT-o1

使用 Huggingface Transformers

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "Krystalan/DRT-o1-7B"

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "Please translate the following text from English to Chinese:\nThe mother, with her feet propped up on a stool, seemed to be trying to get to the bottom of that answer, whose feminine profundity had struck her all of a heap."
messages = [
    {
   "role": "system", "content": "You are a philosopher skilled in deep thinking, accustomed to exploring complex problems with profound insight."},
    {
   "role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=2048
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)

使用 vllm

python3 -m vllm.entrypoints.openai.api_server --model [model_ckpt] --served-model-name [model_name]
from openai import OpenAI
# Set OpenAI's API key and API base to use vLLM's API server.
openai_api_key = "EMPTY"
openai_api_base = "http://localhost:8000/v1"

client = OpenAI(
    api_key=openai_api_key,
    base_url=openai_api_base,
)

chat_response = client.chat.completions.create(
    model=[model_name],
    messages=[
        {
   "role": "system", "content": "You are a philosopher skilled in deep thinking, accustomed to exploring complex problems with profound insight."},
        {
   "role": "user", "content": "Please translate the following text from English to Chinese:\nThe mother, with her feet propped up on a stool, seemed to be trying to get to the bottom of that answer, whose feminine profundity had struck her all of a heap."},
    ],
    temperature=0.7,
    top_p=0.8,
    max_tokens=2048,
    extra_body={
   
        "repetition_penalty": 1.05,
    },
)
print("Chat response:", chat_response)

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
28天前
|
人工智能
AnchorCrafter:中科院联合腾讯推出的AI虚拟主播带货视频制作技术
AnchorCrafter是由中科院和腾讯联合推出的一项AI虚拟主播带货视频制作技术。该技术基于扩散模型,能够自动生成高保真度的主播风格产品推广视频,通过整合人-物交互(HOI)技术,实现对物体外观和运动控制的高度还原。AnchorCrafter在物体外观保持、交互感知以及视频质量方面优于现有方法,为在线广告和消费者参与提供了新的可能性。
147 30
AnchorCrafter:中科院联合腾讯推出的AI虚拟主播带货视频制作技术
|
29天前
|
机器学习/深度学习 人工智能 自然语言处理
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
Voice-Pro是一款开源的多功能音频处理工具,集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等多种功能。它支持超过100种语言,适用于教育、娱乐和商业等多个领域,为用户提供一站式的音频处理解决方案,极大地提高工作效率和音频处理的便捷性。
102 10
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
|
2月前
|
人工智能 编解码 BI
LEOPARD:腾讯AI Lab西雅图实验室推出的视觉语言模型
LEOPARD是由腾讯AI Lab西雅图实验室推出的视觉语言模型,专为处理含有大量文本的多图像任务设计。该模型通过自适应高分辨率多图像编码模块和大规模多模态指令调优数据集,在多个基准测试中表现卓越,适用于自动化文档理解、教育和学术研究、商业智能和数据分析等多个应用场景。
40 2
LEOPARD:腾讯AI Lab西雅图实验室推出的视觉语言模型
|
2月前
|
机器学习/深度学习 人工智能 Python
MuCodec:清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器
MuCodec是由清华大学深圳国际研究生院、腾讯AI实验室和香港中文大学联合开发的超低比特率音乐编解码器。它能够在0.35kbps至1.35kbps的比特率下实现高效的音乐压缩和高保真重建,适用于在线音乐流媒体服务、音乐下载、语言模型建设等多个应用场景。
40 1
MuCodec:清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器
|
30天前
|
人工智能 JSON 自然语言处理
智能化AI工具-语言翻译与本地化
在全球化发展的背景下,语言翻译与本地化需求日益增长。无论是跨境电商、国际合作,还是本地化应用开发,都需要高效、准确的翻译解决方案。阿里云通义千问作为一款强大的大语言模型,不仅具备出色的自然语言理解能力,还能够在多语言翻译和本地化场景中发挥重要作用。本博客将详细介绍如何基于阿里云通义千问开发语言翻译与本地化工具,包括产品介绍、程序代码以及阿里云相关产品的具体使用流程。
67 10
|
Web App开发 人工智能 API
工具推荐:一款强大的AI翻译插件
工具推荐:一款强大的AI翻译插件
1118 0
工具推荐:一款强大的AI翻译插件
|
人工智能 算法 数据可视化
使用AI焕发那场亚运的精彩--给回忆增添色彩,对未来充满期待
1974年9月1日,第七届亚洲运动会在伊朗首都德黑兰的阿里亚梅尔体育中心的主体育场开幕,这是新中国首次参加亚运会。而今正值亚运110周年,第19届杭州亚运会即将举办。本次通过参与“历久弥新——用 AI 修复亚运会珍贵史料”活动,使用阿里云的 AI 技术对亚运会历史老照片进行修复,重燃亚运经典,为亚运助威。
659 8
|
8月前
|
人工智能 JavaScript API
一个接口白嫖四个AI平台, 五个翻译平台
薅夷长技以制夷, 要大薅,快薅,多薅,苦薅,实薅,加油薅,没有了薅字,薅仔就不配当薅仔。薅字当头,薅就完了,就薅
343 4
|
8月前
|
机器学习/深度学习 人工智能 数据可视化
太强!AI没有落下的腾讯出YOLO-World爆款 | 开集目标检测速度提升20倍,效果不减
太强!AI没有落下的腾讯出YOLO-World爆款 | 开集目标检测速度提升20倍,效果不减
701 0
|
8月前
|
人工智能 前端开发 PyTorch
构建自己 AI 翻译助手取代谷歌翻译
构建自己 AI 翻译助手取代谷歌翻译
199 0

热门文章

最新文章