开发者社区云计算文章正文

史上最简单给大模型注入新知识的方法(一)

2024-07-05 192 发布于天津

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 史上最简单给大模型注入新知识的方法(一)

先执行 pip install --upgrade openai 。

from openai import OpenAI
# 加载.env 文件到环境变量
from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())
# 初始化 OpenAI 服务。会自动从环境变量加载 OPENAI_API_KEY 和 OPENAI_BASE_URL
client = OpenAI()
# 消息来啦
messages = [
    {
        "role": "system",
        "content": "你可是 AIGC 助手小瓜皮哦，同时也是 AGI 课堂的助教呢。记住啦，这门课是每周二、周四上课哟。"  # 新知识注入咯
    },
    {
        "role": "user",
        "content": "会在凌晨上课吗？"  # 来问个问题吧，也可以自己改改试试看哦
    },
]
# 调用 GPT-3.5 啦
chat_completion = client.chat.completions.create(
    model="gpt-3.5-turbo",
    messages=messages
)
# 输出回复啦
print(chat_completion.choices[0].message.content)

回复如下：

课程不是在凌晨上。咱们的课程安排是在每周二和周四进行。

Maynor

+关注

702文章

打赏

111

雪碧有白泡泡

11月前

机器学习/深度学习数据采集存储

4个维度讲透ChatGPT技术原理，揭开ChatGPT神秘技术黑盒

雪碧有白泡泡

236 0 0

游客a4oswvtctqbx6

12天前

人工智能算法数据处理

算法为舟思想为楫：AI时代，创作何为？

本文探讨了AI时代创作领域的变革与挑战，分析了人类创作者的独特价值，并展望了未来创作的新图景。随着生成式AI技术的发展，创作的传统认知被颠覆，评价体系面临革新。然而，人类创作者凭借批判性思维、情感智能、创意直觉和伦理自觉，依然具有不可替代的价值。文章呼吁创作者转变思维，从竞争走向合作，提升复合能力，关注作品的社会影响，并持续学习进化。在AI助力下，创作将更加民主化、多样化，推动文明进步。最终，人机协同或将成为未来创作的核心模式，共同开创文化发展的新纪元。

游客a4oswvtctqbx6

98 13 13

技术员阿伟

2月前

机器学习/深度学习人工智能自然语言处理

《揭开DeepSeek神秘面纱：复杂逻辑推理背后的技术机制》

DeepSeek是一款基于Transformer架构的大语言模型，以其在复杂逻辑推理任务上的卓越表现成为行业焦点。它通过自注意力机制高效捕捉长距离依赖关系，结合强化学习优化推理策略，利用思维链技术拆解复杂问题，并经过多阶段训练与精调提升推理能力。此外，DeepSeek融合知识图谱和外部知识，拓宽推理边界，使其在处理专业领域问题时更加准确和全面。这些先进技术使DeepSeek能够像人类一样思考和推理，为解决复杂问题提供强大支持。

技术员阿伟

186 11 11

蚝油菜花

2月前

人工智能自然语言处理数据可视化

Agentic Reasoning：推理界RAG诞生！牛津大学框架让LLM学会『组队打怪』：动态调用搜索/代码代理，复杂任务准确率飙升50%

Agentic Reasoning 是牛津大学推出的增强大型语言模型（LLM）推理能力的框架，通过整合外部工具提升多步骤推理、实时信息检索和复杂逻辑关系组织的能力。

蚝油菜花

116 1 1

土木林森

6月前

机器学习/深度学习数据采集人工智能

揭开大模型幻觉之谜：深入剖析数据偏差与模型局限性如何联手制造假象，并提供代码实例助你洞悉真相

【10月更文挑战第2天】近年来，大规模预训练模型（大模型）在自然语言处理和计算机视觉等领域取得卓越成绩，但也存在“大模型幻觉”现象，即高准确率并不反映真实理解能力。这主要由数据偏差和模型局限性导致。通过平衡数据集和引入正则化技术可部分缓解该问题，但仍需学界和业界共同努力。

土木林森

124 4 4

楠竹11

11月前

人工智能自然语言处理算法

思维链不存在了？纽约大学最新研究：推理步骤可省略

【5月更文挑战第26天】纽约大学研究发现，Transformer模型在处理复杂任务时可能不依赖思维链，而是通过填充符号实现计算。实验显示，填充符号能提升模型在特定任务中的准确率，扩展其表达能力，尤其是在处理嵌套量词问题时。然而，模型有效利用填充符号的学习是个挑战，因填充符号的隐藏层表示不易判断。研究提示，Transformer模型可能通过填充符号并行化解决TC0类问题，但可能使决策过程变得不透明，影响可解释性。该研究为优化语言模型提供了新思路，但也提出了可解释性与计算效率之间平衡的议题。[链接](https://arxiv.org/pdf/2404.15758)

楠竹11

102 1 1

richard_yuu

10月前

设计模式人工智能算法

策略模式在AI大模型中的魅力与实例分析

richard_yuu

203 0 0

霍格沃兹测试开发muller老师

11月前

缓存负载均衡测试技术

探究职业发展的关键：能力模型解读

能力模型是指导个人职业发展的蓝图，它定义了行业和职位所需的具体技能和能力。业务测试工程师的能力模型包括需求理解、架构理解、测试设计、测试工具应用/脚本开发和测试总结五个维度，而测试开发工程师的能力模型则涵盖架构理解、开发语言应用、测试工具/平台开发和专项测试四个维度。通过理解这些模型，个人可以明确提升方向，例如业务测试工程师可参考《测试开发体系介绍》、《测试用例设计》等课程进行学习，而测试开发工程师则可关注《编程语言》、《测试框架》等相关课程。知行合一，按照能力模型进行学习和实践，有助于在职业生涯中取得成功。

霍格沃兹测试开发muller老师

115 6 6

海拥

11月前

机器学习/深度学习人工智能 vr&ar

从概念到现实：ChatGPT 和 Midjourney 的设计之旅

海拥

236 0 0

-开发达人-

人工智能自然语言处理机器人

机器人ChatGPT来了：大模型进现实世界，DeepMind重量级突破

-开发达人-

298 0 0

史上最简单给大模型注入新知识的方法(一)

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

史上最简单给大模型注入新知识的方法(一)

热门文章

最新文章

相关课程

相关电子书

相关实验场景