SocraticLM:通过 AI 提问引导学生主动思考,中科大与科大讯飞联合推出苏格拉底式教育大模型

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: SocraticLM 是由中科大和科大讯飞联合开发的苏格拉底式教学大模型,通过提问引导学生主动思考,提供个性化教学,显著提升教学效果。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 教学方式:采用苏格拉底式提问,引导学生主动思考和解决问题。
  2. 个性化教学:根据学生认知状态提供个性化辅导,模拟真实教学场景。
  3. 多轮对话:基于多轮教学对话数据集,逐步引导学生解决问题。

正文(附运行示例)

SocraticLM 是什么

公众号: 蚝油菜花 - SocraticLM

SocraticLM 是由中国科学技术大学和科大讯飞联合开发的苏格拉底式教学大模型。该模型通过“Thought-Provoking”教学范式,模拟苏格拉底式的提问方式,引导学生主动思考和解决问题。SocraticLM 在名为 SocraTeach 的数据集上进行了微调,该数据集包含 35,000 个精心设计的多轮教学对话,模拟了真实的教学场景。

实验结果表明,SocraticLM 在教学性能上显著优于 GPT-4,总体质量提升了 12%。模型还配备了一个包含五个教学维度的综合评估系统,用于全面评估大型语言模型的教学质量。SocraticLM 的开发不仅提升了教学效果,也为教育技术的发展提供了新的思路。

SocraticLM 的主要功能

  • 苏格拉底式教学:通过提问引导学生主动思考和解决问题,鼓励学生表达自己的想法,挑战假设,并独立思考。
  • 个性化教学:根据不同学生的认知状态和反应类型提供个性化的教学指导,识别学生的不同需求并提供相应的教学策略。
  • 多轮对话能力:基于 SocraTeach 数据集进行微调,能够与学生进行多轮对话,逐步引导学生解决问题。
  • 综合评估系统:配备五个教学维度的评估系统,包括问题引导能力、概念理解能力、解释能力等,全面评估教学质量。

SocraticLM 的技术原理

  • 多智能体交互流程:采用“教导主任-教师-学生”的多智能体交互流程,教导主任监督和优化教师的教学指令,教师生成苏格拉底式的教学指令。
  • 步骤级引导问题分解:将复杂的教学过程拆分成多个步骤,并在每个步骤中生成相应的引导问题,确保教学过程的逻辑性和一致性。

如何运行 SocraticLM

1. 环境准备

首先,确保你的环境满足以下要求:

  • 操作系统:CentOS Linux release 7.7.1908
  • CPU:15 vCPU Intel(R) Xeon(R) Platinum 8358P CPU @ 2.60GHz
  • GPU:NVIDIA RTX 3090 GPUs
  • CUDA:12.1

安装所需的依赖:

pip install -r requirements.txt

2. 数据预处理

将 SocraTeach 数据集分割为训练集、验证集和测试集:

cd codes
python data_preprocess.py --path ../data/SocraTeach_multi.json --split_fold ../data/data_split

3. 运行训练代码

使用以下命令进行模型训练:

cd codes
bash train_chat.sh

4. 运行评估代码

选择评估任务并运行评估代码:

cd codes
bash single_evaluate.sh

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
1月前
|
机器学习/深度学习 人工智能 人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
354 121
|
1月前
|
人工智能 人机交互 知识图谱
当AI学会“融会贯通”:多模态大模型如何重塑未来
当AI学会“融会贯通”:多模态大模型如何重塑未来
273 114
|
1月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
263 120
|
1月前
|
人工智能 API 开发工具
构建AI智能体:一、初识AI大模型与API调用
本文介绍大模型基础知识及API调用方法,涵盖阿里云百炼平台密钥申请、DashScope SDK使用、Python调用示例(如文本情感分析、图像文字识别),助力开发者快速上手大模型应用开发。
1011 16
构建AI智能体:一、初识AI大模型与API调用
|
1月前
|
机器学习/深度学习 人工智能 搜索推荐
|
2月前
|
人工智能 自然语言处理 IDE
模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验
通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。
674 109
|
2月前
|
分布式计算 测试技术 Spark
科大讯飞开源星火化学大模型、文生音效模型
近期,科大讯飞在魔搭社区(ModelScope)和Gitcode上开源两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。
270 2
|
2月前
|
人工智能 Java API
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
1418 122
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
|
3月前
|
存储 人工智能 自然语言处理
告别文字乱码!全新文生图模型Qwen-Image来咯
通义千问团队开源了Qwen-Image,一个20B参数的MMDiT模型,具备卓越的文本渲染和图像编辑能力。支持复杂中英文文本生成与自动布局,适用于多场景图像生成与编辑任务,已在魔搭社区与Hugging Face开源。
683 2

热门文章

最新文章