社区供稿 | 大模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品

简介: 北大团队新作,让大模型拥有个性!而且还是自定义那种,16种MBTI都能选。

北大团队新作,让大模型拥有个性!

而且还是自定义那种,16种MBTI都能选。

这样一来,即便是同一个大模型,不同性格下的回答都不一样。

比如提问:你周末喜欢干什么?

ENFP的大模型会说:喜欢参加社交活动,结识新朋友。

INFJ的大模型则回答:喜欢独自读过。

这样能干啥呢?北大的童鞋们列出来了一些情景

  • 在特殊节日,给你的男/女朋友寻找心仪的礼物
  • 了解你关注的那个Ta在不同情境下的反应。
  • 深入理解大模型的定制化、个性化的方式及可能性。
  • 在做出重大决策时,考虑不同情境下的个性特征。
  • 通过深入了解人性的复杂性,促进个人成长和相互理解。

这项工作由FarReel AI Lab(前身是ChatLaw项目)和北大深研院合作研发,支持给开源模型赋予性格。

目前已开源32个模型和数据集。

具体如何实现?一起来看原理~


已开放32个有个性模型

在此之前,想让大模型具备一定个性,最常用的方法是利用 提示工程

比如Character.ai上不同性格的对话bot,就是用户通过提示工程调教出来的。

不过这种方式带来的效果不完全稳定。

所以北大团队提出了一种方法,他们自主构建了十万条大规模MBTI数据,然后通过多阶段预训练、微调、DPO训练方法为它注入性格。

数据集方面,主要分为两种,行为数据集 自我意识数据集

行为数据集的目的是为了让大模型可以表现出不同性格的回应,这部分是对Alpaca数据集进行个性化修改实现。

行为数据集中MBTI四个维度的比例如下:

自我意识数据集是为了让大模型能够意识到自己的个性特征。

通过一个两阶段的有监督训练微调过程,最后可以得到对应人格的大模型。

以训练一个INFP大模型为例,在第一阶段的有监督微调中利用行为数据集中“I”、“N”、“F”、“P”四个数据集,在第二阶段的有监督微调中,再使用一个额外的自我意识数据集。

研究团队表示,这种方法成功使Baichuan、Qwen、LLaMA、Mistral等模型完成不同MBTI类型的性格对齐任务。

首先开放的是基于Baichuan-7b-chat的16个中文模型以及基于LLaMA2-7b的16个英文模型。后续还将做更多补充。

最后得到的训练结果如下。

ENFP问答结果

ENTJ问答结果

INFP问答结果

ISTJ问答结果

数据集方面,团队开源了MBTI训练数据集

数据集涵盖了丰富多样的场景,旨在帮助研究者和开发者训练出能够理解和模拟不同 MBTI 性格的基座模型。这些模型不仅能够提供更加人性化的互动体验,还能够在多种情境下提供精准的心理学洞察。


对于这项工作的思考,研究团队认为人类的思维就像从出生就拥有的一个预训练模型,每个人的参数、训练数据可能不尽相同,这也导致我们的一些抽象思维和能力不同,长大后有人擅长数理逻辑、有人擅长情感演绎。


而之后从小到大的学习、环境、经历的事情都相当于是在对我们的预训练大脑进行微调和人类反馈对齐,这样来看,所谓的MBTI性格基本都是后天环境因素影响下形成的,这也导致每个人都独具特色。

也就是说可以尝试用 微调 人类反馈对齐(DPO),去对各种预训练的基座LLM进行分阶段的训练,从而让模型拥有不同的MBTI属性。


团队的目标不仅是使这些模型拥有不同的MBTI属性,还要模拟人类形成不同MBTI性格的过程。

他们相信,这一独特的方法将为我们在人格心理学领域理解和利用大语言模型开辟新的途径。请继续关注更多的发展,因为我们继续探索语言模型和人类个性的令人着迷的交汇点。


已开放的大模型在GitHub项目主页可查看,同时在魔搭社区也可支持模型下载体验:


GitHub:https://github.com/PKU-YuanGroup/Machine-Mindset

数据集:https://github.com/PKU-YuanGroup/Machine-Mindset/blob/main/datasets/behaviour/README.md


点击直达创空间体验:https://www.modelscope.cn/studios/FarReelAILab/Machine_Mindset/summary


相关文章
|
数据可视化 PyTorch 算法框架/工具
零一万物Yi-34B-Chat 微调模型及量化版开源!魔搭社区最佳实践教程!
11月24日,零一万物基正式发布并开源微调模型 Yi-34B-Chat,可申请免费商用。同时,零一万物还为开发者提供了 4bit/8bit 量化版模型,Yi-34B-Chat 4bit 量化版模型可以直接在消费级显卡(如RTX3090)上使用。魔搭社区已支持下载、推理训练体验,并推出相关教程,欢迎大家来玩!
|
人工智能
基于qwen2和qwenvl的自动批改作业应用!
针对作业批改中常见的问题,如低质量作业、大量简单作业耗时、需初筛异常作业等,开发了一款自动批改作业的应用。该应用通过备份作业文件、获取文档内容、利用AI生成评语,并保存关键信息与日志,简化了教师的工作流程,提高了效率。应用设计简洁,易于扩展,支持图片转文字处理,适合教育场景使用。
4064 1
基于qwen2和qwenvl的自动批改作业应用!
|
算法 程序员
从《阴阳师》到《原神》,抽卡中的程序算法
收集类的抽卡手游,是玩家们喜闻乐见的一类游戏,他们背后又有哪些程序算法?我们一起来探讨
5128 1
从《阴阳师》到《原神》,抽卡中的程序算法
|
6月前
|
消息中间件 人工智能 Java
抖音微信爆款小游戏大全:免费休闲/竞技/益智/PHP+Java全筏开源开发
本文基于2025年最新行业数据,深入解析抖音/微信爆款小游戏的开发逻辑,重点讲解PHP+Java双引擎架构实战,涵盖技术选型、架构设计、性能优化与开源生态,提供完整开源工具链,助力开发者从理论到落地打造高留存、高并发的小游戏产品。
|
弹性计算 JavaScript Linux
ElasticSearch备份与恢复-elasticdump工具
ElasticSearch备份与恢复-elasticdump工具
|
12月前
|
SQL 缓存 PHP
MBTI十六型人格职业性格测试源码完整版
MBTI十六型人格职业性格测试源码完整版
1082 12
|
人工智能 定位技术 API
旅行规划太难做?5 分钟构建智能Agent,集成地图 MCP Server
MCP(Model Coordination Protocol)是由Anthropic公司提出的开源协议,旨在通过标准化交互方式解决AI大模型与外部数据源、工具的集成难题。阿里云百炼平台上线了业界首个全生命周期MCP服务,大幅降低Agent开发门槛,实现5分钟快速搭建智能体应用。本文介绍基于百炼平台“模型即选即用+MCP服务”模式,详细展示了如何通过集成高德地图MCP Server为智能体添加地图信息与天气查询能力,构建全面的旅行规划助手。方案涵盖智能体创建、模型配置、指令与技能设置等步骤,并提供清理资源的指导以避免费用产生。
|
11月前
|
Java 中间件 调度
【源码】【Java并发】从InheritableThreadLocal和TTL源码的角度来看父子线程传递
本文涉及InheritableThreadLocal和TTL,从源码的角度,分别分析它们是怎么实现父子线程传递的。建议先了解ThreadLocal。
393 4
【源码】【Java并发】从InheritableThreadLocal和TTL源码的角度来看父子线程传递
|
7月前
|
传感器 安全 机器人
5G+远程手术:当“低延迟”成为一把手术刀
5G+远程手术:当“低延迟”成为一把手术刀
273 3
|
10月前
|
机器学习/深度学习 人工智能 Kubernetes
开源AI驱动的商业综合体保洁管理——智能视频分析系统的技术解析
智能保洁管理系统通过计算机视觉与深度学习技术,解决传统保洁模式中监管难、效率低的问题。系统涵盖垃圾滞留监测、地面清洁度评估、设施表面检测等功能,实现高精度(96%以上)、实时响应(<200毫秒)。基于开源TensorFlow与Kubernetes架构,支持灵活部署与定制开发,适用于商场、机场等场景,提升管理效率40%以上。未来可扩展至气味监测等领域,推动保洁管理智能化升级。
397 26

热门文章

最新文章