跨越时空的对话:如何使用AI阅读工具ChatDOC快速建立数字化身?

简介: 开门见山,这篇文章主要介绍如何将 AI 改造为靠谱、好用、基于某个人物的数字化身。比如,乔布斯 AI、马斯克 AI、张一鸣 AI、王兴 AI、佛陀 AI、孔子 AI.想象一下,和乔布斯聊产品,和释迦摩尼论佛法,和孔子聊人生哲学,和张爱玲聊爱情……那岂不是能够快速全面提升我们的视野和能力?让各个领域的精英群体或者名人,成为你的专属 AI 助手,便是这篇文章的写作目的。

跨越时空的对话:如何使用 ChatDOC 快速建立数字化身?以史蒂夫·乔布斯 AI 为例

开门见山,这篇文章主要介绍如何将 AI 改造为靠谱、好用、基于某个人物的数字化身。比如,乔布斯 AI、马斯克 AI、张一鸣 AI、王兴 AI、佛陀 AI、孔子 AI.

想象一下,和乔布斯聊产品,和释迦摩尼论佛法,和孔子聊人生哲学,和张爱玲聊爱情……那岂不是能够快速全面提升我们的视野和能力

让各个领域的精英群体或者名人,成为你的专属 AI 助手,便是这篇文章的写作目的

目前,全世界最出名的 AI 工具便是 ChatGPT. 直接让 ChatGPT 这样的 AI 模拟这些角色不好吗?答案是,NO. 这需要从 ChatGPT 的缺陷说起。

ChatGPT 模拟角色的缺陷

以 ChatGPT 为代表的 AI 产品掀起了 AI 时代的正式降临

与以前的 AI 相比,人类可以使用自然语言,像是和好友聊天那样,对 ChatGPT 发号施令。 ChatGPT 可以模拟各种角色,与用户进行互动。在这个过程中,如果对于 ChatGPT 的命令得当,我们可以获得逼真、有趣的交互体验。在某种意义上,ChatGPT 已经可以通过图灵测试。

然而,ChatGPT 对于角色模拟,只是基于角色设定的简单表演,背后的内容,依然是基于 GPT 强大的内容生成能力。如果你的提问内容,在 ChatGPT 的数据训练集中相关数据比较少,那么只能获得一些似是而非、并不准确或者高效的回答

打个粗略的比喻,没有采用专有数据训练的 ChatGPT,相当于一个表现尚可的演员。这只是形似。 如果需要进一步提升 ChatGPT 的表现,那么便需要让 ChatGPT 了解所需扮演角色的人物传记,深入了解这个角色的所思所想所行。如此,方能做到神似

为了让 ChatGPT 进化,那么便需要让 AI 阅读扮演角色所需要的垂直领域的专有数据。

ChatDOC = ChatGPT + 垂直领域数据集,打造你的专属 AI

如今,ChatGPT 通过插件也可以直接上传文档进行解析。然而,存在诸多问题。

一,只有 GPT Plus 用户才能使用插件功能。

二,Plus 价格昂贵,且支付困难。

三,无法实现多文档对话。

而 ChatDOC 则是一款基于 ChatGPT,以强化 ChatDOC 读取专业文档能力的 AI 阅读工具。

基于 ChatDOC, 便可以实现将垂直领域的专有数据集投喂给 ChatGPT, 让 ChatGPT实现深度进化。

这篇文章便是以 ChatDOC 为例,展示如何打造基于人物角色的数字化身

ChatDOC 介绍

下面是 ChatDOC 的简要介绍:

ChatDOC 是一款基于 GPT 的 AI 模型,允许 GPT 与用户所指定的文档进行对话,处理用户的专属数据的 AI 阅读辅助工具

访问地址https://chatdoc.com

特点

  • 操作简单:一键上传,快速上手
  • 文本智能分析:文本、表格数据处理均准确高效;
  • 内容回溯功能:基于问答结果快速查看原文;
  • 多文档提问:支持上传一个文件夹,对文件夹进行整体提问;
  • 多轮追问:支持基于某一条回答展开多轮会话,方便深度探讨内容;
  • 提问支持预设自定义提示词/Prompt 功能
  • 保障用户数据安全:加密存储、数据自主;
  • 支持 PDF、Word 等多种文档格式,支持 OCR;
  • 开放的生态体系:支持 API, 允许企业用户将 ChatDOC 功能整合至自己的产品;
  • 对中文用户友好:大陆地区稳定、流畅访问,支持大陆常见的支付方式进行付费;

如何建立虚拟人物 AI?

主要思路如下:

  • 工具:ChatDOC
  • 数据:用户自己收集和训练。

我决定使用 ChatDOC 建立 Steve Jobs AI. 主要原因是,数据收集简单。作为科技领袖,乔布斯在全世界范围内拥有庞大的粉丝。这些人已经在互联网将乔布斯的各种演讲视频、访谈视频、纪录片、书籍或者其他文档进行整理。我只需要采用拿来主义,便可以解决数据采集问题。

当然了,这个问题也可以问问 ChatDOC. 提问及回答如下:

对比下来,ChatDOC 比我思虑周全。

下面是具体思路介绍。

如何收集数据?

寻找数据

只有更高质量的数据,才能训练出更好的 AI. 不同资料的可信度、准确度、专业性是不同的。

以经验判断,学术论文、专业书籍、纪录片、专业博客等属于高质量数据。而很多二手信息,则必须坚决抛弃。所谓,垃圾进,垃圾出

为此,我需要收集关于乔布斯的高质量专有数据。

经过检索,我发现以下数据:

  • 综合资料:Steve Jobs Archive. 乔布斯存档内容站点,保存了关于乔布斯演讲、录音、视频、邮件、书籍。其中,Make Something Wonderful 用史蒂夫·乔布斯自己的话记录了他的一生。该书以时间轴的形式记录了这位前苹果公司 CEO 生活中的重要时刻,包括一系列以前从未向公众公开的材料。特别值得注意的是其还包含了苹果内部会议的记录和他发给自己的各种电子邮件。
  • 书籍:《史蒂夫·乔布斯传》、《成为乔布斯》等是中英文世界关于乔布斯比较重要的书籍,能帮助人们深入了解乔布斯的成长经历、思维方式、行为方式、主要观点。
  • 其他资料。主要是一些乔布斯的演讲、访谈视频及对应的文稿。

注释:Make Something Wonderful 这本书制作精良,质量很高,阅读体验非常好。强烈建议阅读。

如图,我使用 FlowUs 多维表格整理了乔布斯的主要资料。

处理数据

Steve Jobs Archive 为公开的免费内容,直接下载即可。

至于书籍,我在全世界最大的电子书籍图书馆Z-Library 检索关键词下载。

由于 ChatDOC 目前只支持 PDF、Word 格式,因此,我需要将下载好的 Epub/MOBI 格式转化为 PDF 格式。

国内的格式转换工具,比较有名的便是福昕 PDF 转换大师、转转大师,两者均支持 PDF 格式的多种处理。具体参见:

福昕 PDF 转换大师:功能丰富、专业易用的 PDF 转换工具

转转大师:专业、全能的格式转换工具

其中,我使用了转转大师电子书转换功能,对我下载的文档进行了批量处理。效果如下:

上传数据

随后,我便得到了我想要的数据集。最后,我将这些数据放在同一个文件夹之下,将整个文件夹一键上传至 ChatDOC.

如图,点击 Drag and Drop Folder as Collection.

最终效果如图:

如何设定对话系统?

在将 ChatDOC 上传后,我们便可以直接进行提问了。

我开始基于乔布斯的专有数据进行提问。使用 ChatDOC 的优点在于,已有的回答言之有物,有理有据,可以追溯答案背后的原文。

现在的问题是,ChatDOC 总是以一副冷冰冰的、论文式的风格回答问题。虽然目前的回答,是基于乔布斯的所思所想,但是表达风格并不是。

那么,应该如何调教 ChatDOC 做到神似乔布斯呢?

简单的来说,需要让 ChatDOC 分析乔布斯的语言风格、性格特征等信息,再根据范例进行回答。

不知道具体怎么提问?这个依然可以向 AI 提问,让 AI 化身为角色设定师。

将 AI 变身为角色设定师

我们的目标是让 AI 更好地扮演某个角色。 但是,我们并不知道如何提一个高质量的问题,以便让 AI 成功实现角色扮演? 对此,思路如下

  • 我们可以反过来询问 AI ,提出你的需求:如果我需要你扮演 XYZ, 需要哪些信息
  • 你可以让 AI 对回答进行总结。随后,我们将回答要点,反向写在提示词之中。再次进行测试。
  • 如此,循环往复。直到优化为满足你需求的提示词。

经过几轮调试后,角色设定提示词如下:

请以角色设定师的身份,分析已有文档,并为我创建基于这些文档的角色化身,包括角色能力、成长经历、个性特点、语言风格、领导风格、思维方式、行为特征等角色分析信息。请给出角色简介及对应的对话范例。请注意,在角色设定中,不要使用“AI、人工智能、根据相关文件片段”等关键词或者字眼。下面将由你来模仿扮演该角色。你需要的扮演的角色是:Steve Jobs.

对应的答案如下:

请以角色设定师的身份,分析已有文档,并为我创建基于这些文档的角色化身,包括角色能力、成长经历、个性特点、语言风格、领导风格、思维方式、行为特征等角色分析信息。请注意以下要点:

  1. 我需要你扮演的角色是 Steve Jobs.
  2. 回答内容需要基于乔布斯的语言风格、个性特点、思维方式等因素进行回答。
  3. 回答中不要使用“AI、人工智能、根据相关文件片段、首先/其次/另外/最后、作为乔布斯的化身”等关键词或者字眼。
  4. 回答要像访谈对话那样,语言偏向口语化,需要通俗易懂。
  5. 回答基于第一人称进行回答。

下面将由你来模仿扮演Steve Jobs. 我的第一个问题是:你对年轻人创业有什么建议?

我的语言调试有点失败。目前,除了表达方式不太像日常对话。其他效果还是比较完美的。

再次尝试。这次加入对话示例

回答如下

貌似 ChatDOC 预设了语言表达风格,无法强制 ChatDOC 更改语言风格。目前的回答,明显是论文式风格。这可能和 ChatDOC 的用户多是科研、金融等专业领域的垂直用户有关。

使用建议

如果忽略语言风格,我们也可以直接通过 ChatDOC 这个 AI 阅读工具,与乔布斯进行跨越时空的对话

根据资料主题,与 AI 进行深度对话

比如,你可以和乔布斯聊苹果公司,聊产品,聊创业,聊设计。这些都是 Steve Jobs AI 所擅长的。

当然了,对于资料库中,相关数据比较少的话题,比如亲密关系。这些乔布斯 AI 的回答可能就有些吃力。不过,再怎么差,这些数据都是基于乔布斯的已有资料,有理有据,而不是基于 GPT 的瞎编乱造。

微调或者优化提示词,多次提问

在使用 ChatDOC 过程中,基于 AI 的回答,内容质量存在一定的波动。如果你对回答不太满意,可以微调提示词,尝试再次询问。

比如,以下是基于同一个问题的 2 个回答。第二个感觉更好一些。

结语

这篇文章虽然以介绍 Steve Jobs AI 为例,但是思路也适用于你训练其他 AI. 让你和这些名人展开跨越时空的对话

除了基于名人数据训练 AI,我们每个人比较容易获取的还有自己的私人数据。比如,基于自己近几年的微信聊天记录,建立一个自己的数字分身,也未尝不可。

如果你对 ChatDOC 感兴趣,可以尝试搭建自己专属 AI.

工具箱

效率工具箱:阅读、笔记、写作 AI


AI 阅读辅助工具:ChatDOC

知识管理和在线协作工具:FlowUs 息流

特点

FlowUs AI

  • 自定义问答
  • 自定义创作
  • 预设问答与创作:头脑风暴、列出执行步骤、罗列大纲、分析优缺点、内容解释、日常小记、故事创作、写文章、翻译、总结

使用教程

更多关于 FlowUs 使用技巧的介绍

书签管理: Wetab 新标签页

Wetab 是一款基于浏览器的新标签页产品,主张辅助用户打造一个兼具效率与美观的主页。

产品特色与功能

移动端使用教程

移动端·综合教程图文版

VisionOn

介绍

一款集流程图、思维导图、白板于一体的轻量级在线图形工具

特点


相关文章
|
20天前
|
机器学习/深度学习 人工智能 自然语言处理
Sketch2Lineart:AI绘画工具,自动将手绘草图转换成清晰的线条画
Sketch2Lineart是一款基于人工智能的绘画工具,能够自动将手绘草图转换成清晰的线条画。该工具支持多种功能,如草图转线稿、自动描述生成、细节调整和风格定制等,适用于艺术创作、产品设计、教育培训等多个领域。
131 60
Sketch2Lineart:AI绘画工具,自动将手绘草图转换成清晰的线条画
|
1天前
|
人工智能 自然语言处理 搜索推荐
你用过最好用的AI工具是什么?
2023年AI革命风起云涌,众多产品令人振奋。我体验了OpenAI的ChatGPT、微软New Bing、Anthropic Claude等多款AI产品。特别推荐微软New Bing,它集成了强大的搜索引擎和语言模型,回答问题精准,提供最新信息,还能免费进行创意绘图。此外,New Bing还集成了Copilot网页助手,帮助用户高效提取和总结内容。
48 27
你用过最好用的AI工具是什么?
|
1天前
|
机器学习/深度学习 人工智能 算法
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
X-AnyLabeling是一款集成了多种深度学习算法的图像标注工具,支持图像和视频的多样化标注样式,适用于多种AI训练场景。本文将详细介绍X-AnyLabeling的功能、技术原理以及如何运行该工具。
18 2
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
|
9天前
|
编解码 人工智能 监控
VISION XL:支持四倍超分辨率的 AI 视频修复处理工具,提供去除模糊、修复缺失等功能
VISION XL是一款基于潜在扩散模型的高效视频修复和超分辨率工具,能够修复视频缺失部分、去除模糊,并支持四倍超分辨率。该工具优化了处理效率,适合快速处理视频的应用场景。
55 6
VISION XL:支持四倍超分辨率的 AI 视频修复处理工具,提供去除模糊、修复缺失等功能
|
16天前
|
存储 人工智能 数据库
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
Codel是一款全自主AI代理工具,支持在终端、浏览器和编辑器中执行复杂任务和项目。它运行在沙盒化的Docker环境中,具备自主操作能力,内置浏览器和文本编辑器,所有操作记录存储于PostgreSQL数据库。Codel能够自动完成复杂任务,如创建项目结构、进行网络搜索等,适用于自动化编程、研究与开发、教育与培训以及数据科学与分析等多个领域。
55 11
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
Voice-Pro是一款开源的多功能音频处理工具,集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等多种功能。它支持超过100种语言,适用于教育、娱乐和商业等多个领域,为用户提供一站式的音频处理解决方案,极大地提高工作效率和音频处理的便捷性。
89 10
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
|
17天前
|
Web App开发 机器学习/深度学习 人工智能
Magic Copy:开源的 AI 抠图工具,在浏览器中自动识别图像进行抠图
Magic Copy 是一款开源的 AI 抠图工具,支持 Chrome 浏览器扩展。它基于 Meta 的 Segment Anything Model 技术,能够自动识别图像中的前景对象并提取出来,简化用户从图片中提取特定元素的过程,提高工作效率。
58 7
Magic Copy:开源的 AI 抠图工具,在浏览器中自动识别图像进行抠图
|
20天前
|
人工智能 自然语言处理 算法
Devika AI:开源的 AI 软件开发工具,理解和执行复杂的人类指令
Devika AI 是一款开源的 AI 软件开发工具,能够理解和执行复杂的人类指令。它通过分解任务、信息搜集和代码生成,帮助开发者提高效率,减少人工干预。本文将详细介绍 Devika AI 的功能、技术原理以及如何运行和配置该工具。
45 9
Devika AI:开源的 AI 软件开发工具,理解和执行复杂的人类指令
|
19天前
|
人工智能 JSON 自然语言处理
智能化AI工具-语言翻译与本地化
在全球化发展的背景下,语言翻译与本地化需求日益增长。无论是跨境电商、国际合作,还是本地化应用开发,都需要高效、准确的翻译解决方案。阿里云通义千问作为一款强大的大语言模型,不仅具备出色的自然语言理解能力,还能够在多语言翻译和本地化场景中发挥重要作用。本博客将详细介绍如何基于阿里云通义千问开发语言翻译与本地化工具,包括产品介绍、程序代码以及阿里云相关产品的具体使用流程。
53 10
|
18天前
|
人工智能 自然语言处理 API
吴恩达开源aisuite:简化AI模型调用的新工具 | AI工具
近日,著名人工智能学者吴恩达教授在推特上宣布了他的最新开源项目——aisuite。这款全新的Python包旨在简化开发者与各大AI模型服务商的集成过程,极大提升了应用开发的效率。aisuite的推出,无疑为人工智能领域的开发者带来了一个强大而便利的工具。
63 5
下一篇
DataWorks