生成式人工智能的完整过时指南（MEAP）（二）（1）-阿里云开发者社区

第七章：使用生成式人工智能超越传统研究和学习工具

本章包括：

生成准确可靠的投资指导
将大型语言模型（LLMs）融入您的技能采用流程
将 LLMs 融入您的日常工作中

有人说 AI 不会让任何人失业，但是那些使用 AI 的人会让那些不使用 AI 的人失业。

当然，前提是 AI 不会首先把我们全部杀光，那么我们应该做些什么才能确保我们成为快乐用户组而不是遗憾的局外人？

让我给你提供一些背景。我比你想的要老很多。我用钢笔在纸上写了我的第一本书。它可能是一种非常古老的技术，但它是太阳能供电的（即：只有在我打开灯的时候才能发挥作用）。当然，后来我费了很多力气将整本书打字到电脑中。但是那时候我使用的软件（WordPerfect 4.2 for DOS）甚至没有自己的拼写检查功能。

从那以后，我的出版事业一直在新技术的推动下蓬勃发展。我的第一台打印机（从姐夫那里获得的），我的第一台文档扫描仪，我的第一次上网连接（是的：这确实是在打印机和扫描仪之后），我的第一台 DSL 调制解调器，我的发现和采用 Linux 等等。每一次变化都对我的工作效率和效能产生了明显影响。

但是这些变化都不及我从生成式人工智能中获得的核动力。这不仅仅是因为我可以以惊人的速度获取有关事件、关系、过程和趋势的详细信息。也不仅仅是因为突然间有更多的解析数据可供我使用。而是因为所有的事情现在都变得更快了。我所做的一切都是无缝进行的。

这里只是我在过去的一周里的几个互动实例：

曾几何时，选择一台新（二手）笔记本电脑需要进行长时间的深入研究：HP EliteBook 840 G3 是否具备我所需的所有端口？它使用什么样的视频芯片组？其 CPU 的性能如何与我之前测试过的其他 CPU 的基准性能评分相比？今天呢？只需要问**能否比较一下 HP EliteBook 840 G1 笔记本与 Lenovo ThinkPad T420 的规格和性能呢？然后是G3 配备 i5 芯片是否比 G1 配备 i7 芯片更好呢？**最后，我能期望它的电池寿命有多长呢？
曾几何时，找出如何访问特定笔记本电脑上的 WiFi 无线电卡可能需要在线搜索正确的用户手册的副本，并且希望手册中有相关信息。今天呢？只需要问：如何访问 Lenovo ThinkPad T420 上的 WiFi 卡？
曾几何时，要了解一些医学问题的背景意味着要在在线医学研究档案中搜索，希望有人已经进行了研究，它已经发表，可以在线获取，并且您能在合理的时间内从中提取意义。如今呢？只需问一下：病人戴着口罩（限制他的气流）进行的 ECHO（超声心动图）应力测试的结果会受影响吗？

当然，你会记得确认 AI 给出的任何信息，尤其是医疗信息。但即便如此，你肯定也想要了解这方面的情况。所以让我举几个例子，让你了解到你过去几乎每一个研究任务如何都可以变得更好、更快、更准确。

7.1 请求投资指导

GPT 能为您挑选股票买卖吗？可以的。GPT 实际上可以在没有您参与的情况下执行交易吗？可以的。这也是可能的。这是个好主意吗？也许现在还不是。坦率地说，我并没有急着按下那个特定的“开始”按钮。

但正如我们一次又一次看到的那样，AI 工具有许多特定的优势，当应用于正确的问题场景时，这些优势就会转化为超能力。嗯，我会说“投资指导”大概是接近“正确问题场景”的问题了。

其中一个明显的原因是做出明智的投资决策涉及消化大量数据。有多少数据？仅一个 10-K 表，公开交易公司每年都必须向美国证券交易委员会（SEC）提交的表格，就可能包含超过 10 万字。而且，通常情况下，它们并不是激动人心的写作。所以不要指望这样的文件会让你在海滩上的悠闲夏日午后着迷。

另一方面，要真正了解一家公司的当前价值，或准确地预测未来的发展，就必须以某种方式阅读并吸收其中包含的基本信息，还有其他文件。不要忽视投资研究的本质是对不止一个公司，而是对数十个甚至数千个公司进行尽职调查。

如果有一种 - 哦，我不知道 - 一种数字工具可以为我们访问和分析所有这些数据，那不是很棒吗？你觉得 GPT 可能在这方面有所帮助吗？

好吧，至少目前来说，先忘了 ChatGPT 吧：10 万字对于一个聊天提示来说太长了。但是到了书的这一部分，你已经熟悉了如何解决这个限制了。所以这就是当我拿着特斯拉 2021 年 12 月 31 日结束的财年的 10-K 表给 ChatPDF 处理时发生的事情。

这份文件本身可以在 SEC 网站上的网页上找到。要将其转换为 PDF 文档，我首先使用wget将 HTML 下载到了我的电脑上。

wget <url>

文件的巨大大小给我带来了一些麻烦，所以我使用了 Cloud Convert 网站将文件转换为 Markdown 格式。然后，免费的文件转换程序Pandoc让我很容易制作 PDF 文件：

pandoc -o tesla_10k.pdf --pdf-engine=xelatex tesla_10k.md

我将该 PDF 文件上传到 ChatPDF，并给出以下提示：

从 10-K 文件中，找出并解释对潜在投资者最重要的项目的意义。必要时，添加表格、摘要和分析。

我得到的回应的一部分如下（图表以 Markdown 格式保存）：

在第 66 页的 10-K 表格中，你可以找到截至 2021 年 12 月 31 日的合并资产负债表。以下是一些可能引起潜在投资者兴趣的关键项目：

项目	金额（以百万美元计）
现金及现金等价物	$16,214
有价证券	$9,986
总流动资产	$38,535
固定资产、厂房和设备净值	$22,936
总资产	$121,872
总流动负债	$23,758
长期债务	$12,385
总负债	$63,091
股东权益总额	$58,781

现金及现金等价物和有价证券是潜在投资者关注的重要项目，因为它们代表特斯拉的流动性状况。截至 2021 年 12 月 31 日，特斯拉的现金和有价证券总额达到 262 亿美元。这与上一年底的 194 亿美元相比，有了显著增长。这种流动性的增加对投资者来说是一个积极的信号，因为它表明特斯拉有足够的资源来支持其运营和投资于增长机会。

固定资产、厂房和设备是另一个对投资者来说重要的项目，因为它代表着特斯拉对固定资产（如工厂和设备）的投资。截至 2021 年 12 月 31 日，特斯拉的固定资产、厂房和设备的净账面价值达到 229 亿美元。这与上一年底的 186 亿美元相比有所增加，这表明特斯拉继续大量投资于其制造能力。

总负债也是投资者关注的重要项目，因为它代表着特斯拉的债务义务。截至 2021 年 12 月 31 日，特斯拉的总负债为 631 亿美元，其中包括

要获得一个全面的图像，你可能想要通过更多问题进行深入挖掘。我试过以下一个问题：

公司当前的资源配置是否存在风险？

这促使我作出以下回应：

是的，特斯拉在 10-K 表格中针对其资源分配确定了几个风险。公司计划通过大量现金投资和管理资源来加速业务增长，以满足全球销售、交付、安装、服务和车辆充电目标。不能保证这些计划将产生特斯拉产品的额外销售或安装，或公司将能够避免成本超支或雇佣额外人员来支持它们。此外，特斯拉面临着与供应链中断、政府监管和激励措施变化以及汽车行业其他公司的竞争相关的风险。这些风险可能会影响公司的财务表现和未来前景。

接下来的问题对我们的研究很有帮助：

特斯拉目前的流动比率和债权-资产比率是多少？

返回结果如下：

根据 10-K 表格提供的信息，截至 2021 年 12 月 31 日，特斯拉的流动比率为 1.14，其债权-资产比率为 2.08。这些比率可以在 10-K 表格的“当前负债及融资租赁”的部分和当前年度的“负债总额”下的第 359 页找到。重要的是要注意，这些比率可能随着时间的推移而发生变化，应与其他财务指标一起评估，以获得对特斯拉财务状况的全面了解。

想要一些背景信息吗？一个简单的后续问题可能有所帮助：

能帮我理解那些比率的意义吗？

这只是我收到的回复的一小部分：

流动比率是一种流动性比率，用于衡量一家公司使用其流动资产支付短期债务的能力。当前比率为 1 或更高通常被认为是很好的，因为这表明公司有足够的流动资产来支付其短期负债。在特斯拉的情况下，当前比率为 1.14，表明公司有足够的流动资产来支付其短期债务…

你有了解吗？但这只是开始。通过 AI 分析每个公司仍需要大量时间。但是，借助我们在早期章节中已经遇到的 API 工具，没有什么可以阻止您编写（相对）简单的自动化脚本，以：

下载 10, 100 或 1,000 家公司的 10-K 文件
将 HTML 文件转换为 PDF 文件
通过 API 将每个 PDF 提交到 ChatPDF
提示 GPT 根据其对每份 10-K 的评估为每家公司分配分数
返回一个列表，按其得分对所有评估的公司进行排名

不确定如何编写脚本？向 OpenAI 的您懂的人提问。只是友好提醒：该脚本可能会延伸到数百行，即使有 AI 的帮助，也需要数小时进行调试。

考虑到所有适当的 API 费用，你也可以每天、每周或每月运行此脚本。或者开设自己的全自动市场调研服务（几个月后，乘坐你的超级游艇退休到希腊群岛）。

听起来很有前途？我可以向你保证，我们并不是第一个想到这个想法的人。例如，一个名为 Global Predictions 的组织为个人提供了一项名为 Portfolio Pilot 的免费服务。该应用程序使用复杂的人工智能管道分析宏观市场状况，并将其产生的见解应用于每个用户自己的投资组合概况。使用（希望）可靠的投资原则，该工具可以提供实时投资建议。

重点是，Portfolio Pilot 声明他们不通过用户费用、广告或销售佣金来变现用户参与度，而是“通过与用户学习如何与我们的经济模型进行交互、运行模拟并将见解直接应用于其投资组合。”换句话说，他们正在利用获得大量消费者投资数据的价值。

当然，值得重申的是，LLM 在这个或任何其他主题上的指导只是一台计算机盲目地串联着一和零。计算机可能不像血肉和骨头的股票经纪人那样会故意欺骗你，但它仍然不应该被盲目信任。将这些指导用作明智决策的重要基础。

要点

不管有多复杂，任何 PDF 文档（包含 120 页或更少）都可以提交给 ChatPDF 并接受持续和深入的审查。和任何 API 一样，ChatPDF 的交互可以自动化，因此可以纳入复杂的操作中。顺便说一句，你在这一切中绝对不限于英语文档。

7.2 使用 LangChain 将搜索引擎连接到人工智能

开发者的世界已经爆发出许多巧妙的新工具、应用程序和处理大型语言模型和生成式人工智能的流程。一个特别灵活的例子是 LangChain 项目。总体目标是提供与各种 LLM 模型的轻松集成。但 LangChain 生态系统也是越来越多（有时是实验性的）项目的主场，这些项目将谦逊的 LLM 的极限推向了更远的地方。

花点时间浏览他们的网站，了解一下可能性。你会看到有多少工具是为帮助你构建更强大的应用程序而设计的。但你也可以将其用作连接你喜爱的人工智能与互联网的替代方案。

让我向你展示一下如何使用 LangChain 文档示例的变体来完成这项工作。

就像我们在这里使用的许多工具一样，LangChain 是为与 Python 一起使用而构建的。如果您仍然在运行 Python 环境，请添加这两个包，您就可以为此示例做好准备了：

pip install langchain[all]
pip install google-search-results

那个 google-search-results 包是干什么用的？它将使您能够在程序或脚本中访问 Google 的 SerpAPI，以便访问 Google 的搜索结果。然而，该功能带有一个限制：您需要从 Google 获取一个 SerpAPI 密钥。您可以免费创建一个帐户，并获得您的密钥 - 每月还可以免费使用 100 次搜索。

当然，还有其他方法可以从程序内部访问互联网搜索结果（例如使用 Python 的 google 和 beautifulsoup4 包），但是熟悉 SerpAPI 对你来说是件好事。

如果您在运行 LangChain 操作时遇到问题，请首先确保您安装了最新版本。这样做就可以了：

pip install langchain --upgrade

我们的目标是创建一个软件代理（一种使用虚拟网络浏览器收集信息的机器人）。我们将指示代理查找可以回答提示中问题的信息。但是这将需要一个多层次操作（称为“链”），涉及“理解”问题的背景并找出有用信息可能被发现的地方。

这是我们将使用的完整代码：

os.environ['OPENAI_API_KEY'] = "sk-xxx"
os.environ['SERPAPI_API_KEY'] = "xxx"
from langchain.agents import AgentType, initialize_agent, load_tools
from langchain.llms import OpenAI
# The language model we're going to use to control the agent:
llm = OpenAI(temperature=0)
# The tools we'll give the Agent access to.
tools = load_tools(["serpapi", "llm-math"], llm=llm)
# Initialize an agent
agent = initialize_agent(tools, llm, \
  agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, verbose=True)
agent.run("How many technology-related books has David Clinton \
  published? What is the most common topic?")

现在让我们一步一步地解释。我们首先创建包含我们的 OpenAI 和 SerpAPI 密钥的环境变量（不要忘记插入您的有效密钥）：

os.environ['OPENAI_API_KEY'] = "sk-xxx"
os.environ['SERPAPI_API_KEY'] = "xxx"

接下来，我们将导入模块，为我们的代理提供所需的所有工具，然后将温度设置为 0 - 我们追求的是准确性：

from langchain.agents import AgentType, initialize_agent, load_tools
from langchain.llms import OpenAI
llm = OpenAI(temperature=0)

这些行将定义我们要在此操作中部署的具体工具，然后初始化代理：

tools = load_tools(["serpapi", "llm-math"], llm=llm)
agent = initialize_agent(tools, llm, \
  agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, verbose=True)

最后，我们准备启动我们的链条。正如我们所见，这将包括请求代理执行网络搜索，以找出您最喜欢的作者（当然就是我）写了多少本书。然后代理将使用该信息来确定所有这些书的主要主题。

agent.run("How many technology-related books has David Clinton \
  published? What is the most common topic?")

当我运行该代码时，这是我收到的回复：

提示工程

进入新的 AgentExecutor 链… 我应该搜索关于 David Clinton 的书籍的信息。动作：搜索动作输入：“David Clinton 书籍” 观察：DAVID CLINTON 是一名 Linux 服务器管理员，在学术和企业环境中有 IT 基础设施工作经验。 … 思考：我应该寻找更具体的关于他出版的书籍的信息。动作：搜索动作输入：“David Clinton 出版书籍” 观察：前 David Clinton 的标题… 思考：我应该寻找他的书籍评论以确定最常见的主题。动作：搜索动作输入：“David Clinton 书评” 观察：David Clinton 的书籍（AWS 认证解决方案架构师学习指南作者）。平均评分：4.06，1,161 条评价，76 条评论。思考：我现在知道 David Clinton 的书籍最常见的主题了。最终答案：David Clinton 的书籍最常见的主题是网页开发和云计算。

完成链。“David Clinton 的书籍最常见的主题是网页开发和云计算。”

注意代理向我发送了关于其进展的详细笔记。这些包括其计划的步骤（“我应该搜索信息…”），它在每个步骤中得出的结论（“观察…”），关于其进展的报告（“想法…”），以及“最终答案：David Clinton 的书中最常见的主题是网页开发和云计算。”这并不完全是我会说的方式，但我想这样也可以。

从某种程度上说，我们刚刚看到的是 AutoGPT 在第五章中所做的事情的 LangChain 版本。在您的工具箱中拥有多个工具始终是一个好主意，因为一个工具失败了，另一个工具通常会起作用。但这也是对 LangChain 生态系统的极好的一般介绍。

如果您感兴趣，这次消耗了我本月可用的 100 次 SerpAPI 搜索的三次。

一如既往，我鼓励您使用 LangChain 文档发现更多的用例和令人兴奋的东西等待着您。但是，由于新的应用几乎每天都在出现，您还应该关注 LangChain 社区的发展。

生成式人工智能的完整过时指南（MEAP）（二）（2）https://developer.aliyun.com/article/1516928

生成式人工智能的完整过时指南（MEAP）（二）（1）

第七章：使用生成式人工智能超越传统研究和学习工具

本章包括：

7.1 请求投资指导

要点

7.2 使用 LangChain 将搜索引擎连接到人工智能

提示工程

热门文章

最新文章

相关课程

相关电子书

相关实验场景