计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-16

简介: 计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-16

1. Leveraging Social Determinants of Health in Alzheimer’s Research Using LLM-Augmented Literature Mining and Knowledge Graphs

Authors: Tianqi Shang, Shu Yang, Weiqing He, Tianhua Zhai, Dawei Li, Bojian

Hou, Tianlong Chen, Jason H. Moore, Marylyn D. Ritchie, Li Shen

https://arxiv.org/abs/2410.09080

利用增强型大型语言模型的文献挖掘和知识图谱在阿尔茨海默病研究中利用健康社会决定因素

摘要:

本研究提出了一个自动化框架,利用大型语言模型(LLM)和自然语言处理技术从广泛的文献中挖掘健康社会决定因素(SDoH)知识,并将其与通用知识图谱PrimeKG中提取的与阿尔茨海默病(AD)相关的生物实体整合。通过图神经网络进行链接预测任务,评估了增强型SDoH知识图谱的结果。该框架显示出在增强AD知识发现方面的潜力,并且可以推广到其他与SDoH相关的研究领域。

问题背景:

阿尔茨海默病(AD)是一种常见的神经退行性疾病,其发病机制复杂,涉及多种医疗和非医疗因素。社会决定因素(SDoH)是影响个体AD风险的非医疗因素,但其与疾病发展的基本生物学过程之间的联系尚不清楚。

算法模型:

研究中使用了图神经网络(GNN)来评估通过LLM增强的文献挖掘得到的SDoH知识图谱。通过链接预测任务来评估知识图谱的性能。

算法创新点:

  • 提出了一个结合LLM和NLP技术的自动化框架,用于从文献中提取SDoH知识。
  • 将SDoH知识与生物医学实体整合,构建了一个AD相关的SDoH知识图谱。
  • 使用GNN进行链接预测任务,以评估知识图谱的性能。

实验效果:

实验结果表明,通过整合SDoH信息,可以显著提高知识图谱在链接预测任务中的性能,显示出在AD研究中应用该框架的潜力。

重要数据结论:

  • 知识图谱包含4,058条边和1,364个独特的SDoH实体/节点。
  • 在链接预测任务中,SDoH增强的知识图谱在所有选定关系上的MRR值显著高于未增强的图谱。

2. Alignment Between the Decision-Making Logic of LLMs and Human Cognition: A Case Study on Legal LLMs

Authors: Lu Chen, Yuxuan Huang, Yixing Li, Yaohui Jin, Shuai Zhao, Zilong

Zheng, Quanshi Zhang

https://arxiv.org/abs/2410.09083

大型语言模型与人类认知决策逻辑的一致性:以法律LLM为例的案例研究

摘要:

本文提出了一种评估大型语言模型(LLM)决策逻辑与人类认知一致性的方法,以法律LLM为案例研究。研究不仅评估了语言生成结果的正确性,还关注了LLM背后的详细决策逻辑的正确性,这是LLM获得人类信任的核心挑战。

问题背景:

LLM在高风险任务中的部署面临着可信赖性和安全性的重大挑战,尤其是在需要与人类用户对齐的决策逻辑时。

算法模型:

研究中提出了一种基于交互的解释方法,通过量化LLM编码的交互作为原始决策逻辑,设计了一套评估LLM详细决策逻辑的指标。

算法创新点:

  • 提出了一种评估LLM决策逻辑与人类认知一致性的方法。
  • 设计了新的指标来量化可靠的和不可靠的交互效应。

实验效果:

实验表明,即使语言生成结果看起来正确,LLM的内部推理逻辑中也有相当一部分存在显著问题。

重要数据结论:

  • 在法律LLM的实验中,即使预测的判断结果正确,也有相当比例的内部推理逻辑存在问题。

3. P-FOLIO: Evaluating and Improving Logical Reasoning with Abundant Human-Written Reasoning Chains

Authors: Simeng Han, Aaron Yu, Rui Shen, Zhenting Qi, Martin Riddell, Wenfei

Zhou, Yujie Qiao, Yilun Zhao, Semih Yavuz, Ye Liu, Shafiq Joty, Yingbo Zhou,

Caiming Xiong, Dragomir Radev, Rex Ying, Arman Cohan

https://arxiv.org/abs/2410.09207

P-FOLIO:评估和提高丰富的人类编写推理链的逻辑推理能力

摘要:

本文介绍了P-FOLIO,这是一个由人类注释的数据集,包含了一组现实逻辑推理故事的多样化和复杂的推理链,这些故事也是由人类编写的。P-FOLIO的收集采用了一种注释协议,方便人类以逐步的方式为一阶逻辑推理问题注释结构良好的自然语言证明。

问题背景:

现有的LLM逻辑推理能力评估方法依赖于二元蕴含分类或合成推理,这些方法不足以适当调查模型的逻辑推理能力。

算法模型:

P-FOLIO数据集用于评估和提高大型语言模型(LLM)的推理能力。通过单步推理规则分类和单步推导推理来评估LLM的推理能力。

算法创新点:

  • 提出了一种新的数据集P-FOLIO,包含了人类编写的逻辑推理证明。
  • 使用P-FOLIO来评估LLM的推理能力,并提出了多种评估任务。

实验效果:

实验结果表明,通过多样本提示和微调,人类编写的推理链显著提高了LLM的逻辑推理能力。

重要数据结论:

  • 在三个其他领域的逻辑推理数据集上,微调Llama3-7B模型的性能提高了10%以上。

4. Natural Language Counterfactual Explanations for Graphs Using Large Language Models

Authors: Flavio Giorgi, Cesare Campagnano, Fabrizio Silvestri and Gabriele

Tolomei

https://arxiv.org/abs/2410.09295

使用大型语言模型为图形生成自然语言反事实解释

摘要:

在这项工作中,我们利用开源的大型语言模型(LLM)在被最新的反事实解释器产生的有效反事实实例提示时,生成自然语言解释。实验表明,我们的方法有效地产生了准确的自然语言表示,通过关键绩效指标验证。

问题背景:

可解释人工智能(XAI)作为研究领域出现,以揭开(深度)机器学习模型的不透明内部逻辑。反事实解释作为XAI技术之一,尽管有前景,但这些“如果”解释通常复杂且技术性强,难以为非专家理解。

算法模型:

研究中考虑了用于GNN节点分类任务的通用图形反事实解释器输出的反事实实例。然后,指导多个开源LLM将这些“原始”反事实实例翻译成连贯的自然语言解释。

算法创新点:

  • 提出了一种使用LLM将图形反事实解释转换为自然语言的方法。
  • 定义了新的指标来适当评估这些解释的有效性。

实验效果:

通过使用两个图形反事实解释器对多个图形数据集和多个开源LLM进行的广泛实验,证明了该方法可以通过生成自然语言解释有效支持决策过程。

重要数据结论:

  • 在Cora和CiteSeer数据集上,随着LLM参数数量的增加,所有指标的性能都有显著提高。

5. Equitable Access to Justice: Logical LLMs Show Promise

Authors: Manuj Kant, Manav Kant, Marzieh Nabi, Preston Carlson, Megan Ma

https://arxiv.org/abs/2410.09904

公平获取正义:逻辑LLM显示出希望

摘要:

美国司法系统的成本和复杂性限制了许多美国人获得法律解决方案的机会。大型语言模型(LLM)有很大的潜力改善获得正义的机会。然而,在法律环境中应用AI和LLMs,其中一致性和可靠性至关重要,需要系统2推理。在本文中,我们探讨了将LLM与逻辑编程相结合,以增强其推理能力,使其战略能力更接近熟练律师的能力。

问题背景:

获取法律解决方案的机会在低、中、上中产阶级中变得越来越有限,所有这些阶级都面临着重大障碍。超过75%的诉讼当事人自行代表,加利福尼亚州报告有超过430万自行代表的诉讼当事人。

算法模型:

研究中提出了将LLM与逻辑编程相结合的方法,以提高其推理能力。通过将法律和合同转化为可以应用于特定法律案例的逻辑程序,专注于保险合同。

算法创新点:

  • 提出了一种结合概率和确定性AI解决方案的方法,以有效解决法律规划和推理问题。
  • 展示了如何使用LLM生成逻辑表示,并将特定案例的详细信息应用于基于逻辑的框架。

实验效果:

实验表明,最新的OpenAI o1-preview模型在将保险政策编码为逻辑程序方面,比其前身GPT-4o有显著优势。

重要数据结论:

  • 在十次试验中,o1-preview的平均正确答案数为7.5,而GPT-4o的平均正确答案数为2.4。

后记

如果您对我的博客内容感兴趣,欢迎三连击(点赞、收藏、关注和评论),我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型,深度学习,计算机视觉相关方向)最新学术论文及工程实践方面的内容分享,助力您更快更准更系统地了解 AI前沿技术

相关文章
|
5月前
|
机器学习/深度学习 算法 机器人
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
548 0
|
5月前
|
存储 监控 算法
基于 Go 语言跳表结构的局域网控制桌面软件进程管理算法研究
针对企业局域网控制桌面软件对海量进程实时监控的需求,本文提出基于跳表的高效管理方案。通过多级索引实现O(log n)的查询、插入与删除性能,结合Go语言实现并发安全的跳表结构,显著提升进程状态处理效率,适用于千级进程的毫秒级响应场景。
243 15
|
5月前
|
机器学习/深度学习 算法 自动驾驶
基于导向滤波的暗通道去雾算法在灰度与彩色图像可见度复原中的研究(Matlab代码实现)
基于导向滤波的暗通道去雾算法在灰度与彩色图像可见度复原中的研究(Matlab代码实现)
317 8
|
5月前
|
机器学习/深度学习 人工智能 算法
【基于TTNRBO优化DBN回归预测】基于瞬态三角牛顿-拉夫逊优化算法(TTNRBO)优化深度信念网络(DBN)数据回归预测研究(Matlab代码实现)
【基于TTNRBO优化DBN回归预测】基于瞬态三角牛顿-拉夫逊优化算法(TTNRBO)优化深度信念网络(DBN)数据回归预测研究(Matlab代码实现)
256 0
|
5月前
|
存储 监控 算法
基于 PHP 布隆过滤器的局域网监控管理工具异常行为检测算法研究
布隆过滤器以其高效的空间利用率和毫秒级查询性能,为局域网监控管理工具提供轻量化异常设备检测方案。相比传统数据库,显著降低延迟与资源消耗,适配边缘设备部署需求,提升网络安全实时防护能力。(238字)
234 0
|
机器学习/深度学习 存储 人工智能
AI职场突围战:夸克应用+生成式人工智能认证,驱动“打工人”核心竞争力!
在AI浪潮推动下,生成式人工智能(GAI)成为职场必备工具。文中对比了夸克、豆包、DeepSeek和元宝四大AI应用,夸克以“超级入口”定位脱颖而出。同时,GAI认证为职场人士提供系统学习平台,与夸克结合助力职业发展。文章还探讨了职场人士如何通过加强学习、关注技术趋势及培养合规意识,在AI时代把握机遇。
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能应用领域有哪些
本文全面探讨了人工智能(AI)的应用领域和技术核心,涵盖医疗、交通、金融、教育、制造、零售等多个行业,并分析了AI技术的局限性及规避策略。同时,介绍了生成式人工智能认证项目的意义与展望。尽管AI发展面临数据依赖和算法可解释性等问题,但通过优化策略和经验验证,可推动其健康发展。未来,AI将在更多领域发挥重要作用,助力社会进步。
|
机器学习/深度学习 人工智能 运维
人工智能在事件管理中的应用
人工智能在事件管理中的应用
375 21
|
机器学习/深度学习 人工智能 搜索推荐
探索人工智能在现代医疗中的革新应用
本文深入探讨了人工智能(AI)技术在医疗领域的最新进展,重点分析了AI如何通过提高诊断准确性、个性化治疗方案的制定以及优化患者管理流程来革新现代医疗。文章还讨论了AI技术面临的挑战和未来发展趋势,为读者提供了一个全面了解AI在医疗领域应用的视角。
313 11
|
机器学习/深度学习 人工智能 自然语言处理
人工智能在医疗诊断中的应用与前景####
本文深入探讨了人工智能(AI)技术在医疗诊断领域的应用现状、面临的挑战及未来发展趋势。通过分析AI如何辅助医生进行疾病诊断,提高诊断效率和准确性,以及其在个性化医疗中的潜力,文章揭示了AI技术对医疗行业变革的推动作用。同时,也指出了数据隐私、算法偏见等伦理问题,并展望了AI与人类医生协同工作的前景。 ####
974 0