歌发布专用于个人健康的大语言模型PH-LLM

简介: 【8月更文挑战第8天】谷歌推出个人健康大语言模型(PH-LLM),利用个人健康数据提供定制化建议。通过三大数据集评估,PH-LLM在睡眠和健身场景中表现出色,多项选择题测试中正确率分别达79%和88%,超越专家平均水平。它还能预测自我报告的睡眠质量,性能媲美专业模型。尽管如此,PH-LLM仍需克服可靠性、复杂性等挑战。此模型标志着AI在个人健康管理上的重要进展。[论文](https://arxiv.org/abs/2406.06474)

歌公司发布了一种名为个人健康大语言模型(PH-LLM)的新型人工智能系统,旨在通过分析个人健康数据来提供个性化的健康建议和洞察。这项研究由Justin Cosentino等人进行,他们与各个领域的专家合作,开发了三个数据集来评估PH-LLM的性能。

首先,PH-LLM被设计用于从睡眠模式、身体活动和生理反应等个人健康数据中生成个性化的见解和建议。为了评估其在这方面的能力,研究人员与专家合作,设计了857个案例研究,涵盖了各种真实世界的睡眠和健身场景。通过使用特定领域的评估标准,他们发现PH-LLM在健身方面的表现与专家相当,而在睡眠方面,虽然专家仍然更胜一筹,但PH-LLM在利用相关领域知识和个性化信息方面取得了显著改进。

其次,PH-LLM被评估了其在睡眠医学和健身方面的专业知识。研究人员使用多项选择题来测试PH-LLM在这些领域的知识水平,结果显示,PH-LLM在睡眠方面的正确率为79%,在健身方面的正确率为88%。这些分数超过了一组人类专家的平均水平,表明PH-LLM具备了丰富的专业知识。

最后,PH-LLM被训练用于预测基于可穿戴设备数据的自我报告睡眠质量结果。研究人员发现,通过结合文本和多模态编码表示,PH-LLM能够达到与专业判别模型相媲美的性能。这表明PH-LLM能够有效地利用各种数据源来提供准确的健康预测。

尽管PH-LLM在个人健康领域取得了令人鼓舞的成果,但仍有一些挑战和限制需要解决。首先,个人健康是一个安全关键领域,因此需要进行更多的开发和评估,以确保PH-LLM的可靠性和安全性。其次,尽管PH-LLM在健身方面的表现与专家相当,但在睡眠方面仍存在差距。这可能是因为睡眠是一个复杂的领域,涉及到许多不同的因素和变量。最后,PH-LLM的训练和评估主要依赖于特定的数据集和评估标准,因此其在其他数据集或真实世界场景中的表现仍有待验证。

然而,PH-LLM的发布标志着人工智能在个人健康领域的重大进步。通过利用个人健康数据和先进的机器学习技术,PH-LLM有潜力为人们提供个性化的健康建议和洞察,从而改善他们的健康状况。此外,PH-LLM还展示了歌公司在开发和应用大型语言模型方面的专业知识和能力。

论文地址:https://arxiv.org/abs/2406.06474

目录
相关文章
|
机器学习/深度学习 自然语言处理
大语言模型(LLM)框架及微调 (Fine Tuning)
大语言模型(LLM)框架及微调 (Fine Tuning)
851 0
|
11月前
|
人工智能 自然语言处理 前端开发
基于RAG和LLM的水利知识大语言模型系统开发有感
在数字化时代,水利行业的智能化管理尤为重要。本文介绍了基于大语言模型(LLM)和检索增强生成(RAG)技术的水利知识问答系统的开发过程。该系统结合了前沿AI技术和水利专业知识,通过构建全面的水利知识库,优化用户体验,确保系统的灵活性和可扩展性。项目展示了AI技术在垂直领域的巨大潜力,为水利行业的智能化发展贡献力量。
|
人工智能 自然语言处理
FBI-LLM低比特基础大语言模型来了,首个完全从头训练的二值化语言模型
【8月更文挑战第22天】《FBI-LLM:通过自回归蒸馏从头开始扩展全二值化大语言模型》由Ma等学者发布于arXiv。该研究呈现了首个完全从头训练的全二值化大语言模型FBI-LLM,在不牺牲性能的前提下大幅降低计算资源需求。通过自回归蒸馏技术,FBI-LLM在多种任务上展现出与高精度模型相当的表现,为二值化模型的发展开辟新路径,并有望推动专用硬件的进步。研究者公开了所有相关资源以促进领域内的进一步探索。
169 10
|
8月前
|
并行计算 API 调度
加速大语言模型推理:NVIDIATensorRT-LLM更新
本次分享由NVIDIA亚太区资深总监李曦鹏主讲,聚焦于加速大语言模型推理的挑战与解决方案。内容涵盖大模型推理优化、性能提升策略及KVCash在用户请求处理中的应用。通过TensorRT-LLM的更新,NVIDIA提供了高性能推理引擎和多种优化技术,如KVCache优化、InflightBatching等,大幅提升了大模型的推理效率。此外,还介绍了与魔搭社区的合作,支持超过50个主流模型的一键部署,显著降低了使用门槛和成本。
398 1
|
10月前
|
人工智能 自然语言处理 物联网
LLM2CLIP:使用大语言模型提升CLIP的文本处理,提高长文本理解和跨语言能力
LLM2CLIP 为多模态学习提供了一种新的范式,通过整合 LLM 的强大功能来增强 CLIP 模型。
421 3
LLM2CLIP:使用大语言模型提升CLIP的文本处理,提高长文本理解和跨语言能力
|
机器学习/深度学习 人工智能 自然语言处理
【LLM】能够运行在移动端的轻量级大语言模型Gemma实践
【4月更文挑战第12天】可以运行在移动端的开源大语言模型Gemma模型介绍
567 0
|
11月前
|
人工智能 API 调度
大语言模型 LLM 管理功能特点解析
大语言模型领域正快速发展,涵盖技术革新、跨领域应用及行业影响。随着技术进步,更多创新性AI应用和服务涌现。Botnow加速迭代AI应用开发平台,赋能各行各业。新发布的模型管理功能包括模型仓库和模型服务,支持模型文件托管、部署及推理服务,提升使用效率,降低成本。模型服务具备本地推理和接入外部模型的能力,满足中大型企业对大语言模型自主可控的需求。
|
算法 API 数据中心
魔搭社区利用 NVIDIA TensorRT-LLM 加速开源大语言模型推理
魔搭社区于 2022 年 11 月初创建,首次在业界提出了 “模型即服务”( MaaS, Model as a Service)的理念。
|
人工智能 安全 物联网
2024年6月后2周重要的大语言模型论文总结:LLM进展、微调、推理和对齐
本文总结了2024年6月后两周发表的一些最重要的大语言模型论文。这些论文涵盖了塑造下一代语言模型的各种主题,从模型优化和缩放到推理、基准测试和增强性能。
456 0
|
自然语言处理 测试技术 计算机视觉
ICLR 2024:Time-LLM:基于大语言模型的时间序列预测
【2月更文挑战第28天】ICLR 2024:Time-LLM:基于大语言模型的时间序列预测
2046 1
ICLR 2024:Time-LLM:基于大语言模型的时间序列预测