歌发布专用于个人健康的大语言模型PH-LLM

简介: 【8月更文挑战第8天】谷歌推出个人健康大语言模型(PH-LLM),利用个人健康数据提供定制化建议。通过三大数据集评估,PH-LLM在睡眠和健身场景中表现出色,多项选择题测试中正确率分别达79%和88%,超越专家平均水平。它还能预测自我报告的睡眠质量,性能媲美专业模型。尽管如此,PH-LLM仍需克服可靠性、复杂性等挑战。此模型标志着AI在个人健康管理上的重要进展。[论文](https://arxiv.org/abs/2406.06474)

歌公司发布了一种名为个人健康大语言模型(PH-LLM)的新型人工智能系统,旨在通过分析个人健康数据来提供个性化的健康建议和洞察。这项研究由Justin Cosentino等人进行,他们与各个领域的专家合作,开发了三个数据集来评估PH-LLM的性能。

首先,PH-LLM被设计用于从睡眠模式、身体活动和生理反应等个人健康数据中生成个性化的见解和建议。为了评估其在这方面的能力,研究人员与专家合作,设计了857个案例研究,涵盖了各种真实世界的睡眠和健身场景。通过使用特定领域的评估标准,他们发现PH-LLM在健身方面的表现与专家相当,而在睡眠方面,虽然专家仍然更胜一筹,但PH-LLM在利用相关领域知识和个性化信息方面取得了显著改进。

其次,PH-LLM被评估了其在睡眠医学和健身方面的专业知识。研究人员使用多项选择题来测试PH-LLM在这些领域的知识水平,结果显示,PH-LLM在睡眠方面的正确率为79%,在健身方面的正确率为88%。这些分数超过了一组人类专家的平均水平,表明PH-LLM具备了丰富的专业知识。

最后,PH-LLM被训练用于预测基于可穿戴设备数据的自我报告睡眠质量结果。研究人员发现,通过结合文本和多模态编码表示,PH-LLM能够达到与专业判别模型相媲美的性能。这表明PH-LLM能够有效地利用各种数据源来提供准确的健康预测。

尽管PH-LLM在个人健康领域取得了令人鼓舞的成果,但仍有一些挑战和限制需要解决。首先,个人健康是一个安全关键领域,因此需要进行更多的开发和评估,以确保PH-LLM的可靠性和安全性。其次,尽管PH-LLM在健身方面的表现与专家相当,但在睡眠方面仍存在差距。这可能是因为睡眠是一个复杂的领域,涉及到许多不同的因素和变量。最后,PH-LLM的训练和评估主要依赖于特定的数据集和评估标准,因此其在其他数据集或真实世界场景中的表现仍有待验证。

然而,PH-LLM的发布标志着人工智能在个人健康领域的重大进步。通过利用个人健康数据和先进的机器学习技术,PH-LLM有潜力为人们提供个性化的健康建议和洞察,从而改善他们的健康状况。此外,PH-LLM还展示了歌公司在开发和应用大型语言模型方面的专业知识和能力。

论文地址:https://arxiv.org/abs/2406.06474

目录
相关文章
|
5月前
|
机器学习/深度学习 自然语言处理
大语言模型(LLM)框架及微调 (Fine Tuning)
大语言模型(LLM)框架及微调 (Fine Tuning)
455 0
|
2月前
|
人工智能 自然语言处理
FBI-LLM低比特基础大语言模型来了,首个完全从头训练的二值化语言模型
【8月更文挑战第22天】《FBI-LLM:通过自回归蒸馏从头开始扩展全二值化大语言模型》由Ma等学者发布于arXiv。该研究呈现了首个完全从头训练的全二值化大语言模型FBI-LLM,在不牺牲性能的前提下大幅降低计算资源需求。通过自回归蒸馏技术,FBI-LLM在多种任务上展现出与高精度模型相当的表现,为二值化模型的发展开辟新路径,并有望推动专用硬件的进步。研究者公开了所有相关资源以促进领域内的进一步探索。
49 10
|
5月前
|
机器学习/深度学习 人工智能 Cloud Native
大语言模型推理提速,TensorRT-LLM 高性能推理实践
大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。
101514 2
|
17天前
|
人工智能 API 调度
大语言模型 LLM 管理功能特点解析
大语言模型领域正快速发展,涵盖技术革新、跨领域应用及行业影响。随着技术进步,更多创新性AI应用和服务涌现。Botnow加速迭代AI应用开发平台,赋能各行各业。新发布的模型管理功能包括模型仓库和模型服务,支持模型文件托管、部署及推理服务,提升使用效率,降低成本。模型服务具备本地推理和接入外部模型的能力,满足中大型企业对大语言模型自主可控的需求。
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
【LLM】能够运行在移动端的轻量级大语言模型Gemma实践
【4月更文挑战第12天】可以运行在移动端的开源大语言模型Gemma模型介绍
290 0
|
3月前
|
算法 API 数据中心
魔搭社区利用 NVIDIA TensorRT-LLM 加速开源大语言模型推理
魔搭社区于 2022 年 11 月初创建,首次在业界提出了 “模型即服务”( MaaS, Model as a Service)的理念。
|
5月前
|
PyTorch 算法框架/工具 异构计算
【Hello AI】安装并使用DeepGPU-LLM-处理大语言模型任务
在处理大语言模型任务中,您可以根据实际业务部署情况,选择在不同环境(例如GPU云服务器环境或Docker环境)下安装推理引擎DeepGPU-LLM,然后通过使用DeepGPU-LLM工具实现大语言模型(例如Llama模型、ChatGLM模型、百川Baichuan模型或通义千问Qwen模型)在GPU上的高性能推理优化功能
|
3月前
|
人工智能 安全 物联网
2024年6月后2周重要的大语言模型论文总结:LLM进展、微调、推理和对齐
本文总结了2024年6月后两周发表的一些最重要的大语言模型论文。这些论文涵盖了塑造下一代语言模型的各种主题,从模型优化和缩放到推理、基准测试和增强性能。
120 0
|
5月前
|
人工智能 自然语言处理 数据库
【AI 生成式】大语言模型(LLM)有哪些典型的应用场景?
【5月更文挑战第5天】【AI 生成式】大语言模型(LLM)有哪些典型的应用场景?
|
5月前
|
存储 人工智能 API
【AIGC】基于检索增强技术(RAG)构建大语言模型(LLM)应用程序
【5月更文挑战第7天】基于检索增强技术(RAG)构建大语言模型(LLM)应用程序实践
436 1