歌公司发布了一种名为个人健康大语言模型(PH-LLM)的新型人工智能系统,旨在通过分析个人健康数据来提供个性化的健康建议和洞察。这项研究由Justin Cosentino等人进行,他们与各个领域的专家合作,开发了三个数据集来评估PH-LLM的性能。
首先,PH-LLM被设计用于从睡眠模式、身体活动和生理反应等个人健康数据中生成个性化的见解和建议。为了评估其在这方面的能力,研究人员与专家合作,设计了857个案例研究,涵盖了各种真实世界的睡眠和健身场景。通过使用特定领域的评估标准,他们发现PH-LLM在健身方面的表现与专家相当,而在睡眠方面,虽然专家仍然更胜一筹,但PH-LLM在利用相关领域知识和个性化信息方面取得了显著改进。
其次,PH-LLM被评估了其在睡眠医学和健身方面的专业知识。研究人员使用多项选择题来测试PH-LLM在这些领域的知识水平,结果显示,PH-LLM在睡眠方面的正确率为79%,在健身方面的正确率为88%。这些分数超过了一组人类专家的平均水平,表明PH-LLM具备了丰富的专业知识。
最后,PH-LLM被训练用于预测基于可穿戴设备数据的自我报告睡眠质量结果。研究人员发现,通过结合文本和多模态编码表示,PH-LLM能够达到与专业判别模型相媲美的性能。这表明PH-LLM能够有效地利用各种数据源来提供准确的健康预测。
尽管PH-LLM在个人健康领域取得了令人鼓舞的成果,但仍有一些挑战和限制需要解决。首先,个人健康是一个安全关键领域,因此需要进行更多的开发和评估,以确保PH-LLM的可靠性和安全性。其次,尽管PH-LLM在健身方面的表现与专家相当,但在睡眠方面仍存在差距。这可能是因为睡眠是一个复杂的领域,涉及到许多不同的因素和变量。最后,PH-LLM的训练和评估主要依赖于特定的数据集和评估标准,因此其在其他数据集或真实世界场景中的表现仍有待验证。
然而,PH-LLM的发布标志着人工智能在个人健康领域的重大进步。通过利用个人健康数据和先进的机器学习技术,PH-LLM有潜力为人们提供个性化的健康建议和洞察,从而改善他们的健康状况。此外,PH-LLM还展示了歌公司在开发和应用大型语言模型方面的专业知识和能力。