要在临床决策中发挥人工智能的潜力,就需要在设计良好的随机临床试验中测试干预措施,并以标准化和透明的方式报告这些结果。
过去几十年发展起来的人工智能(AI)方法为生物医学研究做出了宝贵的贡献。最近在机器学习和深度学习算法方面的技术进步,以及它们在解决临床问题方面的应用,正在扩大加强医疗服务的可能性,并为改变临床研究带来巨大的希望。一些概念验证研究已经说明了这些模型在足够大的数据集上进行训练时,能够达到与临床应用兼容的基于图像的诊断精度,或者为住院患者选择最佳治疗方案等任务。然而,这些算法的实用性在很大程度上仍然是理论上的,它们大多是在受控环境中测试的,无法再现现实世界的复杂性。
当人工智能方法在患者管理方面的价值受到考验时,采取步骤确保涉及人工智能干预的前瞻性随机临床试验报告的最高质量至关重要。考虑到这一目标,CONSORT-AI和SPIRIT-AI指导小组协调了一个涉及多个利益相关者--试验者、统计学家、临床和转化研究人员、患者、监管者和编辑--的Delphi 过程,以详细制定旨在提高涉及AI的随机化临床试验的研究方案和报告的透明度的具体指南。由此产生的核对表,CONSORT-AI和SPIRIT-AI,与各自的解释性文件一起《自然医学》发表,代表了母版CONSORT和SPIRIT指南的延伸,提高了随机临床试验研究方案和报告的影响和质量。
新的扩展内容纳入了一系列现行指南未充分涵盖或根本没有涵盖的项目,如如何将人工智能纳入临床路径或与代码可用性或性能评估有关的方面。与原有的临床指南一样,CONSORT-AI和SPIRIT-AI扩展版为一个新兴的研究领域提供了一套原则,并将随着技术进步和临床需求的需要而不断发展和修订。《自然医学》认为,对于临床研究中的人工智能干预措施,遵循标准化、透明化和严格的报告程序是至关重要的,以确保采取正确的步骤,确保该领域朝着正确的方向前进。因此,与培育高质量临床研究报告的使命相一致,认可CONSORT-AI和SPIRIT-AI指南,并将要求描述临床决策过程中使用人工智能算法的临床试验结果的稿件的投稿按照这些标准进行报告。使用CONSORT-AI扩展的一个例子可以在本期的ADVICE4U研究中看到--这是一项随机非劣效性试验,比较了由基于AI的决策支持系统计算的1型糖尿病青年的胰岛素剂量与医生的剂量。该研究已按照新指南进行了报道,包括完成CONSORT-AI检查表。
阐述扩展的过程中,清楚地认识到将人工智能技术融入到临床医疗中,也带来了新的挑战,需要克服这些挑战,以缩小模拟医疗人工智能与现实世界的差距。本期的一系列委托评论中,对其中的一些挑战进行了探讨。Eric Topol对医疗AI的现状进行了简要介绍,并强调了这些算法和研究设计需要克服的局限性和挑战,以便在临床护理中有效实施。Melissa McCradden及其同事提出了一个循序渐进的过程,以确保这项技术在患者护理中产生积极影响,其中包括对数据访问和保护、模型性能和部署以及监督的考虑。正如Kellie Owens和Alexis Walker所写的那样,为了让这些模型确保临床护理的安全性和公平性,算法的设计也必须没有任何可能在预测中引入结构性不公平的偏见。同样,Atul Butte及其同事也提出了一个框架,即MI_CLAIM指南,描述了确保人工智能算法在医学中的透明度、可重复性和实用性所需的最低报告要素。
临床研究正处于一个新阶段的边缘,创新具有巨大的潜力,可以为推进医疗服务带来新的机遇。然而,也有一些风险需要预估,必须采取必要的步骤,以确保人工智能支持的解决方案优先考虑所有患者的需求,并在此过程中赢得用户的信任。CONSORT-AI和SPIRIT-AI指南为负责任和透明地评估这些工具奠定了基础,期待看到AI增强医疗的承诺将如何实现。