Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入

简介: 【9月更文挑战第8天】《自然》杂志近日揭露,学术出版商如泰勒·弗朗西斯与微软签订千万美元合约,及威利获高额报酬,将论文提供给科技巨头训练AI模型,引发学界对版权与收益分配的热议。此现象反映了AI对高质量数据的渴求,但亦使研究人员担忧成果被无偿商用,且可能影响学术独立性。尽管AI训练使用学术资源能提升模型科学性,助力科研进展,但如何保障作者权益及维持学术纯粹性仍是亟待解决的问题。https://www.nature.com/articles/d41586-024-02599-9

近期,国际顶尖学术期刊《自然》(Nature)曝光了一个令人震惊的现象:学术出版商正在将研究论文以天价卖给科技公司,用于训练人工智能(AI)模型。这一趋势引发了广泛的讨论和争议,让人们开始重新审视学术研究的价值和版权问题。

据报道,英国学术出版商泰勒·弗朗西斯(Taylor & Francis)与微软签署了一份价值1000万美元的合同,允许微软访问其数据以改进AI系统。同样,美国出版商威利(Wiley)也从一家未透露名称的公司获得了2300万美元的收入,用于训练生成式AI模型。这些数字令人咋舌,也引发了人们的质疑:为什么出版商能够从论文中获得如此巨大的利润,而论文的作者却几乎没有任何收入?

这一现象的背后,是AI技术的发展和对高质量数据的需求。大型语言模型(LLMs)需要大量的数据来进行训练,而学术论文因其长度和高信息密度而成为理想的训练材料。通过吸收这些数据中的模式,AI模型能够生成流畅的文本、图像或代码。因此,对于AI开发者来说,学术论文是宝贵的资源。

然而,这种趋势也引发了一些担忧。首先,研究人员担心他们的工作被使用而没有得到适当的认可或补偿。尽管许多科学家愿意分享他们的研究成果,但他们可能并不希望自己的工作被商业化而自己却得不到任何回报。其次,人们担心这种做法可能会对学术研究的独立性和公正性产生影响。如果出版商和科技公司之间的利益关系过于紧密,可能会导致对某些研究领域的偏见或忽视。

为了解决这些问题,一些研究人员正在探索技术手段来帮助作者确定他们的论文是否被用作AI训练数据。例如,通过在论文中设置“版权陷阱”,研究人员可以检测到他们的论文是否被AI模型使用过。然而,即使能够证明论文被使用,目前还不清楚应该采取什么措施来保护作者的权益。

从积极的方面来看,将学术论文用于AI训练可以提高模型的准确性和科学性。通过接触大量的科学信息,AI模型能够更好地理解和处理科学问题。这对于推动科学研究和解决现实世界的问题具有重要意义。此外,一些科学家也表示,他们并不介意自己的工作被用作AI训练数据,只要能够为科学进步做出贡献。

然而,我们也必须认识到这种做法可能带来的负面影响。如果处理不当,可能会导致学术研究的商品化和异化。因此,我们需要找到一种平衡的方式,既能够利用AI技术来推动科学进步,又能够保护研究人员的权益和学术的独立性。

https://www.nature.com/articles/d41586-024-02599-9

目录
相关文章
|
11天前
|
人工智能
谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密
谷歌和苹果的研究揭示了大型语言模型(LLM)的惊人秘密:尽管LLM能自主识别错误,却在生成答案时装作不知情。这一“幻觉”现象背后,模型内部已编码了关于输出真实性的信息,但其外部表现与内部判断常有矛盾,暴露出LLM在实际应用中的局限性。研究为未来开发更有效的错误检测和缓解策略提供了新思路。论文地址:https://arxiv.org/pdf/2410.02707
57 30
|
10天前
|
机器学习/深度学习 人工智能 编解码
ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态
在生物医学领域,蛋白质的结构与功能研究至关重要。ByteDance Research团队开发的CryoSTAR软件,结合AI与冷冻电镜技术,通过深度学习模型、结构先验和异质性重构算法,成功解析了蛋白质的动态行为,尤其在处理结构异质性方面表现出色。该软件已在多个蛋白质体系中取得显著成果,如TRPV1通道蛋白的动态变化研究,为理解蛋白质功能及疾病机制提供了新思路。论文链接:https://www.nature.com/articles/s41592-024-02486-1
64 26
|
13天前
|
人工智能 自然语言处理 算法
谷歌DeepMind研究再登Nature封面,隐形水印让AI无所遁形
近日,谷歌DeepMind团队在《自然》期刊上发表了一项名为SynthID-Text的研究成果。该方法通过引入隐形水印,为大型语言模型(LLM)生成的文本添加统计签名,从而实现AI生成文本的准确识别和追踪。SynthID-Text采用独特的Tournament采样算法,在保持文本质量的同时嵌入水印,显著提高了水印检测率。实验结果显示,该方法在多个LLM中表现出色,具有广泛的应用潜力。论文地址:https://www.nature.com/articles/s41586-024-08025-4。
51 26
|
13天前
|
机器学习/深度学习 人工智能 搜索推荐
哈佛推出全新类ChatGPT癌症诊断AI,登上Nature!准确率高达96%
哈佛大学研究团队开发的新型AI模型CHIEF,在《自然》期刊发表,癌症诊断准确率达96%。CHIEF基于深度学习,能自动识别、分类癌症并预测生存期,具高准确性、多任务能力和泛化性。它结合病理图像与基因组学等数据,显著提升诊断效率和个性化治疗水平,有望改善医疗资源不平等。但数据隐私和临床效果验证仍是挑战。论文见:https://www.nature.com/articles/s41586-024-07894-z
144 101
|
7天前
|
机器学习/深度学习 人工智能 自然语言处理
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
Agent Laboratory 是由 AMD 和约翰·霍普金斯大学联合推出的自主科研框架,基于大型语言模型,能够加速科学发现、降低成本并提高研究质量。
107 23
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
|
3月前
|
机器学习/深度学习 人工智能
打开AI黑匣子,三段式AI用于化学研究,优化分子同时产生新化学知识,登Nature
【10月更文挑战第11天】《自然》杂志发表了一项突破性的化学研究,介绍了一种名为“Closed-loop transfer”的AI技术。该技术通过数据生成、模型训练和实验验证三个阶段,不仅优化了分子结构,提高了光稳定性等性质,还发现了新的化学现象,为化学研究提供了新思路。此技术的应用加速了新材料的开发,展示了AI在解决复杂科学问题上的巨大潜力。
53 1
|
6天前
|
人工智能
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文
《Scaling Laws for Precision》论文提出“精度感知”的扩展理论,将精度纳入模型发展的核心考量,弥补了传统AI模型发展理论忽视精度的不足。研究发现低精度训练会降低模型的有效参数计数,影响性能,并预测了低精度训练和后训练量化带来的损失。作者通过大量实验验证了理论的可靠性和有效性,为计算资源有限情况下如何平衡模型规模和精度提供了新思路。然而,该研究也引发了关于精度与性能权衡复杂性的争议。
47 27
|
14天前
|
机器学习/深度学习 人工智能
微软华人领衔AI²BMD登Nature,AI生物分子模拟双突破!继AlphaFold后又一里程碑
AI²BMD(AI-driven Biomolecular Dynamics)是由微软华人科学家团队领衔的研究,发表于《自然》杂志。该方法通过将蛋白质分解为21种常见单元,并利用机器学习模型预测其相互作用,实现高效精准的生物分子模拟。相比传统方法,AI²BMD在能量和力预测上精度更高,计算速度提升数个数量级,尤其适用于大规模蛋白质模拟,为药物设计等领域提供了有力工具。未来研究将扩展至更多生物分子类型并优化效率。论文地址:https://www.nature.com/articles/s41586-024-08127-z
43 8
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
近年来,大型语言模型(LLM)的内部运作机制备受关注。麻省理工学院的研究人员在论文《The Geometry of Concepts: Sparse Autoencoder Feature Structure》中,利用稀疏自编码器(SAE)分析LLM的激活空间,揭示了其丰富的几何结构。研究发现,特征在原子、大脑和星系三个尺度上展现出不同的结构,包括晶体结构、中尺度模块化结构和大尺度点云结构。这些发现不仅有助于理解LLM的工作原理,还可能对模型优化和其他领域产生重要影响。
71 25
|
3月前
|
人工智能 自然语言处理 算法
几款宝藏级AI阅读工具推荐!论文分析、文档总结必备神器!
【10月更文挑战第8天】几款宝藏级AI阅读工具推荐!论文分析、文档总结必备神器!
234 1

热门文章

最新文章