Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入

简介: 【9月更文挑战第8天】《自然》杂志近日揭露,学术出版商如泰勒·弗朗西斯与微软签订千万美元合约,及威利获高额报酬,将论文提供给科技巨头训练AI模型,引发学界对版权与收益分配的热议。此现象反映了AI对高质量数据的渴求,但亦使研究人员担忧成果被无偿商用,且可能影响学术独立性。尽管AI训练使用学术资源能提升模型科学性,助力科研进展,但如何保障作者权益及维持学术纯粹性仍是亟待解决的问题。https://www.nature.com/articles/d41586-024-02599-9

近期,国际顶尖学术期刊《自然》(Nature)曝光了一个令人震惊的现象:学术出版商正在将研究论文以天价卖给科技公司,用于训练人工智能(AI)模型。这一趋势引发了广泛的讨论和争议,让人们开始重新审视学术研究的价值和版权问题。

据报道,英国学术出版商泰勒·弗朗西斯(Taylor & Francis)与微软签署了一份价值1000万美元的合同,允许微软访问其数据以改进AI系统。同样,美国出版商威利(Wiley)也从一家未透露名称的公司获得了2300万美元的收入,用于训练生成式AI模型。这些数字令人咋舌,也引发了人们的质疑:为什么出版商能够从论文中获得如此巨大的利润,而论文的作者却几乎没有任何收入?

这一现象的背后,是AI技术的发展和对高质量数据的需求。大型语言模型(LLMs)需要大量的数据来进行训练,而学术论文因其长度和高信息密度而成为理想的训练材料。通过吸收这些数据中的模式,AI模型能够生成流畅的文本、图像或代码。因此,对于AI开发者来说,学术论文是宝贵的资源。

然而,这种趋势也引发了一些担忧。首先,研究人员担心他们的工作被使用而没有得到适当的认可或补偿。尽管许多科学家愿意分享他们的研究成果,但他们可能并不希望自己的工作被商业化而自己却得不到任何回报。其次,人们担心这种做法可能会对学术研究的独立性和公正性产生影响。如果出版商和科技公司之间的利益关系过于紧密,可能会导致对某些研究领域的偏见或忽视。

为了解决这些问题,一些研究人员正在探索技术手段来帮助作者确定他们的论文是否被用作AI训练数据。例如,通过在论文中设置“版权陷阱”,研究人员可以检测到他们的论文是否被AI模型使用过。然而,即使能够证明论文被使用,目前还不清楚应该采取什么措施来保护作者的权益。

从积极的方面来看,将学术论文用于AI训练可以提高模型的准确性和科学性。通过接触大量的科学信息,AI模型能够更好地理解和处理科学问题。这对于推动科学研究和解决现实世界的问题具有重要意义。此外,一些科学家也表示,他们并不介意自己的工作被用作AI训练数据,只要能够为科学进步做出贡献。

然而,我们也必须认识到这种做法可能带来的负面影响。如果处理不当,可能会导致学术研究的商品化和异化。因此,我们需要找到一种平衡的方式,既能够利用AI技术来推动科学进步,又能够保护研究人员的权益和学术的独立性。

https://www.nature.com/articles/d41586-024-02599-9

目录
相关文章
|
1月前
|
人工智能 物联网 调度
边缘大型AI模型:协作部署与物联网应用——论文阅读
论文《边缘大型AI模型:协作部署与物联网应用》系统探讨了将大模型(LAM)部署于边缘网络以赋能物联网的前沿框架。针对传统云端部署高延迟、隐私差的问题,提出“边缘LAM”新范式,通过联邦微调、专家混合与思维链推理等技术,实现低延迟、高隐私的分布式智能。
497 6
边缘大型AI模型:协作部署与物联网应用——论文阅读
|
2月前
|
机器学习/深度学习 人工智能 资源调度
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
本文探讨智能家居中AI决策的可解释性,提出以人为中心的XAI框架。通过SHAP、DeepLIFT等技术提升模型透明度,结合用户认知与需求,构建三层解释体系,增强信任与交互效能。
162 19
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
|
7月前
|
人工智能 数据可视化 数据挖掘
AI竟能独立完成顶会论文!The AI Scientist-v2:开源端到端AI自主科研系统,自动探索科学假设生成论文
The AI Scientist-v2 是由 Sakana AI 等机构开发的端到端自主科研系统,通过树搜索算法与视觉语言模型反馈实现科学假设生成、实验执行及论文撰写全流程自动化,其生成论文已通过国际顶会同行评审。
441 34
AI竟能独立完成顶会论文!The AI Scientist-v2:开源端到端AI自主科研系统,自动探索科学假设生成论文
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
SurveyGO是清华与面壁智能联合开源的AI论文写作工具,采用LLMxMapReduce-V2技术实现文献智能聚合,能根据用户输入主题快速生成结构严谨、引用可靠的学术综述。
894 1
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
|
2月前
|
机器学习/深度学习 资源调度 算法框架/工具
AI-ANNE: 将神经网络迁移到微控制器的深度探索——论文阅读
AI-ANNE框架探索将深度学习模型迁移至微控制器的可行路径,基于MicroPython在Raspberry Pi Pico上实现神经网络核心组件,支持本地化推理,推动TinyML在边缘设备中的应用。
126 10
|
8月前
|
人工智能 自然语言处理 机器人
今日AI论文推荐:ReCamMaster、PLADIS、SmolDocling、FlowTok
由浙江大学、快手科技等机构提出的ReCamMaster是一个相机控制的生成式视频重渲染框架,可以使用新的相机轨迹重现输入视频的动态场景。该工作的核心创新在于利用预训练的文本到视频模型的生成能力,通过一种简单但强大的视频条件机制。为克服高质量训练数据的稀缺问题,研究者使用虚幻引擎5构建了一个全面的多相机同步视频数据集,涵盖多样化的场景和相机运动。
408 2
今日AI论文推荐:ReCamMaster、PLADIS、SmolDocling、FlowTok
|
2月前
|
人工智能 算法 开发者
2025年高教社杯E题——AI 辅助智能体测全国大学生数学建模(思路、代码、论文)
2025年高教社杯E题——AI 辅助智能体测全国大学生数学建模(思路、代码、论文)
380 1
|
8月前
|
人工智能 安全 测试技术
本周 AI Benchmark 方向论文推荐
由北京大学和微软亚洲研究院的魏李等人提出的 FEA-Bench,是一个专为评估大型语言模型(LLMs)在代码库级别进行增量开发能力的基准测试。它从 83 个 GitHub 仓库中收集了 1,401 个任务实例,专注于新功能的实现。研究表明,即使是先进的 LLMs 在此任务中的表现仍远低于预期,揭示了仓库级代码开发的重大挑战。
335 0
|
7月前
|
人工智能 自然语言处理 算法
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
BabelDOC 是一款专为科学论文设计的开源AI翻译工具,采用先进的无损解析技术和智能布局识别算法,能完美保留原文格式并生成双语对照翻译。
2071 67
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
|
7月前
|
机器学习/深度学习 人工智能 JSON
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
Paper2Code是由韩国科学技术院与DeepAuto.ai联合开发的多智能体框架,通过规划、分析和代码生成三阶段流程,将机器学习论文自动转化为可执行代码仓库,显著提升科研复现效率。
797 19
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现