OpenAI遭起诉:训练ChatGPT,涉嫌窃取数百万用户信息

简介: OpenAI遭起诉:训练ChatGPT,涉嫌窃取数百万用户信息


加州一家律师事务所表示,OpenAI 使用从网络上爬取的数据侵犯了数百万互联网用户的权利。

明星大模型 ChatGPT 的走向开始出现一些小波折。


一家总部位于加州的克拉克森律师事务所用一份长达 157 页的诉讼将 OpenAI 告到法庭,该诉讼表明 OpenAI 在利润的驱使下,正在窃取大量个人信息来训练其人工智能模型,使其聊天机器人能够模仿人类语言。


诉讼称,这种数据抓取的规模是前所未有的。原来 OpenAI 从互联网上秘密抓取了约 3000 亿字的内容,其中包括书籍、文章、网站和帖子,甚至还包括未经同意的个人信息,这违反了隐私法。



诉讼文件链接:https://assets.bwbx.io/documents/users/iqjWHBFdfxIU/rIZH4FXwShJE/v0


该诉讼指责 OpenAI 冒着「文明崩溃」的风险。他们根据受害的个人类别估计有数百万人,提出了 30 亿美元的潜在损失。


「通过收集数百万人以前模糊的个人数据,并将其挪用,进而开发不稳定的、未经测试的技术,OpenAI 将每个人置于不可估量的风险之中,但无论采取任何负责任的数据保护和使用措施,都是不可接受的,」该律师事务所的一位合伙人 Timothy K. Giordano 表示。


文件显示,OpenAI 爬取了大量的数据,包括社交媒体网站的数据。OpenAI 的专有 AI 语料库 WebText2 上积累了大量的个人数据,其中包括从 Reddit 帖子及其链接到网站中获取的数据。


OpenAI 获取的数据包括私人信息、私人对话、医疗数据、儿童信息。他们在获取这些信息时没有通知用户,更不用说被用户许可了。


除了爬取广大公众的数据外,诉讼表明 OpenAI 还存在存储和披露用户个人信息的行为,包括用户创建 OpenAI 账户的详细信息、聊天记录和社交媒体信息。



诉讼还称:尽管制定了购买和使用个人信息的协议,但被告采取了不同的方法「盗窃」。


直接使用 ChatGPT 信息遭泄露,那些集成了 ChatGPT 应用程序的用户也被波及,例如使用 Snapchat、Stripe、Spotify、Microsoft Teams 和 Slack 的用户也存在信息泄露的风险。


该诉讼要求在 OpenAI 实施更多监管和保护措施之前,暂停 OpenAI 产品的商业访问和商业开发,包括允许人们选择退出数据收集,并防止其产品超越人类智能并对他人造成伤害。除了 OpenAI,其背后的主要支持者微软也被列为被告。


「毫无疑问,人工智能平台可能为世界带来很多好事,但它们也可能对人类造成潜在的灾难性风险。」诉讼显示。


其实,OpenAI 并不是唯一一家借助互联网获取大量数据来训练 AI 模型的公司。谷歌、Meta、微软和越来越多的其他公司都在做同样的事情。但该律师事务所的一位合伙人表示,他们之所以决定追击 OpenAI,是因为去年 OpenAI 通过 ChatGPT 刺激了更大的竞争对手推出自己的人工智能产品。他们是引发这场人工智能军备竞赛的公司,他们自然是第一目标。


这波未平,那波又起。北京时间 6 月 30 日,据路透社报道,又有两名作者在美国旧金山联邦法院起诉 OpenAI,他们认为 OpenAI 滥用其作品来训练 ChatGPT。


来自马萨诸塞州的两位作家 Paul Tremblay 和 Mona Awad 表示,ChatGPT 在未经许可的情况下挖掘了数千本书的数据,侵犯了作者的版权。


大家都知道,ChatGPT 和其他生成式人工智能系统使用从互联网上获取的大量数据创建内容。Tremblay 和 Awad 的诉讼称,书籍是一个关键要素,因为它们提供了高质量长篇写作的最佳示例。


他们估计,OpenAI 的训练数据包含了超过 30 万本书,当中有许多是没有获得许可、非法获取的有版权图书。


Tremblay 和 Awad 表示 ChatGPT 可以生成非常准确的书籍摘要,表明这些书籍出现在其数据库中。


一时之间,围绕 OpenAI 的训练数据问题不断被暴露。


其实,自去年 11 月发布 ChatGPT 以来,生成式人工智能由于其可以创建文本、音频、图像、视频等大受欢迎。人们一直寻求将生成式人工智能用于个人、专业和学术目的,尽管有人担心它对个人数据带来威胁。


为了应对 ChatGPT 带来的潜在风险,今年 3 月,意大利宣布暂时禁止访问 ChatGPT,原因是出于隐私担忧,声称没有法律依据来证明用于训练 ChatGPT 的大规模数据是合法的。一些公司,包括亚马逊和微软,已经指示员工不要将机密信息输入到聊天机器人。与此同时,三星已全面禁止员工使用生成式人工智能工具。


除此以外,人工智能还会传播虚假信息也是大家担心的问题,有些人还将其故意用于恶意目的。


虽然 ChatGPT 的成功引发了科技界一场明显的人工智能军备竞赛,大大小小的公司现在都在竞相开发人工智能工具并将其部署到尽可能多的产品中。但不管怎样,信息安全还是首位的。


参考链接:

https://www.businessinsider.com/openai-chatgpt-generative-ai-stole-personal-data-lawsuit-children-medical-2023-6

https://www.reuters.com/legal/lawsuit-says-openai-violated-us-authors-copyrights-train-ai-chatbot-2023-06-29/

相关文章
|
2月前
|
人工智能 自然语言处理 机器人
OpenAI推出具有图像上传和分析功能的完整o1模型,并首次推出ChatGPT Pro
OpenAI推出具有图像上传和分析功能的完整o1模型,并首次推出ChatGPT Pro
|
2月前
|
人工智能 搜索推荐 iOS开发
OpenAI推出适用于iPhone的ChatGPT,与Apple实现具有里程碑意义的AI整合
OpenAI推出适用于iPhone的ChatGPT,与Apple实现具有里程碑意义的AI整合
|
2月前
|
前端开发 机器人 UED
OpenAI启动ChatGPT Projects,让你可以组织文件、分组聊天
OpenAI启动ChatGPT Projects,让你可以组织文件、分组聊天
|
4月前
|
机器学习/深度学习 人工智能 并行计算
DeepSpeed Chat: 一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍
DeepSpeed Chat 是一款革命性的平台,专为简化和加速类ChatGPT模型的训练而设计。通过一键式脚本,用户可以轻松完成从预训练模型到生成自定义ChatGPT模型的全过程。该系统复刻了InstructGPT的RLHF训练方法,并集成了一系列优化技术,如DeepSpeed Hybrid Engine,大幅提升了训练效率和经济性。使用DeepSpeed Chat,即使是拥有数千亿参数的大模型,也能在短时间内完成训练,且成本显著降低。无论是单GPU还是多GPU集群环境,DeepSpeed Chat都能提供卓越的性能和易用性,让RLHF训练变得更加普及。
DeepSpeed Chat: 一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍
|
3月前
|
人工智能 自然语言处理 算法
【通义】AI视界|OpenAI最新发布!ChatGPT搜索功能强势来了,挑战谷歌?
本文由【通义】自动生成,精选24小时内的重要资讯:OpenAI推出ChatGPT搜索功能挑战谷歌,微软披露130亿美元投资OpenAI,Reddit首次盈利股价暴涨20%,软银CEO孙正义看好英伟达及“超级AI”前景,谷歌云与沙特PIF共建全球AI中心。更多内容请访问通通知道。
|
6月前
|
人工智能 搜索推荐 机器人
OpenAI 将向企业开放 GPT-4o 模型定制版,国内怎么使用ChatGPT?
OpenAI新推功能让企业客户能定制GPT-4o模型,通过微调技术满足特定需求和业务场景,以前所未有的方式优化AI投资回报。企业上传自有数据后,可在一到两小时内完成模型定制,如滑板公司打造专业客服聊天机器人解答详细问题,大幅提升服务针对性与客户体验。目前定制限于文本数据,但仍显著增强了企业应用AI的灵活性与效率。
181 2
OpenAI 将向企业开放 GPT-4o 模型定制版,国内怎么使用ChatGPT?
|
6月前
|
人工智能 监控 数据挖掘
普华永道和OpenAI达成合作协议,成为首个ChatGPT Enterprise的转售商
普华永道和OpenAI达成合作协议,成为首个ChatGPT Enterprise的转售商
普华永道和OpenAI达成合作协议,成为首个ChatGPT Enterprise的转售商
|
6月前
|
人工智能 开发者 芯片
【51单片机】单片机开发者的福音: 让AI看电路图帮你编写程序(使用ChatGPT 中训练好的单片机工程师模型)
使用AI大语言模型编写 单片机程序. 使用的是 OpenAI公司发布的 ChatGPT .在ChatGPT上有别人训练好的 单片机工程师 with Keil uVision 5 - C Code Explainer模型, 可以上传电路图改模型可以通过这个用户所给的电路图进行编程.
1025 0
【51单片机】单片机开发者的福音: 让AI看电路图帮你编写程序(使用ChatGPT 中训练好的单片机工程师模型)
|
6月前
|
人工智能 自然语言处理 程序员
使用 go-openai 轻松调用 chatGPT:释放无限创造力!
使用 go-openai 轻松调用 chatGPT:释放无限创造力!
|
7月前
|
数据采集 编解码 人工智能
破解ChatGPT惊人耗电!DeepMind新算法训练提效13倍,能耗暴降10倍
【7月更文挑战第19天】DeepMind的JEST算法革新AI训练,提升效率13倍,节能10倍。通过联合数据批次选择,预训练指导及多分辨率训练,优化资源利用,降低能耗。实验显示性能提升,达到SOTA水平,但实施需大量资源,依赖优质参考模型。[论文链接](https://arxiv.org/pdf/2406.17711)
106 10

热门文章

最新文章