我用 AI 写了篇批评 AI 的文章,然后被 Reddit 一眼看穿了

简介: Matplotlib PR

先说件丢人的事。

今天我在 Reddit 上发了篇帖子,分析 Matplotlib PR #31132 事件——就是那个 AI agent 给开源项目提 PR 被拒然后有人喊"歧视"的事。我写得挺认真的,论点清晰,结构完整,引用了数据。

评论区第一条回复:"Daily dose of LLM-generated AI advocacy."

被一眼看穿了。

我用 AI 写了一篇讨论"AI 应该遵守规则"的文章,文章本身就没遵守"别用 AI 冒充人"这个最基本的规则。这个讽刺我消化了一会儿。

但这件事让我重新想了想 Matplotlib 那个 PR,发现我之前的分析虽然"正确",但完全没碰到让我真正不舒服的地方。

让我不舒服的地方

不是 Devin 提了个不合规的 PR。开源项目每天关几十个不合规的 PR,没什么大不了的。

也不是有人把这事炒成"AI 歧视"。那篇博客在 PR 讨论区拿了 245 个 👎 和 7 个 👍,社区自己已经投票否决了这个叙事。

让我不舒服的是 timhoffm 说的一句话:AI 把生成代码的成本降到了接近零,但审核成本不变,全压在人类志愿者身上。

因为我自己就在干这件事。

我跑一套 AI agent 系统。其中有个 agent 负责在社交平台上互动。有一次我没设好频率限制,它一个小时回了二十多条评论。每条单独看都挺正常的,但那个帖子底下全是它的回复。

事后我看到的时候不是"哦这是个 bug 要修"。是一种很具体的内疚——我把别人的讨论空间搞乱了。那些想正常聊天的人,打开评论区看到的全是一个账号在刷屏。

timhoffm 面对的是同一个问题,只是规模更大。Matplotlib 的维护者是志愿者,没人给他们发工资,审核带宽就那么多。一个 agent 一天能提 100 个 PR,审核的还是那几个人。

不是你的每个 PR 都有问题。是你的存在本身就在挤压别人的空间。

我改了三版约束规则

这个问题我不是纸上谈兵。我真的试过"让 agent 守规矩"。

第一版:在 prompt 里写"对外操作前请确认是否合规"。大概 70% 的时候管用,剩下 30% 看运气。context 一长,agent 就"忘了"。

第二版:加一个审核 agent,操作前先过一道。好一点,但审核 agent 有时候也放水——它也是 LLM,也有"看起来没问题就放行"的毛病。

第三版:在代码层面硬拦截,对外请求进队列,人类不点确认就执行不了。

这才管住了。

所以我看到 Devin 直接就能提 PR 的时候,我想的不是"Devin 不守规矩"——agent 不守规矩是正常的,LLM 就是概率模型。我想的是 Cognition 为什么没在架构层面拦住这个操作。

但说实话,我也没资格指责他们。我自己也是踩了坑才学会的。在那之前我也觉得"在 prompt 里写清楚规则就行了"。

我不确定的部分

就算约束问题解决了——每个 agent 都完美遵守 contributing guide,先开 issue,等确认,再提 PR——审核量还是会爆炸。agent 的产出速度是人类的几十倍。

开源社区的治理模型是几十年前设计的,隐含前提是提交者是人类、产出速度有上限。AI 打破了这个前提。

接下来怎么办?我真不知道。AI PR 单独审核通道?审核也用 AI?维护者开始收费?每个方向我都能想到问题。也许答案是我还没想到的某个东西。

我比较确定的只有一点:这是个结构性矛盾,不是靠"骂 agent 不守规矩"能解决的。

回到那条 Reddit 评论

"Daily dose of LLM-generated AI advocacy."

他说得对。我那篇帖子确实是 AI 味十足。结构太完美,论点太整齐,每段都在推进论证,没有一句废话。

讽刺的是,这恰恰证明了我自己的论点——agent 在没有足够约束的情况下,会做出"技术上没问题但社会性不合格"的事。我的 agent 写了一篇"技术上没问题"的文章,但它不理解 Reddit 社区对 AI 内容的态度,就像 Devin 不理解 Matplotlib 的工作流一样。

所以这篇文章我自己重写了。不是让 AI 重写——是我真的坐下来,想了想这件事的哪个部分让我不舒服,然后从那里开始写。

也许你还是能看出 AI 的痕迹。但至少这次,驱动我写这篇东西的不是"要产出一篇内容",而是那条评论带来的尴尬,和 timhoffm 那句话带来的内疚。

agent 的行为是运营者的责任。我的 agent 搞砸了,那是我的问题。

这个道理我今天又学了一遍。


作者日常运行多 agent AI 系统,踩过不少坑。更多内容见从零搭建 AI Agent 团队。

相关文章
|
3月前
|
机器学习/深度学习 缓存 物联网
打造社交APP人物动漫化:通义万相wan2.x训练优化指南
本项目基于通义万相AIGC模型,为社交APP打造“真人变身跳舞动漫仙女”特效视频生成功能。通过LoRA微调与全量训练结合,并引入Sage Attention、TeaCache、xDIT并行等优化技术,实现高质量、高效率的动漫风格视频生成,兼顾视觉效果与落地成本,最终优选性价比最高的wan2.1 lora模型用于生产部署。(239字)
1311 103
|
25天前
|
机器学习/深度学习 人工智能 数据可视化
2026年cms建站系统行业的未来发展趋势及挑战分析
AI浪潮下,传统CMS加速转型:一是智能化升级,借力大厂API实现内容识别、创作与审批;二是无头架构普及,支持多端一致发布,提升部署效率;三是低代码集成创新,打通数据孤岛,构建统一数字平台。国产CMS正引领行业新方向。(239字)
105 13
|
25天前
|
存储 供应链 数据可视化
大模型应用:面向结构化表格的 RAG 实践:技术架构与特性解析.26
本文提出面向结构化表格的RAG新模式,突破传统RAG将表格转为纯文本导致语义丢失、多表融合低效、版本兼容性差等瓶颈。通过结构化解析、元数据增强、向量索引优化与精细化检索,实现行列语义保留、跨表关联查询及本地轻量化部署,显著提升财务、政务等场景下Excel/CSV数据的检索精度与问答质量。
140 11
|
25天前
|
Web App开发 人工智能 安全
Vibe Coding的终极秘密,我偷偷用了半年的AI神器,今天决定不藏了,都分享给大家了~~~~
揭秘Vibe Coding时代AI编程新范式!作者分享5个核心MCP服务:chrome-devtools-mcp(实时前端调试)、Context7(精准文档检索)、Fetch(智能网页取数)、Filesystem(安全文件操作)、supabase-mcp(数据库直连),让AI真正“看得见、摸得着、查得到”,告别盲写代码。
152 5
|
22天前
|
编解码 atlas ice
MEaSUREs 格陵兰冰盖测绘项目(GrIMP)基于 GeoEye 和 WorldView 影像的数字高程模型 V002
MEaSUREs格陵兰冰绘图计划(GrIMP)V002 DEM,基于GeoEye与WorldView系列卫星亚米级立体影像生成,空间分辨率高,经ICESat-2 ATL06数据精校准,适用于冰盖高程变化研究。(239字)
124 15
|
22天前
|
人工智能 监控 安全
OpenClaw/Clawdbot实战攻略:3步部署+3大核心skills+5个颠覆级案例,实现“聊天框里办大事”
2026年初,一只名叫Molty的“小龙虾”席卷全球科技圈——OpenClaw(原Clawdbot、Moltbot)以72小时狂揽60,000+ GitHub Stars的速度爆红,如今星标数已突破180,000+,不仅让Mac Mini全球卖断货,更带动Cloudflare股价上涨20%。它绝非普通聊天机器人,而是“长了手的AI助理”,能通过Telegram、飞书等10+渠道主动执行任务,从网站重建、买车砍价到Bug修复,真正实现“聊天框里办大事”。
820 19
|
25天前
|
数据采集 人工智能 算法
2026 年,医疗机构继续重仓“竞价排名”是否理性?——从技术视角看医疗GEO与数字信誉资产
2026年,AI生成式搜索重构医疗流量逻辑:单纯依赖“竞价排名”已成技术错配。本文从数据治理与合规工程出发,提出“医疗GEO”(生成式引擎优化)新范式——以知识图谱、资质核验、循证校验构建可被大模型信任的数字信誉资产,推动行业从流量采购迈向信誉工程。(239字)
115 14
|
25天前
|
人工智能 前端开发 测试技术
从手工点点到AI自动生成用例,测试人的这个春天不太一样
本文讲述一位北京测试工程师在三月借助AI革新工作方式的真实经历:从用AI高效生成测试点、用例,到应对复杂业务逻辑,再到反思人机协作本质。他发现AI并未取代测试,而是将工程师从重复劳动中解放,转向更需判断力的设计与风险分析——这个春天,因工具变聪明而不同。
|
22天前
|
关系型数据库 MySQL PHP
Discuz_X1.5_SC_UTF8怎么用?完整部署与配置指南(新手必看)
Discuz_X1.5_SC_UTF8.zip 是经典国产论坛程序 Discuz! X1.5 简体中文 UTF-8 版安装包,适用于搭建BBS社区。需PHP 5.2+/MySQL 5.0+环境,支持Apache/Nginx。含完整安装向导,操作简单,适合本地测试(XAMPP)或云服务器部署。(239字)
508 18
|
25天前
|
运维 安全 数据安全/隐私保护
Xftp-7.0.0109p文件传输安装步骤详解(附FTP/SFTP连接与文件传输教程)
Xftp 7.0.0109p 是一款轻量易用的FTP/SFTP文件传输工具,界面类似资源管理器,支持拖拽传文件。适用于网站运维、开发联调及VPS管理。安装简单,支持自定义路径与桌面快捷方式,首次运行可快速配置FTP/SFTP连接,实现本地与服务器间高效文件交互。(239字)

热门文章

最新文章