猫猫版 Pokémon GO 火了,GitHub 账号被毒舌审判,OpenAI、DeepSeek 发布新品

简介: 回顾 AI 与开发者生态动态,涵盖产品更新、社区创意玩法与工具发布

这期的「周一上线」,一边是社区继续整活,一边是模型、工具和基础设施继续更新。

有人做了猫猫版 Pokémon GO,有人想象 Claude Code 如果生在 2010 年会长什么样,还有人做了一个 GitHub 账号毒舌评分器。

另一边,OpenAI 更新了 Daybreak 安全工具,Cloudflare 开放 Self-Managed OAuth,Notion 接入外部 Agent,DeepSeek-V4-Pro-DSpark 也发布了。

下面,开始一周回顾。

有点新鲜

「有点新鲜」收录本周 AI / 开发者圈里那些不算大新闻,但挺值得看一眼的新鲜事。

猫猫版 Pokémon GO

om_patel5 分享了一个挺可爱的应用:有点像 Pokémon GO,但收集对象换成了现实里遇到的猫。

玩法很直接:看到猫,打开相机,拍下来,它就会进入你的 collection。

现在,每一只你遇到的流浪猫都会变成你的稀有收藏了。

如果 Claude Code 生在 2010

假设 Claude Code 出现在 2010 年,会是什么样子。大概就是 CD 交付,全靠驱动器读取、安装 Claude Code 了。

Claude Code 也有红绿灯了

gxjo_dev 分享了一个和 Claude Code 有关的小硬件玩法。

它看起来像是一个外接状态灯,用颜色提示 Claude Code 当前的状态。机器在跑,人坐旁边看灯,这个画面很美好。

AI 小机器人的周末

M5Stack 发了一条「Preparing for this weekend」。

桌面 AI 小机器人准备开趴,StackChan 是 M5Stack 和社区一起做的开源 AI 桌面机器人,基于 CoreS3,带屏幕、摄像头、麦克风、扬声器、舵机和 RGB LED。它可以做表情动画,也能接入 AI Agent,用起来像一个能摆在桌上的小机器人。

GitHub 账号也逃不过毒舌审判

githubroast.dev 是一个很适合摸鱼打开的网站。

你输入一个 GitHub 账号,它会根据公开数据给出 0 到 100 分评分,再配上一句毒舌点评。页面上还做了名人堂、热度榜和进步榜。

在线试玩:githubroast.dev/

溜 Gemini

上周末 GPT-5.6 系列发布之后,这张梗图又火了。

周五发版

「周五发版」是一个程序梗:一旦版本上线,我们就要开始祈祷一切如期运行。这个模块寓意,所有模型、产品版本更新,都能大吉大利。

OpenAI 更新 Daybreak 安全工具

OpenAI 这周更新了 Daybreak。

这次包括 Codex Security 插件、GPT-5.5-Cyber,以及面向开源维护者的 Patch the Planet 计划。

简单说,Codex Security 可以在 Codex 里帮助查找、验证和修复代码漏洞;GPT-5.5-Cyber 面向经过验证的安全防守方;Patch the Planet 则会把 AI 辅助安全研究和人工审查结合起来,用在开源项目修复上。

Mistral OCR 4 能标位置了

Mistral AI 发布 Mistral OCR 4。

这次更新的重点是结构化文档理解。它在提取文字的同时,会返回 bounding box、区块类型和置信度,能识别标题、表格、公式、签名等内容块,也支持 170 种语言。

Mistral OCR 4 可以处理 PDF、DOC、PPT、OpenDocument 等常见文档格式,并支持 API、Mistral Studio、Amazon SageMaker、Microsoft Foundry 等方式使用。企业客户可以选择自托管部署,把文档数据留在自己的基础设施里。

Cloudflare 开放自管 OAuth

Cloudflare 宣布 Self-managed OAuth 面向所有客户开放。

开发者现在可以自己创建 OAuth 应用,让用户通过标准授权流程授予限定范围的 Cloudflare API 访问权限。相比直接使用 API Token,这种方式更适合 SaaS 集成、内部开发平台和 Agent 工具,也方便用户查看授权范围、撤销访问和控制应用权限。

Notion 接入外部 Agent

Notion 发布 External Agents,把 Claude 和 Cursor 接进了 Notion 工作区。

用户可以在 Notion 里 @ 这些外部 Agent,或者把任务分配给它们,让它们围绕页面、任务和项目继续处理工作。

以后 Notion 里的任务卡片,不一定只分给人,也可以分给外部 Agent。

DeepSeek-V4-Pro-DSpark 发布

DeepSeek-V4-Pro-DSpark 发布了。

官方说明里提到,它基于 DeepSeek-V4-Pro 的 checkpoint,并额外附带 speculative decoding 模块。DeepSeek-V4-Pro 本身是 MoE 模型,总参数约 1.6T,激活参数约 49B,支持 1M 上下文。

DSpark 这个版本的重点是 speculative decoding。简单说,它会配合推测解码模块来提高生成效率,如果你关注推理加速和部署,可以了解下它。

GPT-5.6 Sol 限量登场

OpenAI 这周开始 GPT-5.6 系列 limited preview。

这一组里包括 GPT-5.6 Sol、Terra 和 Luna。Sol 是旗舰模型,Terra 偏日常工作和成本平衡,Luna 则主打速度和成本效率。

这次不是全面开放,OpenAI 说会先给一小部分经过审核的合作伙伴使用。详情可阅读:https://mp.weixin.qq.com/s/MURaOqKCnPbAgEu65fkwig

开源雷达

周榜速递

周榜主要根据新增 star 数进行排名,下面的单项目讲解则偏向新晋项目、实用老项目,标星并非单项目讲解的唯一指标:

Executor:给 Agent 准备统一工具目录

Executor 是一个面向 AI Agent 的工具集成层。

它把 OpenAPI、MCP、GraphQL、Google Discovery 和自定义工具放进一个统一 catalog 里。Agent 需要找工具、看参数、调用 API 时,可以从这里统一接入。

项目也支持作为 MCP Server 使用,可以接到 Cursor、Claude Code、OpenCode 这类 MCP 兼容工具里。

地址:github.com/RhysSullivan/executor

PixelRAG:让 RAG 直接看截图

PixelRAG 是一个视觉检索项目。

它的做法是把网页、PDF 和图片渲染成截图,再基于截图 tile 做检索。这样表格、图表、布局和信息图这些内容,不会在 HTML 解析或文本抽取时被丢掉。

项目还提供 pixelshot 命令,可以把网页或 PDF 转成截图 tile。

地址:github.com/StarTrail-org/PixelRAG

Fractal:递归式 CLI Agent

Fractal 是一个命令行 Agent,项目自称是 recursive language model CLI agent。

它基于 Trampoline 的 Recursive Language Model runtime,可以在终端里运行。官方介绍里提到,它可以自己写代码、运行代码、调用子模型,并管理执行过程中的上下文。

如果你想看递归式 Agent 在命令行里怎么跑,可以看这个项目。

地址:github.com/Trampoline-AI/fractal

SimpleX Chat:没有用户 ID 的聊天网络

SimpleX Chat 是一个开源聊天项目,主打隐私。

它的特点是没有用户 ID,也不依赖电话号码、邮箱或用户名这类长期身份标识。项目提供 iOS、Android 和桌面端应用。

这个项目适合对隐私聊天、端到端加密和去标识化通信感兴趣的人看。

地址:github.com/simplex-chat/simplex-chat

这周有事

「这周有事」收录本周值得记一下的行业动态、事故、融资、人员流动和基础设施变化。

GitLab 回到纳斯达克敲钟

GitLab 这周回到 Nasdaq 敲响开市钟。

GitLab 从开源协作工具一路走到上市公司,现在还在围绕 DevSecOps 和 AI 工作流继续扩展。

Groq 融资 6.5 亿美元

Groq 宣布完成 6.5 亿美元融资,用于扩展 AI inference cloud 业务。

官方信息显示,Groq 目前运营 13 个数据中心,服务超过 500 万开发者,并计划在 2027 年底前扩展到 200MW 算力规模。

训练模型很贵,推理服务也越来越像一门单独的大生意。Groq 这次融资,重点就落在 AI 推理云上。

Grammarly 母公司收购 GPTZero

36 氪报道,Grammarly 母公司 Superhuman 收购了 AI 检测工具 GPTZero。

这个新组合挺有意思。Grammarly 负责帮用户写得更顺,GPTZero 负责判断内容是不是 AI 写的。一个写,一个查,放在同一家公司下面,多少有点互相照镜子的感觉。

对教育、内容和招聘场景来说,AI 写作和 AI 检测之间的关系,后面还会继续变复杂。

OpenAI 和 Broadcom 发布 Jalapeño

OpenAI 和 Broadcom 发布了 Jalapeño。

这是 OpenAI 的第一颗 Intelligence Processor,面向 LLM inference 场景,也就是 ChatGPT、Codex、API 和 Agent 产品背后的推理请求。

OpenAI 官方把它称为多代计算平台的第一步。模型公司继续往芯片和基础设施层走,这件事本身就值得记一下。更新详情阅读:https://mp.weixin.qq.com/s/bBJQecddiZXi8BUxG4P5oQ

MiniMax 服务遭遇 DDoS 攻击

MiniMax 近期出现过一次服务中断。从官方说明看,原因是遭遇 DDoS 攻击。

对普通用户来说,最直观的感受就是:网站打不开、服务登不上、模型用不了。

这类事故也提醒了一件事:AI 产品一旦进入高频使用,稳定性、安全防护和抗攻击能力就会变得非常现实。

Qualcomm 将收购 Modular

Qualcomm 宣布将收购 AI 软件公司 Modular。

Modular 做的是 AI 计算软件平台,核心产品包括 MAX 和 Mojo,目标是让 AI 模型更容易跑在不同硬件环境上。Qualcomm 这次收购,主要是为了补强从边缘设备到数据中心的 AI 软件能力。

Reuters 报道称,这笔交易为全股票交易,估值接近 40 亿美元。

Mirendil 种子轮融资 2 亿美元

Mirendil 获得 2 亿美元种子轮融资,估值达到 10 亿美元。由 a16z 和 Kleiner Perkins(凯鹏华盈)领投,NVIDIA 跟投,出道便是独角兽。

这家公司由前 Anthropic / Google 研究人员创办,团队成员还有 xAI、OpenAI 等背景。研究方向是把前沿 AI 研发能力开放给更多科学家和研究人员。

目前它还没有正式产品,但融资规模已经很大。AI 圈现在不只卷模型,也在卷“谁能更快做出下一代模型”的能力。

留个小题

本周的「周一上线」已经进入尾声。为了给你这周带来一点点小惊喜,在「留个小题」模块会出一道简单的问答题。第一个答对的小伙伴可以联系小七,任选一个七牛周边作为礼品。

小题解答方法:在评论区留下你的答案,小七会在第二天中午 12 点的推文中,告知昨日是哪位小伙伴第一个答对小题。

注意:为了让后面的人可以参与回答,所有评论将会在第二天 12 点统一精选展示。

第 9 期小题:这期提到的 githubroast.dev,会根据 GitHub 账号生成什么?

A. 一份 AI 招聘简历,自动把摸鱼经历包装成项目经验

B. 一只会自动修 bug 的电子猫,专治祖传代码

C. 一张 GitHub 好运签,告诉你今天适不适合 push

D. 一份公开处刑报告:评分、毒舌点评和灵魂拷问

相关文章
|
4天前
|
人工智能 定位技术 SEO
我学 GEO 第 15 天:终于知道AI GEO该如何做?
我是暴走的莉莉酱,边旅行边研究AI GEO的数字游民。专注普通人如何提升“AI可见度”——让AI在回答用户问题时准确识别、理解并推荐你。不讲玄学,只做可测、可调、可持续的GEO实践。
396 124
|
7天前
|
机器学习/深度学习 人工智能 调度
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
HappyHorse 1.1 是新一代视频生成大模型,全面升级动态表现力、角色一致性、指令遵循、视觉质感与音画协同能力。支持I2V/T2V/R2V三类生成,适配短剧、电商广告、品牌营销等场景,提供高质、流畅、可控的AI视频生产力。
676 4
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
|
4天前
|
缓存 人工智能 运维
阿里云618百炼大模型Qwen3.7-Max功能、免费试用、订阅计费、配置接入详解
Qwen3.7-MAX是阿里云百炼平台推出的通义千问3.7系列旗舰大语言模型,专为智能体时代复杂任务打造,依托阿里云全域算力与自研技术,在逻辑推理、长文本处理、代码工程、长周期自主执行等领域达到行业顶尖水平。2026年618期间,该模型推出多重免费试用权益、按量计费5折、订阅套餐优惠等专属福利,覆盖个人开发者、团队与企业全场景需求,以下从核心功能、免费试用、订阅计费、配置接入四方面展开详细解析。
391 123
|
2天前
|
人工智能 自然语言处理 API
阿里云Token Plan团队版解析:功能、三档套餐与省钱订阅指南
阿里云百炼平台推出的Token Plan团队版,是面向企业与团队的AI大模型订阅服务,以Credits为统一计量单位,整合文本与图像生成模型,提供团队管理、数据安全、多工具兼容等核心能力,解决团队零散订阅AI服务的管理混乱、成本失控、数据安全等痛点。本文将从核心定位、套餐详情、计费规则、团队管理、工具兼容、便宜订阅技巧等方面,全面解析Token Plan团队版,帮助企业与团队高效、低成本地使用AI服务。
296 108
|
17天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
3天前
|
存储 人工智能 数据可视化
别再手动复制 Skill 了:多 Agent 时代的 Skill 管理方案
多 Agent 场景下 Skill 的统一管理与同步。
228 125
|
11天前
|
缓存 人工智能 运维
GLM 5.2自托管全流程实战:硬件选型、vLLM/SGLang部署与成本盈亏测算
2026年智谱发布GLM 5.2超大混合专家模型,区别于以往仅开放API的闭源大模型,该模型权重以MIT开源协议对外发布,企业与开发者可完整下载、本地审计、私有化部署,实现数据不出环境、自定义微调、自主调度推理资源。GLM 5.2拥有753B总参数,原生支持百万级上下文窗口,在代码生成、长文档推理、数学逻辑等多项基准测试中对标国际顶尖商用模型,是首款可完整自托管的前沿代码向大模型。
847 0
|
3天前
|
SQL 存储 运维
日志能不能改?SLS LogStore 原生支持更新和删除了
随着日志承载的业务语义越来越多,数据订正、回填、清理等需求变得越来越常见。SLS 现已为 LogStore 提供原生 update/delete 能力——支持按 RowID 精确修改,按查询条件批量操作,类似计费调账、标签刷新、反馈回填等场景都可以直接在 LogStore 内完成闭环。
195 124