备案控制台

蚝油菜花_个人页

蚝油菜花

文章

645

问答

1

视频

0

个人介绍

微信公众号：@蚝油菜花｜如果你也关注大模型发展现状，或对大模型应用开发非常感兴趣，很期待你的关注和私信，我会不定期分享自己的想法和开源实例。

擅长的技术

获得更多能力

通用技术能力：

Python
高级
能力说明：

通过课程学习与实战项目，熟练掌握Python的语法知识与编程技能，具备Python语言的函数、面向对象、异常处理等能力，常用开发框架的实际应用和开发能力，具备使用，掌握Python数据分析三剑客Matplotlib、Numpy、Pandas的概念与应用场景，掌握利用Python语言从数据采集到分析的全流程相关知识。
获取记录：
- 2025-02-23 在大学考试大学/社区-用户参加考试
- 2025-02-23 在大学考试 Python初级能力大学/社区用户通过技能测试
- 2025-02-23 在大学考试大学/社区-用户参加考试
- 2025-02-23 在大学考试 Python中级能力大学/社区用户通过技能测试
- 2025-02-22 在大学考试大学/社区-用户参加考试
- 2025-02-22 在大学考试 Python高级能力大学/社区用户通过技能测试

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

文章
问答
视频

暂无更多信息

2025年04月

04.06 00:31:53

发表了文章 2025-04-06 00:31:53

这个模型让AI角色会说话还会演！MoCha：Meta联手滑铁卢大学打造对话角色视频生成黑科技

MoCha是由Meta与滑铁卢大学联合开发的端到端对话角色视频生成模型，通过创新的语音-视频窗口注意力机制实现精准的唇语同步和全身动作生成。
04.04 11:06:44

发表了文章 2025-04-04 11:06:44

PaperBench：OpenAI开源AI智能体评测基准，8316节点精准考核复现能力

PaperBench是OpenAI推出的开源评测框架，通过8316个评分节点系统评估AI智能体复现学术论文的能力，涵盖理论理解、代码实现到实验执行全流程。
04.04 11:06:08

发表了文章 2025-04-04 11:06:08

DeepSite：基于DeepSeek的开源AI前端开发神器，一键生成游戏/网页代码

DeepSite是基于DeepSeek-V3模型的在线开发工具，无需配置环境即可通过自然语言描述快速生成游戏、网页和应用代码，并支持实时预览效果，显著降低开发门槛。
04.04 11:05:26

发表了文章 2025-04-04 11:05:26

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

Dolphin是清华大学与海天瑞声联合研发的语音识别大模型，支持40种东方语言和22种中文方言，采用CTC-Attention混合架构，词错率显著低于同类模型。
04.04 11:05:09

发表了文章 2025-04-04 11:05:09

DreamActor-M1：字节跳动推出AI动画黑科技，静态照片秒变生动视频

DreamActor-M1是字节跳动研发的AI图像动画框架，通过混合引导机制实现高保真人物动画生成，支持多语言语音驱动和形状自适应功能。
04.04 11:04:44

发表了文章 2025-04-04 11:04:44

WorldScore：斯坦福开源世界生成模型评估新标杆：3000样本+九维指标，视频/4D/3D模型一网打尽

WorldScore是斯坦福大学提出的首个统一评估世界生成模型的基准测试，通过基于相机轨迹的布局规范和3000个多样化样本，全面评测生成内容的可控性、质量与动态性。
04.04 11:04:17

发表了文章 2025-04-04 11:04:17

SWEET-RL：8B小模型暴打GPT-4？Meta开源强化学习黑科技，多轮任务成功率飙升6%

Meta最新开源的SWEET-RL框架通过优化多轮交互任务的信用分配机制，使Llama-3.1-8B模型在协作推理任务中的表现提升6%，性能达到顶尖大模型水平。
04.04 11:03:06

发表了文章 2025-04-04 11:03:06

EasyControl Ghibli：在线体验一键生成宫崎骏动画风，开源AI模型让你的照片秒变吉卜力

EasyControl Ghibli是基于扩散模型的AI工具，通过条件注入技术将普通照片转化为吉卜力动画风格，仅需100张训练样本即可精准还原标志性光影与色调特征。
04.02 22:48:11

发表了文章 2025-04-02 22:48:11

Text to Bark：让狗狗听懂人话！全球首个AI"狗语"生成器，137种狗狗口音任君挑选

ElevenLabs推出的Text to Bark是全球首个能将文本转换为逼真狗吠声的AI模型，支持多种犬种选择并适配智能家居设备，其核心技术基于深度神经网络训练。
04.02 22:47:51

发表了文章 2025-04-02 22:47:51

AutoAgent：无需编程！接入DeepSeek用自然语言创建和部署AI智能体！港大开源框架让AI智能体开发变成填空题

香港大学推出的AutoAgent框架通过自然语言交互实现零代码创建AI智能体，支持多模型接入与自动化工作流编排，在GAIA基准测试中表现优异。
04.02 22:47:26

发表了文章 2025-04-02 22:47:26

Cua：Mac用户狂喜！这个开源框架让AI直接接管你的电脑，快速实现AI自动化办公

Cua是一个结合高性能虚拟化与AI代理能力的开源框架，能在Apple Silicon上以接近原生性能运行虚拟机，并让AI直接操作系统应用。
04.01 21:47:48

发表了文章 2025-04-01 21:47:48

智谱AI新突破！GLM-Z1-Rumination：新一代沉思模型，推动AI助手进入"高智商+高自主"的新阶段

GLM-Z1-Rumination是智谱推出的新一代沉思模型，通过扩展强化学习训练实现长程推理能力，支持动态工具调用与自我验证机制，显著提升AI自主研究能力。
04.01 21:47:27

发表了文章 2025-04-01 21:47:27

AI-ClothingTryOn：服装店老板连夜下架试衣间！基于Gemini开发的AI试衣应用，一键生成10种穿搭效果

AI-ClothingTryOn是基于Google Gemini技术的虚拟试衣应用，支持人物与服装照片智能合成，可生成多达10种试穿效果版本，并提供自定义提示词优化功能。
04.01 21:46:20

发表了文章 2025-04-01 21:46:20

32B小模型竟能吊打百亿参数？GLM-4-Air-0414：智谱AutoGLM沉思背后的模型，智能体开发迎来新纪元

GLM-4-Air-0414是智谱公司推出的320亿参数开源基座模型，通过优化预训练数据和对齐策略，在工具调用、联网搜索和代码生成等智能体任务中展现出卓越性能。
04.01 21:45:33

发表了文章 2025-04-01 21:45:33

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

Qlib是微软亚洲研究院推出的开源AI量化投资平台，提供从数据处理、模型训练到组合管理的全流程支持，内置高性能数据基础设施和多种机器学习模型。
04.01 21:45:05

发表了文章 2025-04-01 21:45:05

Amodal3R：3D重建领域新突破！这个模型让残破文物完美还原，3D重建结果助力文物修复

Amodal3R是一种创新的条件式3D生成模型，通过掩码加权多头交叉注意力机制和遮挡感知层，能够从部分可见的2D图像中重建完整3D形态，仅用合成数据训练即可实现真实场景的高精度重建。
04.01 21:44:39

发表了文章 2025-04-01 21:44:39

Neo-1：全球首个原子级生成式AI模型！这个AI模型把10年药物研发周期压缩到1个月

VantAI推出的Neo-1是全球首个统一分子生成与原子级结构预测的AI模型，采用潜在空间扩散技术，结合大规模训练和定制数据集，显著提升药物研发效率。
04.01 21:43:21

发表了文章 2025-04-01 21:43:21

AutoGLM沉思：智谱AI推出首个能"边想边干"的自主智能体！深度研究+多模态交互，颠覆传统AI工作模式

AutoGLM沉思是由智谱AI推出的一款开创性AI智能体，它突破性地将深度研究能力与实际操作能力融为一体，实现了AI从被动响应到主动执行的跨越式发展。
04.01 21:42:57

发表了文章 2025-04-01 21:42:57

Amazon Nova Act：网页操作全自动！亚马逊黑科技把浏览器变AI机器人，请假/订餐/写邮件一键搞定

Amazon Nova Act是亚马逊AGI实验室推出的通用AI代理系统，通过原子化分解网页操作任务并配合Playwright实现高可靠性浏览器自动化，其配套SDK支持开发者快速构建智能体应用原型。
04.01 21:42:40

发表了文章 2025-04-01 21:42:40

Runway Gen-4：AI视频生成新纪元！高保真特效一键生成影视级内容

Runway Gen-4是新一代AI视频生成模型，通过参考图和文字指令即可生成具有物理真实感、叙事连贯性的高质量视频内容，支持与实拍素材无缝融合。
04.01 18:32:17

发表了文章 2025-04-01 18:32:17

Hi3DGen：2D照片秒变高精度模型，毛孔级细节完爆Blender！港中文×字节×清华联手打造3D生成黑科技

Hi3DGen是由香港中文大学、字节跳动和清华大学联合研发的高保真3D几何生成框架，通过法线图中间表示实现细节丰富的3D模型生成，其双阶段生成流程显著提升了几何保真度。
04.01 17:51:39

发表了文章 2025-04-01 17:51:39

OpenDeepSearch：搜索引擎革命！这个开源深度搜索工具让AI代理直接读懂网页，复杂问题一键拆解

OpenDeepSearch是基于开源推理模型的深度搜索工具，通过语义重排和多源整合优化检索效果，支持与AI代理无缝集成，提供快速和专业两种搜索模式。

2025年03月

03.31 20:40:05

发表了文章 2025-03-31 20:40:05

Math24o：SuperCLUE开源的高中奥数推理测评基准，85.71分屠榜

Math24o是首个针对高中奥林匹克数学竞赛的中文大模型测评基准，采用2024年预赛真题实现自动化评估，为模型数学推理能力提供客观衡量标准。
03.31 20:39:47

发表了文章 2025-03-31 20:39:47

EmotiVoice：网易开源AI语音合成黑科技，2000+音色情感可控

EmotiVoice是网易有道开源的多语言语音合成系统，支持中英文2000多种音色，通过提示词控制情感输出，提供Web界面和API接口，具备语音克隆等先进功能。
03.31 20:39:22

发表了文章 2025-03-31 20:39:22

Vibe Draw：涂鸦秒变3D模型！开源AI建模神器解放创意生产力

Vibe Draw 是一款基于AI技术的开源3D建模工具，通过Next.js和FastAPI构建，能将用户绘制的2D草图智能转化为3D模型，并支持文本提示优化和场景构建。
03.31 20:39:05

发表了文章 2025-03-31 20:39:05

ObjectMover：港大联合Adobe打造图像编辑黑科技，移动物体光影自动匹配

香港大学与Adobe联合研发的ObjectMover模型，通过视频生成先验迁移技术，实现图像中物体的自然移动、删除和插入，自动保持光影一致性。
03.31 20:38:09

发表了文章 2025-03-31 20:38:09

PhysGen3D：清华等高校联合推出，单图秒变交互式3D场景

PhysGen3D是清华等高校联合开发的创新框架，通过单张图像重建3D场景并模拟物理行为，实现从静态图像到动态交互的突破性转换。
03.31 20:36:33

发表了文章 2025-03-31 20:36:33

ChatAnyone：阿里通义黑科技！实时风格化肖像视频生成框架震撼发布

阿里巴巴通义实验室推出的ChatAnyone框架，通过高效分层运动扩散模型和混合控制融合技术，实现高保真度、自然度的实时肖像视频生成。
03.31 20:36:11

发表了文章 2025-03-31 20:36:11

PaddleSpeech：百度飞桨开源语音处理神器，识别合成翻译全搞定

PaddleSpeech是百度飞桨团队推出的开源语音处理工具包，集成语音识别、合成、翻译等核心技术，基于PaddlePaddle框架提供高性能解决方案。
03.29 00:23:46

发表了文章 2025-03-29 00:23:46

QVQ-Max：阿里通义新一代视觉推理模型！再造多模态「全能眼」秒解图文难题

QVQ-Max是阿里通义推出的新一代视觉推理模型，不仅能解析图像视频内容，还能进行深度推理和创意生成，在数学解题、数据分析、穿搭建议等场景展现强大能力。
03.29 00:23:27

发表了文章 2025-03-29 00:23:27

TripoSF：3D建模内存暴降80%！VAST AI新一代模型细节狂飙82%

TripoSF 是 VAST AI 推出的新一代 3D 基础模型，采用创新的 SparseFlex 表示方法，支持 1024³ 高分辨率建模，内存占用降低 82%，在细节捕捉和复杂结构处理上表现优异。
03.29 00:23:07

发表了文章 2025-03-29 00:23:07

TripoSR：开源3D生成闪电战！单图0.5秒建模，Stability AI颠覆设计流程

TripoSR是由Stability AI和VAST联合推出的开源3D生成模型，能在0.5秒内从单张2D图像快速生成高质量3D模型，支持游戏开发、影视制作等多领域应用。
03.29 00:22:44

发表了文章 2025-03-29 00:22:44

TripoSG：3D生成新纪元！修正流模型秒出高保真网格，碾压传统建模

TripoSG 是 VAST AI 推出的基于大规模修正流模型的高保真 3D 形状合成技术，能够从单张图像生成细节丰富的 3D 网格模型，在工业设计、游戏开发等领域具有广泛应用前景。
03.29 00:22:20

发表了文章 2025-03-29 00:22:20

DistilQwen2.5-R1：蒸馏黑科技！32B推理能力塞进3B小模型，推理速度狂飙300%

阿里巴巴最新发布的DistilQwen2.5-R1系列模型通过知识蒸馏技术，在保持高性能的同时大幅降低计算资源需求，7B模型性能甚至可媲美32B大模型。
03.29 00:21:58

发表了文章 2025-03-29 00:21:58

TxGemma：谷歌DeepMind革命药物研发！270亿参数AI药理学家24小时在线

谷歌推出专为药物研发设计的TxGemma大模型，具备药物特性预测、生物文献筛选、多步推理等核心能力，提供20亿至270亿参数版本，显著提升治疗开发效率。
03.28 10:10:49

发表了文章 2025-03-28 10:10:49

Video-T1：视频生成实时手术刀！清华腾讯「帧树算法」终结闪烁抖动

清华大学与腾讯联合推出的Video-T1技术，通过测试时扩展（TTS）和Tree-of-Frames方法，显著提升视频生成的连贯性与文本匹配度，为影视制作、游戏开发等领域带来突破性解决方案。
03.28 10:10:30

发表了文章 2025-03-28 10:10:30

Fin-R1：上海财大开源金融推理大模型！7B参数竟懂华尔街潜规则，评测仅差满血版DeepSeek3分

Fin-R1是上海财经大学联合财跃星辰推出的金融领域推理大模型，基于7B参数的Qwen2.5架构，在金融推理任务中表现出色，支持中英双语，可应用于风控、投资、量化交易等多个金融场景。
03.28 10:10:06

发表了文章 2025-03-28 10:10:06

Cosmos-Reason1：物理常识觉醒！NVIDIA 56B模型让AI懂重力+时空法则

Cosmos-Reason1是NVIDIA推出的多模态大语言模型系列，具备物理常识理解和具身推理能力，支持视频输入和长链思考，可应用于机器人、自动驾驶等场景。
03.28 10:09:47

发表了文章 2025-03-28 10:09:47

RF-DETR：YOLO霸主地位不保？开源 SOTA 实时目标检测模型，比眨眼还快3倍！

RF-DETR是首个在COCO数据集上突破60 mAP的实时检测模型，结合Transformer架构与DINOv2主干网络，支持多分辨率灵活切换，为安防、自动驾驶等场景提供高精度实时检测方案。
03.28 10:08:53

发表了文章 2025-03-28 10:08:53

Oliva：语音RAG革命！开源多智能体秒解复杂搜索，实时对讲颠覆传统

Oliva是一款基于Langchain和Superlinked的开源语音RAG助手，通过实时语音交互在Qdrant向量数据库中进行语义搜索，支持多智能体协作处理复杂查询任务。

1

2

3

4

...

15

发表了文章 2025-04-30

小米7B参数推理大模型首次开源！Xiaomi MiMo：数学代码双杀，超越32B巨头
发表了文章 2025-04-30

这个AI把arXiv变成代码工厂，快速复现顶会算法！Paper2Code：AI论文自动转代码神器，多智能体框架颠覆科研复现
发表了文章 2025-04-26

Cooragent：清华 LeapLab 开源 AI Agent 协作框架，一句话召唤AI军团！
发表了文章 2025-04-26

LongPort MCP：证券业首个券商MCP，AI赋能智能投资新时代，散户也能玩转机构级交易
发表了文章 2025-04-26

RAGEN：RL训练LLM推理新范式！开源强化学习框架让Agent学会多轮决策
发表了文章 2025-04-25

开源8B参数全能扩散模型Flex.2-preview：把线稿变商稿，还能边画边改！
发表了文章 2025-04-24

让AI单次生成4万字！WriteHERE：开源AI长文写作框架，单次生成超长文本，小说报告一键搞定！
发表了文章 2025-04-24

AI生成视频告别剪辑拼接！MAGI-1：开源自回归视频生成模型，支持一镜到底的长视频生成
发表了文章 2025-04-24

全球首款开源通用型AI智能体上线！Suna：自动处理Excel/爬数据/写报告等复杂任务一句话搞定
发表了文章 2025-04-24

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库
发表了文章 2025-04-24

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！
发表了文章 2025-04-24

机器人训练师狂喜！Infinite Mobility：上海AI Lab造物神器1秒生成可动家具，成本只要1分钱
发表了文章 2025-04-24

还在想开题报告？SurveyGO卷姬：清华开源学术论文AI写作神器，一键生成文献综述
发表了文章 2025-04-24

「社会实验室」成真！SocioVerse：复旦联合小红书开源社会模拟世界模型，用AI预演群体行为
发表了文章 2025-04-24

白板秒变IDE，草图直接生成可运行代码！Pad.ws：白板+代码编辑器深度结合，创意到实现无缝衔接
发表了文章 2025-04-22

音乐人必看！OpenUtau：开源AI歌声合成神器，快速打造专业级虚拟歌手，中文日文无缝切换
发表了文章 2025-04-22

视觉分词器突破天花板！GigaTok：港大字节联手打造3B参数视觉分词器，突破图像生成瓶颈
发表了文章 2025-04-22

快速生成商业级高清图！SimpleAR：复旦联合字节推出图像生成黑科技，5亿参数秒出高清大图
发表了文章 2025-04-20

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！
发表了文章 2025-04-20

斯坦福黑科技让笔记本GPU也能玩转AI视频生成！FramePack：压缩输入帧上下文长度！仅需6GB显存即可生成高清动画

正在加载, 请稍后...

滑动查看更多

提交了问题 2020-03-23

oss 上传图片成功能够put，但视频put失败返回403

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息