蚝油菜花_个人页

蚝油菜花

文章

645

问答

视频

个人介绍

微信公众号：@蚝油菜花｜如果你也关注大模型发展现状，或对大模型应用开发非常感兴趣，很期待你的关注和私信，我会不定期分享自己的想法和开源实例。

擅长的技术

获得更多能力

通用技术能力：

Python
高级
能力说明：

通过课程学习与实战项目，熟练掌握Python的语法知识与编程技能，具备Python语言的函数、面向对象、异常处理等能力，常用开发框架的实际应用和开发能力，具备使用，掌握Python数据分析三剑客Matplotlib、Numpy、Pandas的概念与应用场景，掌握利用Python语言从数据采集到分析的全流程相关知识。
获取记录：
- 2025-02-23 在大学考试大学/社区-用户参加考试
- 2025-02-23 在大学考试 Python初级能力大学/社区用户通过技能测试
- 2025-02-23 在大学考试大学/社区-用户参加考试
- 2025-02-23 在大学考试 Python中级能力大学/社区用户通过技能测试
- 2025-02-22 在大学考试大学/社区-用户参加考试
- 2025-02-22 在大学考试 Python高级能力大学/社区用户通过技能测试

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

高分内容

最新动态

文章
问答
视频

...

暂无更多信息

发表了文章 2025-04-30

小米7B参数推理大模型首次开源！Xiaomi MiMo：数学代码双杀，超越32B巨头
发表了文章 2025-04-30

这个AI把arXiv变成代码工厂，快速复现顶会算法！Paper2Code：AI论文自动转代码神器，多智能体框架颠覆科研复现
发表了文章 2025-04-26

Cooragent：清华 LeapLab 开源 AI Agent 协作框架，一句话召唤AI军团！
发表了文章 2025-04-26

LongPort MCP：证券业首个券商MCP，AI赋能智能投资新时代，散户也能玩转机构级交易
发表了文章 2025-04-26

RAGEN：RL训练LLM推理新范式！开源强化学习框架让Agent学会多轮决策
发表了文章 2025-04-25

开源8B参数全能扩散模型Flex.2-preview：把线稿变商稿，还能边画边改！
发表了文章 2025-04-24

让AI单次生成4万字！WriteHERE：开源AI长文写作框架，单次生成超长文本，小说报告一键搞定！
发表了文章 2025-04-24

AI生成视频告别剪辑拼接！MAGI-1：开源自回归视频生成模型，支持一镜到底的长视频生成
发表了文章 2025-04-24

全球首款开源通用型AI智能体上线！Suna：自动处理Excel/爬数据/写报告等复杂任务一句话搞定
发表了文章 2025-04-24

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库
发表了文章 2025-04-24

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！
发表了文章 2025-04-24

机器人训练师狂喜！Infinite Mobility：上海AI Lab造物神器1秒生成可动家具，成本只要1分钱
发表了文章 2025-04-24

还在想开题报告？SurveyGO卷姬：清华开源学术论文AI写作神器，一键生成文献综述
发表了文章 2025-04-24

「社会实验室」成真！SocioVerse：复旦联合小红书开源社会模拟世界模型，用AI预演群体行为
发表了文章 2025-04-24

白板秒变IDE，草图直接生成可运行代码！Pad.ws：白板+代码编辑器深度结合，创意到实现无缝衔接
发表了文章 2025-04-22

音乐人必看！OpenUtau：开源AI歌声合成神器，快速打造专业级虚拟歌手，中文日文无缝切换
发表了文章 2025-04-22

视觉分词器突破天花板！GigaTok：港大字节联手打造3B参数视觉分词器，突破图像生成瓶颈
发表了文章 2025-04-22

快速生成商业级高清图！SimpleAR：复旦联合字节推出图像生成黑科技，5亿参数秒出高清大图
发表了文章 2025-04-20

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！
发表了文章 2025-04-20

斯坦福黑科技让笔记本GPU也能玩转AI视频生成！FramePack：压缩输入帧上下文长度！仅需6GB显存即可生成高清动画

正在加载, 请稍后...

滑动查看更多

提交了问题 2020-03-23

oss 上传图片成功能够put，但视频put失败返回403

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

蚝油菜花_个人页

个人介绍

擅长的技术

EMMA-X：新加坡科技设计大学推出具身多模态动作模型，使夹爪机器人具备空间推理和任务规划能力

GitHub 推出免费版 GitHub Copilot：提供每月2,000次代码补全和50条聊天消息，支持多种主流大模型

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

MV-Adapter：上交大、北航和 VAST 等联合开源多视图一致图像生成模型，将预训练的文生图扩散模型转为多视图生成器

MarkItDown：微软开源的多格式转Markdown工具，支持将PDF、Word、图像和音频等文件转换为Markdown格式

NodeTool：AI 工作流可视化构建器，通过拖放节点设计复杂的工作流，集成 OpenAI 等多个平台

VMB：中科院联合多所高校推出多模态音乐生成框架，能够通过文本、图像和视频等多种输入生成音乐

ColorFlow：腾讯和清华大学联合推出的图像序列着色模型，通过参考图像的颜色对黑白漫画进行着色生成彩色漫画

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

Lyra：SmartMore 联合香港多所高校推出的多模态大型语言模型，专注于提升语音、视觉和语言模态的交互能力

LatentLM：微软联合清华大学推出的多模态生成模型，能够统一处理和生成图像、文本、音频和语音合成

Ruyi：图森未来推出的图生视频大模型，支持多分辨率、多时长视频生成，具备运动幅度和镜头控制等功能

BrushEdit：腾讯和北京大学联合推出的图像编辑框架，通过自然语言指令实现对图像的编辑和修复

RDT：清华开源全球最大的双臂机器人操作任务扩散基础模型、代码与训练集，基于模仿能力机器人能够自主完成复杂任务

Apollo：Meta 联合斯坦福大学推出专注于视频理解的多模态模型，能够理解长达数小时的视频

Leffa：Meta AI 开源精确控制人物外观和姿势的图像生成框架，在生成穿着的同时保持人物特征

Freestyler：微软联合西工大和香港大学推出说唱音乐生成模型，支持控制生成的音色、风格和节奏等

FreeScale：无需微调即可提升模型的图像生成能力，生成 8K 分辨率的高质量图像

CosyVoice 2.0：阿里开源升级版语音生成大模型，支持多语言和跨语言语音合成，提升发音和音色等的准确性

Kimi 上线视觉思考模型，K1 系列强化学习模型正式开放，无需借助外部 OCR 处理图像与文本进行思考并回答

POINTS 1.5：腾讯微信开源的多模态大模型，超越了业界其他的开源视觉语言模型，具备强大的视觉和语言处理能力

Meta Motivo：Meta 推出能够控制数字智能体动作的 AI 模型，提升元宇宙互动体验的真实性

SVDQuant：MIT 推出的扩散模型后训练的量化技术，能够将模型的权重和激活值量化至4位，减少内存占用并加速推理过程

Promptic：轻量级 LLM 应用开发框架，提供完善的底层功能，使开发者更专注于构建上层功能

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

Maya：基于 LLaVA 开发的多模态小模型，能理解和处理八种语言，适用于低资源环境

SynCamMaster：快手联合浙大、清华等大学推出的多视角视频生成模型

DiffSensei：AI 漫画生成框架，能生成内容可控的黑白漫画面板，支持多角色和布局控制

ChatMCP：基于 MCP 协议开发的 AI 聊天客户端，支持多语言和自动化安装 MCP 服务器

Multimodal Live API：谷歌推出新的 AI 接口，支持多模态交互和低延迟实时互动

Insight-V：腾讯联合南洋理工、清华大学推出提升长链视觉推理能力的多模态模型

Gemini 2.0：谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型

Ultravox：端到端多模态大模型，能直接理解文本和语音内容，无需依赖语音识别

书生·万象InternVL 2.5：上海 AI Lab 开源的多模态大语言模型，超越了目前许多商业模型

ChatTTSPlus：开源文本转语音工具，支持语音克隆，是 ChatTTS 的扩展版本

FineWeb 2：开源的多语言预训练数据集，覆盖超过 1000 种语言

MMAudio：开源 AI 音频合成项目，根据视频或文本生成同步的音频

Director：构建视频智能体的 AI 框架，用自然语言执行搜索、编辑、合成和生成等复杂视频任务

SPDL：Meta AI 推出的开源高性能AI模型数据加载解决方案，兼容主流 AI 框架 PyTorch

EXAONE 3.5：LG 推出的开源 AI 模型，采用 RAG 和多步推理能力降低模型的幻觉问题

DrivingDojo：中科院联合美团推出的自动驾驶数据集，包含视频片段、驾驶操作和驾驶知识

DeepSeek-V2.5-1210 在线开放使用！支持联网搜索，在各大领域的表现得到全面提升

VISION XL：支持四倍超分辨率的 AI 视频修复处理工具，提供去除模糊、修复缺失等功能

ClotheDreamer：上海大学联合腾讯等高校推出的3D服装生成技术

Florence-VL：微软和马里兰大学共同开源的多模态大语言模型

OOTDiffusion：开源AI虚拟试衣工具，智能适配性别和体型自动调整衣物

See3D：智源研究院开源的无标注视频学习 3D 生成模型

Amurex：开源AI会议助手，提供实时建议、智能摘要、快速回顾关键信息

O1-CODER：北交大推出的O1代码版开源项目，专注于编码任务

GenMAC：港大、清华联合微软推出文本到视频生成的多代理协作框架

小米7B参数推理大模型首次开源！Xiaomi MiMo：数学代码双杀，超越32B巨头

这个AI把arXiv变成代码工厂，快速复现顶会算法！Paper2Code：AI论文自动转代码神器，多智能体框架颠覆科研复现

Cooragent：清华 LeapLab 开源 AI Agent 协作框架，一句话召唤AI军团！

LongPort MCP：证券业首个券商MCP，AI赋能智能投资新时代，散户也能玩转机构级交易

RAGEN：RL训练LLM推理新范式！开源强化学习框架让Agent学会多轮决策

开源8B参数全能扩散模型Flex.2-preview：把线稿变商稿，还能边画边改！

让AI单次生成4万字！WriteHERE：开源AI长文写作框架，单次生成超长文本，小说报告一键搞定！

AI生成视频告别剪辑拼接！MAGI-1：开源自回归视频生成模型，支持一镜到底的长视频生成

全球首款开源通用型AI智能体上线！Suna：自动处理Excel/爬数据/写报告等复杂任务一句话搞定

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！