蚝油菜花_个人页

蚝油菜花

文章

645

问答

视频

个人介绍

微信公众号：@蚝油菜花｜如果你也关注大模型发展现状，或对大模型应用开发非常感兴趣，很期待你的关注和私信，我会不定期分享自己的想法和开源实例。

擅长的技术

获得更多能力

通用技术能力：

Python
高级
能力说明：

通过课程学习与实战项目，熟练掌握Python的语法知识与编程技能，具备Python语言的函数、面向对象、异常处理等能力，常用开发框架的实际应用和开发能力，具备使用，掌握Python数据分析三剑客Matplotlib、Numpy、Pandas的概念与应用场景，掌握利用Python语言从数据采集到分析的全流程相关知识。
获取记录：
- 2025-02-23 在大学考试大学/社区-用户参加考试
- 2025-02-23 在大学考试 Python初级能力大学/社区用户通过技能测试
- 2025-02-23 在大学考试大学/社区-用户参加考试
- 2025-02-23 在大学考试 Python中级能力大学/社区用户通过技能测试
- 2025-02-22 在大学考试大学/社区-用户参加考试
- 2025-02-22 在大学考试 Python高级能力大学/社区用户通过技能测试

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

高分内容

最新动态

文章
问答
视频

...

暂无更多信息

发表了文章 2025-04-30

小米7B参数推理大模型首次开源！Xiaomi MiMo：数学代码双杀，超越32B巨头
发表了文章 2025-04-30

这个AI把arXiv变成代码工厂，快速复现顶会算法！Paper2Code：AI论文自动转代码神器，多智能体框架颠覆科研复现
发表了文章 2025-04-26

Cooragent：清华 LeapLab 开源 AI Agent 协作框架，一句话召唤AI军团！
发表了文章 2025-04-26

LongPort MCP：证券业首个券商MCP，AI赋能智能投资新时代，散户也能玩转机构级交易
发表了文章 2025-04-26

RAGEN：RL训练LLM推理新范式！开源强化学习框架让Agent学会多轮决策
发表了文章 2025-04-25

开源8B参数全能扩散模型Flex.2-preview：把线稿变商稿，还能边画边改！
发表了文章 2025-04-24

让AI单次生成4万字！WriteHERE：开源AI长文写作框架，单次生成超长文本，小说报告一键搞定！
发表了文章 2025-04-24

AI生成视频告别剪辑拼接！MAGI-1：开源自回归视频生成模型，支持一镜到底的长视频生成
发表了文章 2025-04-24

全球首款开源通用型AI智能体上线！Suna：自动处理Excel/爬数据/写报告等复杂任务一句话搞定
发表了文章 2025-04-24

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库
发表了文章 2025-04-24

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！
发表了文章 2025-04-24

机器人训练师狂喜！Infinite Mobility：上海AI Lab造物神器1秒生成可动家具，成本只要1分钱
发表了文章 2025-04-24

还在想开题报告？SurveyGO卷姬：清华开源学术论文AI写作神器，一键生成文献综述
发表了文章 2025-04-24

「社会实验室」成真！SocioVerse：复旦联合小红书开源社会模拟世界模型，用AI预演群体行为
发表了文章 2025-04-24

白板秒变IDE，草图直接生成可运行代码！Pad.ws：白板+代码编辑器深度结合，创意到实现无缝衔接
发表了文章 2025-04-22

音乐人必看！OpenUtau：开源AI歌声合成神器，快速打造专业级虚拟歌手，中文日文无缝切换
发表了文章 2025-04-22

视觉分词器突破天花板！GigaTok：港大字节联手打造3B参数视觉分词器，突破图像生成瓶颈
发表了文章 2025-04-22

快速生成商业级高清图！SimpleAR：复旦联合字节推出图像生成黑科技，5亿参数秒出高清大图
发表了文章 2025-04-20

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！
发表了文章 2025-04-20

斯坦福黑科技让笔记本GPU也能玩转AI视频生成！FramePack：压缩输入帧上下文长度！仅需6GB显存即可生成高清动画

正在加载, 请稍后...

滑动查看更多

提交了问题 2020-03-23

oss 上传图片成功能够put，但视频put失败返回403

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

蚝油菜花_个人页

个人介绍

擅长的技术

Infinity：字节跳动开源高分辨率图像生成模型，生成 1024x1024 的图像仅需 0.8 秒

联通元景：中国联通开源中文原生的文生图模型，优化对中文长文本和成语语义等理解

MNN：阿里开源的轻量级深度学习推理框架，支持在移动端等多种终端上运行，兼容主流的模型格式

FinRobot：开源的金融专业 AI Agent，提供市场预测、报告分析和交易策略等金融解决方案

VidTok：微软开源的视频分词器，能够将视频内容转换为视觉 Token

Vision Parse：开源的 PDF 转 Markdown 工具，结合视觉语言模型和 OCR，识别文本和表格并保持原格式

Diff-Instruct：指导任意生成模型训练的通用框架，无需额外训练数据即可提升生成质量

EDTalk：只需上传图片、音频和视频，就能使图片中的人物说话，情感表情与音频情绪高度统一

FastExcel：开源的 JAVA 解析 Excel 工具，集成 AI 通过自然语言处理 Excel 文件，完全兼容 EasyExcel

CogAgent-9B：智谱 AI 开源 GLM-PC 的基座模型，专注于预测和执行 GUI 操作，可应用于自动化交互任务

VE-Bench：北京大学开源首个针对视频编辑质量的评估指标，从多角度考虑审美并准确地评估视频编辑效果

Qwen-Agent：阿里通义开源 AI Agent 应用开发框架，支持构建多智能体，具备自动记忆上下文等能力

PeterCat：一键创建开源项目 AI 问答机器人，自动抓取 GitHub 仓库信息、文档和 issue 等构建知识库

Cobalt：开源的流媒体下载工具，支持解析和下载全平台的视频、音频和图片，支持多种视频质量和格式，自动提取视频字幕

Enhance-A-Video：上海 AI Lab 推出视频生成质量增强算法，显著提升 AI 视频生成的真实度和细节表现

DynamicControl：腾讯推出动态地条件控制图像生成框架，结合了多模态大语言模型的推理能力和文生图模型的生成能力

DRT-o1：腾讯推出专注于文学翻译的 AI 模型，擅长理解比喻和隐喻等修辞手法，在翻译时保留原文的情感色彩

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

Mathtutor on Groq：AI 数学辅导工具，实时计算并展示解题过程，支持通过语音提出数学问题

DiTCtrl：腾讯推出多提示视频生成方法，通过多个提示生成连贯的视频内容，确保内容与提示一致

ModernBERT：英伟达开源的新一代编码器模型，性能超越 SOTA，通过去除填充和序列打包减少计算浪费，提高训练和推理的效率

SPAR：智谱 AI 推出自我博弈训练框架，基于生成者和完善者两个角色的互动，提升了执行准确度和自我完善能力

DeepSeek V3：DeepSeek 开源的最新多模态 AI 模型，编程能力超越Claude，生成速度提升至 60 TPS

PC Agent：开源 AI 电脑智能体，自动收集人机交互数据，模拟认知过程实现办公自动化

Midscene.js：AI 驱动的 UI 自动化测试框架，支持自然语言交互，生成可视化报告

ASAL：Sakana AI 联合 OpenAI 推出自动探索人工生命的系统，通过计算机模拟生命进化的过程

TRELLIS：微软联合清华和中科大推出的高质量 3D 生成模型，支持局部控制和多种输出格式

Browser Use：开源 AI 浏览器助手，自动完成网页交互任务，支持多标签页管理、视觉识别和内容提取等功能

Granite 3.1：IBM 开源新一代可商用大语言模型，支持 128K 上下文长度、多语言和复杂任务处理

Open Notebook：开源 AI 笔记工具，支持多种文件格式，自动转播客和生成总结，集成搜索引擎等功能

Univer：开源全栈 AI 办公工具，支持 Word、Excel、PPT 等文档处理和多人实时协作

Kheish：开源的多智能体开发框架，通过 YAML 配置工作流和多个 Agent 共同协作解决复杂任务

Bamba-9B：基于 Mamba2 架构的仅解码语言模型，旨在提高大型语言模型在推理时的效率

DisPose：清华北大等多所高校联合推出基于人物图像增强视频生成技术，实现对人物动画的准确控制和一致性

HelloMeme：开源的面部表情与姿态迁移框架，将视频中的人物表情迁移到静态图像中生成动态视频

InvSR：开源图像超分辨率生成模型，提升分辨率，修复老旧照片为超清图像

CLEAR：新加坡国立大学推出线性注意力机制，使8K图像的生成速度提升6.3倍，显著减少了计算量和时间延迟

VSI-Bench：李飞飞谢赛宁团队推出视觉空间智能基准测试集，旨在评估多模态大语言模型在空间认知和理解方面的能力

3D-Speaker：阿里通义开源的多模态说话人识别项目，支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录

VisionFM：通用眼科 AI 大模型，具备眼科疾病诊断能力，展现出专家级别的准确性

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

LeviTor：蚂蚁集团开源3D目标轨迹控制视频合成技术，能够控制视频中3D物体的运动轨迹

RWKV-7：RWKV系列开源最新的大模型架构，具有强大的上下文学习能力，超越传统的Attention范式

PromptWizard：微软开源 AI 提示词自动化优化框架，能够迭代优化提示指令和上下文示例，提升 LLMs 特定任务的表现

StyleStudio：支持图像风格迁移的文生图模型，能将融合参考图像的风格和文本提示内容生成风格一致的图像

OpenAI 12天发布会内容全纪录！一文快速回顾获知亮点信息，原文附发布会中文字幕视频

Gemini 2.0 Flash Thinking：谷歌推出实验性多模态推理模型，在快速生成的同时展示详细的思考过程

AniDoc：蚂蚁集团开源 2D 动画上色 AI 模型，基于视频扩散模型自动将草图序列转换成彩色动画，保持动画的连贯性

Genesis：卡内基梅隆大学联合 20 多所研究机构开源生成式物理引擎，能够模拟各种材料、物体和物理运动现象

WeaveFox：蚂蚁集团推出 AI 前端智能研发平台，能够根据设计图直接生成源代码，支持多种客户端和技术栈

小米7B参数推理大模型首次开源！Xiaomi MiMo：数学代码双杀，超越32B巨头

这个AI把arXiv变成代码工厂，快速复现顶会算法！Paper2Code：AI论文自动转代码神器，多智能体框架颠覆科研复现

Cooragent：清华 LeapLab 开源 AI Agent 协作框架，一句话召唤AI军团！

LongPort MCP：证券业首个券商MCP，AI赋能智能投资新时代，散户也能玩转机构级交易

RAGEN：RL训练LLM推理新范式！开源强化学习框架让Agent学会多轮决策

开源8B参数全能扩散模型Flex.2-preview：把线稿变商稿，还能边画边改！

让AI单次生成4万字！WriteHERE：开源AI长文写作框架，单次生成超长文本，小说报告一键搞定！

AI生成视频告别剪辑拼接！MAGI-1：开源自回归视频生成模型，支持一镜到底的长视频生成

全球首款开源通用型AI智能体上线！Suna：自动处理Excel/爬数据/写报告等复杂任务一句话搞定

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！