蚝油菜花_个人页

蚝油菜花

文章

645

问答

视频

个人介绍

微信公众号：@蚝油菜花｜如果你也关注大模型发展现状，或对大模型应用开发非常感兴趣，很期待你的关注和私信，我会不定期分享自己的想法和开源实例。

擅长的技术

获得更多能力

通用技术能力：

Python
高级
能力说明：

通过课程学习与实战项目，熟练掌握Python的语法知识与编程技能，具备Python语言的函数、面向对象、异常处理等能力，常用开发框架的实际应用和开发能力，具备使用，掌握Python数据分析三剑客Matplotlib、Numpy、Pandas的概念与应用场景，掌握利用Python语言从数据采集到分析的全流程相关知识。
获取记录：
- 2025-02-23 在大学考试大学/社区-用户参加考试
- 2025-02-23 在大学考试 Python初级能力大学/社区用户通过技能测试
- 2025-02-23 在大学考试大学/社区-用户参加考试
- 2025-02-23 在大学考试 Python中级能力大学/社区用户通过技能测试
- 2025-02-22 在大学考试大学/社区-用户参加考试
- 2025-02-22 在大学考试 Python高级能力大学/社区用户通过技能测试

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

高分内容

最新动态

文章
问答
视频

...

暂无更多信息

发表了文章 2025-04-30

小米7B参数推理大模型首次开源！Xiaomi MiMo：数学代码双杀，超越32B巨头
发表了文章 2025-04-30

这个AI把arXiv变成代码工厂，快速复现顶会算法！Paper2Code：AI论文自动转代码神器，多智能体框架颠覆科研复现
发表了文章 2025-04-26

Cooragent：清华 LeapLab 开源 AI Agent 协作框架，一句话召唤AI军团！
发表了文章 2025-04-26

LongPort MCP：证券业首个券商MCP，AI赋能智能投资新时代，散户也能玩转机构级交易
发表了文章 2025-04-26

RAGEN：RL训练LLM推理新范式！开源强化学习框架让Agent学会多轮决策
发表了文章 2025-04-25

开源8B参数全能扩散模型Flex.2-preview：把线稿变商稿，还能边画边改！
发表了文章 2025-04-24

让AI单次生成4万字！WriteHERE：开源AI长文写作框架，单次生成超长文本，小说报告一键搞定！
发表了文章 2025-04-24

AI生成视频告别剪辑拼接！MAGI-1：开源自回归视频生成模型，支持一镜到底的长视频生成
发表了文章 2025-04-24

全球首款开源通用型AI智能体上线！Suna：自动处理Excel/爬数据/写报告等复杂任务一句话搞定
发表了文章 2025-04-24

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库
发表了文章 2025-04-24

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！
发表了文章 2025-04-24

机器人训练师狂喜！Infinite Mobility：上海AI Lab造物神器1秒生成可动家具，成本只要1分钱
发表了文章 2025-04-24

还在想开题报告？SurveyGO卷姬：清华开源学术论文AI写作神器，一键生成文献综述
发表了文章 2025-04-24

「社会实验室」成真！SocioVerse：复旦联合小红书开源社会模拟世界模型，用AI预演群体行为
发表了文章 2025-04-24

白板秒变IDE，草图直接生成可运行代码！Pad.ws：白板+代码编辑器深度结合，创意到实现无缝衔接
发表了文章 2025-04-22

音乐人必看！OpenUtau：开源AI歌声合成神器，快速打造专业级虚拟歌手，中文日文无缝切换
发表了文章 2025-04-22

视觉分词器突破天花板！GigaTok：港大字节联手打造3B参数视觉分词器，突破图像生成瓶颈
发表了文章 2025-04-22

快速生成商业级高清图！SimpleAR：复旦联合字节推出图像生成黑科技，5亿参数秒出高清大图
发表了文章 2025-04-20

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！
发表了文章 2025-04-20

斯坦福黑科技让笔记本GPU也能玩转AI视频生成！FramePack：压缩输入帧上下文长度！仅需6GB显存即可生成高清动画

正在加载, 请稍后...

滑动查看更多

提交了问题 2020-03-23

oss 上传图片成功能够put，但视频put失败返回403

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

蚝油菜花_个人页

个人介绍

擅长的技术

Cosmos：英伟达生成式世界基础模型平台，加速自动驾驶与机器人开发

KAG：增强 LLM 的专业能力！蚂蚁集团推出专业领域知识增强框架，支持逻辑推理和多跳问答

OpenHands：能自主检索外部知识的 AI 编程工具，自动执行命令、网页浏览和生成代码等操作

PersonaMagic：人像与风格融合！快速生成个性化的头像

LatentSync：根据音频生成高分辨率、动态逼真的唇形同步视频

LLM2LLM：LLM2LLM：用 LLM 来增强 LLM ！通过教师模型合成数据，增强学生模型的训练数据集

GeneralDyG：南洋理工推出通用动态图异常检测方法，支持社交网络、电商和网络安全

Inf-DiT：清华联合智谱AI推出超高分辨率图像生成模型，生成的空间复杂度从 O(N^2) 降低到 O(N)

FlexRAG：不再局限于文本的 RAG！中科院开源多模态 RAG 助手，支持多数据类型、上下文压缩和多种检索器类型

RLCM：康奈尔大学推出文本到图像一致性模型优化框架，支持快速生成与任务特定奖励优化

VMix：即插即用！字节联合中科大推出增强模型生成美学质量的开源适配器，支持多源输入、高质量视频处理

Smolagents：三行代码就能开发 AI 智能体，Hugging Face 开源轻量级 Agent 构建库

VITRON：开源像素级视觉大模型，同时满足图像与视频理解、生成、分割和编辑等视觉任务

TryOffAnyone：快速将模特服装图还原为平铺商品图，生成标准化的服装展示效果

Memory Layers：如何在不增加算力成本的情况下扩大模型的参数容量？Meta 开源解决方法

SoulChat2.0：低成本构建 AI 心理咨询师，华南理工开源心理咨询师数字孪生大语言模型

Cognita：小白也能搭建 RAG 系统，提供交互界面的开源模块化 RAG 框架，支持多种文档检索技术

SocraticLM：通过 AI 提问引导学生主动思考，中科大与科大讯飞联合推出苏格拉底式教育大模型

ImBD：复旦联合华南理工推出 AI 内容检测模型，快速辨别文本内容是否为 AI 生成

Jina Reader：一键将网页内容转为适合 LLM 处理的文本格式，自动抓取和清洗网页内容，支持多种输出格式

SEMIKONG：专为半导体领域设计的大型语言模型，支持制造优化、辅助 IC 设计等半导体制造任务

MMedAgent：专为医疗领域设计的多模态 AI 智能体，支持医学影像处理、报告生成等多种医疗任务

LongDocURL：中科院联合阿里推出多模态长文档理解基准数据集，用于评估模型对复杂文档分析与推理的能力

Languine：专为开发者设计的 AI 多语言翻译工具，快速生成100+种语言的准确翻译，简化应用程序的 i18n 国际化配置

MarS：微软开源金融市场模拟预测引擎，支持策略测试、风险管理和市场分析

AigcPanel：开源的 AI 虚拟数字人系统，一键安装开箱即用，支持视频合成、声音合成和声音克隆

TITAN：哈佛医学院推出多模态全切片病理基础模型，支持病理报告生成、跨模态检索

R2R：开源的 RAG 集成系统，支持多模态处理、混合搜索、知识图谱构建等增强检索技术

RAG Logger：专为检索增强生成(RAG)应用设计的开源日志工具，支持查询跟踪、性能监控

Figma-Low-Code：快速将Figma设计转换为Vue.js应用，支持低代码渲染、数据绑定

TangoFlux：高速生成高质量音频，仅用3.7秒生成长达30秒的音频，支持文本到音频转换

LangGraph：构建多代理动态工作流的开源框架，支持人工干预、循环、持久性等复杂工作流自动化

Eliza：TypeScript 版开源 AI Agent 开发框架，快速搭建智能、个性的 Agents 系统

AI Dev Gallery：微软开源 Windows AI 模型本地运行工具包和示例库，助理开发者快速集成 AI 功能

OpenEMMA：德克萨斯开源端到端的自动驾驶多模态模型框架，基于预训练的 MLLMs，处理复杂的视觉数据，推理驾驶场景

StoryWeaver：故事可视化生成模型，快速生成故事绘本，支持处理单角色和多角色的故事可视化任务

StockMixer：上海交大推出预测股票价格的 MLP 架构，通过捕捉指标、时间和股票间的复杂相关性，预测下一个交易日的收盘价

StereoCrafter：腾讯开源将任意2D视频转换为立体3D视频的框架，适用于Apple Vision Pro等多种显示设备

HuatuoGPT-o1：开源的医学推理大模型，通过复杂推理和强化学习提升医学问题解决能力

DeepSeek Engineer：集成 DeepSeek API 的开源 AI 编程助手，支持文件读取、编辑并生成结构化响应

AgiBot World：智元机器人开源百万真机数据集，数据集涵盖了日常生活所需的绝大多数动作

FireCrawl：开源 AI 网络爬虫工具，自动爬取网站及子页面内容，预处理为结构化数据

GraphAgent：自动构建知识图谱，能够处理结构化和非结构化数据，并通过知识图谱展示复杂关系

VideoPhy：UCLA 和谷歌联合推出评估视频生成模型物理模拟能力的评估工具，衡量模型生成的视频是否遵循现实世界的物理规则

AGUVIS：指导模型实现 GUI 自动化训练框架，结合视觉-语言模型进行训练，实现跨平台自主 GUI 交互

VersaGen：生成式 AI 代理，基于 Stable Diffusion 生成图像，专注于控制一至多个视觉主体等生成细节

AutoRAG：自动优化 RAG 管道工具，自动评估各种 RAG 模块组合，快速找到最优的 RAG 管道

Poetry2Image：专为中文古诗词设计的图像生成校正框架，增强了诗歌内容与模型生成图像之间的一致性

VideoVAE+：AI 生成视频高保真重建和跨模态重建工具，基于文本信息指导视频重建，提升视频细节质量

Valley：字节跳动开源小体积的多模态模型，在小于 10B 参数的模型中排名第二

小米7B参数推理大模型首次开源！Xiaomi MiMo：数学代码双杀，超越32B巨头

这个AI把arXiv变成代码工厂，快速复现顶会算法！Paper2Code：AI论文自动转代码神器，多智能体框架颠覆科研复现

Cooragent：清华 LeapLab 开源 AI Agent 协作框架，一句话召唤AI军团！

LongPort MCP：证券业首个券商MCP，AI赋能智能投资新时代，散户也能玩转机构级交易

RAGEN：RL训练LLM推理新范式！开源强化学习框架让Agent学会多轮决策

开源8B参数全能扩散模型Flex.2-preview：把线稿变商稿，还能边画边改！

让AI单次生成4万字！WriteHERE：开源AI长文写作框架，单次生成超长文本，小说报告一键搞定！

AI生成视频告别剪辑拼接！MAGI-1：开源自回归视频生成模型，支持一镜到底的长视频生成

全球首款开源通用型AI智能体上线！Suna：自动处理Excel/爬数据/写报告等复杂任务一句话搞定

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！