开发者社区阿里云高校学研支持计划文章正文

视觉AI训练营Day1

2020-10-30 314

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 视觉AI训练营Day1

40分钟的科普课，介绍了图像识别、图像生产、分割抠图等等内容。让我印象很深的是视觉增强，终于理解了Google相机和其他相机软件的产生原因。不知道借助这次课程能够做成什么项目。

文章标签：

人工智能

关键词：

AI视觉

AI训练营

视觉AI训练营

游客n3bktacbcoqk2

1808090903196729

12天前

人工智能编解码安全

[译][AI OpenAI-doc] 视觉

学习如何使用 GPT-4 来理解图像。具有视觉功能的 GPT-4 Turbo 允许模型接收图像并回答与之相关的问题。了解图像上传、处理、成本计算、模型限制等详细信息。

1808090903196729

38 0 0

楠竹11

20天前

人工智能编解码安全

揭秘AI幻觉：GPT-4V存在视觉编码漏洞，清华联合NUS提出LLaVA-UHD

【4月更文挑战第14天】清华大学与新加坡国立大学团队针对大型多模态模型（LMMs）在处理高分辨率图像时的局限，提出新模型LLaVA-UHD。该模型通过图像模块化、压缩和空间模式组织策略，有效提升了处理任意比例和高分辨率图像的能力。实验显示，LLaVA-UHD在9个基准测试中超越现有模型，且在TextVQA任务上准确率提升6.4%，同时训练时间更短。然而，模型训练成本高、泛化能力待优化是未来需解决的问题。

楠竹11

30 8 8