【OpenVI—AI热点日报】10月12日

本文涉及的产品
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,分割抠图1万点
简介: AI热点日报隆重推出! 我们汇集了最新的AI热点信息、最新论文和观点,为您提供最前沿的AI领域资讯。 (往期链接请在子社区查看官方博文哦~)

📣📣📣视觉智能开放平台子社区建立新版块——AI热点日报~

我们汇总了世界各地最具影响力的AI项目、研究成果和创新应用的信息,为读者带来前沿的科技资讯。无论你是科技爱好者、人工智能从业者或者只是对未来科技趋势感兴趣的读者,我们都致力于满足你的需求。通过简明易懂的报道和深入的分析,本系列文章将带你领略未来的畅想,了解人工智能正在如何改变我们的生活和社会。

不容错过的每一期,让我们与科技同行,共同探索AI的无限可能。


🌈热点内容直通车

1. AI应用-EPIK登上应用商店榜首,用户可以为自己生成怀旧的、90年代风格的 “年鉴”照片

     一款应用名为EPIK,最近一周已飙升至App Store应用商店的榜首,用户可以为自己生成怀旧的、90年代风格的 “年鉴”照片,作为其中众多模板之一。

     与其他最近流行的AI应用类似,EPIK的工作原理是,用户首先上传一系列自拍照,然后EPIK使用这些自拍照来生成用户不同姿势、不同长相和发型的怀旧年鉴照片。该公司还开发了AI档案应用Snow。最近几周,随着来自世界各地的网红开始在社交媒体上分享他们的AI生成照片,EPIK在App Store上获得了关注。在美国App Store,EPIK目前排名第一,尽管它在Google Play的受欢迎程度不高,排名第37。

     要使用EPIK的年鉴功能,用户需要上传8-12张自拍照,然后用于创建AI照片。虽然应用程序本身是免费下载的,但用户必须为AI输出付费。他们也可以选择付费来更快地生成照片——标准生成(3.99美元)的等待时间长达24小时,而快速生成(5.99美元)的等待时间不到两小时。

2. 微软 AI 客服专利获批:用自然语言处理客户遇到的问题

     根据国外科技媒体 WinBuzzer 报道,微软于本月获批了一项 AI 客服专利,通过自然语言可以有效处理用户问题。

     专利指出现有客服系统基本都接入了客服机器人,但它们只能处理常规的任务需求,根据关键词或者相关预设内容提供相关的响应,不像 Bing Chat、Google Bard 或 ChatGPT 等工具那么复杂。微软在 AI 客服专利中引入了自然语言处理 (NLP) 技术,通过相关数据培训,系统性地生成相关回答内容。收到客户支持请求后,系统会将问题转换为一种或多种文本编码表示形式,转换为系统可理解的格式。系统会匹配格式和相关单元,同时提供各种操作流程的编码作为辅助格式。AI 客服系统在确认最佳匹配之后,结合多种解决问题方案,用自然语言回答可行的解决方案或建议,引导客户解决遇到的问题。

3. Docker 推出生成式 AI 堆栈和 Docker AI

     Docker 公司近日在洛杉矶举办了 Dockercon 23 大会,推出了全新的 Docker GenAI 堆栈,让 Docker 容器技术无缝集成 Neo4j 图形数据库、LangChain 模型链接技术以及用于执行大型语言模型的 Ollama。

     Docker GenAI 堆栈主要简化生成式 AI 应用程序的开发,通过引入 Neo4j 图形数据库简化矢量数据库等流程,并通过 Ollama 平台提供的功能,可以本地运行 Llama 2 等大语言模型。整套 Docker GenAI 堆栈免费提供,并且可以在开发人员的系统上本地运行。Docker 旨在随着应用程序的进展向企业提供可用的部署和商业支持选项。与市场上其他丰富的生成式 AI 开发工具不同,Docker 正在推出其专门的 GenAI 工具,称为 Docker AI。Docker AI 基于从数百万个 Dockerfile、撰写文件和错误日志中积累的 Docker 专有数据进行训练,提供了能够直接在开发人员工作流程中纠正错误的资源。该工具旨在使故障排除和修复问题更易于管理,从而改善开发人员的体验。

📖新鲜论文早知道

微软|多模态基础模型:从专家到通用助手

动机:旨在对多模态基础模型进行综合调查,重点关注从专家模型向通用助手的转变,以展示视觉和视觉语言能力的多模态基础模型的分类和演变。为研究人员和专业人士提供了基础知识和最新进展的重要参考。

方法:论文通过分类两类核心主题,包括已建立的研究领域和开放性研究领域,来介绍多模态基础模型的学习方法和训练技术。

本文对现代多模态基础模型进行了全面综述,涵盖了视觉理解、视觉生成、统一视觉模型、与大型语言模型(LLM)的训练/串联等方面。

它倡导从开发特定用途的多模态模型,向能遵循人类意图完成视觉任务的通用助手的转变。

在视觉理解方面,它回顾了有监督学习、图像文本对比学习(CLIP)、仅图像自监督表示学习,以及它们的组合。

在视觉生成方面,它着眼于通过空间/文本控制、更好地遵循文本提示、概念自定义等方面改进人类意图匹配。

在构建通用助手方面,讨论了不使用LLM的统一视觉模型、使用LLM训练视觉模型、以及将视觉模型串联到LLM。

提供了从专业模型向通用视觉助手发展的多模态基础模型趋势观点。

优势:论文全面综合了多模态基础模型的研究进展,对于想要了解多模态基础模型基础知识和最新进展的研究人员、研究生和专业人士具有重要参考价值。

https://arxiv.org/abs/2309.10020

🎤观点方向多了解

麦肯锡倪以理:AIGC正面影响可达7.9万亿美元,高科技、零售、银行三个行业位列前三

麦肯锡中国区主席、全球资深董事合伙人倪以理在2023INCLUSION·外滩大会上表示,生成式AI对全球经济的正面影响最高可达7.9万亿美元,但是整体广泛的AI可能达到25万亿美元。生成式AI将对各个行业产生影响,其中对高科技、零售、银行的影响位列前三。



关注子社区,每周热点抢先看~

更多精彩内容欢迎点击下方链接,了解更多viapi相关信息。

视觉智能开放平台直通车

相关文章
|
6月前
|
人工智能 边缘计算 机器人
AI日报:谷歌的“双子时代”:将第二代人工智能嵌入其所做的一切
AI日报:谷歌的“双子时代”:将第二代人工智能嵌入其所做的一切
|
6月前
|
人工智能 安全 芯片
AI日报:扎克伯格瞄准AGI通用人工智能
AI日报:扎克伯格瞄准AGI通用人工智能
|
6月前
|
数据采集 人工智能 机器人
AI日报:欧盟人工智能法案通过后行业面临合规障碍
AI日报:欧盟人工智能法案通过后行业面临合规障碍
AI日报:欧盟人工智能法案通过后行业面临合规障碍
|
6月前
|
人工智能 安全 数据库
AI日报:这种病毒从生成式AI工具中窃取您的数据
AI日报:这种病毒从生成式AI工具中窃取您的数据
AI日报:这种病毒从生成式AI工具中窃取您的数据
|
6月前
|
机器学习/深度学习 存储 人工智能
AI日报:戴尔首席执行官:我们可能在10年内需要100倍以上的数据中心
AI日报:戴尔首席执行官:我们可能在10年内需要100倍以上的数据中心
|
6月前
|
传感器 人工智能 安全
AI日报:一个新的“科技超级周期”正在出现
AI日报:一个新的“科技超级周期”正在出现
|
6月前
|
人工智能 自然语言处理 搜索推荐
AI日报:Anthropic推出商业友好型Claude 3人工智能模型
AI日报:Anthropic推出商业友好型Claude 3人工智能模型
|
6月前
|
人工智能 算法 机器人
AI日报:埃隆·马斯克起诉OpenAI
AI日报:埃隆·马斯克起诉OpenAI
|
6月前
|
机器学习/深度学习 人工智能 算法
AI日报:人工智能使用和评估的关键任务
AI日报:人工智能使用和评估的关键任务
|
6月前
|
人工智能 自然语言处理 数据可视化
AI日报:2024年世代人工智能将如何改变业务
AI日报:2024年世代人工智能将如何改变业务
AI日报:2024年世代人工智能将如何改变业务

热门文章

最新文章