【OpenVI—AI热点日报】8月21日

本文涉及的产品
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,图像资源包5000点
简介: AI热点日报八月第13期隆重推出! 我们汇集了最新的AI热点信息、最新论文和观点,为您提供最前沿的AI领域资讯。 (往期链接请在子社区查看官方博文哦~)

📣📣📣视觉智能开放平台子社区建立新版块——AI热点日报~

     我们汇总了世界各地最具影响力的AI项目、研究成果和创新应用的信息,为读者带来前沿的科技资讯。无论你是科技爱好者、人工智能从业者或者只是对未来科技趋势感兴趣的读者,我们都致力于满足你的需求。通过简明易懂的报道和深入的分析,本系列文章将带你领略未来的畅想,了解人工智能正在如何改变我们的生活和社会。

不容错过的每一期,让我们与科技同行,共同探索AI的无限可能。


🌈热点内容直通车

1. 阿里云上线AI视频生成工具Live Portait

     近日,阿里云推出数字人视频生成工具Live Portait。上传一张照片和一段文本或语音,即可生成一段开口说话的数字人视频。该功能可应用于视频直播、聊天机器人、企业营销等场景。目前,该工具已在魔搭社区创空间开放体验。

      此次上线的Live Portait工具由运动模块和生成模块组成,其采用阿里云自研的口型预测算法,生成的口型准确度相比传统方法大幅提高;在训练阶段,增加了姿态的显式控制,无需底板视频也可以生成任意动作的视频,大幅提升数字人说话的真实感。此外,通过眼神主动控制技术,Live Portait可以为眼球增加一些自然运动,使得生成结果在观感上更接近真人效果。在Live Portait上传照片后,用户可选择文本驱动和音频驱动两种方式,文本驱动模式下,该工具提供了普通话、英语、粤语、童声等28种声音。



2. Adobe 开放 Express 工具:基于 AI 的图像 / 视频编辑器

      近日,Adobe 今天发布新闻稿,宣布旗下的图形设计工具 Adobe Express 在经过一段时间的测试之后,目前已经向所有用户开放。 据了解,正式版的Express带来了许多新功能,包括利用Adobe Firefly支持的AI生成功能来生成各种文字效果和图片,并对不同的内容进行修改。此外,正式版的Express还可以合并视频、图片和音乐,轻松完成视频制作。

      Adobe对这款工具的描述是:“借助由Adobe Firefly提供支持的生成式AI,创作出令人惊叹的作品,脱颖而出。借助功能完备的全新Adobe Express,您可以设计传单、抖音视频、简历以及连续短片。更轻松地进行创作,助您实现更大的梦想。”  目前桌面版的Adobe Express已经正式上线,移动版应用将在不久后更新。



3. 字节AI对话产品“豆包”小范围测试

     字节跳动已开始对外测试AI对话产品“豆包”,其提供以AI对话为核心功能的技术服务,接入了利用深度神经网络、强化学习等技术训练的大规模语言模型以及其他模型及服务,模型采用对话格式,可以根据用户输入的指令,通过自动化分析后生成参考信息。目前可通过其官网下载相关APP,并支持抖音登录。豆包APP也就是此前字节内部代号为“Grace”的AI项目。

     8月18日,“豆包”项目组人士回应记者:“‘豆包’是一款聊天机器人产品,还处于早期开发验证阶段,这次上架仍是小范围的邀请制测试。目前测试期的'豆包'还存在较多局限,生成的内容也可能不准确,欢迎测试用户提供反馈意见,帮助我们持续改进产品。”


4. 快手自研的大语言模型“快意”开启内测

     快手自研的大语言模型“快意”(KwaiYii)已开启内测,并为业务团队提供了标准 API 和定制化项目合作方案。据官方介绍,快意大模型(KwaiYii) 是由快手 AI 团队从零到一独立自主研发的一系列大规模语言模型(Large Language Model,LLM),当前包含了多种参数规模的模型,并覆盖了预训练模型(KwaiYii-Base)、对话模型(KwaiYii-Chat)。

     其 13B 规模的系列模型 KwaiYii-13B,预训练模型具备优异的通用技术底座能力,在绝大部分权威的中 / 英文 Benchmark 上取得了同等模型尺寸下的 State-Of-The-Art 效果。对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明 KwaiYii-13B 超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近 ChatGPT(3.5)同等水平。

  在最新的 CMMLU 中文向排名中,快意的 13B 版本 KwaiYii-13B 同时位列 five-shot 和 zero-shot 下的第一名,在人文学科、中国特定主题等方面较强,平均分超 61 分。

项目地址:https://github.com/kwai/KwaiYii


📖新鲜论文早知道

微软最新开源大模型WizardMath,70B数学能力超ChatGPT

     微软最新开源大模型WizardMathAI生成的指令微调羊驼大模型,数学能力超ChatGPT。经过GSM8k数据集测试,WizardMath数学能力直接击败了ChatGPT、Claude Instant 1、PaLM 2-540B等一众大模型——并且是在参数只有700亿,远不及后三者的情况之下。

     WizardMath究竟是如何做到的?我们知道OpenAI的大模型(InstructGPT、GPT-4等)能够取得巨大成功、去执行各种复杂和多样化的任务,一部分原因是使用了真实人类用户生成的开放域指令数据进行了微调。然而,不是谁都能像这家公司一样获得这样的指令数据集。一是因为整个注释过程极其昂贵且耗时,二是人工难以创建出足够比例的高难度指令。因此,开发出一种成本相对较低的、大规模开放域指令自动生产方法,成为当下指令调优语言模型的关键。在此,WizardMath的作者将他们的方法命名为Evol Instruction。它是一种利用AI来代替人类自动生成涵盖各种难度级别开放域指令的新方法。

     具体而言,Evol Instruction分为指令进化器和指令消除器。其中指令进化器可通过深度进化(蓝线)或广度进化(红线)两种路径,将简单指令升级为更复杂的指令或创建一条全新指令。具体执行哪一条?随机选择就好。其中,深度进化的具体“进化法”,则是通过五种类型的操作来完成,包括:添加约束(add constraints)、深化(deepening)、具体化(concretizing)、增加推理步骤(increase reasoning steps)和使输入复杂化(complicate input)。由于所有指令均由AI完成,有时难免会出现错误。因此,指令消除器就是用于过滤失败指令的。通过重复这一生成过程,最终我们就能得到足够多的指令,然后将它们合并并随机打乱,组成一个难度级别均匀分布的指令集,就可以对基础大模型进行微调了。

     在此,作者选择Alpaca的训练数据(仅由175条人工创建的种子指令生成)作为初始数据集,然后使用ChatGPT的API执行了四个进化周期,最终获得25万条指令。为了与Vicuna的70k真实用户数据(ShareGPT)进行公平比较,作者从这25万条数据中抽取了等量的样本,训练LLaMA 7B模型,最终得到WizardLM,结果WizardLM的性能明显优于Vicuna。(Alpaca:斯坦福在LLaMa-7B基础上微调出来的模型;Vicuna,UC伯克利在LLaMa-13B的基础上微调得来的)此外,在更为复杂的测试指令下,人类更喜欢WizardLM的输出,而非ChatGPT,这表明该方法可以显著提高LLM处理复杂指令的能力。基于此,作者又利用Evol Instruction生成了很多数学领域相关的指令,然后微调羊驼大模型,得到了WizardMath。以此类推,作者还在羊驼之上得到了专攻代码能力的WizardCoder,效果超越Claude和Bard。

项目主页: https://github.com/nlpxucan/WizardLM/tree/main/WizardMath 

论文地址:https://arxiv.org/abs/2304.12244 (WizardLM)https://arxiv.org/abs/2306.08568 (WizardCoder)


🔥开源模型先体验

Doctor GPT:通过医学执照考试的大模型

     Doctor GPT:基于Llama2 70亿参数的大型语言模型的一个微调版本,经过医学对话数据集进行微调,并通过强化学习进一步改进。通过了美国医学执照考试。它离线工作,是跨平台的,并且您的健康数据保持私密。

 

GitHub: https://github.com/llSourcell/DoctorGPT




关注子社区,每周热点抢先看~

更多精彩内容欢迎点击下方链接,了解更多viapi相关信息。

视觉智能开放平台直通车

相关文章
|
7月前
|
人工智能 边缘计算 机器人
AI日报:谷歌的“双子时代”:将第二代人工智能嵌入其所做的一切
AI日报:谷歌的“双子时代”:将第二代人工智能嵌入其所做的一切
|
7月前
|
人工智能 安全 芯片
AI日报:扎克伯格瞄准AGI通用人工智能
AI日报:扎克伯格瞄准AGI通用人工智能
|
7月前
|
数据采集 人工智能 机器人
AI日报:欧盟人工智能法案通过后行业面临合规障碍
AI日报:欧盟人工智能法案通过后行业面临合规障碍
AI日报:欧盟人工智能法案通过后行业面临合规障碍
|
7月前
|
人工智能 安全 数据库
AI日报:这种病毒从生成式AI工具中窃取您的数据
AI日报:这种病毒从生成式AI工具中窃取您的数据
AI日报:这种病毒从生成式AI工具中窃取您的数据
|
7月前
|
机器学习/深度学习 存储 人工智能
AI日报:戴尔首席执行官:我们可能在10年内需要100倍以上的数据中心
AI日报:戴尔首席执行官:我们可能在10年内需要100倍以上的数据中心
|
7月前
|
传感器 人工智能 安全
AI日报:一个新的“科技超级周期”正在出现
AI日报:一个新的“科技超级周期”正在出现
|
7月前
|
人工智能 自然语言处理 搜索推荐
AI日报:Anthropic推出商业友好型Claude 3人工智能模型
AI日报:Anthropic推出商业友好型Claude 3人工智能模型
|
7月前
|
人工智能 算法 机器人
AI日报:埃隆·马斯克起诉OpenAI
AI日报:埃隆·马斯克起诉OpenAI
|
7月前
|
机器学习/深度学习 人工智能 算法
AI日报:人工智能使用和评估的关键任务
AI日报:人工智能使用和评估的关键任务
|
7月前
|
人工智能 自然语言处理 数据可视化
AI日报:2024年世代人工智能将如何改变业务
AI日报:2024年世代人工智能将如何改变业务
AI日报:2024年世代人工智能将如何改变业务

热门文章

最新文章

下一篇
DataWorks