【OpenVI—AI热点日报】10月9日

2023-10-09 394

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： AI热点日报隆重推出！我们汇集了最新的AI热点信息、最新论文和观点，为您提供最前沿的AI领域资讯。（往期链接请在子社区查看官方博文哦~）

📣📣📣视觉智能开放平台子社区建立新版块——AI热点日报～

我们汇总了世界各地最具影响力的AI项目、研究成果和创新应用的信息，为读者带来前沿的科技资讯。无论你是科技爱好者、人工智能从业者或者只是对未来科技趋势感兴趣的读者，我们都致力于满足你的需求。通过简明易懂的报道和深入的分析，本系列文章将带你领略未来的畅想，了解人工智能正在如何改变我们的生活和社会。

不容错过的每一期，让我们与科技同行，共同探索AI的无限可能。

🌈热点内容直通车

1. 微软推Win11新功能：AI智能助手

最近，微软推出了一个名为Windows Copilot的新功能，这是一款基于人工智能的智能助手，能够与Windows的各种应用和功能进行交互，包括Microsoft Office、画图、照片和Windows设置等。

Copilot是Bing Chat的一部分，由ChatGPT和微软自己开发的大型语言模型（LLMs）驱动。然而，目前仅限于美国（和北美）、英国以及部分亚洲和南美的用户可以使用。原因是由于欧洲地区的隐私保护法规，Copilot暂时无法在欧洲提供服务，但微软承诺将扩展Copilot的支持范围。值得注意的是，Copilot已经集成在所有版本的Windows 11 Moment 4更新中。如果用户所在地区的 Copilot暂时无法提供支持，则用户可能无法在任务栏或设置中看到该功能。 Copilot实际上运行在Windows 11上，使用Bing Chat体验并不理想，也不支持更深入的Windows集成或第三方应用和插件的帮助。微软表示，这款人工智能工具最终将变得更加完善。

2. 日本首相将公布生成式 AI 监管规则，旨在打击虚假信息

据《读卖新闻》报道，日本首相岸田文雄将于明日在京都公布生成式 AI 的使用和监管规则，目前演讲稿已经确定。

据介绍，这项规则旨在打击 AI 生成的虚假信息，确保用户能够辨别音频或视频是否由 AI 生成。此外，开发者应当确保 AI 的透明度并披露有关风险信息，预计将包括“AI 水印”等选项。岸田文雄预计认为，生成式 AI 产生复杂图像和信息的能力，存在着混淆公众、威胁经济乃至造成社会混乱的风险。为了应对生成式 AI 带来的风险，日本计划首先推出针对开发者的措施，随后在今年年底制定包括针对用户的生成式 AI“国际指导方针”。

此前，日本警察厅决定从 9 月 29 日开始，首次利用 AI 技术监测社交平台上可能与犯罪有关的有害帖子，并要求删除。而在今年 5 月 11 日，日本政府首相官邸召开了探讨 AI 所要遵守的应用准则等方面的首届 AI 战略会议会议将探讨教育机构、行政和企业使用 AI 时的活用方式以及监管机制。

3. ChatGPT现在可以看、听、说了

用户现在可以与ChatGPT进行自然的来回语音对话，并显示图像以接收相关响应。

1）语音功能允许实时语音聊天。用户可以从5种不同的声音中进行选择，并通过对话提出后续问题。文本到语音转换由一个模型提供支持，该模型可以在几秒钟内从文本生成类似人类的声音。OpenAI与voice actors合作创建了五个语音选项，但尚未提供创建自定义语音的选项。

2）图像功能允许用户显示ChatGPT单个或多个图像，以获得帮助解释它们。它可以帮助日常任务，如从冰箱照片或图表分析工作的膳食计划。在移动设备上，绘图工具会聚焦图像。图像理解使用多模式GPT-3.5和GPT-4模型将语言技能应用于不同的图像类型，如照片，屏幕截图和文本 + 图像文档。

📖新鲜论文早知道

一拖一拽，玫瑰复活了！谷歌：生成图像动力学，万物皆有灵

谷歌研究人员将研究范围限定在，具有自然摆动动态的真实世界场景，如随风飘动的树木和花朵，因此选择傅立叶级数作为基函数。然后，使用扩散模型来预测「神经随机运动纹理」，模型每次只生成一个频率的系数，但会在不同频段之间协调这些预测。由此产生的频率空间纹理，可以转化为密集的长距离像素运动轨迹，可用于合成未来帧，将静态图像转化为逼真的动画。

论文地址：generative-dynamics.github.io/static/pdfs/GenerativeImageDynamics.pdf

🎤观点方向多了解

斯坦福大学医学院院长Lloyd Minor：在抗生素之后，人工智能是医学领域最激动人心的突破

斯坦福大学医学院院长Lloyd Minor去年开始玩人工智能驱动的聊天机器人。聊天机器人能够在短时间内吐出研究需要花费几个小时才能完成研究的问题的答案，Lloyd Minor察觉，神经网络和生成性人工智能可以在大量数据中快速发现难以识别的模式，可以彻底改变医生的培训方式、生物医学研究进行方式和医疗保健的提供方式。

博士斯坦福大学医学院院长Lloyd Minor认为，现在是进入医学领域的最佳时机。

他与斯坦福大学以人为本的人工智能研究所联合主任Fei-Fei Li合作，发起了一项名为“Responsible AI for Safe and Equitable Health”的倡议，旨在作为关键研究的存储库，聚集专家来讨论人工智能，并解决其应用中的道德问题。

Minor与《华尔街日报》谈论了他期望人工智能如何改变医学。

在生物医学科学中，生成人工智能具有显著提高科学准确性的可能性和概率。它将帮助我们从临床试验中获得相同的质量和数据，但可能更集中的试验不一定有今天一些临床试验必须做的数以万计的参与者。它将帮助我们安全地将新疗法纳入医学实践。作为教育工作者，我们要做的是决定学生在积极的记忆中需要哪些基础知识才能成为优秀的从业者。这可能会比今天小得多，因为更广泛的知识将很容易获得。
第一组非常令人高兴和肯定的目标将是，如果美国农村执业的医生能够像学术医疗中心的医生一样获得分析信息和诊断信息。例如，美国农村的一名医生看到一个皮肤生长的病人，他们用智能手机拍照，并立即分析可能的诊断以及这代表恶性肿瘤的可能性。医生立即知道这是否是我需要担心的事情，以及我是否需要鼓励这位患者开车三个小时去转诊中心。
现在是进入医学领域的最佳时机。今天开始学习医学的年轻人将站在前排，并且非常投入到最激进的领域，我希望自引入抗生素以来，健康发生最积极的转变。今天进入医学界的人一生中将发生的变化将是无与伦比的。现在我们必须确保这些都是好的改变。

🔥开源模型先体验

Stability发布生成式音频模型Stable Audio

Stable Audio：Stability最新发布的生成式音频模型。

可用于商业用途的高品质音乐(44.1 kHz)，该模型使用类似于Stable Diffusion的潜扩散，并在 800,000 多个音轨和音效上进行了训练。《Stable Audio - Generative AI for music & sound fx》

https://www.stableaudio.com

关注子社区，每周热点抢先看~

更多精彩内容欢迎点击下方链接，了解更多viapi相关信息。

视觉智能开放平台直通车

【OpenVI—AI热点日报】10月9日

🌈热点内容直通车

1. 微软推Win11新功能：AI智能助手

2. 日本首相将公布生成式 AI 监管规则，旨在打击虚假信息

3. ChatGPT现在可以看、听、说了

📖新鲜论文早知道

一拖一拽，玫瑰复活了！谷歌：生成图像动力学，万物皆有灵

🎤观点方向多了解

斯坦福大学医学院院长Lloyd Minor：在抗生素之后，人工智能是医学领域最激动人心的突破

🔥开源模型先体验

Stability发布生成式音频模型Stable Audio

视觉智能

热门文章

最新文章

相关课程

相关电子书

相关实验场景