📣📣📣视觉智能开放平台子社区建立新版块——AI热点日报~
我们汇总了世界各地最具影响力的AI项目、研究成果和创新应用的信息,为读者带来前沿的科技资讯。无论你是科技爱好者、人工智能从业者或者只是对未来科技趋势感兴趣的读者,我们都致力于满足你的需求。通过简明易懂的报道和深入的分析,本系列文章将带你领略未来的畅想,了解人工智能正在如何改变我们的生活和社会。
不容错过的每一期,让我们与科技同行,共同探索AI的无限可能。
🌈热点内容直通车
1. 360 智脑大模型面向公众开放:千亿参数规模,十大核心能力
360 公司官方今日宣布,360 智脑大模型全面接入 360 全家桶,正式面向公众开放。用户可通过 ai.360.com 一站式登录体验 360 智脑 App、360 搜索等大模型服务。
360 智脑拥有千亿参数规模,预训练超万亿 tokens,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能,能够覆盖大模型应用的所有场景。基于 360 智脑的企业级垂直大模型,已在金融、医疗、教育等近 20 个行业陆续落地。与其他大模型相比,360智脑拥有三大创新:
- 智能助手可一键对浏览网页进行总结摘要、翻译、改写,结合图形化效率工具。
- 智能优化用户输入 prompt,识别用户意图。
- 多轮问答生成和引导的追问形式。
2. 亚马逊升级 Alexa 语音助手:整合生成式 AI、对话更自然
亚马逊在今天举办的活动中,预告了整合生成式 AI 的全新 Alexa,此外可以在不再次使用唤醒词“Alexa”的情况下继续对话。
新版语音助手在大语言模型的加持下,和用户的交流体验更加自然,让 Alexa 的对话感觉更像与人类交谈。例如用户说:“Alexa,我很冷”,Alexa 就知道需要提高室内温度。亚马逊通过整合生成式 AI,增强 Alexa 的智能水平,更贴心地满足用户需求。
亚马逊还推出了全新的“speech-to-speech”引擎,能够感知用户的情绪和语调,并允许 Alexa 根据用户情绪做出不同的回应。例如,如果客户要求更新他们最喜欢的运动队,并且他们赢得了最新的比赛,Alexa 将能够以愉快的声音回应。然而,如果他们输了,Alexa 听起来会更有同情心。
3. TikTok 要求创作者使用人工智能必须披露,否则内容可能会被删
TikTok 正在为创作者引入一种新方式来标记使用人工智能工具制作的内容。该功能于上个月首次被用户发现,今天 TikTok 在一篇博客文章中正式宣布。
TikTok 的用户指南已经要求创作者在使用人工智能工具制作内容时进行披露。新的功能会提示创作者开启标记功能,让观众知道哪些视频和照片是使用人工智能软件创建的。人工智能标签会出现在视频角落的用户名下方,提示还包括一个提醒,如果没有披露使用了人工智能工具,内容可能会被删除。该公司还表示,本周将开始测试一种自动标记内容为人工智能生成的方法。
📖新鲜论文早知道
NLP七十年!斯坦福教授Manning长文梳理:十年后的基础模型能成AGI吗?
近日斯坦福大学大学教授Christopher D. Manning在Daedalus期刊上发表了一篇关于「人类语言理解和推理」的论文,主要梳理自然语言处理的发展历史,并分析了基础模型的未来发展前景。
论文作者Christopher Manning是斯坦福大学计算机与语言学教授,也是将深度学习应用于自然语言处理领域的领军者,研究方向专注于利用机器学习方法处理计算语言学问题,以使计算机能够智能处理、理解并生成人类语言。Manning教授是ACM Fellow,AAAI Fellow 和ACL Fellow,他的多部著作,如《统计自然语言处理基础》、《信息检索导论》等都成为了经典教材,其课程斯坦福CS224n《深度学习自然语言处理》更是无数NLPer的入门必看。
除了BERT和GPT-3这样早期的基础模型外,还可以将语言模型与知识图神经网络、结构化数据连接起来,或是获取其他感官数据,以实现多模态学习,如DALL-E模型,在成对的图像、文本的语料库进行自监督学习后,可以通过生成相应的图片来表达新文本的含义。我们目前还处于基础模型研发的早期,但未来大多数信息处理和分析任务,甚至像机器人控制这样的任务,都可以由相对较少的基础模型来处理。虽然大型基础模型的训练是昂贵且耗时的,但训练完成后,使其适应于不同的任务还是相当容易的,可以直接使用自然语言来调整模型的输出。但这种方式也存在风险:
- 有能力训练基础模型的机构享受的权利和影响力可能会过大;
- 大量终端用户可能会遭受模型训练过程中的偏差影响;
- 由于模型及其训练数据非常大,所以很难判断在特定环境中使用模型是否安全。
虽然这些模型的最终只能模糊地理解世界,缺乏人类水平的仔细逻辑或因果推理能力,但基础模型的广泛有效性也意味着可以应用的场景非常多,下一个十年内或许可以发展为真正的通用人工智能。
论文链接👉https://direct.mit.edu/daed/article/151/2/127/110621/Human-Language-Understanding-amp-Reasoning
🎤观点方向多了解
OpenAI科学家Jason Wei专访:思维链灵感来源于冥想
对于当时的许多华人家庭来说,美国梦就是供孩子去读常春藤盟校,在华尔街谋求一份体面的工作,赚很多钱。而我成为了当时朋友圈中唯一一个从事人工智能研究的人。早期的化学研究教会了我何为研究的本质,以及如何提出严格的假设并进行测试。在2019年我创建了第一个对肺癌分类的神经网络。这也是我发表的一篇论文,在论文被接收前被拒了六次。
我对冥想很感兴趣。冥想的作用是观测到你头脑中出现的所有想法,我称之为思想流(stream of thought),连续不断流动的思想。很多观点文章都认为,语言模型可以有思想流,也暗示着意识的存在。我想到可以参考人类如何解决数学问题的过程,在给出问题的答案之前,人类有一个内在的思考流程,于是我从数学问题出发,尝试改变prompt,发现了语言模型也可以具有内在推理能力(要求模型在回答之前进行一系列思考过程,也就是思维链)。起初效果并不好,和模型大小有关,后来更加强大的PalM出现了,模型越大CoT可以做得更好。后来我将这种思维链的技巧嫁接在解决其他类型的问题上,也表现得很好。技术上被称为思维链的原因是,思想流更像是杂乱无章地,随机在头脑中涌现的任何东西。而思维链则是一个更有逻辑或组织性质的思维过程。
冥想的灵感不是宗教的原因(Jason表示自己不信教),但受到了Sam Harris所写的《Waking up— A Guide to Spirituality Without Religion》一书的启发(《Waking up》一书作者为美国无神论者、公共知识分子、脑神经科学家Sam Harris,这本书是写给美国人口20%的”spiritual but not religious”,即相信灵性的存在,但是没有宗教信仰的人。该书强调如何通过冥想消除人类对于自我的幻象,试图用脑科学研究、思想实验来证明:1)人的思维有更高维度的存在,我们认为的自我、喜怒哀乐其实都是虚幻的,基本就是佛教的世界观 2)人可以籍由冥想练习来达到空性的体验)
《觉醒:通往灵性的非宗教指南》,Sam Harris著,阅读链接:https://www.amazon.com/Waking-Up-Spirituality-Without-Religion/dp/1451636024
从谷歌到OpenAI,最大的变化是每个人从做自己的研究、选择项目转变为在具有核心目标的更大团队中工作。OpenAI 的员工工作非常努力,所有人都对通用人工智能 (AGI) 充满热情。大部分加入OpenAI的人都是想参与研究一些更庞大的事项,成为GPT这样项目的一员。我不是非常擅长平衡工作和生活,也不认为每个人都应该渴望做到平衡。事实是,没有哪个超级成功的人是不努力工作的。我的策略是每周休息一天,其他日子都工作,到晚上10 点或 11 点左右。确保睡眠充足,且每周至少锻炼3次。
关于推广宣传,很多研究者做得还远远不够。贝尔实验室著名数学家Richard Hamming的建议是,应该花与实际工作(做实验写论文)一样多的时间来做宣传。(Richard Hamming原话曾经这样说,许多原本优秀的工作因为糟糕的宣传而石沉大海,后来又被其他人重新发现。很多时候,重要工作的发现者懒得把研究结果清楚地表达出来,导致工作的社会价值大打折扣。)
🔥开源模型先体验
腾讯开源 StableDiffusion 插件 LightDiffusionFlow,一键保存所有工作流数据
腾讯日前推出了一款基于 AI 绘画开源平台 StableDiffusion webUI(以下简称 SD)的开源插件 LightDiffusionFlow,目前已经上线 GitHub。该插件的 4 个主要功能:
- 保存与复现工作流:一键保存或复现 SD 绘画工作流,包括模型、提示词、垫图和其他第三方插件的参数设置。
- 支持读取 PNG Info:兼容读取图片内置的 PNG Info,并自动还原到 UI 界面上,并且支持解析和还原 ControlNet 设置。
- 自动搜索模型:导入 Flow 文件时,会自动在 Civitai 搜索相关模型,匹配对应模型并提供下载链接。
- 支持第三方插件:理论上支持保存所有第三方插件的参数。
关注子社区,每周热点抢先看~
更多精彩内容欢迎点击下方链接,了解更多viapi相关信息。