📣📣📣视觉智能开放平台子社区建立新版块——AI热点日报~
我们汇总了世界各地最具影响力的AI项目、研究成果和创新应用的信息,为读者带来前沿的科技资讯。无论你是科技爱好者、人工智能从业者或者只是对未来科技趋势感兴趣的读者,我们都致力于满足你的需求。通过简明易懂的报道和深入的分析,本系列文章将带你领略未来的畅想,了解人工智能正在如何改变我们的生活和社会。
不容错过的每一期,让我们与科技同行,共同探索AI的无限可能。
🌈热点内容直通车
1. ChatGPT 上线 DALL・E 3 测试版,可根据文字生成高质量图片
OpenAI 推出的 DALL-E 的模型,可以根据用户输入的文字描述生成相应的图片。上个月,OpenAI 宣布 DALL・E 新版本——DALL・E 3,现在其已上线 ChatGPT。
OpenAI 在周一通过官方网站发布了 DALL・E 3 的测试版,让部分用户可以直接通过 ChatGPT 来使用 DALL E-3。用户在 ChatGPT 中选择 GPT-4 选项下的 DALL・E 3。选择好之后,用户就可以输入任意长度的文字描述,从一句话到一段话都可以,来描述他们想要的艺术作品,然后 DALL・E 3 就会在几秒钟内生成图片。
OpenAI 在公布 DALL・E 3 时表示,这个模型可以超越之前的 DALL・E 2 的能力,生成更准确和更细致的图片,并且更好地捕捉文字描述中的细微差别。目前,微软已经免费在 Bing Chat 中提供 DALL・E 3。
2. 消息称 YouTube 正开发 AI 变声工具,可利用“著名音乐人”音色录音
熟悉内情的人士透露称 YouTube 正开发一种由 AI 驱动的工具,创作者可使用一系列“著名音乐人”的声音录制音频。
据消息人士透露,为了达成这一功能,YouTube 已经与唱片公司接洽,希望获得用于训练该工具的歌曲版权。据报道,尽管双方之间的讨论仍在继续,但各大主流唱片公司尚未签署任何协议。对于音乐产业来说,AI 既拥有广阔前景,也能带来重大威胁。
YouTube 上个月推出了基于 AI 的新工具,其中一种就包括由 AI 生成视频(母语以外)的另一种语言配音。报道称,该公司当时曾希望推出这种利用 AI 来“变声”的音乐工具,但因尚未获得版权而终止。
3. 智谱 AI 宣布完成超 25 亿元融资,美团、腾讯、小米等公司参与
智谱 AI 今日发布消息称,北京智谱华章科技有限公司今年已累计获得超 25 亿人民币融资。据介绍,该公司的融资参与方主要包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss 直聘、好未来、红杉、高瓴等多家机构及包括君联资本在内的部分老股东跟投。上述融资将用于基座大模型的进一步研发,更好地支撑行业生态。
公司官网显示,智谱 AI 致力于打造新一代认知智能通用模型,合作研发双语千亿级超大规模预训练模型 GLM-130B,并基于此打造 ChatGLM(chatglm.cn)。此外,智谱 AI 还推出了认知大模型平台 Bigmodel.ai,包括 CodeGeeX 和 CogView 等产品,提供智能 API 服务。
📖新鲜论文早知道
微软报告称 GPT-4 易受“越狱”提示词影响,生成不良内容
微软旗下研究团队近日发表论文,详细研究了大型语言模型 (LLM) 的“可信度”和潜在毒性,特别关注 OpenAI 的 GPT-4 及其前代 GPT-3.5。
研究团队,GPT-4 虽然在标准基准测试中比 GPT-3.5 更加可靠,但容易受到“越狱”提示(绕过模型安全措施)影响。GPT-4 可能会根据这些“越狱”提示,生成有害内容。论文中强调 GPT-4 更容易受到恶意“越狱”系统或用户提示影响,会准确地遵循(误导性)指令,生成不良内容,微软强调这个潜在漏洞不会影响当前面向客户的服务。
🔥开源模型先体验
北大推出“最强编程助手”:代码大模型 CodeShell-7B 开源,性能霸榜
北京大学软件工程国家工程研究中心知识计算实验室联合四川天府银行 AI 实验室,今天正式开源旗下 70 亿参数的代码大模型 CodeShell,号称“同等规模最强代码基座”。
CodeShell-7B 基于 5000 亿 Tokens 进行了冷启动训练,上下文窗口长度为 8192,架构设计上融合了 StarCoder 和 Llama 两者的核心特性。
官方声称,CodeShell 的原始训练数据基于自家爬取的 Github 数据、Stack 和 StarCoder 数据集,以及少量“高质量的中英文数据”,这些预训练数据均经过了“数据判重、数据过滤规则、数据质量模型一系列流水线”。
CodeShell 构建了包含 7 万个词的词表,中文、英文、代码的压缩比分别为 2.83、3.29、3.21,支持中英文和代码的平衡且高效的编解码。
具体性能方面,为了获得最大的分布式训练效率,Codeshell 基于 Megatron-LM,声称“在 Attention 算子优化、数据预处理、数据加载、日志输出、状态监控、分布式训练管理等方面进行了深度定制”,支持 Flash Attention2 加速,训练吞吐量达到了每 GPU 每秒 3400 Token 的业界先进水平。
在代码评估基准 HumanEval 和 MBPP 中,CodeShell 超过了 CodeLlama-7B 和 StarCodeBase-7B,在 humaneval 的其它编程语言评测中,如 JavaScript、Java、C++,CodeShell 依然性能领先。
官方已经在 GitHub 开源了模型、相关配套方案及 IDE 插件,支持商用👉体验地址在此前往。
关注子社区,每周热点抢先看~
更多精彩内容欢迎点击下方链接,了解更多viapi相关信息。