📣📣📣视觉智能开放平台子社区建立新版块——AI热点日报~
我们汇总了世界各地最具影响力的AI项目、研究成果和创新应用的信息,为读者带来前沿的科技资讯。无论你是科技爱好者、人工智能从业者或者只是对未来科技趋势感兴趣的读者,我们都致力于满足你的需求。通过简明易懂的报道和深入的分析,本系列文章将带你领略未来的畅想,了解人工智能正在如何改变我们的生活和社会。
不容错过的每一期,让我们与科技同行,共同探索AI的无限可能。
🌈热点内容直通车
1. 淘宝问问 AI 助手测试版上线:无需申请即可体验,具有导购功能
淘宝 AI 大模型“淘宝问问”现已上线测试,用户将 App 升级到最新版(苹果手机更新到 iOS14 以上系统),无需申请即可体验。
据淘宝官方介绍,淘宝问问是淘宝 App 在原搜索功能上对电商搜索导购方式进行迭代的创新尝试,旨在结合用户输入,通过深度合成算法为用户提供更符合消费习惯的商品和内容。用户在淘宝 App 搜索框输入“淘宝问问”即可跳转到相关页面,进入该页面之后在搜索框内输入产品名称,即可看到相关产品的视频和文字介绍。此外,推荐产品的购买链接也会出现在文字介绍之下。
2. 英国公布 AI 监管原则:开发者要为输出内容负责
据报道,英国反垄断监管机构“竞争与市场管理局”(CMA)今日提出了管理 AI 模式的新标准,涵盖问责、访问和透明度等事宜,以促进这项技术的健康发展。
英国 CMA 很早就开始研究 ChatGPT 等生成式人工智能应用的影响。CMA 称,这项技术确实有潜力提高生产率,让数百万人的日常任务变得更容易。但这并不意味着,这项技术所带来的后果一定就是积极的。
CMA 此次公布的监管原则共包括七个方面内容,分别是问责、访问、多样性、选择、灵活性、公平交易和透明度。问责方面,要求开发人员和部署人员对输出内容负责;访问方面,要求不得进行不必要的限制;选择方面,要为企业提供足够的选择,以便他们可以决定如何使用 AI 模型;公平交易方面,要求不得从事反竞争行为。在接下来的几个月里,CMA 将与英国和国际上广泛的利益相关者开展一项重要的参与计划,进一步发展这些原则,共同支持 AI 在这些关键市场的积极发展,以促进有效竞争和消费者保护,造福于人民、企业和经济
如果该提议被通过,则受版权保护的艺术和文化内容就将轻易沦落为生成式人工智能的培训资料。为此,一群英国国会议员上个月呼吁,要求政府对人工智能系统执行更明确和更严格的规则,以免一些版权内容被非法利用。
3. 新加坡华人团队开源全能「大一统」多模态大模型
继各类输入端多模态大语言模型之后,新加坡国立大学华人团队近期开源了一种支持任意模态输入和任意模态输出的「大一统」多模态大模型,火爆AI社区。
继ChatGPT引爆2023年的AI潮后,各类开源LLM也陆续问世。
紧接着,为了更好地模拟世界,研究人员又将纯语言的大模型,扩展到了处理语言之外的「多模态大语言模型」——
诸如支持图像类的MiniGPT-4、BLIP-2、Flamingo、InstructBLIP等,支持视频类的Video-LLaMA, PandaGPT等,以及支持声音类的SpeechGPT等等。
然而目前的多模态LLM,距离真正人类级别的AGI,总感觉少了点「那味儿」。
「大一统」通用多模态大模型来了
正当大家都在期待OpenAI未来要发布的GPT-5是否实现了任意模态大一统功能时,来自于新加坡国立大学NExT++实验室的华人团队出手了!
就在最近,团队正式开源了一款「大一统」通用多模态大模型——NExT-GPT,可以支持任意模态输入到任意模态输出。
目前,NExT-GPT的代码已经开源,并且还上线了Demo系统。
项目地址:https://next-gpt.github.io
代码地址:https://github.com/NExT-GPT/NExT-GPT
论文地址:https://arxiv.org/abs/2309.05519
📖新鲜论文早知道
Meta推出OCR神器,PDF、数学公式都能转(学术必备)
Meta AI 推出了一个 OCR 神器Nougat。Nougat 基于 Transformer 模型构建而成,可以轻松的将 PDF 文档转换为 MultiMarkdown,扫描版的 PDF 也能转换,让人头疼的数学公式也不在话下。
论文链接:arxiv.org/pdf/2308.13418v1.pdf
🔥开源模型先体验
复旦大学发布中文医疗健康个人助手,开源47万微调数据DISC-MedLLM
随着远程医疗的兴起,在线问诊、咨询越发成为患者寻求便捷高效的医疗支持的首选项。近来大语言模型(LLM)展示出强大的自然语言交互能力,为健康医疗助手走进人们的生活带来了希望。医疗健康咨询场景通常较为复杂,个人助手需要有丰富的医学知识,具备通过多个轮次对话了解病人意图,并给出专业、详实回复的能力。通用语言模型在面对医疗健康咨询时,往往因为缺乏医疗知识,出现避而不谈或者答非所问的情况;同时,倾向于针对当前轮次问题完成咨询,缺少令人满意的多轮追问能力。除此之外,当前高质量的中文医学数据集也十分难得,这为训练强大的医疗领域语言模型构成了挑战。
复旦大学数据智能与社会计算实验室(FudanDISC)发布中文医疗健康个人助手——DISC-MedLLM。在单轮问答和多轮对话的医疗健康咨询评测中,模型的表现相比现有医学对话大模型展现出明显优势。课题组同时公开了包含47万高质量的监督微调(SFT)数据集——DISC-Med-SFT,模型参数和技术报告也一并开源。
主页地址:https://med.fudan-disc.com
Github地址:https://github.com/FudanDISC/DISC-MedLLM
技术报告:https://arxiv.org/abs/2308.14346
关注子社区,每周热点抢先看~
更多精彩内容欢迎点击下方链接,了解更多viapi相关信息。