LLM应用实战:当KBQA集成LLM
项目是关于一个博物馆知识图谱,上层做KBQA应用。实现要求是将传统KBQA中的部分模块,如NLU、指代消解、实体对齐等任务,完全由LLM实现,本qiang~针对该任务还是灰常感兴趣的,遂开展了项目研发工作
GPT-4被证实具有人类心智登Nature!AI比人类更好察觉讽刺和暗示
【6月更文挑战第5天】Nature发表的论文显示,GPT-4在心智理论任务中表现出色,特别是在识别讽刺上超越了人类。然而,在理解失礼行为和相关社会意识方面,GPT-4逊于人类,而LLaMA2-Chat在此类情境中表现更佳。尽管如此,GPT-4在失礼行为可能性测试中展现出高超的理解力。该研究强调了AI在模拟人类心理状态方面的进步与局限性。[链接](https://www.nature.com/articles/s41562-024-01882-z)
会议之眼报道:助力学术成就!第六版CCF中国计算机学会推荐国际学术会议和期刊目录!
会议之眼快报:CCF中国计算机学会是全国性、学术性、非营利的学术团体,由从事计算机及相关科学技术领域的个人和单位自愿组成。作为独立社团法人,CCF是中国科学技术协会的成员之一,是全国一级学会! CCF的前身是1962年成立的中国电子学会计算机专业委员会。在文革期间的1978年1月,学会恢复了活动,并更名为中国电子学会计算机学会。1985年3月,经过国家体改委批准,正式成立了中国计算机学会。截至2022年4月,CCF下设14个工作委员会、39个专业委员会、4个“计算+行业”分会以及36个地方会员活动中心。

【SCI论文】“学术丑闻揭露:当AI写作遭遇学术审稿,ChatGPT意外成为论文共作者!“
最近,一篇发表在《Surfaces and Interfaces》的论文引起了广泛关注,因为其中意外包含了ChatGPT的提示语,暴露出学术审稿过程中的疏忽。这篇论文讨论了铜基金属-有机框架-芳香族纤维素分隔器对锂金属阳极电池的影响,但却出现了不该出现的ChatGPT对话内容。这一事件不仅令人哭笑不得,还引发了对学术审核严谨性的质疑。它反映了当前学术界可能过度依赖AI写作工具,忽略了基本的检查和编辑步骤。这一事件提醒学术界必须加强审查机制和自律,确保论文质量,防止类似尴尬情况的再次发生。

新王Claude3实测!各项能力给跪,打麻将也会,确实比GPT-4好用
随着Claude 3(支持中文)一夜登陆,榜单性能跑分全面超越GPT-4,成为首个全面超越GPT-4的产品,也坐上了全球最强大模型新王座。实测对比了一波,全球热乎的一手体验,悉数奉上。
阿里云向量检索服务测评
在当今的大数据时代,向量检索技术已成为处理海量数据、实现高效信息检索的重要手段。阿里云作为国内领先的云计算服务提供商,推出了自己的向量检索服务。本文将对阿里云的向量检索服务进行深入的测评,探讨其在语义检索、知识库搭建、AI多模态搜索等场景的最佳实践,并分析其与其他向量检索工具的优劣。
CodeFuse-MFTCoder提升Qwen-14B代码能力
Qwen(通义千问)是阿里云开源的大型语言模型集合,目前有两个参数规模的模型:Qwen-7B和Qwen-14B。Qwen官方透出的评测中,在各项能力上都超过了同等大小的开源大语言模型,包括LLaMA,LLaMA2,ChatGLM2,Baichuan2,InternLM等。

2023第十二届中国智能产业高峰论坛之文档大模型的探索与思考
近日,2023第十二届中国智能产业高峰论坛(CIIS 2023)在江西南昌顺利举行,本次论坛主要讲解了关于AI大模型、生成式AI、无人系统、智能制造和数字安全等领域的议题。其中令我印象最深刻的就是上海合合信息的丁凯老师讲解的**多模态大模型与文档图像智能理解专题论坛**的部分了。
深入了解大模型:探讨大型神经网络的崛起与应用
近年来,大型神经网络模型如GPT-3、BERT和T5已经引领了人工智能领域的发展潮流。这些庞大的模型参数、深层网络结构和大规模训练数据的结合,使它们成为了自然语言处理、计算机视觉和其他领域的重要工具。本文将深入探讨大型神经网络模型的崛起、技术细节和实际应用。
深入探讨大型语言模型:创新、挑战与前景
随着人工智能领域的不断发展,大型语言模型已经成为人们热议的话题之一。这些模型如GPT-3、BERT和T5,以其强大的自然语言处理能力和广泛的应用领域而闻名。本文将深入探讨大型语言模型的技术、创新、挑战以及未来前景。

如何向大模型注入知识?达摩院通义对话模型SPACE系列探索
如何将人类先验知识低成本融入到预训练模型中一直是个难题。达摩院对话智能团队提出了一种基于半监督预训练的新训练方式,将对话领域的少量有标数据和海量无标数据一起进行预训练,从而把标注数据中蕴含的知识注入到预训练模型中去,打造了SPACE 1/2/3 系列模型,在11个国际公开对话数据集取得SOTA。
[架构思考] 咱们写Prompt的姿势,是不是该换换了?
本文想聊聊现在 Prompt 工程里的“内卷”怪象,并扔出一个可能的新玩法。我会把现在主流的 Prompt 写法,跟咱们码农都懂的“过程式编程”做个类比,扒一扒它在搞复杂 Agent 时的局限。然后,我会介绍一种基于“状态驱动”的“涌现式 Prompt”思路,并用一个叫《自衍体》的开源项目当例子,拆解一下它的技术实现。目的很简单,就是给想搞高级 AI Agent 的兄弟们,提供一个新思路。
Spring漏洞太难搞?AiPy生成漏洞检测辅助工具
本文介绍了 Spring 框架的漏洞风险、优缺点,并提出通过开发可视化工具 Aipy 来解决未授权访问问题。Spring 广泛应用于企业级开发,但因配置不当可能导致 RCE、数据泄露等漏洞。其优点包括强大的生态系统和灵活的事务管理,但也存在学习曲线陡峭、性能开销等问题。为应对安全挑战,Aipy 提供 GUI 界面,可自动扫描 Spring 组件(如 Swagger UI、Actuator)中的未授权漏洞,标记风险并提供修复方案,结果以图表形式展示,支持报告导出,有效提升安全性和易用性。
建模世界偏好:偏好建模中的Scaling Laws
本文探讨了人类偏好建模的可扩展性,揭示其遵循Scaling Law。通过大规模训练(1.5B-72B参数)Qwen 2.5模型,使用1500万对论坛偏好数据,发现测试损失随规模指数增长而线性下降。研究提出WorldPM(Modeling World Preference),作为统一的人类偏好表征方法,在客观与主观评估中展现优势。实验表明,WorldPM可显著提升样本效率和多维度性能,成为高效的人类偏好微调基座。同时,文章反思主观评估复杂性,建议放弃简单预设,让模型自主发现人类偏好的深层规律,推动AI对齐新方向。论文与代码已开源。
深度合成算法备案全知道:不同角色审核的重点是什么?
深度合成技术正深刻改变生活,其算法备案对保障技术安全至关重要。目前已有3445款算法通过备案,其中服务提供者占76.78%。本文详解服务提供者与技术支持者的角色差异、审核重点及文件要求,强调两者不可混用且需独立备案。只有严格遵循备案流程,才能让深度合成技术真正造福大众,推动行业健康发展。
qwen3大模型目前的不足与功能建议
这段内容反映了用户在过去半个多月与Qwen3大模型在线服务互动后,发现的功能不足及对未来功能的建议。用户已将所有意见汇总至一个会话,并通过www.tongyi.com页面分享对话链接。希望Qwen开发团队重视这些建议,同时也会发布到阿里云开发者社区讨论。待官方回复后,用户将根据回复决定是否分享给其他云服务厂商和开源社区。