中国信通院联合金橙果科技等十七家单位发起人工智能大模型安全基准测试

简介: 2024年2月20日下午,AIIA“SafetyAI Bench”(人工智能大模型安全基准测试)线上研讨会成功举办。来自中国信息通信研究院(以下简称“中国信通院”)、厦门大学、北京大学、北京交通大学、360、百度、蚂蚁集团、VIVO、西门​子、小鹏汽车、马上消费、浪潮科技、海信视像、交通银行、商汤科技、邮储银行、普华永道、科大讯飞、金橙果科技、万商天勤律所、中兴通讯、博特智能、开源网安、云天励飞等单位40余位科研机构专家及企业代表参加了本次会议。

2024年2月20日下午,AIIA“SafetyAI Bench”(人工智能大模型安全基准测试)线上研讨会成功举办。来自中国信息通信研究院(以下简称“中国信通院”)、厦门大学、北京大学、北京交通大学、360、百度、蚂蚁集团、VIVO、西门子、小鹏汽车、马上消费、浪潮科技、海信视像、交通银行、商汤科技、邮储银行、普华永道、科大讯飞、金橙果科技、万商天勤律所、中兴通讯、博特智能、开源网安、云天励飞等单位40余位科研机构专家及企业代表参加了本次会议。

中国信通院人工智能研究中心、AIIA 安全治理委员会 AI原生安全工作组组长张蔚敏介绍了AIIA“SafetyAI Bench”的工作背景。为了进一步推动大模型的安全部署应用,中国信通院联合17家单位发起大模型安全基准测试SafetyAI Bench,秉持公平公正、产业应用和场景导向的原则,目标建立业内权威大模型安全中文基准测试体系。以提高内容安全、数据安全和科技伦理等安全能力为目标,覆盖价值观正确、合法合规、隐私保护、文明健康等二十个维度的中文评测数据集。帮助大模型技术提供方提升模型安全风险防范能力,为大模型研发和落地保驾护航。

中国信通院人工智能研究中心安全与元宇宙部白入文博士介绍了“大模型评测系统”建设工作,系统将依托工信部大模型公共服务平台形成大模型评测执行的“硬工具”,为通用大模型、行业大模型、 大模型应用产品等提供一站式评测服务。一是以中立身份形成全维度、可拓展、公开、公正、公平的大模型评测能力,二是围绕产业实际应用需求开展动态评测服务,三是提供包括模型选型与供需对接在内的应用落地配套服务。

金橙果科技是人工智能中台技术研发的优秀团队,其产品AZSYS系统可以有效提升对异构数据的处理能力,帮助大模型与应用场景深度融合。搭载了该系统的伙伴AI在深度学习、自然语言理解、AI模型开发、角色构建与训练等领域均有非常出色的表现。金橙果科技CEO宋佰轩表示,我们正处于新的科技革命爆发前夕,AI不仅会改变我们思考和解决问题的方式,更会为人类社会生产生活方式激活无限新可能。未来AI将无处不在,随之而来的AI安全问题将是我们面临的巨大挑战,我们愿意携手更多同道者,一起推动行业安全标准的制定和实施,共建美好AI未来。



http://www.cnaifm.com/rgzn/3ddy/2024-02-22/12252.html

https://www.xinpin1688.com/article-19250-1.html

https://www.xinpin1688.com/article-19249-1.html

https://www.xinpin1688.com/article-19244-1.html

https://www.xinpin1688.com/article-19243-1.html

https://www.xinpin1688.com/article-19242-1.html

相关文章
|
4月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
533 120
|
5月前
|
人工智能 数据挖掘 大数据
人工智能模型决策过程:机器与人类协作成效
决策智能(DI)融合AI与人类判断,提升商业决策质量。通过数据驱动的预测与建议,结合人机协作,实现更高效、精准的业务成果,推动企业迈向数据文化新阶段。(238字)
|
7月前
|
数据采集 人工智能 监控
人工智能驱动的软件工程:测试左移的崛起价值
本文探讨了人工智能驱动下测试左移理念在软件工程中的重要性,分析测试工程师在需求评估、AI代码生成及遗留系统优化中的关键作用,揭示AI带来的挑战与机遇,并指出测试工程师需提升技能、关注合规与可维护性,以在AI时代保障软件质量。
428 89
|
5月前
|
机器学习/深度学习 人工智能 测试技术
EdgeMark:嵌入式人工智能工具的自动化与基准测试系统——论文阅读
EdgeMark是一个面向嵌入式AI的自动化部署与基准测试系统,支持TensorFlow Lite Micro、Edge Impulse等主流工具,通过模块化架构实现模型生成、优化、转换与部署全流程自动化,并提供跨平台性能对比,助力开发者在资源受限设备上高效选择与部署AI模型。
515 9
EdgeMark:嵌入式人工智能工具的自动化与基准测试系统——论文阅读
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
通用人工智能的标准是什么,与大模型有何区别?发展到什么程度了?
本文深入解析2025年迅猛发展的通用人工智能(AGI),梳理其核心概念、关键技术与现实应用,对比当前主流大模型的差异,并探讨普通人如何在日常生活与工作中体验和应用这一颠覆性技术,展望AGI带来的社会变革与伦理挑战。
2064 5
|
10月前
|
机器学习/深度学习 人工智能 并行计算
AI部署架构:A100、H100、A800、H800、H20的差异以及如何选型?开发、测试、生产环境如何进行AI大模型部署架构?
AI部署架构:A100、H100、A800、H800、H20的差异以及如何选型?开发、测试、生产环境如何进行AI大模型部署架构?
AI部署架构:A100、H100、A800、H800、H20的差异以及如何选型?开发、测试、生产环境如何进行AI大模型部署架构?
|
7月前
|
人工智能 算法 机器人
关于开展“人工智能大模型应用工程师”培训的通知
为贯彻落实《"十四五"机器人产业发展规划》和 2025年政府工作报告关于具身智能的战略部署,推进人工智能与实体经济深度融合,培育专业人才队伍,推动具身智能产业创新发展,工业和信息化部电子工业标准化研究院依据行业标准 SJ/T11805-2022《人工智能从业人员能力要求》,联合北京博创鑫鑫教育科技有限公司定于 2025年7月在广东、大连北京等地举办“人工智能大模型应用工程师”(具身智能实践案例提升与融合创新算法提升)培训,TsingtaoAI负责本次培训的交付事项。
314 12

热门文章

最新文章