“智海-录问”法律大模型正式发布并开源在魔搭社区,行业首个法律大模型评估指标体系公开

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 8月21日,由中国工程院院刊《Engineering》、中国人工智能学会、中国工程院院刊信息与电子工程领域分刊《FITEE》联合主办的Engineering大讲堂暨“智行中国”第五期系列论坛在浙江大学举行,论坛围绕基座模型基础理论、AI+X垂直领域赋能应用及基座模型评测体系等问题邀请领域专家展开了深入探讨。

8月21日,由中国工程院院刊《Engineering》、中国人工智能学会、中国工程院院刊信息与电子工程领域分刊《FITEE》联合主办的Engineering大讲堂暨“智行中国”第五期系列论坛在浙江大学举行,论坛围绕基座模型基础理论、AI+X垂直领域赋能应用及基座模型评测体系等问题邀请领域专家展开了深入探讨。

在论坛上,由浙江大学联合阿里云、华院计算联合研制面向司法领域开源开放的法律大模型——智海-录问正式发布。中国工程院院士潘云鹤中国科学院院士杨树锋浙江大学副校长吴健“智慧司法”技术总师许建峰、浙江大学计算机学院教授庄越挺、浙江大学光华法学院教授熊明辉、上海交通大学凯原法学院教授李学尧、同济大学法学院副院长徐钢等嘉宾出席并见证了发布仪式。

image.png

据介绍,“录问”取自《魏书 世宗纪》中“慎狱重刑,著于往诰...当与王公卿士,亲临录问”,表示对案件卷宗中蛛丝马迹信息认真审阅分析、甄别细微。目前智海-录问已具备提供法律问答、知识检索增强问答、案情分析、意图识别、推理决策、法律文书生成等法律辅助服务功能。

以大模型赋能法治,让法治插上科技的翅膀,实现数字法治赋能,智海-录问为开展智能司法理论研究与技术创新、推动智慧法院与平台建设提供服务,同时也积极为浙江大学数字法治新型司法人才培养提供新路径。目前,智海-录问已在github和阿里云魔搭社区等平台开源。

Github开源地址:

https://github.com/zhihaiLLM/wisdomInterrogatory

Modelscope开放地址:

https://modelscope.cn/models/wisdomOcean/wisdomInterrogatory

https://modelscope.cn/studios/wisdomOcean/wisdomInterrogatory 

image.png

同期,智慧司法技术总师许建峰发布并解读了由国家重点研发计划“社会治理和智慧社会重点专项” 重点专项智慧司法板块技术总师系统、浙江大学、上海交通大学、阿里云计算有限公司、科大讯飞研究院联合起草的《法律大模型评估指标和测评方法(征求意见稿)》,旨在推动法律大模型的研发、评测和应用的规范化。

意见稿涵盖了法律大模型的能力体系,提出了法律大模型的评估指标、测评方法和典型应用场景等内容,在评测方法内容中,针对特定任务,意见稿提出需从功能、性能、安全、质量四个方面共12项指标,为法律大模型测评提供各项指标的选择、评分和计算方法,最终获得该项任务的性能测评结果。

image.png

许建峰强调:“面对众多科研团队和企业相继推出法律大模型的蓬勃发展形势,通过一套较为全面、系统、实用的评估指标和测评方法,指引和推动法律大模型的研发、测评工作,是业界的共同呼声和迫切需求,大模型为法律人工智能领域带来了新的机遇,推出指标体系是指导行业规范化的基础,我们希望更多行业从业者提供反馈和意见,并进一步完善法律大模型的评估标准,促进法律人工智能更好更快的发展。”

image.png

据介绍,此次论坛,浙江大学还联合阿里云等发布了教育大模型智海-三乐,可提供智能问答、试题生成、学习导航、教学评估等服务,并且将与101计划核心建设课程《人工智能引论》教材深度结合,于今年9月起为全国12所高校试点应用,形成数字化和智能化的教学基座能力,提供更智能、个性的教育教学体验。

相关文章
|
8月前
|
存储 人工智能 自然语言处理
社区供稿 | 开放开源!蚂蚁集团浙江大学联合发布开源大模型知识抽取框架OneKE
OneKE 是由蚂蚁集团和浙江大学联合研发的大模型知识抽取框架,具备中英文双语、多领域多任务的泛化知识抽取能力,并提供了完善的工具链支持。OneKE 以开源形式贡献给 OpenKG 开放知识图谱社区。
|
29天前
|
人工智能 Serverless
解决方案 | 函数计算玩转 AI 大模型评测获奖名单公布!
解决方案 | 函数计算玩转 AI 大模型评测获奖名单公布!
|
30天前
|
人工智能
解决方案 | 文档智能 & RAG让AI大模型更懂业务获奖名单公布!
解决方案 | 文档智能 & RAG让AI大模型更懂业务获奖名单公布!
|
4月前
|
人工智能
解决方案评测|10分钟构建AI客服并应用到聊天系统中获奖名单公布
10分钟构建AI客服并应用到聊天系统中获奖名单公布!!!
|
4月前
|
人工智能 自动驾驶 云计算
【通义】AI视界|谷歌大模型被盯上!欧盟最高隐私监管机构对PaLM2模型展开调查~
本文汇总了近24小时内科技领域的五大要闻:欧盟对谷歌PaLM2模型启动隐私合规调查;甲骨文推出Zettascale云计算集群,集成大量NVIDIA GPU强化计算力;红杉资本偏好AI应用投资而非模型构建;夸克新推智能助手CueMe,支持长达2万字内容生成;沃尔沃与NVIDIA合作,未来车型将采用后者先进芯片提升自动驾驶功能。以上内容由通义自动生成。
|
机器学习/深度学习 自然语言处理 测试技术
社区供稿 | 封神榜团队揭秘大模型训练秘密:以数据为中心
近一年来,各种各样的开源和闭源的大语言模型,不断在多个中文英文的测试基准中刷新着记录。然而,大语言模型的开发仍然面临诸多挑战,比如从头开始训练大语言模型的高昂成本,以及继续预训练导致的灾难性遗忘等等。尽管许多研究致力于解决这些问题,但一个重要而且实际的限制是,许多研究过于追求扩大模型规模,没有全面分析和优化预训练数据在训练大语言模型过程中的使用。
|
人工智能 运维 算法
隐私计算互联互通成果正式发布,相关代码已在隐语社区上线!
隐私计算互联互通成果正式发布,相关代码已在隐语社区上线!
220 0
|
存储 机器学习/深度学习 人工智能
如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》
如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》
268 0
|
人工智能 算法 搜索推荐
大规模开放数字商业知识图谱评测基准来了:OpenBG上线天池
大规模开放数字商业知识图谱评测基准来了:OpenBG上线天池
148 0
|
机器学习/深度学习 自然语言处理 安全
清华、剑桥、UIC联合推出首个中文事实核查数据集:基于证据、涵盖医疗社会等多个领域
清华、剑桥、UIC联合推出首个中文事实核查数据集:基于证据、涵盖医疗社会等多个领域
224 0

热门文章

最新文章