遇见您的私人法律顾问:智能法律大模型,智能解答您的法律困惑

简介: 遇见您的私人法律顾问:智能法律大模型,智能解答您的法律困惑

遇见您的私人法律顾问:智能法律大模型,智能解答您的法律困惑

为了让法律服务深入到每个人的身边,让更多的人能够得到法律帮助,开启了【律知】这个项目, 致力于打造一系列引领法律智能化的大模型。AI 法律模型是一位虚拟法律顾问,具备丰富的法律知识和技能,能够回答法律问题和提供法律建议。

语言模型

Name Params Language Corpus Objective File Config
GLM-Base 110M English Wiki+Book Token glm-base-blank.tar.bz2 model_blocklm_base.sh
GLM-Large 335M English Wiki+Book Token glm-large-blank.tar.bz2 model_blocklm_large.sh
GLM-Large-Chinese 335M Chinese WuDaoCorpora Token+Sent+Doc glm-large-chinese.tar.bz2 model_blocklm_large_chinese.sh
GLM-Doc 335M English Wiki+Book Token+Doc glm-large-generation.tar.bz2 model_blocklm_large_generation.sh
GLM-410M 410M English Wiki+Book Token+Doc glm-1.25-generation.tar.bz2 model_blocklm_1.25_generation.sh
GLM-515M 515M English Wiki+Book Token+Doc glm-1.5-generation.tar.bz2 model_blocklm_1.5_generation.sh
GLM-RoBERTa 335M English RoBERTa Token glm-roberta-large-blank.tar.bz2 model_blocklm_roberta_large.sh
GLM-2B 2B English Pile Token+Sent+Doc glm-2b.tar.bz2 model_blocklm_2B.sh
GLM-10B 10B English Pile Token+Sent+Doc Download model_blocklm_10B.sh
GLM-10B-Chinese 10B Chinese WuDaoCorpora Token+Sent+Doc Download model_blocklm_10B_chinese.sh
  • GLM-模型结果

dev set, single model, single-task finetuning

Model COPA WSC RTE WiC CB MultiRC BoolQ ReCoRD
GLM-10B 98.0 95.2 93.1 75.7 98.7/98.2 88.1/63.3 88.7 94.4/94.0
DeBERTa-XXLarge-v2 97.0 - 93.5 - - 87.8/63.6 88.3 94.1/93.7
  • Seq2Seq

CNN/Daily Mail (test set, no additional data used)

Model ROUGE-1 ROUGE-2 ROUGE-L
GLM-10B 44.7 21.4 41.4
T5-11B 43.5 21.6 40.7
PEGASUS-Large 44.2 21.5 41.4
BART-Large 44.2 21.3 40.9

XSum (test set, no additional data used)

Model ROUGE-1 ROUGE-2 ROUGE-L
GLM-10B 48.9 25.7 40.4
PEGASUS-Large 47.2 24.6 39.3
BART-Large 45.1 22.3 37.3
  • Language Modeling

test set, zero-shot

Model LAMBADA (accuracy) Wikitext103 (perplexity)
GLM-10B (bi) 72.35 11.33
GLM-10B (uni) 67.18 12.22
GPT-2 52.66 17.48
Megatron-LM (8.3B) 66.51 10.81
Turing-NLG 67.98 10.21

2.快速使用部署

推出的语言模型支持 HuggingFace🤗

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

hf_model = "law-llm/law-glm-10b"
max_question_length = 64
max_generation_length = 490

tokenizer = AutoTokenizer.from_pretrained(
    hf_model,
    cache_dir=model_cache_dir,
    use_fast=True,
    trust_remote_code=True
)

model = AutoModelForSeq2SeqLM.from_pretrained(
    hf_model,
    cache_dir=model_cache_dir,
    trust_remote_code=True
)

model = model.to('cuda')
model.eval()

model_inputs = "提问: 犯了盗窃罪怎么判刑? 回答: [gMASK]"

model_inputs = tokenizer(model_inputs,
                            max_length=max_question_length,
                            padding=True,
                            truncation=True,
                            return_tensors="pt")

model_inputs = tokenizer.build_inputs_for_generation(model_inputs,
                                                     targets=None,
                                                     max_gen_length=max_generation_length,
                                                     padding=True)

inputs = model_inputs.to('cuda')

outputs = model.generate(**inputs, max_length=max_generation_length,
                            eos_token_id=tokenizer.eop_token_id)
prediction = tokenizer.decode(outputs[0].tolist())

3. 效果展示

3.1. 法律咨询示例

的模型能够提供法律咨询服务,在大部分情况下能够依据真实的法律法规生成有指导性的建议。

问题 回答 (Law-GLM-10B, 2023.07.13, 模型输出)
犯了盗窃罪怎么判刑? 盗窃罪是指以非法占有为目的,窃取他人占有的数额较大的财物,或者多次盗窃的行为。盗窃罪侵犯的对象,仅限于国家、集体或个人的财物,而不是骗取其他非法利益。根据《刑法》第二百六十四条规定,盗窃公私财物,数额较大的,或者多次盗窃、入户盗窃、携带凶器盗窃、扒窃的,处三年以下有期徒刑、拘役或者管制,并处或者单处罚金;数额巨大或者有其他严重情节的,处三年以上十年以下有期徒刑,并处罚金;数额特别巨大或者有其他特别严重情节的,处十年以上有期徒刑或者无期徒刑,并处罚金或者没收财产。
未成年犯罪要承担刑事责任吗? 未成年犯罪要承担刑事责任。我国《刑法》第十七条规定,已满十六周岁的人犯罪,应当负刑事责任。已满十四周岁不满十六周岁的人,犯故意杀人、故意伤害致人重伤或者死亡、强奸、抢劫、贩卖毒品、放火、爆炸、投放危险物质罪的,应当负刑事责任。已满十二周岁不满十四周岁的人,犯故意杀人、故意伤害罪,致人死亡或者以特别残忍手段致人重伤造成严重残疾,情节恶劣,经最高人民检察院核准追诉的,应当负刑事责任。对依照前三款规定追究刑事责任的不满十八周岁的人,应当从轻或者减轻处罚。因不满十六周岁不予刑事处罚的,责令其父母或者其他监护人加以管教;在必要的时候,依法进行专门矫治教育。

3.2. 失败案例

的模型还远不够完美.以下是一些失败案例, 模型在这些案例中给出的答案并不完全正确.
正在分析模型的局限性,将继续推出更为强大, 准确的版本.

提问 回答 (Law-GLM-10B, 2023.07.13, 模型输出) 分析
非法集资罪员工如何处理?非法集资罪员工判多少年? 非法集资罪员工的处理: 1、员工构成非法集资罪的,一般处三年以下有期徒刑或者拘役,并处或者单处罚金;2、员工构成非法集资罪的,一般处三年以上七年以下有期徒刑,并处罚金;3、员工构成非法集资罪的,一般处七年以上有期徒刑,并处罚金或者没收财产。法律依据:《刑法》第一百九十二条以非法占有为目的,使用诈骗方法非法集资,数额较大的,处三年以下有期徒刑或者拘役,并处或者单处罚金;数额巨大或者有其他严重情节的,处三年以上七年以下有期徒刑,并处罚金。单位犯前款罪的,对单位判处罚金,并对其直接负责的主管人员和其他直接责任人员,依照前款的规定处罚。 法条引用正确, 刑期有错误 (应当为 "处五年以上十年以下有期徒刑")
犯人被逮捕后,会通知家属吗?多久会有通知? 逮捕后,会通知家属。根据 《刑事诉讼法》第六十九条规定,公安机关逮捕人的时候,必须出示逮捕证。逮捕后,应当立即将被逮捕人送看守所羁押,至迟不得超过二十四小时。除无法通知或者涉嫌危害国家安全犯罪、恐怖活动犯罪通知可能有碍侦查的情形以外,应当在逮捕后二十四小时以内,通知被逮捕人的家属。有碍侦查的情形消失以后,应当立即通知被逮捕人的家属。 回答基本正确, 但法条引用错误

更多优质内容请关注公号:汀丶人工智能;会提供一些相关的资源和优质文章,免费获取阅读。

相关文章
|
4月前
|
安全 应用服务中间件 Linux
|
7月前
|
机器学习/深度学习 人工智能 算法
专家观点:Sora暴力创新与中国工业软件的突破时刻
全球人工智能快速发展,挑战人类智能认知。第四范式,以大数据分析为代表,通过Sora等数据驱动模型取得胜利。另一方面,基于物理定律的仿真计算,依赖科学计算和偏微分方程,提供确定性预测。然而,大模型AI以统计学经验主义动摇了这一基础。OpenAI的ChatGPT参数规模迅速增长,逼近人类大脑,预示人类智能决战时刻提前到来。美国科技股集中投资于AI创新,如OpenAI和英伟达,形成“独角戏”模式,推动算力爆发式增长。与此同时,第三范式的科学计算似乎达到极限,如ANSYS被新思收购,象征物理仿真的转变。中国在工业软件领域仍处于第三范式初期,需大力投入实现自主创新,借鉴饱和攻关模式以加速发展。
68 0
|
7月前
|
机器学习/深度学习 人工智能 文字识别
AI时代带来的图片造假危机,该如何解决
AI时代带来的图片造假危机,该如何解决
138 0
|
机器学习/深度学习 供应链 安全
【网安AIGC专题10.11】软件安全+安全代码大模型
【网安AIGC专题10.11】软件安全+安全代码大模型
298 0
|
机器学习/深度学习 人工智能 编解码
MIT新研究:AI仅靠看X光片就能准确识别患者种族,但没人知道为什么
MIT新研究:AI仅靠看X光片就能准确识别患者种族,但没人知道为什么
198 0
MIT新研究:AI仅靠看X光片就能准确识别患者种族,但没人知道为什么
|
人工智能 搜索推荐 大数据
心脑血管疾病被两会重点关注,谈谈AI能帮点儿什么?
2019年2月7日,武汉某医院急诊科,武汉理工大学职工黄先生(化名)因为胸痛在值班医生的安排下刚刚做完心脏CT,正在焦急等待结果。
心脑血管疾病被两会重点关注,谈谈AI能帮点儿什么?
|
机器学习/深度学习 人工智能 安全
陆奇对话Gary Marcus:面对技术缺陷、伦理争议和实践缺失的当下,如何构建可信AI?
新冠疫情是一个警钟,提醒我们要去构建信任度 90% 以上的 AI。
330 0
陆奇对话Gary Marcus:面对技术缺陷、伦理争议和实践缺失的当下,如何构建可信AI?
|
机器学习/深度学习 人工智能 监控
美国白宫为人工智能发声:通过公开对话讨论机遇与风险
白宫科技政策办公室(OSTP)于当地时间周二发布声明,将分别于今年 5、6、7 三个月份召开四次公开研讨会并成立跨机构工作组,来讨论高速发展的人工智能所带来的收益和风险,为未来人工智能做好准备。
180 0
美国白宫为人工智能发声:通过公开对话讨论机遇与风险
|
机器学习/深度学习 人工智能 自然语言处理
面对5400万抑郁症患者,这600位志愿者“树洞”打算用AI拯救他们
面对5400万抑郁症患者,这600位志愿者“树洞”打算用AI拯救他们
362 0
|
区块链 数据安全/隐私保护 开发者
区块链小册 | 必知的运营常识
区块链的运营可以说是五味杂陈,处处有坑,我知道的可能是冰山一角,但请允许我瞎比比一下。
1239 0