遇见您的私人法律顾问:智能法律大模型,智能解答您的法律困惑

简介: 遇见您的私人法律顾问:智能法律大模型,智能解答您的法律困惑

遇见您的私人法律顾问:智能法律大模型,智能解答您的法律困惑

为了让法律服务深入到每个人的身边,让更多的人能够得到法律帮助,开启了【律知】这个项目, 致力于打造一系列引领法律智能化的大模型。AI 法律模型是一位虚拟法律顾问,具备丰富的法律知识和技能,能够回答法律问题和提供法律建议。

语言模型

Name Params Language Corpus Objective File Config
GLM-Base 110M English Wiki+Book Token glm-base-blank.tar.bz2 model_blocklm_base.sh
GLM-Large 335M English Wiki+Book Token glm-large-blank.tar.bz2 model_blocklm_large.sh
GLM-Large-Chinese 335M Chinese WuDaoCorpora Token+Sent+Doc glm-large-chinese.tar.bz2 model_blocklm_large_chinese.sh
GLM-Doc 335M English Wiki+Book Token+Doc glm-large-generation.tar.bz2 model_blocklm_large_generation.sh
GLM-410M 410M English Wiki+Book Token+Doc glm-1.25-generation.tar.bz2 model_blocklm_1.25_generation.sh
GLM-515M 515M English Wiki+Book Token+Doc glm-1.5-generation.tar.bz2 model_blocklm_1.5_generation.sh
GLM-RoBERTa 335M English RoBERTa Token glm-roberta-large-blank.tar.bz2 model_blocklm_roberta_large.sh
GLM-2B 2B English Pile Token+Sent+Doc glm-2b.tar.bz2 model_blocklm_2B.sh
GLM-10B 10B English Pile Token+Sent+Doc Download model_blocklm_10B.sh
GLM-10B-Chinese 10B Chinese WuDaoCorpora Token+Sent+Doc Download model_blocklm_10B_chinese.sh
  • GLM-模型结果

dev set, single model, single-task finetuning

Model COPA WSC RTE WiC CB MultiRC BoolQ ReCoRD
GLM-10B 98.0 95.2 93.1 75.7 98.7/98.2 88.1/63.3 88.7 94.4/94.0
DeBERTa-XXLarge-v2 97.0 - 93.5 - - 87.8/63.6 88.3 94.1/93.7
  • Seq2Seq

CNN/Daily Mail (test set, no additional data used)

Model ROUGE-1 ROUGE-2 ROUGE-L
GLM-10B 44.7 21.4 41.4
T5-11B 43.5 21.6 40.7
PEGASUS-Large 44.2 21.5 41.4
BART-Large 44.2 21.3 40.9

XSum (test set, no additional data used)

Model ROUGE-1 ROUGE-2 ROUGE-L
GLM-10B 48.9 25.7 40.4
PEGASUS-Large 47.2 24.6 39.3
BART-Large 45.1 22.3 37.3
  • Language Modeling

test set, zero-shot

Model LAMBADA (accuracy) Wikitext103 (perplexity)
GLM-10B (bi) 72.35 11.33
GLM-10B (uni) 67.18 12.22
GPT-2 52.66 17.48
Megatron-LM (8.3B) 66.51 10.81
Turing-NLG 67.98 10.21

2.快速使用部署

推出的语言模型支持 HuggingFace🤗

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

hf_model = "law-llm/law-glm-10b"
max_question_length = 64
max_generation_length = 490

tokenizer = AutoTokenizer.from_pretrained(
    hf_model,
    cache_dir=model_cache_dir,
    use_fast=True,
    trust_remote_code=True
)

model = AutoModelForSeq2SeqLM.from_pretrained(
    hf_model,
    cache_dir=model_cache_dir,
    trust_remote_code=True
)

model = model.to('cuda')
model.eval()

model_inputs = "提问: 犯了盗窃罪怎么判刑? 回答: [gMASK]"

model_inputs = tokenizer(model_inputs,
                            max_length=max_question_length,
                            padding=True,
                            truncation=True,
                            return_tensors="pt")

model_inputs = tokenizer.build_inputs_for_generation(model_inputs,
                                                     targets=None,
                                                     max_gen_length=max_generation_length,
                                                     padding=True)

inputs = model_inputs.to('cuda')

outputs = model.generate(**inputs, max_length=max_generation_length,
                            eos_token_id=tokenizer.eop_token_id)
prediction = tokenizer.decode(outputs[0].tolist())

3. 效果展示

3.1. 法律咨询示例

的模型能够提供法律咨询服务,在大部分情况下能够依据真实的法律法规生成有指导性的建议。

问题 回答 (Law-GLM-10B, 2023.07.13, 模型输出)
犯了盗窃罪怎么判刑? 盗窃罪是指以非法占有为目的,窃取他人占有的数额较大的财物,或者多次盗窃的行为。盗窃罪侵犯的对象,仅限于国家、集体或个人的财物,而不是骗取其他非法利益。根据《刑法》第二百六十四条规定,盗窃公私财物,数额较大的,或者多次盗窃、入户盗窃、携带凶器盗窃、扒窃的,处三年以下有期徒刑、拘役或者管制,并处或者单处罚金;数额巨大或者有其他严重情节的,处三年以上十年以下有期徒刑,并处罚金;数额特别巨大或者有其他特别严重情节的,处十年以上有期徒刑或者无期徒刑,并处罚金或者没收财产。
未成年犯罪要承担刑事责任吗? 未成年犯罪要承担刑事责任。我国《刑法》第十七条规定,已满十六周岁的人犯罪,应当负刑事责任。已满十四周岁不满十六周岁的人,犯故意杀人、故意伤害致人重伤或者死亡、强奸、抢劫、贩卖毒品、放火、爆炸、投放危险物质罪的,应当负刑事责任。已满十二周岁不满十四周岁的人,犯故意杀人、故意伤害罪,致人死亡或者以特别残忍手段致人重伤造成严重残疾,情节恶劣,经最高人民检察院核准追诉的,应当负刑事责任。对依照前三款规定追究刑事责任的不满十八周岁的人,应当从轻或者减轻处罚。因不满十六周岁不予刑事处罚的,责令其父母或者其他监护人加以管教;在必要的时候,依法进行专门矫治教育。

3.2. 失败案例

的模型还远不够完美.以下是一些失败案例, 模型在这些案例中给出的答案并不完全正确.
正在分析模型的局限性,将继续推出更为强大, 准确的版本.

提问 回答 (Law-GLM-10B, 2023.07.13, 模型输出) 分析
非法集资罪员工如何处理?非法集资罪员工判多少年? 非法集资罪员工的处理: 1、员工构成非法集资罪的,一般处三年以下有期徒刑或者拘役,并处或者单处罚金;2、员工构成非法集资罪的,一般处三年以上七年以下有期徒刑,并处罚金;3、员工构成非法集资罪的,一般处七年以上有期徒刑,并处罚金或者没收财产。法律依据:《刑法》第一百九十二条以非法占有为目的,使用诈骗方法非法集资,数额较大的,处三年以下有期徒刑或者拘役,并处或者单处罚金;数额巨大或者有其他严重情节的,处三年以上七年以下有期徒刑,并处罚金。单位犯前款罪的,对单位判处罚金,并对其直接负责的主管人员和其他直接责任人员,依照前款的规定处罚。 法条引用正确, 刑期有错误 (应当为 "处五年以上十年以下有期徒刑")
犯人被逮捕后,会通知家属吗?多久会有通知? 逮捕后,会通知家属。根据 《刑事诉讼法》第六十九条规定,公安机关逮捕人的时候,必须出示逮捕证。逮捕后,应当立即将被逮捕人送看守所羁押,至迟不得超过二十四小时。除无法通知或者涉嫌危害国家安全犯罪、恐怖活动犯罪通知可能有碍侦查的情形以外,应当在逮捕后二十四小时以内,通知被逮捕人的家属。有碍侦查的情形消失以后,应当立即通知被逮捕人的家属。 回答基本正确, 但法条引用错误

更多优质内容请关注公号:汀丶人工智能;会提供一些相关的资源和优质文章,免费获取阅读。

相关文章
|
2月前
|
数据采集 存储 数据安全/隐私保护
数据抓取过程中需要注意哪些法律和道德问题?
【2月更文挑战第23天】【2月更文挑战第74篇】数据抓取过程中需要注意哪些法律和道德问题?
|
3月前
|
机器学习/深度学习 人工智能 文字识别
AI时代带来的图片造假危机,该如何解决
AI时代带来的图片造假危机,该如何解决
64 0
|
6月前
|
机器学习/深度学习 供应链 安全
【网安AIGC专题10.11】软件安全+安全代码大模型
【网安AIGC专题10.11】软件安全+安全代码大模型
165 0
|
8月前
|
人工智能 算法 计算机视觉
用AI修复亚运老照片:一次文化传承和历史回顾的活动
用AI修复亚运老照片:一次文化传承和历史回顾的活动
478 1
用AI修复亚运老照片:一次文化传承和历史回顾的活动
|
9月前
|
存储 机器学习/深度学习 自然语言处理
个人关于数字技术在修复古籍方面的见解
近几年信息技术的快速发展,也让传统领域得到了新的发展,就拿数字技术来讲,通过借助数字技术手段可以解决之前不能解决的问题。数字技术在修复古籍方面具有重要的应用价值,可以帮助我们更好地保存和传承古籍文化,数字技术的作用不在于此,通过数字技术的不断发展进步,可能在不久将来会在更广泛的领域有所运用和助力。本文就来简单聊一下运用数字技术修复古籍。
198 1
个人关于数字技术在修复古籍方面的见解
|
机器学习/深度学习 人工智能 安全
陆奇对话Gary Marcus:面对技术缺陷、伦理争议和实践缺失的当下,如何构建可信AI?
新冠疫情是一个警钟,提醒我们要去构建信任度 90% 以上的 AI。
289 0
陆奇对话Gary Marcus:面对技术缺陷、伦理争议和实践缺失的当下,如何构建可信AI?
|
机器学习/深度学习 存储 人工智能
从这个愚人节视频看人类意识上传研究
在生物进化的路途中,某些原始人可能是第一个认识到自己有一天终将死去的动物。而人类终其一生都在应对终将一死的现实。许多人向宗教寻求来生的慰藉,而有些人则希望能够逃离死亡,从庞塞德利昂对青春之泉的探寻,到现在流行的思维复制和意识上传。
157 0
从这个愚人节视频看人类意识上传研究
|
机器学习/深度学习 人工智能 监控
美国白宫为人工智能发声:通过公开对话讨论机遇与风险
白宫科技政策办公室(OSTP)于当地时间周二发布声明,将分别于今年 5、6、7 三个月份召开四次公开研讨会并成立跨机构工作组,来讨论高速发展的人工智能所带来的收益和风险,为未来人工智能做好准备。
145 0
美国白宫为人工智能发声:通过公开对话讨论机遇与风险
|
安全 区块链 数据安全/隐私保护
【得得专栏】方军:谈论区块链时,“数字资产”这个词可能是误导
互联网和当下的区块链技术,它们的关键角色是连接实体世界和数字世界,特别地,区块链所能连接和协助交换的是”价值“。但是,这些价值应当是实体世界的映射,而不是在数字世界中凭空生出来的。
1161 0