备案控制台

开发者社区问答正文

命名实体识别任务——模型encoder配置报错

在进行命名实体识别模型训练时，我想修改模型的结构。我观察到当前modelscope模型以bert-crf为主，我想加入编码层，查阅文档后未能正确配置encoder。我的问题是： 1. 如何正确配置编码层？是否像嵌入层一样，设置一个model_name_or_path的路径 2.如何正确引用huggingface的模型？如上面图3和图4所示，我加入了一个huggingface的模型，但在训练时未能识别出encoder

展开

收起

同济大学_陶志欣 2023-06-16 10:59:40 184 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

配置编码层在使用编码层时，需要确保已经正确安装了 transformers 库，并且已经下载了需要使用的预训练模型。编码层的配置方式与嵌入层稍有不同。您需要在代码中手动创建一个 AutoModel 实例，并将其作为编码层传递给模型。例如，如果您想使用 bert-base-uncased 模型作为编码层，可以按照以下方式进行配置： python Copy from transformers import AutoModel

encoder_layer = AutoModel.from_pretrained('bert-base-uncased') 其中，AutoModel 类是 transformers 库中的一个工厂函数，用于根据模型名称自动加载对应的模型。from_pretrained 方法用于从预训练模型中加载权重。

引用 Hugging Face 的模型如果您想使用 Hugging Face 的预训练模型，可以使用 transformers 库中的 AutoModel 类或其他相关类。例如，您可以按照以下方式使用 Hugging Face 的 bert-base-uncased 模型： python Copy from transformers import AutoModel

bert_model = AutoModel.from_pretrained('bert-base-uncased') 在训练或推理过程中，您需要将输入数据传递给 bert_model，然后获取模型的输出进行后续处理。需要注意的是，如果您的模型需要进行微调或其他修改，您需要将 bert_model 的参数设置为可训练，并在训练过程中更新其权重。

2023-06-16 17:16:36

赞同 1 展开评论

问答分类：

自然语言处理

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

83659

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

3704

1

0

sql server的用户名和密码怎么查啊？

37502

21

0

重启Docker后报错：Error response from daemon

2293

0

0

this xml file does not appear to have any style in

51861

10

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60922

32

0

OSS的endpoint如何查看

37487

6

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3647

1

0

阿里云服务器如何重置系统？

24718

4

0

LoRa的网络覆盖能力范围是怎么样的？

3151

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

索引构建：搜索引擎如何为万亿级别网站生成索引？

索引更新：刚发布的文章就能被搜到，这是怎么做到的？

索引拆分：大规模检索系统如何使用分布式技术加速检索？

希望国内AI不要作恶，不要变成百度

搜索引擎：输入搜索词以后，搜索引擎是怎么工作的？

还有其他疑问?