产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
Modelscope模型即服务
弹性计算
云原生
数据库
物联网
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
>
ModelScope模型即服务
>
自然语言处理
>
正文
使用fp16半精度进行微调时,为啥 loss直接就为nan
使用fp16半精度进行微调时,为啥 loss直接就为nan
展开
收起
GPT-3预训练生成模型-中文-2.7B
萧瑟的味道
2023-03-14 19:58:15
738
0
1
条回答
写回答
取消
提交回答
木子李炼丹术
您好,您使用的是哪个模型呢
2023-03-22 22:42:16
赞同
展开评论
打赏
相关问答
自然语言处理
有哪些值得收藏的五个种子搜索引擎&磁力搜索引擎?
66070
13
0
手机号码定位,是根据什么原理来确定位置的?
22316
29
0
什么是二进制?二进制怎么算?
25454
32
0
OSS的endpoint如何查看
25916
3
0
sql server的用户名和密码怎么查啊?
28224
19
0
如果购买了域名,一定要备案才能用吗
27227
21
0
购买阿里国外的云服务器是否可以访问谷歌?
70421
43
0
this xml file does not appear to have any style in
11701
4
0
域名在腾讯云备案成功,解析到阿里云服务器,提示仍需备案?
48837
27
0
算法工程师是学什么专业出身的?
14585
21
0
ModelScope模型即服务
自然语言处理
包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域
我要提问
热门讨论
热门文章
请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token?
386
如何提高qwen-7b-chat-int4的并行处理能力
919
如何下载llama模型到本地?
1969
Distributed package doesn't have NCCL built in
684
modelscope-funasr这个是说明已经支持GPU了吗?
26
modelscope-funasr这个命令可以直接在win10系统下装docker吗?
23
在modelscope-funasr 我添加了热词(hotwords.txt)后, 是重启吗?
22
第二次modelscope-funasr调用的时候,明显变慢了,而且 cpu 消耗变大了,怎么回事?
22
modelscope-funasr是否有像whisper一样?
21
在modelscope-funasr训练陕西话,不同地区的陕西话还不大一样,这咋整?
21
展开全部
基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手(检索增强生成(RAG)大模型)
116
检索增强生成(RAG)实践:基于LlamaIndex和Qwen1.5搭建智能问答系统
98
LLM 大模型学习必知必会系列(一):大模型基础知识篇
78
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
61
LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关
50
DashVector&千问7B模型,打造极简RAG 之 基于专属知识的问答服务实践
216
表格问答
552
使用ModelScope社区搭建OCR应用
1191
ModelScope X 昇腾910快速上手
173
用modelscope分析了百万字的《天龙八部》,原来金庸大师最偏爱的是TA
2077
展开全部
相关文章
【ACL 2023获奖论文】再现奖:Do CoNLL-2003 Named Entity Taggers Still Work Well in 2023?
【ACL 2023-NER注入到PLM】基于上下文学习的命名实体识别 Learning In-context Learning for Named Entity Recognition
【威胁情报综述阅读3】Cyber Threat Intelligence Mining for Proactive Cybersecurity Defense
【好书推荐4】图机器学习
【笔记】探索生成范式:大型语言模型在信息提取中的作用
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载