mmdetection训练数据遇到的问题

简介: mmdetection训练数据遇到的问题

1 Permission denied

报错:

-bash: ./compile.sh: Permission denied

没有操作权限,改为赋予最高权限(777):

chmod 777 compile.sh

2 cuda 问题

报错:

unable to execute '/usr/local/cuda-9.0/bin/nvcc': No such file or directory

error: command '/usr/local/cuda-9.0/bin/nvcc' failed with exit status 1

找不到cuda下nvcc文件,需要找到自己的nvcc文件所在地,然后输入:

./compile.sh \ --export CUDA_HOME=/usr/local/cuda-8.0/bin

如果还不行,需要查看一下是否有nvcc:

nvcc --version

2.1 nvcc正常

若nvcc正常,设置cuda路径首先执行:

sudo vim ~/.bashrc

设置为:

export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

然后执行:

sudo vim /etc/profile

末尾添加:

export CUDA_HOME=/usr/local/cuda-9.0
export PATH=/MATLAB/R2016b/bin:/usr/local/cuda-9.0/bin:/anaconda3/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH

然后执行

source /etc/profile

使链接生效

2.2 command not found

报错:

-bash: nvcc: command not found

应该安装nvcc:

sudo apt-get install nvidia-cuda-toolkit

报错:

E: Unable to fetch some archives, maybe run apt-get update or try with --fix-missing?

升级apt-get update:

sudo apt-get update

报错:

Failed to connect to nvidia.github.io port 443: Connection timed out

2.2.1 修改源

则应该修改源:

(1)修改前先做备份:

sudo cp /etc/apt/sources.list /etc/apt/sources.list.old

(2)打开sources.list文件:

sudo vim /etc/apt/sources.list

替换为其他源:

清华源:

# deb cdrom:[Ubuntu 16.04 LTS _Xenial Xerus_ - Release amd64 (20160420.1)]/ xenial main restricted
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial main restricted
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-updates main restricted
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial universe
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-updates universe
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial multiverse
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-updates multiverse
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-backports main restricted universe multiverse
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-security main restricted
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-security universe
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-security multiverse

阿里源:

# deb cdrom:[Ubuntu 16.04 LTS _Xenial Xerus_ - Release amd64 (20160420.1)]/ xenial main restricted
deb-src http://archive.ubuntu.com/ubuntu xenial main restricted #Added by software-properties
deb http://mirrors.aliyun.com/ubuntu/ xenial main restricted
deb-src http://mirrors.aliyun.com/ubuntu/ xenial main restricted multiverse universe #Added by software-properties
deb http://mirrors.aliyun.com/ubuntu/ xenial-updates main restricted
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-updates main restricted multiverse universe #Added by software-properties
deb http://mirrors.aliyun.com/ubuntu/ xenial universe
deb http://mirrors.aliyun.com/ubuntu/ xenial-updates universe
deb http://mirrors.aliyun.com/ubuntu/ xenial multiverse
deb http://mirrors.aliyun.com/ubuntu/ xenial-updates multiverse
deb http://mirrors.aliyun.com/ubuntu/ xenial-backports main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-backports main restricted universe multiverse #Added by software-properties
deb http://archive.canonical.com/ubuntu xenial partner
deb-src http://archive.canonical.com/ubuntu xenial partner
deb http://mirrors.aliyun.com/ubuntu/ xenial-security main restricted
deb-src http://mirrors.aliyun.com/ubuntu/ xenial-security main restricted multiverse universe #Added by software-properties
deb http://mirrors.aliyun.com/ubuntu/ xenial-security universe
deb http://mirrors.aliyun.com/ubuntu/ xenial-security multiverse

2.2.2 修改 nameserver

修改/etc/resolv.conf文件为:

nameserver 8.8.8.8
nameserver 4.2.2.2

3 not in the sudoers file

报错:

××× is not in the sudoers file. This incident will be reported.

1.切换到超级用户root:

su root

2.查看/etc/sudoers权限:

 ls -all /etc/sudoers

可以看到当前权限为744:

-r--r----- 1 root root 744 4月 16 20:36 /etc/sudoers

3.更改权限为777(表示允许操作):

chmod 777 /etc/sudoers

4.编辑/etc/sudoers:

vi /etc/sudoers

5.在root ALL=(ALL:ALL) ALL 下面添加一行:

XXX    ALL=(ALL)ALL

其中XXX表示当前用户名

6.把/etc/sudoers权限改回440:

chmod 440 /etc/sudoers

然后就可以切换回自己的用户操作了

4 ASSERT

报错:

ASSERT: "false" in file qasciikey.cpp, line 501

OpenCV版本不对,没有里面没有tracker。安装contrib的OpenCV:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-contrib-python

如果提示使用--user

pip install --user -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-contrib-python

5 no commands supplied

报错:

no commands supplied

应该将 python setup.py 改为 python setup.py install

6 FileNotFoundError

报错:

[Errno 2] No usable temporary directory found in ['/tmp', '/var/tmp', '/usr/tmp', /home/snowstorm/mmdetection']

磁盘空间已满,清理空间。

学习更多编程知识,请关注我的公众号:

代码的路

相关文章
|
Python
MMDetection系列 | 3. MMDetection自定义模型训练
MMDetection系列 | 3. MMDetection自定义模型训练
840 0
MMDetection系列 | 3. MMDetection自定义模型训练
|
存储 机器学习/深度学习 算法
MMDetection3d对KITT数据集的训练与评估介绍
MMDetection3d对KITT数据集的训练与评估介绍
1958 0
MMDetection3d对KITT数据集的训练与评估介绍
|
3月前
|
数据采集 人工智能 小程序
如何制作数据集并基于yolov5训练成模型并部署
这篇文章介绍了如何为YOLOv5制作数据集、训练模型、进行模型部署的整个流程,包括搜集和标注图片、创建数据集文件夹结构、编写配置文件、训练和评估模型,以及将训练好的模型部署到不同平台如ROS机器人、微信小程序和移动应用等。
如何制作数据集并基于yolov5训练成模型并部署
|
2月前
|
人工智能 自动驾驶 数据库
领域大模型的训练需要什么数据?
领域大模型的训练需要什么数据?
118 0
|
3月前
|
机器学习/深度学习
DNN模型训练
【8月更文挑战第9天】DNN模型训练。
29 1
|
5月前
|
计算机视觉
【YOLOv10训练教程】如何使用YOLOv10训练自己的数据集并且推理使用
【YOLOv10训练教程】如何使用YOLOv10训练自己的数据集并且推理使用
|
6月前
|
机器学习/深度学习 算法 Serverless
YoLo_V4模型训练过程
YoLo_V4模型训练过程
93 0
|
11月前
|
数据采集 机器学习/深度学习 自然语言处理
本地训练,开箱可用,Bert-VITS2 V2.0.2版本本地基于现有数据集训练(原神刻晴)
按照固有思维方式,深度学习的训练环节应该在云端,毕竟本地硬件条件有限。但事实上,在语音识别和自然语言处理层面,即使相对较少的数据量也可以训练出高性能的模型,对于预算有限的同学们来说,也没必要花冤枉钱上“云端”了,本次我们来演示如何在本地训练Bert-VITS2 V2.0.2模型。
本地训练,开箱可用,Bert-VITS2 V2.0.2版本本地基于现有数据集训练(原神刻晴)
|
网络安全 开发工具 网络架构
YOLOV7详细解读(四)训练自己的数据集
YOLOV7详细解读(四)训练自己的数据集
762 0
|
固态存储 开发工具 git
mmdetection目标检测训练自己的数据
mmdetection目标检测训练自己的数据