安装
使用pip安装
我们强烈建议您创建一个虚拟环境,或者使用pipx
(在 Python 3.7+
上)来封装您的本地环境。
pip install dvc 复制代码
您可以根据您使用的远程存储类型,选择性的安装可选依赖项:[s3]
、[azure]
、[gdrive]
、[gs]
、[oss]
、[ssh]
。 使用 [all]
将它们所有包含在内一起安装。
例如,支持 Amazon S3
存储:
pip install "dvc[s3]" 复制代码
在这种情况下,它会同时安装 DVC
与 boto3
库。
使用conda安装
安装 DVC
之前,需要提前安装 Miniconda
或 Anaconda
发行版。
conda install -c conda-forge mamba # installs much faster than conda mamba install -c conda-forge dvc 复制代码
您可以根据您使用的远程存储类型,选择性的安装可选依赖项:dvc-s3
, dvc-azure
, dvc-gdrive
, dvc-gs
, dvc-oss
, dvc-ssh
。
例如,支持 Amazon S3
存储:
conda install -c conda-forge mamba mamba install -c conda-forge dvc-s3 复制代码
在这种情况下,它会同时安装 DVC
与 boto3
库。
使用berw安装(MacOS)
安装 DVC
之前,需要确保已经安装了 Homebrew
。
brew install dvc 复制代码
使用apt安装(Debian/Ubuntu)
sudo wget \ https://dvc.org/deb/dvc.list \ -O /etc/apt/sources.list.d/dvc.list wget -qO - https://dvc.org/deb/iterative.asc | sudo apt-key add - sudo apt update sudo apt install dvc 复制代码
使用yum安装(Fedora/CentOS)
sudo wget \ https://dvc.org/rpm/dvc.repo \ -O /etc/yum.repos.d/dvc.repo sudo rpm --import https://dvc.org/rpm/iterative.asc sudo yum update sudo yum install dvc 复制代码
使用snap安装(Linux)
安装 DVC
之前,需要确保已经安装了snapd
。
snap install --classic dvc 复制代码
查看帮助文档
$ dvc -h 复制代码
注意:
- 如果要将
DVC
用作Python
库,请使用pip
或conda
安装。- 当使用
Homebrew
、deb
或rpm
存储库 、snap
安装DVC
时,会自动启用 Shell 补全。
项目初始化
安装完DVC
之后, 通过在 Git
项目中运行 dvc init
来初始化它。
准备工作:
$ mkdir example-get-started $ cd example-get-started $ git init 复制代码
初始化DVC:
$ dvc init 复制代码
初始化DVC之后,创建了一些应该添加到 Git
仓库的内部文件。
$ git status Changes to be committed: new file: .dvc/.gitignore new file: .dvc/config ... $ git commit -m "Initialize DVC" 复制代码
ok,现在你已经准备好DVC
了。 DVC
的特性可以分为几个功能组件(数据和模型版本控制、访问与下载数据和模型、数据流水线、指标跟踪、更新训练参数以及可视化模型表现、机器学习实验管理),后面我将在博文中一一探讨。