DeepSpeed
- 安装DeepSpeed
1 |
|
更多配置信息可见于OvJat/DeepSpeedTutorial: DeepSpeed Tutorial (github.com)
- 训练的模型不止一个时 (此处以stable diffusion为例), an example:
cli/jobs/deepspeed/deepspeed-training/src
- 安装mpi4py
sudo apt update sudo apt-get install libopenmpi-dev
pip install mpi4py
- hf与deepspeed的配置冲突, 将deepspeed的相应配置修改为”auto”
"bf16": { "enabled": "auto" }
- 使用deepspeed需要安装bitsandbytes
pip install bitsandbytes
- 多卡运行
CUDA_VISIBLE_DEVICES=0,1 torchrun --nproc_per_node=2 --master_port=29500 finetune.py
运行时间: 03:33<12:41:38
- 单卡运行
CUDA_VISIBLE_DEVICES=0 torchrun --nproc_per_node=1 --master_port=29500 finetune.py
运行时间: 03:38<46:53:33
- 如何调用
1 |
|
- 传递参数
1 |
|
- ZeRO-stage-0配置示例
1 |
|
- ZeRO-stage-1配置示例
1 |
|
- ZeRO-stage-2配置示例
1 |
|
- ZeRO-stage-3配置示例
1 |
|
- inference
1 |
|
- Accelerate