GitHub - zhangnn520/znn_chatglm_finetuning: chatglm 6b 大模型微调

statement

deep_training

    dev 分支加一些新功能和想法 如果求稳定，请使用 stable分支
    05-12 fix lora int8 多卡训练 , ppo training move to https://github.com/ssbuild/rlhf_chatglm
    04-28 deep_training 0.1.3 pytorch-lightning 改名 ligntning ，旧版本 deep_training <= 0.1.2
    04-23 增加lora 保存hf权重（修改infer_lora_finetuning.py enable_merge_weight 选项），超大数据集见训练节说明
    04-12 deep_training 0.1.2.post0 fix load_in_8bit in lora v1 , lora v2
    04-11 增加 lora v2 以及 adalora, 另外官方fix eos_token , 请更新tokenizer_config.json
    04-10 增加一直冻结前N层微调方式，根据需要修改models.py 变量 global_num_layers_freeze
    04-07 官方精简了词表和权重，配置已同步，建议重新下载权重信息 deep_training 最低要求 0.1.1
    04-02 增加p-tuning-v2训练, 建议训练前删除缓存数据 rm -rf output
    03-28 支持加载chatglm-6b-int4权重 (修改 对应配置文件quantization_bit 4 or 8)
    03-27 fix eos
    03-26 增加三种数据策略

install

pip install -i https://pypi.org/simple -U deep_training>=0.1.3 cpm_kernels transformers>=4.26.1 deepspeed

weight

data sample

第三方羊驼数据 https://github.com/hikariming/alpaca_chinese_dataset 单条数据示例

 {
     "id": 0, "paragraph": [
         {
             "q": "从南京到上海的路线",
             "a":  "你好，南京到上海的路线如下：1. 南京到上海，可以乘坐南京地铁1号线，在南京站乘坐轨道交通1号线。2. 南京到浦东机场，可以搭乘上海地铁1号，在陆家嘴站乘坐地铁1线，在浦东国际机场站乘坐机场快线，前往上海浦东国际机场。3. 上海到南京，可以换乘上海地铁2号线，从南京站换乘地铁2线，再从南京南站换乘地铁1路，然后到达上海站"
         }
     ]
 }

或者

 {
     "id": 0, "paragraph": [
         {
             "q": "从南京到上海的路线",
             "a": [
                 "你好，南京到上海的路线如下：",
                 "1. 南京到上海，可以乘坐南京地铁1号线，在南京站乘坐轨道交通1号线。",
                 "2. 南京到浦东机场，可以搭乘上海地铁1号，在陆家嘴站乘坐地铁1线，在浦东国际机场站乘坐机场快线，前往上海浦东国际机场。",
                 "3. 上海到南京，可以换乘上海地铁2号线，从南京站换乘地铁2线，再从南京南站换乘地铁1路，然后到达上海站"
             ]
         }
     ]
 }

多轮会话

 {
     "id": 0, "paragraph": [
        {
           "q": "你好",
           "a": "我是机器人，有什么可以帮助你的？"
        },
         {
             "q": "从南京到上海的路线",
             "a":  "你好，南京到上海的路线如下：1. 南京到上海，可以乘坐南京地铁1号线，在南京站乘坐轨道交通1号线。2. 南京到浦东机场，可以搭乘上海地铁1号，在陆家嘴站乘坐地铁1线，在浦东国际机场站乘坐机场快线，前往上海浦东国际机场。3. 上海到南京，可以换乘上海地铁2号线，从南京站换乘地铁2线，再从南京南站换乘地铁1路，然后到达上海站"
         }
     ]
 }

generate record

python data_utils.py
注:
num_process_worker 为多进程制作数据 ， 如果数据量较大 ， 适当调大至cpu数量
dataHelper.make_dataset_with_args(data_args.train_file,mixed_data=False, shuffle=True,mode='train',num_process_worker=0)

infer

# infer.py 推理预训练模型
# infer_finetuning.py 推理微调模型
# infer_lora_finetuning.py 推理lora微调模型
 python infer.py

量化等级	最低 GPU 显存
FP16（无量化）	13 GB
INT8	10 GB
INT4	6 GB

finetuning

支持4种微调方式

冻结 N 层修改models/chatglm_model.py global_num_layers_freeze
ptuning v2
lora
正常微调

    python train.py

多机多卡训练 例子 3个机器 每个机器 4个卡
修改train.py Trainer num_nodes = 3
MASTER_ADDR=10.0.0.1 MASTER_PORT=6667 WORLD_SIZE=12 NODE_RANK=0 python train.py 
MASTER_ADDR=10.0.0.1 MASTER_PORT=6667 WORLD_SIZE=12 NODE_RANK=1 python train.py 
MASTER_ADDR=10.0.0.1 MASTER_PORT=6667 WORLD_SIZE=12 NODE_RANK=2 python train.py

lora finetuning

config/__init__.py
with_lora = True ， lora 和 adalora 不能同时开启

ptuning v2

odels/config/config_ptv2.json
对于 deepspeed模式 , ptuning v2  只支持 stage 0
修改对应配置文件
"pre_seq_len": 32,
"prefix_projection": false

混合精度训练

Trainer.precision=‘16-mixed’,#混合精度训练 需 pl_model.float() 并注释掉 Trainer.max_grad_norm

int高效训练方式

p-tuning-v2 使用chatglm-6b-int4 权重，修改配置文件models/config/config.json quantization_bit=4
lora int8 配置文件quantization_bit=0，使用官方标准float 16权重文件，修改 config/init.py global_load_in_8bit = True 并且对应with_lora=True

超大数据集

修改data_utils.py "data_backend": "lmdb"

deepspeed

启动则将data_utils.py  修改 enable_deepspeed 
lora 模式暂时不支持deepspeed

Reference

https://github.com/THUDM/ChatGLM-6B

友情链接

纯粹而干净的代码

Name		Name	Last commit message	Last commit date
Latest commit History 219 Commits
config		config
data		data
models		models
web		web
.gitignore		.gitignore
README.MD		README.MD
data_processer.py		data_processer.py
data_utils.py		data_utils.py
evaluate.py		evaluate.py
infer.py		infer.py
infer_finetuning.py		infer_finetuning.py
infer_lora_finetuning.py		infer_lora_finetuning.py
requirements.txt		requirements.txt
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

statement

install

weight

data sample

generate record

infer

finetuning

lora finetuning

ptuning v2

混合精度训练

int高效训练方式

超大数据集

deepspeed

Reference

友情链接

Star History

About

Releases

Packages

Languages

zhangnn520/znn_chatglm_finetuning

Folders and files

Latest commit

History

Repository files navigation

statement

install

weight

data sample

generate record

infer

finetuning

lora finetuning

ptuning v2

混合精度训练

int高效训练方式

超大数据集

deepspeed

Reference

友情链接

Star History

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages