GitHub - aliushn/chatglm2_finetuning: chatglm2 6b finetuning and alpaca finetuning

statement

deep_training

    10-09 support accelerator trainer
    10-07 support colossalai trainer
    09-26 support transformers trainer
    08-16 解除 chatglm2-6b-int4 全参训练限制， 推理可选使用 Rope NtkScale , 不训练扩展推理长度
    08-02 增加 muti lora infer 例子, 手动升级 aigc_zoo , pip install -U git+https://github.com/ssbuild/aigc_zoo.git --force-reinstall --no-deps
    07-18 微调经验分享见: https://github.com/ssbuild/aigc_zoo#训练经验分享
    07-16 modify data strategy
    07-04 support ptv2 and arrow_stream,arrow_file,parquet dataset

install

pip install -U -r requirements.txt
如果无法安装 , 可以切换官方源 pip install -i https://pypi.org/simple -U -r requirements.txt

dev 通过一下方式安装
pip install -U git+https://github.com/ssbuild/deep_training.git
pip install -U transformers>=4.30 deepspeed xformers bitsandbytes>=0.39 accelerate>=0.20

weight

chatglm2-6b 支持四种微调方式
chatglm2-6b-int4 支持四种微调方式
chatglm2-6b-32k 支持四种微调方式
chatglm2-6b-32k-int4 支持四种微调方式

data sample

open_data https://github.com/ssbuild/open_data

单条数据示例

p prefix  optional
q question optional
a answer   must

 {
    "id": 0, 
    "p": "我是qwen训练的模型",
    "paragraph": [
        {
           "q": "你好",
           "a": "我是机器人，有什么可以帮助你的？"
        },
         {
             "q": "从南京到上海的路线",
             "a":  "你好，南京到上海的路线如下：1. 南京到上海，可以乘坐南京地铁1号线，在南京站乘坐轨道交通1号线。2. 南京到浦东机场，可以搭乘上海地铁1号，在陆家嘴站乘坐地铁1线，在浦东国际机场站乘坐机场快线，前往上海浦东国际机场。3. 上海到南京，可以换乘上海地铁2号线，从南京站换乘地铁2线，再从南京南站换乘地铁1路，然后到达上海站"
         }
     ]
 }

或者

 {
    "id": 0,
    "conversations": [
      {
        "from": "system",
        "value": "我是qwen训练的模型"
      },
      {
        "from": "user",
        "value": "你好"
      },
      {
        "from": "assistant",
        "value": "我是机器人，有什么可以帮助你的？"
      },
      {
        "from": "user",
        "value": "从南京到上海的路线"
      },
      {
        "from": "assistant",
        "value": "你好，南京到上海的路线如下：1. 南京到上海，可以乘坐南京地铁1号线，在南京站乘坐轨道交通1号线。2. 南京到浦东机场，可以搭乘上海地铁1号，在陆家嘴站乘坐地铁1线，在浦东国际机场站乘坐机场快线，前往上海浦东国际机场。3. 上海到南京，可以换乘上海地铁2号线，从南京站换乘地铁2线，再从南京南站换乘地铁1路，然后到达上海站"
      }
     ]
 }

infer

# infer.py 推理预训练模型
# infer_finetuning.py 推理微调模型
# infer_lora_finetuning.py 推理lora微调模型
 python infer.py

量化等级	最低 GPU 显存
FP16（无量化）	13 GB
INT8	10 GB
INT4	6 GB

training

    # 制作数据
    cd scripts
    bash train_full.sh -m dataset 
    or
    bash train_lora.sh -m dataset 
    or
    bash train_ptv2.sh -m dataset 
    
    注: num_process_worker 为多进程制作数据 ， 如果数据量较大 ， 适当调大至cpu数量
    dataHelper.make_dataset_with_args(data_args.train_file,mixed_data=False, shuffle=True,mode='train',num_process_worker=0)
    
    # 全参数训练 
        bash train_full.sh -m train 
        
    # lora adalora ia3 
        bash train_lora.sh -m train 
        
    # ptv2
        bash train_ptv2.sh -m train

训练参数

友情链接

纯粹而干净的代码

Reference

https://huggingface.co/THUDM/chatglm2-6b

Name		Name	Last commit message	Last commit date
Latest commit History 80 Commits
config		config
data		data
infer		infer
scripts		scripts
training		training
.gitignore		.gitignore
LICENSE		LICENSE
README.MD		README.MD
args.MD		args.MD
data_processer.py		data_processer.py
data_utils.py		data_utils.py
requirements.txt		requirements.txt
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

statement

install

weight

data sample

infer

training

训练参数

友情链接

Reference

Star History

About

Releases

Packages

Languages

License

aliushn/chatglm2_finetuning

Folders and files

Latest commit

History

Repository files navigation

statement

install

weight

data sample

infer

training

训练参数

友情链接

Reference

Star History

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages