Name		Name	Last commit message	Last commit date
parent directory ..
.vscode		.vscode
configs		configs
data_proj		data_proj
images		images
base_run.sh		base_run.sh
ds_all.sh		ds_all.sh
infer.ipynb		infer.ipynb
readme.md		readme.md
train.py		train.py
train_old.py		train_old.py

readme.md

🚀 让人人都可以用70亿参数的大模型！（没有法律风险可商用）

🎯 在效果上，只希望比肩chatglm-6b
⚙️ 使用sft数据训练中文bloom、falcon模型。
🎉 提供一整套的开源解决方案。让小公司、个人都可以玩起来。可商用、无任何法务风险。

🔄更新记录

[2023-06-04]日更新

支持对falcon模型做sft～

📣 介绍

✅ 基于stanford_alpaca项目，使用sft格式数据对bloom、falcon模型微调；
✅ 支持deepspeed-zero2、deepspeed-zero3；
✅ 支持自定义数据，支持大数据训练；
✅ 得益于bloom本身的能力，微调后的模型支持中文、英文、代码、法语、西班牙语等；
✅ 微调后的模型，中文能力显著提升；
✅ 支持不同尺寸bloom模型，如560m、3b、7b、13b；
✅ 支持falcon模型，如https://huggingface.co/tiiuae/falcon-7b;

🥰 体验

🎊 模型已经上传到huggingface上，欢迎来尝试：

bloom-560m_chat: 想要体验一个轻量的，那就直接体验5.6亿参数https://huggingface.co/yuanzhoulvpi/chinese_bloom_560m
bloom-7b_chat: 想要体验一个更大的，那就可以试一试70亿参数https://huggingface.co/yuanzhoulvpi/chinese_bloom_7b_chat

🎉 在hugginface上部署了一个cpu版本的（有点慢，毕竟是🆓）https://huggingface.co/spaces/yuanzhoulvpi/chinese_bloom_560_chat

🔄 模型

bloom模型支持中文、英文、代码、法语、西班牙语。具体的训练数据的语言占比如下👇。
bloom-3b: https://huggingface.co/bigscience/bloom-3b
bloom-系列模型: https://huggingface.co/bigscience

💽 数据

数据来源于BelleGroup，主要是用到这几个数据集:['BelleGroup/generated_chat_0.4M', 'BelleGroup/school_math_0.25M', 'BelleGroup/train_2M_CN', 'BelleGroup/train_1M_CN', 'BelleGroup/train_0.5M_CN', 'BelleGroup/multiturn_chat_0.8M']；
可以基于这些数据样式，制作自己的数据，并训练；

⚙️ 步骤

数据部分

运行data_proj/process_data.ipynb代码；或者模仿结果，制作自己的数据集；
运行结束之后，有一个文件夹data_proj/opendata。文件夹下有若干个json格式的文件。

运行模型

基础运行策略

sh base_run.sh

deepspeed运行策略

sh ds_all.sh

🎯 推理代码

infer.ipynb文件
gradio交互界面：https://huggingface.co/spaces/yuanzhoulvpi/chinese_bloom_560_chat 因为是使用的huggingface的免费的cpu版本，所以推理速度比较慢。

效果

不管是写代码还是写文案，bloom-7b在中文领域有极大的潜力

example 1
example 2
example 3
example 4
example 5

体验

chinese_bloom_560m模型，可以在这里体验https://huggingface.co/spaces/yuanzhoulvpi/chinese_bloom_560_chat
chinese_bloom_7b模型，可以在这里体验http://101.68.79.42:7861

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

chinese_bloom

chinese_bloom

readme.md

🚀 让人人都可以用70亿参数的大模型！（没有法律风险可商用）

🔄更新记录

[2023-06-04]日更新

📣 介绍

🥰 体验

🔄 模型

💽 数据

⚙️ 步骤

数据部分

运行模型

🎯 推理代码

效果

体验

Files

chinese_bloom

Directory actions

More options

Directory actions

More options

Latest commit

History

chinese_bloom

Folders and files

parent directory

readme.md

🚀 让人人都可以用70亿参数的大模型！（没有法律风险 可商用）

🔄更新记录

[2023-06-04]日更新

📣 介绍

🥰 体验

🔄 模型

💽 数据

⚙️ 步骤

数据部分

运行模型

🎯 推理代码

效果

体验

🚀 让人人都可以用70亿参数的大模型！（没有法律风险可商用）