llm_test

Most of codes borrow from litgpt.

Test demo with Infini-Transformer \ MOE \ MOD \ Mamba ...etc

Easy to compare with each other. Support deepspeed v2 v3 or fsdp.

Demo result:

Base Model	Epochs	max seq len	segment len	datasets	params	val loss
Llama2	10	256	/	tinystories	15+M	1.127
Mamba	10	256	/	tinystories	12+M	1.13
Infini-Llama2	10	512	256	tinystories	15+M	1.16
Infini-Llama2-MOE 4/2	10	512	256	tinystories	27+M	1.05

Demo respond with Infini-Llama2-MOE 4/2:

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
assets		assets
config_hub		config_hub
extensions		extensions
litgpt		litgpt
tests		tests
tutorials		tutorials
.gitattributes		.gitattributes
README.md		README.md
inference.sh		inference.sh
inference_base.py		inference_base.py
trainer.py		trainer.py
trainer.sh		trainer.sh

Provide feedback