GitHub - shitanshubhushan/Linearizing-Llama-3.2-1B

LMAOCaT: Low-Rank Mamba and gated Attention Optimization via Conversion and Transfer

Repository for code to linearize Llama-3.2-1B

Currently contains code only for linear attention + sliding window

To run:

Create and activate a virtual environment:

python -m venv .venv

# Activate virtual environment
# On Windows:
.venv\Scripts\activate
# On macOS/Linux:
source .venv/bin/activate

Install requirements:

pip install -r requirements.txt

Run the notebooks in the following order:

# Attention Transfer
Llama_attn_transfer.ipynb

# LoRA fintune
llama_lora_finetune.ipynb

# Evaluation
Linear_llama_eval_inference_speed.ipynb
MMLU_eval-0shot.ipynb
MMLU_eval-5shot.ipynb

Poster for the Project:

Outdated and does not reflect accurate results

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
.venv		.venv
assets		assets
models		models
.DS_Store		.DS_Store
.gitignore		.gitignore
Linear_llama_eval_inference_speed.ipynb		Linear_llama_eval_inference_speed.ipynb
Llama_attn_transfer.ipynb		Llama_attn_transfer.ipynb
MMLU_eval-0shot.ipynb		MMLU_eval-0shot.ipynb
MMLU_eval-5shot.ipynb		MMLU_eval-5shot.ipynb
README.md		README.md
data_processing.py		data_processing.py
dataset.py		dataset.py
llama_lora_finetune.ipynb		llama_lora_finetune.ipynb
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LMAOCaT: Low-Rank Mamba and gated Attention Optimization via Conversion and Transfer

To run:

Poster for the Project:

About

Releases

Packages

Languages

shitanshubhushan/Linearizing-Llama-3.2-1B

Folders and files

Latest commit

History

Repository files navigation

LMAOCaT: Low-Rank Mamba and gated Attention Optimization via Conversion and Transfer

To run:

Poster for the Project:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages