Reasoning Generalization

Code for reproducing the experiments in What Do Learning Dynamics Reveal About Generalization in LLM Reasoning?.

Setup

conda create -n reasoning_generalization python=3.9
conda activate reasoning_generalization
cd reasoning_generalization
pip install -r requirements.txt

Fill in huggingface token in huggingface_params.py.

Usage

See gsm8k_run.sh or math_run.sh for examples of training and evaluation scripts. See gsm8k_analyze.ipynb or gsm8k_analyze.ipynb for analysis code.

Acknowledgements

Our codebase borrows code from stanford_alpaca.

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
ckpts		ckpts
figures		figures
.gitignore		.gitignore
README.md		README.md
gsm8k_analyze.ipynb		gsm8k_analyze.ipynb
gsm8k_analyze2.ipynb		gsm8k_analyze2.ipynb
gsm8k_eval_perplexity.py		gsm8k_eval_perplexity.py
gsm8k_eval_samples.py		gsm8k_eval_samples.py
gsm8k_run.sh		gsm8k_run.sh
gsm8k_train.py		gsm8k_train.py
huggingface_params.py		huggingface_params.py
math_analyze.ipynb		math_analyze.ipynb
math_eval_perplexity.py		math_eval_perplexity.py
math_eval_samples.py		math_eval_samples.py
math_run.sh		math_run.sh
math_train.py		math_train.py
requirements.txt		requirements.txt
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Reasoning Generalization

Setup

Usage

Acknowledgements

About

Releases

Packages

Languages

katiekang1998/reasoning_generalization

Folders and files

Latest commit

History

Repository files navigation

Reasoning Generalization

Setup

Usage

Acknowledgements

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages