reward-modeling

This is a research repository for training and evaluating reward models. Code is also included to train supervised fine-tuned base models.

Example

Running bash scripts/train_rm/run_gptj.sh will train a gptj reward model using train config configs/rm_configs/gptj.yaml by default.

Note: To do eval on gptj please install transformers repo from source.

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
configs		configs
data		data
reward-modeling		reward-modeling
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt