Running Experiments with adapated MEAN on design of CDRs

This code originates from MEAN, with our modifications detailed in the change log.

This document describes how to run the three main experiments using the provided scripts:

Evaluation on SAbDab
Antigen-binding CDR-H3 Redesign
Affinity Optimization

Common Setup

Before running any experiments:

Follow the setup instructions in the original README.md:
- Install dependencies using bash scripts/setup.sh
- Download structure data from SAbDab
- Place the structure data in all_structures/imgt

1. K-fold Evaluation on SAbDab

This experiment involves training and evaluating models on different CDR combinations.

Data Preparation

bash scripts/prepare_data_kfold.sh summaries/sabdab_summary.tsv all_structures/imgt

Training

# Train all CDR combinations for each CDRH type
GPU=0 bash run_all_cdrs.sh

This will:

Process CDRH1-3 directories
Train models for all CDR combinations (1, 2, 3, 1-2, 1-3, 2-3, 1-2-3)
Skip combinations where checkpoints already exist
Save checkpoints in summaries/cdrh{i}/CDR{combination}/ckpt/

Evaluation

# Evaluate all trained models
GPU=0 bash run_all_cdrs_eval.sh

This will:

Evaluate each trained model
Generate results for each CDR combination
Save results in the corresponding output directories

2. Antigen-binding CDR-H3 Redesign

prepare the RAbD data:

bash scripts/prepare_data_rabd.sh summaries/rabd_summary.jsonl all_structures/imgt summaries/sabdab_all.json

run training and evaluation:

# Train and evaluate all CDR combinations
GPU=0 bash run_all_cdrs_rabd.sh

This will:

Train models for each CDR combination
Target CDRH3 for redesign
Save results in summaries/cdrh3/CDR{combination}/

3. Affinity Optimization

prepare the SKEMPI data:

bash scripts/prepare_data_skempi.sh summaries/skempi_v2_summary.jsonl all_structures/imgt summaries/sabdab_all.json

run the optimization:

# Run pretraining, ITA training, and evaluation for all combinations
GPU=0 bash run_all_cdrs_opt.sh

This will:

Run pretraining if needed
Perform ITA training
Generate and evaluate optimized sequences
Save results in summaries/CDR{combination}/

Notes

All scripts support the GPU environment variable to specify which GPU to use
Set GPU=-1 to run on CPU
Results and checkpoints are organized by:
- CDR type (cdrh1/2/3)
- CDR combination (1, 2, 3, 1-2, etc.)
- Model type and mode
Each script will skip combinations where checkpoints already exist
Use MODE=100 for heavy chain only, MODE=111 for full context (default)

Directory Structure

summaries/
├── cdrh1/
│   ├── CDR1/
│   ├── CDR1_2/
│   └── ...
├── cdrh2/
│   ├── CDR1/
│   ├── CDR1_2/
│   └── ...
└── cdrh3/
    ├── CDR1/
    ├── CDR1_2/
    └── ...

Each CDR combination directory contains:

ckpt/ - Model checkpoints
Results and evaluation logs

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
checkpoints		checkpoints
data		data
evaluation		evaluation
licenses		licenses
models/MCAttGNN		models/MCAttGNN
scripts		scripts
summaries		summaries
trainer		trainer
utils		utils
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
README_ORI.md		README_ORI.md
env.yml		env.yml
generate.py		generate.py
generate.sh		generate.sh
ita_generate.py		ita_generate.py
ita_generate.sh		ita_generate.sh
ita_train.py		ita_train.py
ita_train.sh		ita_train.sh
rabd_test.sh		rabd_test.sh
run_all_cdrs.sh		run_all_cdrs.sh
run_all_cdrs_eval.sh		run_all_cdrs_eval.sh
run_all_cdrs_opt.sh		run_all_cdrs_opt.sh
run_all_cdrs_rabd.sh		run_all_cdrs_rabd.sh
train.py		train.py
train.sh		train.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Running Experiments with adapated MEAN on design of CDRs

Common Setup

1. K-fold Evaluation on SAbDab

Data Preparation

Training

Evaluation

2. Antigen-binding CDR-H3 Redesign

prepare the RAbD data:

run training and evaluation:

3. Affinity Optimization

prepare the SKEMPI data:

run the optimization:

Notes

Directory Structure

About

Releases

Packages

Languages

License

xinyu-g/MEAN_for_-joint_CDRs_designs

Folders and files

Latest commit

History

Repository files navigation

Running Experiments with adapated MEAN on design of CDRs

Common Setup

1. K-fold Evaluation on SAbDab

Data Preparation

Training

Evaluation

2. Antigen-binding CDR-H3 Redesign

prepare the RAbD data:

run training and evaluation:

3. Affinity Optimization

prepare the SKEMPI data:

run the optimization:

Notes

Directory Structure

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages