bert_theuse_torch 實現《BERT-of-Theseus: Compressing BERT by Progressive Module Replacing》, 由於沒有GPU,沒有測試。 使用 配置文件config.py 數據預處理 python data_preprocess.py 訓練模型 python train.py