仓库文件说明

MISSION1 对比监督学习和自监督学习在图像分类任务上的性能表现

一共四个代码文件。

dataloader.py：导入数据。
model.py：模型class实现、训练函数实现。
train.py：主要调用python文件，在其中导入了dataloader.py与model.py。在使用时，该文件需要命令行输入所需的参数（后文会明确指明），随后运行即可。
test.py：用来实现测试pth的正确率。

MISSION2 在CIFAR-100数据集上比较基于Transformer和CNN的图像分类模型

一共四个代码文件。

dataloader.py：导入数据、实现Cutmix。
model.py：模型class实现、训练函数实现。
train.py：主要调用python文件，在其中导入了dataloader.py与model.py。在使用时，该文件需要命令行输入所需的参数（后文会明确指明），随后运行即可。
test.py：用来实现测试pth的正确率。

MISSION1

Ⅰ. 准备步骤

1. 代码下载 下载Repo中/mission1下的四个python文件，放在同级目录。

调整终端目录，以便train.py能方便的导入其他同级目录的函数。

命令行运行代码

cd 四个文件摆放的同级目录位置

2. 数据集准备 下载Tiny ImageNet

命令行运行代码（请注意修改以下的信息的绝对位置）

wget http://cs231n.stanford.edu/tiny-imagenet-200.zip -P /path/to/your/directory

运行data_process.py，将数据处理为我的代码中，自监督学习所需的数据形式。

命令行运行代码（请注意修改以下的信息的绝对位置）

python data_process.py --data_dir /path/to/your/directory

3. 可调参数概述

参数名	类型	默认值	描述
`--trytime`	int	(必须指定)	运行轮次序号
`--data_dir`	str	服务器上的数据集位置(必须指定)	Path to the CIFAR100 dataset directory.
`--batch_size`	int	64	Batch size for training.
`--num_epochs`	int	70	训练轮次设定
`--lr`	float	0.001	Learning rate for the optimizer.
`--momentum`	float	0.9	Momentum for the SGD optimizer.
`--pthpath`	str	None	Path to a saved model checkpoint to continue training.
`--optimizer`	str	'SGD'(大小写敏感)	Optimizer to use (SGD or Adam or AdamW).
`--base_dir`	str	(必须指定)	Base directory for saving model and logs.
`--decay`	float	1e-3	Weight decay for the optimizer.
`--milestones`	list	[]	List of epochs to decrease the learning rate. (Only for Supervised)
`--gamma`	float	0.1	Factor to decrease the learning rate.
`--strategy`	str	(必须指定，全小写缩写)	Strategy for training.

4. 必须自适应调整的参数

--try_times: 运行轮次序号。

每次运行，都需要设置try_times。目的是为了辅助文件夹进行排序，其，实为放在开头的轮次序号。该数没有过多要求，只要是int且不在同一个int使用相同的配置即可（否则会自动弹出报错）。

--data_dir：改为本地CIFAR100的位置（绝对位置）

因为代码中的默认地址信息为服务器上的地址，所以本地运行时，必须在命令行中重新赋值以修改。

--base_dir：运行过程中，进行保存pathpth和log时的根目录。

根目录需要自适应修改。代码实现了，会在base_dir/model/下，以各个当前运行的参数进行命名文件夹名a，随后会在base_dir/model/a/下进行pth的保存。同理会在base_dir/tensorboard/a/下进行log的保存。

注：其中文件夹名a为f"{try_times}{model_choice}{optimizer}{momentum}{decay}{learning_rate}{num_epochs}{batch_size}{scratch}{milestones}{gamma}"

--strategy：训练策略

参数待选项含义

"ss"：Self-Supervised (from scratch)
"s"：Supervised (from scratch)
"sl1"：Self-supervised Linear-protocal
- frozen the parameters before the FC layer
"sl2"：Self-supervised Linear-protocal
- parameters before the FC layer: learning rate*0.1
- FC layer: learning rate
"pl1"：Pretrain (on ImageNet via supervised) Linear-protocal
- frozen the parameters before the FC layer
"pl2"：Pretrain (on ImageNet via supervised) Linear-protocal
- parameters before the FC layer: learning rate*0.1
- FC layer: learning rate

5. 下载模型权重文件

模型权重1: 在ImageNet上pre-trained的ResNet-18只训练分类层得到的模型。(Google Drive)

浏览器打开链接以后，进行pth的下载。

https://drive.google.com/file/d/1yoffo1ex-ccwM_DMeit6tK_AOGQinTeE/view?usp=sharing

模型权重2: 在ImageNet上pre-trained的ResNet-18经过全局微调训练得到的模型。(Google Drive)

浏览器打开链接以后，进行pth的下载。

https://drive.google.com/file/d/14LN02EpIHkkBkvlixGS7NKQF9UkDg7wE/view?usp=sharing

模型权重3: 从零经过自监督学习（Tiny ImageNet）预训练得到的模型。(Google Drive)

浏览器打开链接以后，进行pth的下载。

https://drive.google.com/file/d/1CULinKLzEEl4ypP_-MjKmworNGgTebWs/view?usp=sharing

模型权重4: 从零经过自监督学习（Tiny ImageNet）预训练，再只训练分类层得到的模型。(Google Drive)

浏览器打开链接以后，进行pth的下载。

https://drive.google.com/file/d/1gnkb4iZEAwzZ_gVfnW3dRH3fQO6_e_Av/view?usp=sharing

模型权重5: 从零经过自监督学习（Tiny ImageNet）预训练，再经过全局微调训练得到的模型。(Google Drive)

浏览器打开链接以后，进行pth的下载。

https://drive.google.com/file/d/1bLBBv6pD-FNN6yQeexMi0EFvNFN2MtdN/view?usp=sharing

模型权重6：从零进行监督学习得到的模型。(Google Drive)

浏览器打开链接以后，进行pth的下载。

https://drive.google.com/file/d/1KUVjIUjCiYd0HbsztkmMRJG1wZ0y7qqG/view?usp=sharing

Ⅱ. 训练

命令行运行代码

注：自监督学习的data_dir指向Tiny-ImageNet的位置，监督学习的data_dir指向CIFAR100的位置。如果多次尝试，建议每次修改trytime（如每次加1）。

示例1（请注意修改以下的信息的绝对位置）：使用自监督学习在Tiny ImageNet上进行预训练（默认参数）

python train.py --data_dir "path to tiny-imagenet-200" --base_dir "path to save log and pth" --trytime 1 --strategy ss --num_epochs 10

示例2（请注意修改以下的信息的绝对位置）：对自监督学习得到的预训练模型，使用监督学习在CIFAR100上进行微调训练。

注：在以下的示例代码中，若只训练分类层，输入--strategy sl1；若全局微调，则输入--strategy sl2。
```
python train.py --data_dir "path to CIFAR100" --pthpath "path to self-supervised model's pth" --base_dir "path to save log and pth" --trytime 2 --strategy sl1 --num_epochs 10
```
示例3（请注意修改以下的信息的绝对位置）：对监督学习（on ImageNet）得到的预训练模型，使用监督学习在CIFAR100上进行微调训练。

注：在以下的示例代码中，若只训练分类层，输入--strategy pl1；若全局微调，则输入--strategy pl2。
```
python train.py --data_dir "path to CIFAR100" --base_dir "path to save log and pth" --trytime 3 --strategy pl1 --num_epochs 10
```

示例4（请注意修改以下的信息的绝对位置）：使用监督学习在CIFAR100上从零开始训练。

python train.py --data_dir "path to CIFAR100" --base_dir "path to save log and pth" --trytime 4 --strategy s --num_epochs 10

额外：如果想尝试参数列表中的其它参数，请按照如下形式，添加在示例1-示例4的代码中。
```
--batch_size 256
```
```
--optimizer Adam
```

Ⅲ. 测试

测试的效果为输出如下信息：

print(f'Val Loss: {val_loss:.4f}, Val Accuracy: {val_acc:.4f}, Val Time: {val_elapsed_time:.2f}s')

测试时，必须提供四个参数'--data_dir'、'--pthpath'、'--batch_size'、'--model'。

命令行运行代码，示例如下（请注意修改以下的信息的绝对位置）：

python test.py --data_dir "path to CIFAR100" --pthpath model.pth --batch_size 64

MISSION2

cutmix说明

代码实现所在具体位置

/mission2/dataloader.py

训练中调用的位置

/mission2/train.py中调用model.py

/mission2/model.py

Ⅰ. 准备步骤

1. 代码下载 下载Repo中/mission2下的四个python文件，放在同级目录。

调整终端目录，以便train.py能方便的导入其他同级目录的函数。

命令行运行代码

cd 四个文件摆放的同级目录位置

2. 可调参数概述

参数名	类型	默认值	描述
`--trytime`	int	(必须指定)	运行轮次序号
`--data_dir`	str	服务器上的数据集位置(必须指定)	Path to the CIFAR100 dataset directory.
`--batch_size`	int	64	Batch size for training.
`--num_epochs`	int	70	训练轮次设定
`--lr`	float	0.001	Learning rate for the optimizer.
`--momentum`	float	0.9	Momentum for the SGD optimizer.
`--pthpath`	str	None	Path to a saved model checkpoint to continue training.
`--optimizer`	str	'SGD'(大小写敏感)	Optimizer to use (SGD or Adam or AdamW).
`--base_dir`	str	(必须指定)	Base directory for saving model and logs.
`--decay`	float	1e-3	Weight decay for the optimizer.
`--step_size`	list	[]	step size for the learning rate scheduler.
`--model`	str	'vgg11'	Model to train ("vgg11" or "vit").
`--scratch`	bool	False	Train the model from scratch.

3. 必须自适应调整的参数

--try_times: 运行轮次序号。

每次运行，都需要设置try_times。目的是为了辅助文件夹进行排序，其，实为放在开头的轮次序号。该数没有过多要求，只要是int且不在同一个int使用相同的配置即可（否则会自动弹出报错）。

--data_dir：改为本地CIFAR100的位置（绝对位置）

因为代码中的默认地址信息为服务器上的地址，所以本地运行时，必须在命令行中重新赋值以修改。

--base_dir：运行过程中，进行保存pathpth和log时的根目录。

根目录需要自适应修改。代码实现了，会在base_dir/model/下，以各个当前运行的参数进行命名文件夹名a，随后会在base_dir/model/a/下进行pth的保存。同理会在base_dir/tensorboard/a/下进行log的保存。

注：其中文件夹名a为f"{try_times}{model_choice}{optimizer}{momentum}{decay}{learning_rate}{num_epochs}{batch_size}{scratch}_{step_size}"

4. 下载模型权重文件

模型权重1: 在pre-trained的ViT基础上微调得到的结果。(Google Drive)

浏览器打开链接以后，进行pth的下载。

https://drive.google.com/file/d/158AM9eq0hviv13OEkq41jov50RdESlqw/view?usp=sharing

模型权重2: 在pre-trained的VGG-11基础上微调得到的结果。(Google Drive)

浏览器打开链接以后，进行pth的下载。

https://drive.google.com/file/d/1rgtjg6-939enlmTW56ZkFdzar5tp_Hs_/view?usp=sharing

Ⅱ. 训练

命令行运行代码

注：如果多次尝试，建议每次修改trytime（如每次加1）。

示例1（请注意修改以下的信息的绝对位置）：使用预训练vgg11模型与默认参数进行训练
```
python train.py --data_dir "path to CIFAR100" --base_dir "path to save log and pth" --trytime 1 --num_epochs 10
```

示例2（请注意修改以下的信息的绝对位置）：使用预训练vit模型与默认参数进行训练

python train.py --data_dir "path to CIFAR100" --base_dir "path to save log and pth" --trytime 2 --num_epochs 10 --model vit

示例3（请注意修改以下的信息的绝对位置）：使用预训练vgg11模型、Adam与其他默认参数开始训练

python train.py --data_dir "path to CIFAR100" --base_dir "path to save log and pth" --optimizer Adam --trytime 3 --num_epochs 10

示例4（请注意修改以下的信息的绝对位置）：使用随机初始化vgg11模型与其他默认参数开始训练

python train.py --data_dir "path to CIFAR100" --base_dir "path to save log and pth"--scratch True --trytime 4 --num_epochs 10

示例5（请注意修改以下的信息的绝对位置）：使用本地vgg11模型的pth与其他默认参数开始训练

python train.py --data_dir "path to CIFAR100" --base_dir "path to save log and pth" --pthpath model.pth --trytime 5 --num_epochs 10

Ⅲ. 测试

测试的效果为输出如下信息：

print(f'Val Loss: {val_loss:.4f}, Val Accuracy: {val_acc:.4f}, Val Time: {val_elapsed_time:.2f}s')

测试时，必须提供四个参数'--data_dir'、'--pthpath'、'--batch_size'、'--model'。

命令行运行代码，示例如下（请注意修改以下的信息的绝对位置）：

python test.py --data_dir /mission2/data --pthpath model.pth --batch_size 64 --model vgg

Name		Name	Last commit message	Last commit date
Latest commit History 82 Commits
mission1		mission1
mission2		mission2
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

仓库文件说明

MISSION1 对比监督学习和自监督学习在图像分类任务上的性能表现

MISSION2 在CIFAR-100数据集上比较基于Transformer和CNN的图像分类模型

MISSION1

Ⅰ. 准备步骤

Ⅱ. 训练

Ⅲ. 测试

MISSION2

cutmix说明

Ⅰ. 准备步骤

Ⅱ. 训练

Ⅲ. 测试

About

Releases

Packages

Languages

He1senbergg/FinalTerm

Folders and files

Latest commit

History

Repository files navigation

仓库文件说明

MISSION1 对比监督学习和自监督学习在图像分类任务上的性能表现

MISSION2 在CIFAR-100数据集上比较基于Transformer和CNN的图像分类模型

MISSION1

Ⅰ. 准备步骤

Ⅱ. 训练

Ⅲ. 测试

MISSION2

cutmix说明

Ⅰ. 准备步骤

Ⅱ. 训练

Ⅲ. 测试

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages