add pretrain code

Han-Jia · Han-Jia · commit 7a16a1f37061 · 2019-09-01T15:57:47.000+08:00
diff --git a/feat/dataloader/mini_imagenet_pre.py b/feat/dataloader/mini_imagenet_pre.py
@@ -0,0 +1,90 @@
+import os.path as osp
+import PIL
+from PIL import Image
+
+import torch
+from torch.utils.data import Dataset
+from torchvision import transforms
+import numpy as np
+
+# use for miniImageNet pre-train
+THIS_PATH = osp.dirname(__file__)
+ROOT_PATH = osp.abspath(osp.join(THIS_PATH, '..', '..'))
+IMAGE_PATH = osp.join(ROOT_PATH, 'data/miniimagenet/images')
+SPLIT_PATH = osp.join(ROOT_PATH, 'data/miniimagenet/split')
+
+class MiniImageNet(Dataset):
+
+    def __init__(self, setname, args):
+        csv_path = osp.join(SPLIT_PATH, setname + '.csv')
+        lines = [x.strip() for x in open(csv_path, 'r').readlines()][1:]
+
+        data = []
+        label = []
+        lb = -1
+
+        self.wnids = []
+
+        for l in lines:
+            name, wnid = l.split(',')
+            path = osp.join(IMAGE_PATH, name)
+            if wnid not in self.wnids:
+                self.wnids.append(wnid)
+                lb += 1
+            data.append(path)
+            label.append(lb)
+
+        self.data = data
+        self.label = label
+        self.num_class = len(set(label))
+
+        if args.model_type == 'conv':
+            image_size = 84
+            if setname == 'train':
+                self.transform = transforms.Compose([
+                    transforms.RandomResizedCrop(image_size),
+                    # transforms.ColorJitter(brightness=0.4, contrast=0.4, saturation=0.4),
+                    transforms.RandomHorizontalFlip(),
+                    transforms.ToTensor(),
+                    # Lighting(0.1, imagenet_pca['eigval'], imagenet_pca['eigvec']),
+                    transforms.Normalize(np.array([0.485, 0.456, 0.406]),
+                                         np.array([0.229, 0.224, 0.225])),
+                              
+                ])
+            else:
+                self.transform = transforms.Compose([
+                    transforms.Resize(92),
+                    transforms.CenterCrop(image_size),
+                    transforms.ToTensor(),
+                    transforms.Normalize(np.array([0.485, 0.456, 0.406]),
+                                         np.array([0.229, 0.224, 0.225]))
+                ])            
+        else:
+            # for resNet
+            image_size = 80
+            mean = [x / 255 for x in [125.3, 123.0, 113.9]]
+            std = [x / 255 for x in [63.0, 62.1, 66.7]]            
+            if setname == 'train':
+                self.transform = transforms.Compose([
+                    # transforms.Resize(92, interpolation = PIL.Image.BICUBIC),
+                    transforms.RandomResizedCrop(image_size),
+                    # transforms.ColorJitter(brightness=0.4, contrast=0.4, saturation=0.4),
+                    transforms.RandomHorizontalFlip(),
+                    transforms.ToTensor(),
+                    # Lighting(0.1, imagenet_pca['eigval'], imagenet_pca['eigvec']),
+                    transforms.Normalize(mean, std)])
+            else:
+                self.transform = transforms.Compose([
+                    transforms.Resize(92),
+                    transforms.CenterCrop(image_size),
+                    transforms.ToTensor(),
+                    transforms.Normalize(mean, std)])
+
+    def __len__(self):
+        return len(self.data)
+
+    def __getitem__(self, i):
+        path, label = self.data[i], self.label[i]
+        image = self.transform(Image.open(path).convert('RGB'))
+        return image, label
+
diff --git a/feat/models/classifier.py b/feat/models/classifier.py
@@ -0,0 +1,39 @@
+import torch
+import torch.nn as nn
+import numpy as np
+from feat.utils import euclidean_metric
+import torch.nn.functional as F
+    
+class Classifier(nn.Module):
+
+    def __init__(self, args):
+        super().__init__()
+        self.args = args
+        if args.model_type == 'ConvNet':
+            hdim = 64
+            from feat.networks.convnet import ConvNet
+            self.encoder = ConvNet()
+        elif args.model_type == 'ResNet':
+            hdim = 640
+            from feat.networks.resnet import ResNet as ResNet
+            self.encoder = ResNet()
+        else:
+            raise ValueError('')
+
+        self.fc = nn.Linear(hdim, args.num_class)
+
+    def forward(self, data, is_emb = False):
+        out = self.encoder(data)
+        if not is_emb:
+            out = self.fc(out)
+        return out
+    
+    def forward_proto(self, data_shot, data_query, way = None):
+        if way is None:
+            way = self.args.num_class
+        proto = self.encoder(data_shot)
+        proto = proto.reshape(self.args.shot, way, -1).mean(dim=0)
+        
+        query = self.encoder(data_query)
+        logits = euclidean_metric(query, proto)
+        return logits
diff --git a/feat/utils.py b/feat/utils.py
@@ -10,11 +10,12 @@ def set_gpu(x):
     print('using gpu:', x)
 
 
-def ensure_path(path):
+def ensure_path(path, remove=True):
     if os.path.exists(path):
-        if input('{} exists, remove? ([y]/n)'.format(path)) != 'n':
-            shutil.rmtree(path)
-            os.mkdir(path)
+        if remove:
+            if input('{} exists, remove? ([y]/n)'.format(path)) != 'n':
+                shutil.rmtree(path)
+                os.mkdir(path)
     else:
         os.mkdir(path)
 
diff --git a/pretrain.py b/pretrain.py
@@ -0,0 +1,200 @@
+import argparse
+import os.path as osp
+import shutil
+import torch
+import torch.nn.functional as F
+from torch.utils.data import DataLoader
+from feat.models.classifier import Classifier
+from feat.dataloader.samplers import CategoriesSampler
+from feat.utils import pprint, set_gpu, ensure_path, Averager, Timer, count_acc, euclidean_metric
+from tensorboardX import SummaryWriter
+from tqdm import tqdm
+
+# pre-train backbone
+if __name__ == '__main__':
+    parser = argparse.ArgumentParser()
+    parser.add_argument('--batch_size', type=int, default=128)
+    parser.add_argument('--max_epoch', type=int, default=200)
+    parser.add_argument('--lr', type=float, default=0.001)
+    parser.add_argument('--ngpu', type=int, default=1, help='0 = CPU.')
+    parser.add_argument('--dataset', type=str, default='MiniImageNet', choices=['MiniImageNet', 'TieredImagenet'])    
+    parser.add_argument('--model_type', type=str, default='ResNet', choices=['ConvNet', 'ResNet'])
+    parser.add_argument('--schedule', type=int, nargs='+', default=[30, 50, 80], help='Decrease learning rate at these epochs.')
+    parser.add_argument('--gamma', type=float, default=0.1)
+    parser.add_argument('--resume', type=bool, default=False)
+    args = parser.parse_args()
+    pprint(vars(args))
+    
+    save_path1 = '-'.join([args.dataset, args.model_type, 'Pre'])
+    save_path2 = '_'.join([str(args.lr), str(args.gamma)])
+    args.save_path = osp.join(save_path1, save_path2)
+    ensure_path(save_path1, remove=False)
+    ensure_path(args.save_path)
+
+    if args.dataset == 'MiniImageNet':
+        # Handle MiniImageNet
+        from feat.dataloader.mini_imagenet_pre import MiniImageNet as Dataset
+    elif args.dataset == 'CUB':
+        from feat.dataloader.cub import CUB as Dataset
+    elif args.dataset == 'TieredImagenet':
+        from feat.dataloader.tiered_imagenet import tieredImageNet as Dataset    
+    else:
+        raise ValueError('Non-supported Dataset.')
+
+    trainset = Dataset('train', args)
+    train_loader = DataLoader(dataset=trainset, batch_size=args.batch_size, shuffle=True, num_workers=8, pin_memory=True)
+    args.num_class = trainset.num_class
+    valset = Dataset('val', args)
+    val_sampler = CategoriesSampler(valset.label, 200, valset.num_class, 1 + 15) # test on 16-way 1-shot
+    val_loader = DataLoader(dataset=valset, batch_sampler=val_sampler, num_workers=8, pin_memory=True)
+    args.way = valset.num_class
+    args.shot = 1
+    
+    # construct model
+    model = Classifier(args)
+    if args.model_type == 'ConvNet':
+        optimizer = torch.optim.Adam(model.parameters(), lr=args.lr, weight_decay=0.0005)
+    elif args.model_type == 'ResNet':
+        optimizer = torch.optim.SGD(model.parameters(), lr=args.lr, momentum=0.9, nesterov=True, weight_decay=0.0005)
+    else:
+        raise ValueError('No Such Encoder')    
+    criterion = torch.nn.CrossEntropyLoss()
+    
+    if torch.cuda.is_available():
+        torch.backends.cudnn.benchmark = True
+        if args.ngpu  > 1:
+            model = torch.nn.DataParallel(model, device_ids=list(range(args.ngpu)))
+        
+        model = model.cuda()
+        criterion = criterion.cuda()
+    
+    def save_model(name):
+        torch.save(dict(params=model.state_dict()), osp.join(args.save_path, name + '.pth'))
+    
+    def save_checkpoint(is_best, filename='checkpoint.pth.tar'):
+        state = {'epoch': epoch + 1,
+                 'args': args,
+                 'state_dict': model.state_dict(),
+                 'trlog': trlog,
+                 'val_acc': trlog['max_acc'],
+                 'optimizer' : optimizer.state_dict(),
+                 'global_count': global_count}
+        
+        torch.save(state, osp.join(args.save_path, filename))
+        if is_best:
+            shutil.copyfile(osp.join(args.save_path, filename), osp.join(args.save_path, 'model_best.pth.tar'))
+    
+    if args.resume == True:
+        # load checkpoint
+        state = torch.load(osp.join(args.save_path, 'model_best.pth.tar'))
+        init_epoch = state['epoch']
+        resumed_state = state['state_dict']
+        # resumed_state = {'module.'+k:v for k,v in resumed_state.items()}
+        model.load_state_dict(resumed_state)
+        trlog = state['trlog']
+        optimizer.load_state_dict(state['optimizer'])
+        initial_lr = optimizer.param_groups[0]['lr']
+        global_count = state['global_count']
+    else:
+        init_epoch = 1
+        trlog = {}
+        trlog['args'] = vars(args)
+        trlog['train_loss'] = []
+        trlog['val_loss'] = []
+        trlog['train_acc'] = []
+        trlog['val_acc'] = []
+        trlog['max_acc'] = 0.0
+        trlog['max_acc_epoch'] = 0
+        initial_lr = args.lr
+        global_count = 0
+
+    timer = Timer()
+    writer = SummaryWriter(logdir=args.save_path) # should change to log_dir for previous version tensorboardX
+    for epoch in range(init_epoch, args.max_epoch + 1):
+        # refine the step-size
+        if epoch in args.schedule:
+            initial_lr *= args.gamma
+            for param_group in optimizer.param_groups:
+                param_group['lr'] = initial_lr
+        
+        model.train()
+        tl = Averager()
+        ta = Averager()
+
+        for i, batch in enumerate(train_loader, 1):
+            global_count = global_count + 1
+            if torch.cuda.is_available():
+                data, label = [_.cuda() for _ in batch]
+                label = label.type(torch.cuda.LongTensor)
+            else:
+                data, label = batch
+                label = label.type(torch.LongTensor)
+            logits = model(data)
+            loss = criterion(logits, label)
+            acc = count_acc(logits, label)
+            writer.add_scalar('data/loss', float(loss), global_count)
+            writer.add_scalar('data/acc', float(acc), global_count)
+            print('epoch {}, train {}/{}, loss={:.4f} acc={:.4f}'.format(epoch, i, len(train_loader), loss.item(), acc))
+
+            tl.add(loss.item())
+            ta.add(acc)
+
+            optimizer.zero_grad()
+            loss.backward()
+            optimizer.step()
+
+        tl = tl.item()
+        ta = ta.item()
+
+        # do not do validation in first 500 epoches
+        if epoch > 30 or epoch % 5 == 0:
+            model.eval()
+            vl = Averager()
+            va = Averager()
+            print('best epoch {}, current best val acc={:.4f}'.format(trlog['max_acc_epoch'], trlog['max_acc']))
+            # test performance with Few-Shot
+            label = torch.arange(valset.num_class).repeat(15)
+            if torch.cuda.is_available():
+                label = label.type(torch.cuda.LongTensor)
+            else:
+                label = label.type(torch.LongTensor)        
+            with torch.no_grad():
+                for i, batch in tqdm(enumerate(val_loader, 1)):
+                    if torch.cuda.is_available():
+                        data, _ = [_.cuda() for _ in batch]
+                    else:
+                        data, _ = batch
+                    data_shot, data_query = data[:valset.num_class], data[valset.num_class:] # 16-way test
+                    if args.ngpu > 1:
+                        logits = model.module.forward_proto(data_shot, data_query, valset.num_class)
+                    else:
+                        logits = model.forward_proto(data_shot, data_query, valset.num_class)
+                    loss = F.cross_entropy(logits, label)
+                    acc = count_acc(logits, label)
+                    vl.add(loss.item())
+                    va.add(acc)
+
+            vl = vl.item()
+            va = va.item()
+            writer.add_scalar('data/val_loss', float(vl), epoch)
+            writer.add_scalar('data/val_acc', float(va), epoch)        
+            print('epoch {}, val, loss={:.4f} acc={:.4f}'.format(epoch, vl, va))
+    
+            if va > trlog['max_acc']:
+                trlog['max_acc'] = va
+                trlog['max_acc_epoch'] = epoch
+                save_model('max_acc')
+                save_checkpoint(True)
+    
+            trlog['train_loss'].append(tl)
+            trlog['train_acc'].append(ta)
+            trlog['val_loss'].append(vl)
+            trlog['val_acc'].append(va)
+            save_model('epoch-last')
+    
+            print('ETA:{}/{}'.format(timer.measure(), timer.measure(epoch / args.max_epoch)))
+    writer.close()
+    
+    
+    import pdb
+    pdb.set_trace()