Add experiments

tamell · Feb 25, 2021 · 16077be · 16077be
1 parent 2a79967
commit 16077be
Show file tree

Hide file tree

Showing 10 changed files with 875 additions and 69 deletions.
diff --git a/experiments/classification.py b/experiments/classification.py
@@ -0,0 +1,244 @@
+import pickle
+import numpy as np
+import torch
+import tqdm
+from torch.nn.utils import parameters_to_vector
+
+from preds.optimizers import LaplaceGGN, get_diagonal_ggn
+from preds.models import SiMLP
+from preds.likelihoods import BernoulliLh, CategoricalLh
+from preds.predictives import nn_sampling_predictive, linear_sampling_predictive
+from preds.utils import acc, nll_cls, ece
+from preds.mfvi import run_bbb
+from preds.refine import laplace_refine, vi_refine, vi_diag_refine
+from preds.datasets import UCIClassificationDatasets
+
+torch.backends.cudnn.deterministic = True
+torch.backends.cudnn.benchmark = False
+
+
+def train(model, likelihood, X_train, y_train, optimizer, n_epochs):
+    """Train model with given optimizer and run postprocessing"""
+    losses = list()
+    for i in range(n_epochs):
+        def closure():
+            model.zero_grad()
+            f = model(X_train)
+            return likelihood.log_likelihood(y_train, f)
+        loss = optimizer.step(closure)
+        losses.append(loss)
+    optimizer.post_process(model, likelihood, [(X_train, y_train)])
+    return losses
+
+
+def preds_glm(X, model, likelihood, mu, Sigma_chol, samples):
+    gs = linear_sampling_predictive(X, model, likelihood, mu, Sigma_chol, mc_samples=samples)
+    return gs.mean(dim=0)
+
+
+def preds_nn(X, model, likelihood, mu, Sigma_chol, samples):
+    gs = nn_sampling_predictive(X, model, likelihood, mu, Sigma_chol, mc_samples=samples)
+    return gs.mean(dim=0)
+
+
+def evaluate(p, y, likelihood, name, data):
+    # returns are result dictionary with nll, acc, ece named
+    res = dict()
+    res[f'{data}_nll_{name}'] = nll_cls(p, y, likelihood)
+    res[f'{data}_acc_{name}'] = acc(p, y, likelihood)
+    res[f'{data}_ece_{name}'] = ece(p, y, likelihood, bins=10)
+    return res
+
+
+def inference(ds_train, ds_test, ds_valid, prior_prec, lr, n_epochs, device, seed,
+              n_layers=2, n_units=50, activation='tanh', n_samples=1000):
+    """Full inference (training and prediction)
+    storing all relevant quantities and returning a state dictionary.
+    if sigma_noise is None, we have classification.
+    """
+    """Training"""
+    X_train, y_train = ds_train.data.to(device), ds_train.targets.to(device)
+    X_test, y_test = ds_test.data.to(device), ds_test.targets.to(device)
+    X_valid, y_valid = ds_valid.data.to(device), ds_valid.targets.to(device)
+    D = X_train.shape[1]
+    res = dict()
+    torch.manual_seed(seed)
+    if ds_train.C == 2:
+        likelihood = BernoulliLh()
+        K = 1
+    else:
+        likelihood = CategoricalLh()
+        K = ds_train.C
+
+    model = SiMLP(D, K, n_layers, n_units, activation=activation).to(device)
+    optimizer = LaplaceGGN(model, lr=lr, prior_prec=prior_prec)
+    res['losses'] = train(model, likelihood, X_train, y_train, optimizer, n_epochs)
+    # baseline  (needs higher lr)
+    lrv, epochsv = lr * 10, int(n_epochs/2)
+    res_bbb = run_bbb(ds_train, ds_test, ds_valid, prior_prec, device, likelihood, epochsv, lr=lrv,
+                      n_samples_train=1, n_samples_pred=n_samples, n_layers=n_layers,
+                      n_units=n_units, activation=activation)
+    res['elbos_bbb'] = res_bbb['elbos']
+
+    # Extract relevant variables
+    theta_star = parameters_to_vector(model.parameters()).detach()
+    Sigmad, Sigma_chold = get_diagonal_ggn(optimizer)
+    Sigma_chol = optimizer.state['Sigma_chol']
+
+    """Prediction"""
+    lh = likelihood
+    # MAP
+    fs_train = likelihood.inv_link(model(X_train).detach())
+    fs_test = likelihood.inv_link(model(X_test).detach())
+    fs_valid = likelihood.inv_link(model(X_valid).detach())
+    res.update(evaluate(fs_train, y_train, lh, 'map', 'train'))
+    res.update(evaluate(fs_test, y_test, likelihood, 'map', 'test'))
+    res.update(evaluate(fs_valid, y_valid, likelihood, 'map', 'valid'))
+
+    # BBB
+    res.update(evaluate(res_bbb['preds_train'], y_train, lh, 'bbb', 'train'))
+    res.update(evaluate(res_bbb['preds_test'], y_test, lh, 'bbb', 'test'))
+    res.update(evaluate(res_bbb['preds_valid'], y_valid, lh, 'bbb', 'valid'))
+
+    # LinLaplace full Cov assuming convergence
+    fs_train = preds_glm(X_train, model, likelihood, theta_star, Sigma_chol, samples=n_samples)
+    fs_test = preds_glm(X_test, model, likelihood, theta_star, Sigma_chol, samples=n_samples)
+    fs_valid = preds_glm(X_valid, model, likelihood, theta_star, Sigma_chol, samples=n_samples)
+    res.update(evaluate(fs_train, y_train, lh, 'glm', 'train'))
+    res.update(evaluate(fs_test, y_test, lh, 'glm', 'test'))
+    res.update(evaluate(fs_valid, y_valid, lh, 'glm', 'valid'))
+
+    # LinLapalce diagonal cov
+    fs_train = preds_glm(X_train, model, likelihood, theta_star, Sigma_chold, samples=n_samples)
+    fs_test = preds_glm(X_test, model, likelihood, theta_star, Sigma_chold, samples=n_samples)
+    fs_valid = preds_glm(X_valid, model, likelihood, theta_star, Sigma_chold, samples=n_samples)
+    res.update(evaluate(fs_train, y_train, lh, 'glmd', 'train'))
+    res.update(evaluate(fs_test, y_test, lh, 'glmd', 'test'))
+    res.update(evaluate(fs_valid, y_valid, lh, 'glmd', 'valid'))
+
+    # Laplace-GGN NN sampling (cf Ritter et al.)
+    fs_train = preds_nn(X_train, model, likelihood, theta_star, Sigma_chol, samples=n_samples)
+    fs_test = preds_nn(X_test, model, likelihood, theta_star, Sigma_chol, samples=n_samples)
+    fs_valid = preds_nn(X_valid, model, likelihood, theta_star, Sigma_chol, samples=n_samples)
+    res.update(evaluate(fs_train, y_train, lh, 'nn', 'train'))
+    res.update(evaluate(fs_test, y_test, lh, 'nn', 'test'))
+    res.update(evaluate(fs_valid, y_valid, lh, 'nn', 'valid'))
+
+    # Laplace-GGN diagonal cov
+    fs_train = preds_nn(X_train, model, likelihood, theta_star, Sigma_chold, samples=n_samples)
+    fs_test = preds_nn(X_test, model, likelihood, theta_star, Sigma_chold, samples=n_samples)
+    fs_valid = preds_nn(X_valid, model, likelihood, theta_star, Sigma_chold, samples=n_samples)
+    res.update(evaluate(fs_train, y_train, lh, 'nnd', 'train'))
+    res.update(evaluate(fs_test, y_test, lh, 'nnd', 'test'))
+    res.update(evaluate(fs_valid, y_valid, lh, 'nnd', 'valid'))
+
+    # REFINEMENT
+    # Full Laplace
+    m, S_chol, S_chold, losses = laplace_refine(model, X_train, y_train, likelihood, prior_prec)
+    res['losses_lap'] = losses
+    fs_train = preds_glm(X_train, model, likelihood, m, S_chol, samples=n_samples)
+    fs_test = preds_glm(X_test, model, likelihood, m, S_chol, samples=n_samples)
+    fs_valid = preds_glm(X_valid, model, likelihood, m, S_chol, samples=n_samples)
+    res.update(evaluate(fs_train, y_train, lh, 'glmLap', 'train'))
+    res.update(evaluate(fs_test, y_test, lh, 'glmLap', 'test'))
+    res.update(evaluate(fs_valid, y_valid, lh, 'glmLap', 'valid'))
+
+    # Diag Laplace
+    fs_train = preds_glm(X_train, model, likelihood, m, S_chold, samples=n_samples)
+    fs_test = preds_glm(X_test, model, likelihood, m, S_chold, samples=n_samples)
+    fs_valid = preds_glm(X_valid, model, likelihood, m, S_chold, samples=n_samples)
+    res.update(evaluate(fs_train, y_train, lh, 'glmLapd', 'train'))
+    res.update(evaluate(fs_test, y_test, lh, 'glmLapd', 'test'))
+    res.update(evaluate(fs_valid, y_valid, lh, 'glmLapd', 'valid'))
+
+    # Full VI
+    m, S_chol, losses = vi_refine(model, optimizer, X_train, y_train, likelihood)
+    res['elbos_vi'] = losses
+    res['elbo_glm'] = losses[-1]
+    fs_train = preds_glm(X_train, model, likelihood, m, S_chol, samples=n_samples)
+    fs_test = preds_glm(X_test, model, likelihood, m, S_chol, samples=n_samples)
+    fs_valid = preds_glm(X_valid, model, likelihood, m, S_chol, samples=n_samples)
+    res.update(evaluate(fs_train, y_train, lh, 'glmVI', 'train'))
+    res.update(evaluate(fs_test, y_test, lh, 'glmVI', 'test'))
+    res.update(evaluate(fs_valid, y_valid, lh, 'glmVI', 'valid'))
+
+    # Diag VI
+    m, S_chold, losses = vi_diag_refine(model, optimizer, X_train, y_train, likelihood)
+    res['elbos_vid'] = losses
+    res['elbo_glmd'] = losses[-1]
+    fs_train = preds_glm(X_train, model, likelihood, m, S_chold, samples=n_samples)
+    fs_test = preds_glm(X_test, model, likelihood, m, S_chold, samples=n_samples)
+    fs_valid = preds_glm(X_valid, model, likelihood, m, S_chold, samples=n_samples)
+    res.update(evaluate(fs_train, y_train, lh, 'glmVId', 'train'))
+    res.update(evaluate(fs_test, y_test, lh, 'glmVId', 'test'))
+    res.update(evaluate(fs_valid, y_valid, lh, 'glmVId', 'valid'))
+
+    return res
+
+
+def main(ds_train, ds_test, ds_valid, deltas, device, dataset, name, seed, **kwargs):
+    results = list()
+    for i, delta in tqdm.tqdm(list(enumerate(deltas))):
+        res = inference(ds_train, ds_test, ds_valid, prior_prec=delta, device=device,
+                        seed=seed, **kwargs)
+        results.append(res)
+
+    resdict = dict()
+    resdict['results'] = results
+    resdict['deltas'] = deltas
+    resdict['N_train'] = len(ds_train)
+    resdict['N_test'] = len(ds_test)
+    resdict['K'] = ds_train.C
+
+    with open(f'experiments/results/classification_{dataset}_{name}_{seed}.pkl', 'wb') as f:
+        pickle.dump(resdict, f)
+
+
+if __name__ == '__main__':
+    import argparse
+    parser = argparse.ArgumentParser()
+    multi_datasets = ['glass', 'vehicle', 'waveform', 'satellite', 'digits']
+    binary_datasets = ['TwoMoons', 'australian', 'breast_cancer', 'ionosphere', 'banana']
+    datasets = multi_datasets + binary_datasets
+    parser.add_argument('-d', '--dataset', help='dataset', choices=datasets)
+    parser.add_argument('--double', help='double precision', action='store_true')
+    parser.add_argument('-s', '--seed', help='randomness seed', default=7011, type=int)
+    parser.add_argument('--n_epochs', help='epochs training neural network', default=10000, type=int)
+    parser.add_argument('--lr', help='neural network learning rate', default=1e-3, type=float)
+    parser.add_argument('--n_deltas', help='number of deltas to try', default=10, type=int)
+    parser.add_argument('--logd_min', help='min log delta', default=-2.0, type=float)
+    parser.add_argument('--logd_max', help='max log delta', default=2.0, type=float)
+    parser.add_argument('--n_layers', help='number of layers', default=2, type=int)
+    parser.add_argument('--n_units', help='number of hidden units per layer', default=50, type=int)
+    parser.add_argument('--activation', help='activation function', default='tanh',
+                        choices=['tanh', 'relu'])
+    parser.add_argument('--name', help='name result file', default='', type=str)
+    parser.add_argument('--n_samples', help='number predictive samples', type=int, default=1000)
+    args = parser.parse_args()
+    dataset = args.dataset
+    double = args.double
+    seed = args.seed
+    n_epochs = args.n_epochs
+    lr = args.lr
+    n_deltas = args.n_deltas
+    logd_min, logd_max = args.logd_min, args.logd_max
+    n_layers, n_units = args.n_layers, args.n_units
+    activation = args.activation
+    n_samples = args.n_samples
+    name = args.name
+
+    if double:
+        torch.set_default_dtype(torch.double)
+
+    device = 'cuda' if torch.cuda.is_available() else 'cpu'
+
+    ds_train = UCIClassificationDatasets(dataset, random_seed=seed, stratify=True,
+                                         train=True, double=double)
+    ds_test = UCIClassificationDatasets(dataset, random_seed=seed, stratify=True,
+                                        train=False, valid=False, double=double)
+    ds_valid = UCIClassificationDatasets(dataset, random_seed=seed, stratify=True,
+                                         train=False, valid=True, double=double)
+
+    deltas = np.logspace(logd_min, logd_max, n_deltas)
+    main(ds_train, ds_test, ds_valid, deltas, device, dataset, name, seed, n_epochs=n_epochs,
+         lr=lr, n_layers=n_layers, n_units=n_units, activation=activation, n_samples=n_samples)
diff --git a/experiments/img_classification_commands.py b/experiments/img_classification_commands.py
@@ -0,0 +1,23 @@
+model_ds_combs = [('MLP', 'MNIST'),
+                  ('CNN', 'MNIST'),
+                  ('MLP', 'FMNIST'),
+                  ('CNN', 'FMNIST'),
+                  ('CNN', 'CIFAR10'),
+                  ('AllCNN', 'CIFAR10')]
+
+seeds = [117, 68, 187, 27, 51]
+
+for model, ds in model_ds_combs:
+    print(f'###### {model} on {ds} ######')
+    for seed in seeds:
+        # train models
+        cmd = f'python imgclassification.py -d {ds} -m {model} -s {seed}'
+        print(cmd)
+        # inference and performance estimation
+        base_cmd = f'python imginference.py -d {ds} -m {model} --seed {seed} --loginfo'
+        # predictive comparison
+        print(base_cmd)
+        # OOD performance
+        print(base_cmd + ' --ood')
+        # GP performance
+        print(base_cmd + ' --gp')