Add solver

sushantjha8 · Jul 29, 2017 · a961de9 · a961de9
1 parent 2e665dc
commit a961de9
Showing 1 changed file with 91 additions and 0 deletions.
diff --git a/Day_02/CNN/solver.py b/Day_02/CNN/solver.py
@@ -0,0 +1,91 @@
+import torch
+from torch.autograd import Variable
+from models import CNN
+
+from tqdm import tqdm
+import os
+import numpy as np
+
+
+class Solver(object):
+    def __init__(self, config, data_loader):
+        self.config = config
+        self.data_loader = data_loader
+
+    def build(self, is_train):
+        self.model = CNN(self.config)
+        self.loss_fn = self.config.loss_fn()
+
+        if is_train:
+            self.model.train()
+            self.optimizer = self.config.optimizer(self.model.parameters(), lr=self.config.lr)
+        else:
+            self.model.eval()
+
+    def train(self):
+        for epoch in tqdm(range(self.config.epochs)):
+            loss_history = []
+            for batch in self.data_loader:
+                # text: [max_seq_len, batch_size]
+                # label: [batch_size]
+                text, label = batch.text, batch.label
+
+                # [batch_size, max_seq_len]
+                text.data.t_()
+
+                # [batch_size, 2]
+                logit = self.model(text)
+
+                # Calculate loss
+                average_batch_loss = self.loss_fn(logit, true_labels)  # [1]
+                loss_history.append(average_batch_loss.data[0])  # Variable -> Tensor
+
+                # Flush out remaining gradient
+                self.optimizer.zero_grad()
+
+                # Backpropagation
+                average_batch_loss.backward()
+
+                # Gradient descent
+                self.optimizer.step()
+
+            # Log intermediate loss
+            if (epoch + 1) % self.config.log_every_epoch == 0:
+                epoch_loss = np.mean(loss_history)
+                log_str = f'Epoch {epoch + 1} | loss: {epoch_loss:.2f}\n'
+                print(log_str)
+
+            # Save model parameters
+            if (epoch + 1) % self.config.save_every_epoch == 0:
+                ckpt_path = os.path.join(self.config.save_dir, f'epoch-{epoch+1}.pkl')
+                print('Save parameters at ', ckpt_path)
+                torch.save(self.model.state_dict(), ckpt_path)
+
+    def eval(self, epoch=None):
+
+        # Load model parameters
+        if not isinstance(epoch, int):
+            epoch = self.config.epochs
+        ckpt_path = os.path.join(self.config.save_dir, f'epoch-{epoch}.pkl')
+        print('Load parameters from ', ckpt_path)
+        self.model.load_state_dict(torch.load(ckpt_path))
+
+        loss_history = []
+        for batch in self.data_loader:
+            # text: [max_seq_len, batch_size]
+            # label: [batch_size]
+            text, label = batch.text, batch.label
+
+            # [batch_size, max_seq_len]
+            text.data.t_()
+
+            # [batch_size, 2]
+            logit = self.model(text)
+
+            # Calculate loss
+            average_batch_loss = self.loss_fn(logit, true_labels)  # [1]
+            loss_history.append(average_batch_loss.data[0])  # Variable -> Tensor
+
+        epoch_loss = np.mean(loss_history)
+
+        print('Loss: {epoch_loss:.2f}')