pre-fix

niki-amini-naieni · Mar 24, 2022 · 76f7329 · 76f7329
1 parent b92b939
commit 76f7329
Show file tree

Hide file tree

Showing 17 changed files with 3,641 additions and 56 deletions.
diff --git a/main_nerf.py b/main_nerf.py
@@ -15,6 +15,7 @@
  parser.add_argument('--workspace', type=str, default='workspace')
  parser.add_argument('--seed', type=int, default=0)
  ### training options
+ parser.add_argument('--batch_size', type=int, default=1) 
  parser.add_argument('--num_rays', type=int, default=4096)
  parser.add_argument('--cuda_ray', action='store_true', help="use CUDA raymarching instead of pytorch")
  # (only valid when not using --cuda_ray)
@@ -83,32 +84,32 @@
  else:
 
  optimizer = lambda model: torch.optim.Adam([
- {'name': 'encoding', 'params': list(model.encoder.parameters())},
- {'name': 'net', 'params': list(model.sigma_net.parameters()) + list(model.color_net.parameters()), 'weight_decay': 1e-6},
- ], lr=1e-2, betas=(0.9, 0.99), eps=1e-15)
+ {'name': 'encoding', 'params': list(model.encoder.parameters()), 'lr': 2e-2},
+ {'name': 'net', 'params': list(model.sigma_net.parameters()) + list(model.color_net.parameters()), 'weight_decay': 1e-6, 'lr': 1e-3},
+ ], betas=(0.9, 0.99), eps=1e-15)
 
  # need different milestones for GUI/CMD mode.
- scheduler = lambda optimizer: optim.lr_scheduler.MultiStepLR(optimizer, milestones=[1000, 1500, 2000] if opt.gui else [50, 100, 150], gamma=0.33)
+ scheduler = lambda optimizer: optim.lr_scheduler.MultiStepLR(optimizer, milestones=[1000, 1500, 2000] if opt.gui else [100, 200], gamma=0.33)
 
  trainer = Trainer('ngp', vars(opt), model, workspace=opt.workspace, optimizer=optimizer, criterion=criterion, ema_decay=0.95, fp16=opt.fp16, lr_scheduler=scheduler, metrics=[PSNRMeter()], use_checkpoint='latest', eval_interval=50)
 
  # need different dataset type for GUI/CMD mode.
 
  if opt.gui:
  train_dataset = NeRFDataset(opt.path, type='all', mode=opt.mode, scale=opt.scale, preload=opt.preload)
- train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=1, shuffle=True, pin_memory=True)
+ train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=opt.batch_size, shuffle=True, pin_memory=True)
  trainer.train_loader = train_loader # attach dataloader to trainer
 
  gui = NeRFGUI(opt, trainer)
  gui.render()
 
  else:
  train_dataset = NeRFDataset(opt.path, type='train', mode=opt.mode, scale=opt.scale, preload=opt.preload)
- train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=1, shuffle=True, pin_memory=True)
+ train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=opt.batch_size, shuffle=True, pin_memory=True)
  valid_dataset = NeRFDataset(opt.path, type='val', mode=opt.mode, downscale=2, scale=opt.scale, preload=opt.preload)
  valid_loader = torch.utils.data.DataLoader(valid_dataset, batch_size=1, pin_memory=True)
 
- trainer.train(train_loader, valid_loader, 200)
+ trainer.train(train_loader, valid_loader, 300)
 
  # also test
  test_dataset = NeRFDataset(opt.path, type='test', mode=opt.mode, scale=opt.scale, preload=opt.preload)

diff --git a/main_sdf.py b/main_sdf.py
@@ -23,6 +23,7 @@
  assert opt.fp16, "fully-fused mode must be used with fp16 mode"
  from sdf.netowrk_ff import SDFNetwork
  elif opt.tcnn:
+ assert opt.fp16, "tcnn mode must be used with fp16 mode"
  from sdf.network_tcnn import SDFNetwork 
  else:
  from sdf.netowrk import SDFNetwork

diff --git a/main_tensoRF.py b/main_tensoRF.py
@@ -0,0 +1,117 @@
+import torch
+import argparse
+
+from nerf.provider import NeRFDataset
+from nerf.gui import NeRFGUI
+from tensoRF.utils import *
+
+#torch.autograd.set_detect_anomaly(True)
+
+if __name__ == '__main__':
+
+ parser = argparse.ArgumentParser()
+ parser.add_argument('path', type=str)
+ parser.add_argument('--test', action='store_true', help="test mode")
+ parser.add_argument('--workspace', type=str, default='workspace')
+ parser.add_argument('--seed', type=int, default=0)
+ ### training options
+ parser.add_argument('--batch_size', type=int, default=1) 
+ parser.add_argument('--num_rays', type=int, default=4096)
+ parser.add_argument('--cuda_ray', action='store_true', help="use CUDA raymarching instead of pytorch")
+ parser.add_argument('--l1_reg_weight', type=float, default=4e-5)
+ # (only valid when not using --cuda_ray)
+ parser.add_argument('--num_steps', type=int, default=128)
+ parser.add_argument('--upsample_steps', type=int, default=128)
+ parser.add_argument('--max_ray_batch', type=int, default=4096)
+ ### network backbone options
+ parser.add_argument('--fp16', action='store_true', help="use amp mixed precision training")
+ parser.add_argument('--resolution0', type=int, default=128)
+ parser.add_argument('--resolution1', type=int, default=300)
+ parser.add_argument("--upsample_model_steps", type=int, action="append", default=[2000, 3000, 4000, 5500, 7000])
+ ### dataset options
+ parser.add_argument('--mode', type=str, default='colmap', help="dataset mode, supports (colmap, blender)")
+ parser.add_argument('--preload', action='store_true', help="preload all data into GPU, fasten training but use more GPU memory")
+ # (default is for the fox dataset)
+ parser.add_argument('--bound', type=float, default=2, help="assume the scene is bounded in box(-bound, bound)")
+ parser.add_argument('--scale', type=float, default=0.33, help="scale camera location into box(-bound, bound)")
+ ### GUI options
+ parser.add_argument('--gui', action='store_true', help="start a GUI")
+ parser.add_argument('--W', type=int, default=800, help="GUI width")
+ parser.add_argument('--H', type=int, default=800, help="GUI height")
+ parser.add_argument('--radius', type=float, default=5, help="default GUI camera radius from center")
+ parser.add_argument('--fovy', type=float, default=90, help="default GUI camera fovy")
+ parser.add_argument('--max_spp', type=int, default=64, help="GUI rendering max sample per pixel")
+
+ opt = parser.parse_args()
+ print(opt)
+
+ seed_everything(opt.seed)
+
+ from tensoRF.network import NeRFNetwork
+
+ model = NeRFNetwork(
+ resolution=[opt.resolution0] * 3,
+ bound=opt.bound,
+ cuda_ray=opt.cuda_ray,
+ )
+
+ print(model)
+
+ criterion = torch.nn.MSELoss()
+
+ ### test mode
+ if opt.test:
+
+ trainer = Trainer('ngp', vars(opt), model, workspace=opt.workspace, criterion=criterion, fp16=opt.fp16, metrics=[PSNRMeter()], use_checkpoint='latest')
+
+ if opt.gui:
+ gui = NeRFGUI(opt, trainer)
+ gui.render()
+
+ else:
+ test_dataset = NeRFDataset(opt.path, type='test', mode=opt.mode, scale=opt.scale, preload=opt.preload)
+ test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=1, pin_memory=True)
+
+ if opt.mode == 'blender':
+ trainer.evaluate(test_loader) # blender has gt, so evaluate it.
+ else:
+ trainer.test(test_loader) # colmap doesn't have gt, so just test.
+
+ else:
+
+ optimizer = lambda model: torch.optim.Adam(model.get_params(2e-2, 1e-3), betas=(0.9, 0.99), eps=1e-15)
+
+ # need different milestones for GUI/CMD mode.
+ scheduler = lambda optimizer: optim.lr_scheduler.MultiStepLR(optimizer, milestones=[1000, 2000] if opt.gui else [100, 200], gamma=0.33)
+
+ trainer = Trainer('ngp', vars(opt), model, workspace=opt.workspace, optimizer=optimizer, criterion=criterion, ema_decay=None, fp16=opt.fp16, lr_scheduler=scheduler, metrics=[PSNRMeter()], use_checkpoint='latest', eval_interval=50)
+
+ # calc upsample target resolutions
+ upsample_resolutions = (np.round(np.exp(np.linspace(np.log(opt.resolution0), np.log(opt.resolution1), len(opt.upsample_model_steps) + 1)))).astype(np.int32).tolist()[1:]
+ print('upsample_resolutions:', upsample_resolutions)
+ trainer.upsample_resolutions = upsample_resolutions
+
+ if opt.gui:
+ train_dataset = NeRFDataset(opt.path, type='all', mode=opt.mode, scale=opt.scale, preload=opt.preload)
+ train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=opt.batch_size, shuffle=True, pin_memory=True)
+ trainer.train_loader = train_loader # attach dataloader to trainer
+
+ gui = NeRFGUI(opt, trainer)
+ gui.render()
+
+ else:
+ train_dataset = NeRFDataset(opt.path, type='train', mode=opt.mode, scale=opt.scale, preload=opt.preload)
+ train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=opt.batch_size, shuffle=True, pin_memory=True)
+ valid_dataset = NeRFDataset(opt.path, type='val', mode=opt.mode, downscale=2, scale=opt.scale, preload=opt.preload)
+ valid_loader = torch.utils.data.DataLoader(valid_dataset, batch_size=1, pin_memory=True)
+
+ trainer.train(train_loader, valid_loader, 300)
+
+ # also test
+ test_dataset = NeRFDataset(opt.path, type='test', mode=opt.mode, scale=opt.scale, preload=opt.preload)
+ test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=1, pin_memory=True)
+
+ if opt.mode == 'blender':
+ trainer.evaluate(test_loader) # blender has gt, so evaluate it.
+ else:
+ trainer.test(test_loader) # colmap doesn't have gt, so just test.
diff --git a/main_tensorf.py b/main_tensorf.py
@@ -0,0 +1,136 @@
+import torch
+import argparse
+
+from tensorf.provider import NeRFDataset
+from tensorf.utils import *
+
+#torch.autograd.set_detect_anomaly(True)
+
+
+if __name__ == '__main__':
+
+ parser = argparse.ArgumentParser()
+ parser.add_argument('path', type=str)
+ parser.add_argument('--test', action='store_true', help="test mode")
+ parser.add_argument('--workspace', type=str, default='workspace')
+ parser.add_argument('--seed', type=int, default=0)
+ ### training options
+ parser.add_argument('--num_rays', type=int, default=4096)
+ parser.add_argument('--num_steps', type=int, default=128)
+ parser.add_argument('--upsample_steps', type=int, default=128)
+ parser.add_argument('--max_ray_batch', type=int, default=4096)
+ parser.add_argument('--cuda_ray', action='store_true', help="use CUDA raymarching instead of pytorch")
+ ### dataset options
+ parser.add_argument('--mode', type=str, default='blender', help="dataset mode, supports (colmap, blender)")
+ parser.add_argument('--preload', action='store_true', help="preload all data into GPU, fasten training but use more GPU memory")
+ parser.add_argument('--bound', type=float, default=1.5, help="assume the scene is bounded in box(-bound, bound)")
+ parser.add_argument('--scale', type=float, default=1.0, help="scale camera location into box(-bound, bound)")
+ ### tensorf options
+ parser.add_argument('--fp16', action='store_true', help="use amp mixed precision training")
+ parser.add_argument("--lr_init", type=float, default=2e-2, help='learning rate') 
+ parser.add_argument("--lr_basis", type=float, default=1e-3, help='learning rate')
+ parser.add_argument('--N_voxel_init', type=int, default=128**3)
+ parser.add_argument('--N_voxel_final', type=int, default=300**3)
+ parser.add_argument("--upsamp_list", type=int, action="append", default=[2000,3000,4000,5500,7000])
+ parser.add_argument("--update_AlphaMask_list", type=int, action="append", default=[2000,4000])
+ parser.add_argument('--lindisp', default=False, action="store_true", help='use disparity depth sampling')
+ parser.add_argument("--perturb", type=float, default=1., help='set to 0. for no jitter, 1. for jitter')
+ parser.add_argument("--accumulate_decay", type=float, default=0.998)
+ parser.add_argument("--fea2denseAct", type=str, default='relu')
+ parser.add_argument('--ndc_ray', type=int, default=0)
+ parser.add_argument('--nSamples', type=int, default=1e6, help='sample point each ray, pass 1e6 if automatic adjust')
+ parser.add_argument('--step_ratio',type=float,default=0.5)
+ parser.add_argument("--L1_weight_inital", type=float, default=8e-5, help='loss weight')
+ parser.add_argument("--L1_weight_rest", type=float, default=4e-5, help='loss weight')
+ #parser.add_argument("--Ortho_weight", type=float, default=0.0, help='loss weight')
+ #parser.add_argument("--TV_weight_density", type=float, default=0.0, help='loss weight')
+ #parser.add_argument("--TV_weight_app", type=float, default=0.0, help='loss weight')
+ # volume options
+ parser.add_argument("--n_lamb_sigma", type=int, action="append", default=[16, 16, 16])
+ parser.add_argument("--n_lamb_sh", type=int, action="append", default=[48, 48, 48])
+ parser.add_argument("--data_dim_color", type=int, default=27)
+ parser.add_argument("--rm_weight_mask_thre", type=float, default=0.0001, help='mask points in ray marching')
+ parser.add_argument("--alpha_mask_thre", type=float, default=0.08, help='threshold for creating alpha mask volume')
+ parser.add_argument("--distance_scale", type=float, default=25, help='scaling sampling distance for computation')
+ parser.add_argument("--density_shift", type=float, default=-10, help='shift density in softplus; making density = 0 when feature == 0')
+ # network decoder
+ parser.add_argument("--shadingMode", type=str, default="MLP_Fea", help='which shading mode to use')
+ parser.add_argument("--pos_pe", type=int, default=6, help='number of pe for pos')
+ parser.add_argument("--view_pe", type=int, default=2, help='number of pe for view')
+ parser.add_argument("--fea_pe", type=int, default=2, help='number of pe for features')
+ parser.add_argument("--featureC", type=int, default=128, help='hidden feature channel in MLP')
+
+ opt = parser.parse_args()
+ print(opt)
+
+ seed_everything(opt.seed)
+
+ from tensorf.network import TensorVMSplit
+
+ device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
+
+ aabb = (torch.tensor([[-1.0, -1.0, -1.0], [1.0, 1.0, 1.0]]) * opt.bound).to(device)
+ reso_cur = N_to_reso(opt.N_voxel_init, aabb)
+ nSamples = min(opt.nSamples, cal_n_samples(reso_cur, opt.step_ratio))
+ near_far = [2.0, 6.0] # fixed for blender
+ N_voxel_list = (torch.round(torch.exp(torch.linspace(np.log(opt.N_voxel_init), np.log(opt.N_voxel_final), len(opt.upsamp_list)+1))).long()).tolist()[1:]
+
+ model = TensorVMSplit(
+ aabb, reso_cur, device,
+ density_n_comp=opt.n_lamb_sigma, appearance_n_comp=opt.n_lamb_sh, 
+ app_dim=opt.data_dim_color, near_far=near_far,
+ shadingMode=opt.shadingMode, alphaMask_thres=opt.alpha_mask_thre, density_shift=opt.density_shift, distance_scale=opt.distance_scale,
+ pos_pe=opt.pos_pe, view_pe=opt.view_pe, fea_pe=opt.fea_pe, 
+ featureC=opt.featureC, step_ratio=opt.step_ratio, fea2denseAct=opt.fea2denseAct,
+ cuda_ray=opt.cuda_ray,
+ )
+
+ print(model)
+
+ criterion = torch.nn.MSELoss() # HuberLoss(delta=0.1)
+
+ ### test mode
+ if opt.test:
+
+ trainer = Trainer('tensorf', vars(opt), model, device=device, workspace=opt.workspace, criterion=criterion, fp16=opt.fp16, metrics=[PSNRMeter()], use_checkpoint='latest')
+
+ test_dataset = NeRFDataset(opt.path, type='test', mode=opt.mode, scale=opt.scale, preload=opt.preload)
+ test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=1, pin_memory=True)
+
+ if opt.mode == 'blender':
+ trainer.evaluate(test_loader) # blender has gt, so evaluate it.
+ else:
+ trainer.test(test_loader) # colmap doesn't have gt, so just test.
+
+ else:
+
+
+ optimizer = lambda model: torch.optim.Adam(model.get_optparam_groups(opt.lr_init, opt.lr_basis), betas=(0.9, 0.99))
+
+ scheduler = lambda optimizer: optim.lr_scheduler.MultiStepLR(optimizer, milestones=[100, 200], gamma=0.33)
+
+ trainer = Trainer('tensorf', vars(opt), model, device=device, workspace=opt.workspace, optimizer=optimizer, criterion=criterion, ema_decay=None, fp16=opt.fp16, lr_scheduler=scheduler, metrics=[PSNRMeter()], use_checkpoint='latest', eval_interval=50)
+
+ # attach extra things
+ trainer.aabb = aabb
+ trainer.reso_cur = reso_cur
+ trainer.nSamples = nSamples
+ trainer.near_far = near_far
+ trainer.L1_reg_weight = opt.L1_weight_inital
+ trainer.N_voxel_list = N_voxel_list
+
+ train_dataset = NeRFDataset(opt.path, type='train', mode=opt.mode, scale=opt.scale, preload=opt.preload)
+ train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=1, shuffle=True, pin_memory=True)
+ valid_dataset = NeRFDataset(opt.path, type='val', mode=opt.mode, downscale=2, scale=opt.scale, preload=opt.preload)
+ valid_loader = torch.utils.data.DataLoader(valid_dataset, batch_size=1, pin_memory=True)
+
+ trainer.train(train_loader, valid_loader, 300)
+
+ # also test
+ test_dataset = NeRFDataset(opt.path, type='test', mode=opt.mode, scale=opt.scale, preload=opt.preload)
+ test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=1, pin_memory=True)
+
+ if opt.mode == 'blender':
+ trainer.evaluate(test_loader) # blender has gt, so evaluate it.
+ else:
+ trainer.test(test_loader) # colmap doesn't have gt, so just test.