6 жил өмнө · 52b802a166
--- a/ColorizeTraining.ipynb
+++ b/ColorizeTraining.ipynb
@@ -43,12 +43,9 @@
 
															     "IMAGENET = Path('data/imagenet/ILSVRC/Data/CLS-LOC')\n",
														
 
															     "BWIMAGENET = Path('data/imagenet/ILSVRC/Data/CLS-LOC/bandw')\n",
														
 
															     "\n",
														
 
															-    "proj_id = 'colorizeESR45'\n",
														
 
															+    "proj_id = 'colorize1'\n",
														
 
															     "TENSORBOARD_PATH = Path('data/tensorboard/' + proj_id)\n",
														
 
															     "\n",
														
 
															-    "gpath = IMAGENET.parent/(proj_id + '_gen_64.h5')\n",
														
 
															-    "dpath = IMAGENET.parent/(proj_id + '_critic_64.h5')\n",
														
 
															-    "\n",
														
 
															     "torch.backends.cudnn.benchmark=True"
														
 
															    ]
														
 
															   },
														
@@ -131,7 +128,7 @@
 
															    "metadata": {},
														
 
															    "outputs": [],
														
 
															    "source": [
														
 
															-    "def colorize_gen_learner_exp(data:ImageDataBunch, gen_loss=FeatureLoss4(), arch=models.resnet34):\n",
														
 
															+    "def colorize_gen_learner_exp(data:ImageDataBunch, gen_loss=FeatureLoss(), arch=models.resnet34):\n",
														
 
															     "    return unet_learner3(data, arch, wd=1e-3, blur=True, norm_type=NormType.Spectral,\n",
														
 
															     "                        self_attention=True, y_range=(-3.,3.), loss_func=gen_loss)"
														
 
															    ]
														
@@ -157,7 +154,7 @@
 
															     "learn_crit = colorize_crit_learner(data=data, nf=256)\n",
														
 
															     "learn_crit.unfreeze()\n",
														
 
															     "\n",
														
 
															-    "gen_loss = FeatureLoss4()\n",
														
 
															+    "gen_loss = FeatureLoss()\n",
														
 
															     "learn_gen = colorize_gen_learner_exp(data=data)\n",
														
 
															     "\n",
														
 
															     "switcher = partial(AdaptiveGANSwitcher, critic_thresh=0.65)\n",
														
@@ -386,6 +383,15 @@
 
															     "save()"
														
 
															    ]
														
 
															   },
														
 
															+  {
														
 
															+   "cell_type": "code",
														
 
															+   "execution_count": null,
														
 
															+   "metadata": {},
														
 
															+   "outputs": [],
														
 
															+   "source": [
														
 
															+    "load()"
														
 
															+   ]
														
 
															+  },
														
 
															   {
														
 
															    "cell_type": "markdown",
														
 
															    "metadata": {},
														
@@ -571,7 +577,7 @@
 
															    "source": [
														
 
															     "lr=lr/1.5\n",
														
 
															     "sz=224\n",
														
 
															-    "bs=bs//1.5"
														
 
															+    "bs=int(bs//1.5)"
														
 
															    ]
														
 
															   },
														
 
															   {
														
@@ -646,7 +652,94 @@
 
															    "execution_count": null,
														
 
															    "metadata": {},
														
 
															    "outputs": [],
														
 
															-   "source": []
														
 
															+   "source": [
														
 
															+    "load()"
														
 
															+   ]
														
 
															+  },
														
 
															+  {
														
 
															+   "cell_type": "markdown",
														
 
															+   "metadata": {},
														
 
															+   "source": [
														
 
															+    "## 256px"
														
 
															+   ]
														
 
															+  },
														
 
															+  {
														
 
															+   "cell_type": "code",
														
 
															+   "execution_count": null,
														
 
															+   "metadata": {},
														
 
															+   "outputs": [],
														
 
															+   "source": [
														
 
															+    "lr=lr/1.75\n",
														
 
															+    "sz=256\n",
														
 
															+    "bs=int(bs//1.5)"
														
 
															+   ]
														
 
															+  },
														
 
															+  {
														
 
															+   "cell_type": "code",
														
 
															+   "execution_count": null,
														
 
															+   "metadata": {},
														
 
															+   "outputs": [],
														
 
															+   "source": [
														
 
															+    "learn.data = get_data(sz=sz, bs=bs, keep_pct=0.1)\n",
														
 
															+    "learn_gen.freeze_to(-1)\n",
														
 
															+    "learn.fit(1,lr/10)"
														
 
															+   ]
														
 
															+  },
														
 
															+  {
														
 
															+   "cell_type": "code",
														
 
															+   "execution_count": null,
														
 
															+   "metadata": {},
														
 
															+   "outputs": [],
														
 
															+   "source": [
														
 
															+    "save()"
														
 
															+   ]
														
 
															+  },
														
 
															+  {
														
 
															+   "cell_type": "code",
														
 
															+   "execution_count": null,
														
 
															+   "metadata": {},
														
 
															+   "outputs": [],
														
 
															+   "source": [
														
 
															+    "learn.data = get_data(sz=sz, bs=bs, keep_pct=0.25)"
														
 
															+   ]
														
 
															+  },
														
 
															+  {
														
 
															+   "cell_type": "code",
														
 
															+   "execution_count": null,
														
 
															+   "metadata": {},
														
 
															+   "outputs": [],
														
 
															+   "source": [
														
 
															+    "learn_gen.freeze_to(-1)\n",
														
 
															+    "learn.fit(1,lr)"
														
 
															+   ]
														
 
															+  },
														
 
															+  {
														
 
															+   "cell_type": "code",
														
 
															+   "execution_count": null,
														
 
															+   "metadata": {},
														
 
															+   "outputs": [],
														
 
															+   "source": [
														
 
															+    "save()"
														
 
															+   ]
														
 
															+  },
														
 
															+  {
														
 
															+   "cell_type": "code",
														
 
															+   "execution_count": null,
														
 
															+   "metadata": {},
														
 
															+   "outputs": [],
														
 
															+   "source": [
														
 
															+    "learn_gen.unfreeze()\n",
														
 
															+    "learn.fit(1,lr*unfreeze_fctr)"
														
 
															+   ]
														
 
															+  },
														
 
															+  {
														
 
															+   "cell_type": "code",
														
 
															+   "execution_count": null,
														
 
															+   "metadata": {},
														
 
															+   "outputs": [],
														
 
															+   "source": [
														
 
															+    "save()"
														
 
															+   ]
														
 
															   },
														
 
															   {
														
 
															    "cell_type": "code",
														
--- a/fasterai/filters.py
+++ b/fasterai/filters.py
@@ -30,7 +30,7 @@ class BaseFilter(IFilter):
 
															         #a simple stretch to fit a square really makes a big difference in rendering quality/consistency.
														
 
															         #I've tried padding to the square as well (reflect, symetric, constant, etc).  Not as good!
														
 
															         targ_sz = (targ, targ)
														
 
															-        return orig.resize(targ_sz, resample=PIL.Image.BILINEAR).convert('RGB')
														
 
															+        return orig.resize(targ_sz, resample=PIL.Image.BILINEAR)
														
 
															     def _get_model_ready_image(self, orig:PilImage, sz:int)->PilImage:
														
 
															         result = self._scale_to_square(orig, sz)
														
@@ -51,7 +51,7 @@ class BaseFilter(IFilter):
 
															     def _unsquare(self, image:PilImage, orig:PilImage)->PilImage:
														
 
															         targ_sz = orig.size
														
 
															-        image = image.resize(targ_sz, resample=PIL.Image.BILINEAR).convert('RGB')
														
 
															+        image = image.resize(targ_sz, resample=PIL.Image.BILINEAR)
														
 
															         return image
														
@@ -64,6 +64,7 @@ class ColorizerFilter(BaseFilter):
 
															     def filter(self, orig_image:PilImage, filtered_image:PilImage, render_factor:int)->PilImage:
														
 
															         render_sz = render_factor * self.render_base
														
 
															         model_image = self._model_process(orig=filtered_image, sz=render_sz)
														
 
															+
														
 
															         if self.map_to_orig:
														
 
															             return self._post_process(model_image, orig_image)
														
 
															         else:
														
--- a/fasterai/loss.py
+++ b/fasterai/loss.py
@@ -5,162 +5,8 @@ from fastai.callbacks  import hook_outputs
 
															 import torchvision.models as models
														
 
															-class FeatureLoss(nn.Module):
														
 
															-    def __init__(self, layer_wgts:[float]=[5.0,15.0,2.0], gram_wgt:float=5e3):
														
 
															-        super().__init__()
														
 
															-        self.gram_wgt = gram_wgt
														
 
															-        self.base_loss = F.l1_loss
														
 
															-        self.m_feat = models.vgg16_bn(True).features.cuda().eval()
														
 
															-        requires_grad(self.m_feat, False)
														
 
															-        blocks = [i-1 for i,o in enumerate(children(self.m_feat)) if isinstance(o,nn.MaxPool2d)]
														
 
															-        layer_ids = blocks[2:5]
														
 
															-        self.loss_features = [self.m_feat[i] for i in layer_ids]
														
 
															-        self.hooks = hook_outputs(self.loss_features, detach=False)
														
 
															-        self.wgts = layer_wgts
														
 
															-        self.metric_names = ['pixel',] + [f'feat_{i}' for i in range(len(layer_ids))
														
 
															-              ] + [f'gram_{i}' for i in range(len(layer_ids))]
														
 
															-
														
 
															-    def _gram_matrix(self, x:torch.Tensor):
														
 
															-        n,c,h,w = x.size()
														
 
															-        x = x.view(n, c, -1)
														
 
															-        return (x @ x.transpose(1,2))/(c*h*w)
														
 
															-
														
 
															-    def make_features(self, x:torch.Tensor, clone=False):
														
 
															-        self.m_feat(x)
														
 
															-        return [(o.clone() if clone else o) for o in self.hooks.stored]
														
 
															-    
														
 
															-    def forward(self, input:torch.Tensor, target:torch.Tensor):
														
 
															-        out_feat = self.make_features(target, clone=True)
														
 
															-        in_feat = self.make_features(input)
														
 
															-        self.feat_losses = [self.base_loss(f_in, f_out)*w
														
 
															-                             for f_in, f_out, w in zip(in_feat, out_feat, self.wgts)]
														
 
															-
														
 
															-        self.feat_losses += [self.base_loss(input,target)]
														
 
															-
														
 
															-        self.feat_losses += [self.base_loss(self._gram_matrix(f_in), self._gram_matrix(f_out))*w**2 * self.gram_wgt
														
 
															-                             for f_in, f_out, w in zip(in_feat, out_feat, self.wgts)]
														
 
															-                             
														
 
															-        self.metrics = dict(zip(self.metric_names, self.feat_losses))
														
 
															-        return sum(self.feat_losses)
														
 
															-    
														
 
															-    def __del__(self): 
														
 
															-        self.hooks.remove()
														
 
															-
														
 
															-
														
 
															-
														
 
															-class FeatureLoss2(nn.Module):
														
 
															-    def __init__(self, layer_wgts:[float]=[20.0,70.0,10.0], gram_wgt:float=5e3):
														
 
															-        super().__init__()
														
 
															-        self.gram_wgt = gram_wgt
														
 
															-        self.base_loss = F.l1_loss
														
 
															-        self.m_feat = models.vgg16_bn(True).features.cuda().eval()
														
 
															-        requires_grad(self.m_feat, False)
														
 
															-        blocks = [i-1 for i,o in enumerate(children(self.m_feat)) if isinstance(o,nn.MaxPool2d)]
														
 
															-        layer_ids = blocks[2:5]
														
 
															-        self.loss_features = [self.m_feat[i] for i in layer_ids]
														
 
															-        self.hooks = hook_outputs(self.loss_features, detach=False)
														
 
															-        self.wgts = layer_wgts
														
 
															-        self.metric_names = ['pixel',] + [f'feat_{i}' for i in range(len(layer_ids))
														
 
															-              ] + [f'gram_{i}' for i in range(len(layer_ids))]
														
 
															-
														
 
															-    def _gram_matrix(self, x:torch.Tensor):
														
 
															-        n,c,h,w = x.size()
														
 
															-        x = x.view(n, c, -1)
														
 
															-        return (x @ x.transpose(1,2))/(c*h*w)
														
 
															-
														
 
															-    def make_features(self, x:torch.Tensor, clone=False):
														
 
															-        self.m_feat(x)
														
 
															-        return [(o.clone() if clone else o) for o in self.hooks.stored]
														
 
															-    
														
 
															-    def forward(self, input:torch.Tensor, target:torch.Tensor):
														
 
															-        out_feat = self.make_features(target, clone=True)
														
 
															-        in_feat = self.make_features(input)
														
 
															-        self.feat_losses = [self.base_loss(f_in, f_out)*w
														
 
															-                             for f_in, f_out, w in zip(in_feat, out_feat, self.wgts)]
														
 
															-
														
 
															-        self.feat_losses += [self.base_loss(input,target)*100]
														
 
															-
														
 
															-        self.feat_losses += [self.base_loss(self._gram_matrix(f_in), self._gram_matrix(f_out))*w**2 * self.gram_wgt
														
 
															-                             for f_in, f_out, w in zip(in_feat, out_feat, self.wgts)]
														
 
															-                             
														
 
															-        self.metrics = dict(zip(self.metric_names, self.feat_losses))
														
 
															-        return sum(self.feat_losses)
														
 
															-    
														
 
															-    def __del__(self): 
														
 
															-        self.hooks.remove()
														
 
															-
														
 
															-
														
 
															-#Includes wasserstein loss
														
 
															-class FeatureLoss3(nn.Module):
														
 
															-    def __init__(self, layer_wgts=[5,15,2], wass_wgts=[3.0,0.7,0.01]):
														
 
															-        super().__init__()
														
 
															-
														
 
															-        self.m_feat = models.vgg16_bn(True).features.cuda().eval()
														
 
															-        requires_grad(self.m_feat, False)
														
 
															-        blocks = [i-1 for i,o in enumerate(children(self.m_feat)) if isinstance(o,nn.MaxPool2d)]
														
 
															-        layer_ids = blocks[2:5]
														
 
															-        self.loss_features = [self.m_feat[i] for i in layer_ids]
														
 
															-        self.hooks = hook_outputs(self.loss_features, detach=False)
														
 
															-        self.wgts = layer_wgts
														
 
															-        self.wass_wgts = wass_wgts
														
 
															-        self.metric_names = ['pixel',] + [f'feat_{i}' for i in range(len(layer_ids))
														
 
															-              ] + [f'wass_{i}' for i in range(len(layer_ids))]
														
 
															-        self.base_loss = F.l1_loss
														
 
															-
														
 
															-    def _make_features(self, x, clone=False):
														
 
															-        self.m_feat(x)
														
 
															-        return [(o.clone() if clone else o) for o in self.hooks.stored]
														
 
															-
														
 
															-    def _calc_2_moments(self, tensor):
														
 
															-        chans = tensor.shape[1]
														
 
															-        tensor = tensor.view(1, chans, -1)
														
 
															-        n = tensor.shape[2] 
														
 
															-        mu = tensor.mean(2)
														
 
															-        tensor = (tensor - mu[:,:,None]).squeeze(0)
														
 
															-        cov = torch.mm(tensor, tensor.t()) / float(n)   
														
 
															-        return mu, cov
														
 
															-
														
 
															-    def _get_style_vals(self, tensor):
														
 
															-        mean, cov = self._calc_2_moments(tensor) 
														
 
															-        eigvals, eigvects = torch.symeig(cov, eigenvectors=True)
														
 
															-        eigroot_mat = torch.diag(torch.sqrt(eigvals.clamp(min=0)))     
														
 
															-        root_cov = torch.mm(torch.mm(eigvects, eigroot_mat), eigvects.t())  
														
 
															-        tr_cov = eigvals.clamp(min=0).sum() 
														
 
															-        return mean, tr_cov, root_cov
														
 
															-
														
 
															-    def _calc_l2wass_dist(self, mean_stl, tr_cov_stl, root_cov_stl, mean_synth, cov_synth):
														
 
															-        tr_cov_synth = torch.symeig(cov_synth, eigenvectors=True)[0].clamp(min=0).sum()
														
 
															-        mean_diff_squared = (mean_stl - mean_synth).pow(2).sum()
														
 
															-        cov_prod = torch.mm(torch.mm(root_cov_stl, cov_synth), root_cov_stl)
														
 
															-        var_overlap = torch.sqrt(torch.symeig(cov_prod, eigenvectors=True)[0].clamp(min=0)+1e-8).sum()
														
 
															-        dist = mean_diff_squared + tr_cov_stl + tr_cov_synth - 2*var_overlap
														
 
															-        return dist
														
 
															-
														
 
															-    def _single_wass_loss(self, pred, targ):
														
 
															-        mean_test, tr_cov_test, root_cov_test = targ
														
 
															-        mean_synth, cov_synth = self._calc_2_moments(pred)
														
 
															-        loss = self._calc_l2wass_dist(mean_test, tr_cov_test, root_cov_test, mean_synth, cov_synth)
														
 
															-        return loss
														
 
															-    
														
 
															-    def forward(self, input, target):
														
 
															-        out_feat = self._make_features(target, clone=True)
														
 
															-        in_feat = self._make_features(input)
														
 
															-        self.feat_losses = [self.base_loss(input,target)]
														
 
															-        self.feat_losses += [self.base_loss(f_in, f_out)*w
														
 
															-                             for f_in, f_out, w in zip(in_feat, out_feat, self.wgts)]
														
 
															-        
														
 
															-        styles = [self._get_style_vals(i) for i in out_feat]
														
 
															-        self.feat_losses += [self._single_wass_loss(f_pred, f_targ)*w
														
 
															-                            for f_pred, f_targ, w in zip(in_feat, styles, self.wass_wgts)]
														
 
															-        
														
 
															-        self.metrics = dict(zip(self.metric_names, self.feat_losses))
														
 
															-        return sum(self.feat_losses)
														
 
															-    
														
 
															-    def __del__(self): self.hooks.remove()
														
 
															-
														
 
															-
														
 
															 #"Before activations" in ESRGAN paper
														
 
															-class FeatureLoss4(nn.Module):
														
 
															+class FeatureLoss(nn.Module):
														
 
															     def __init__(self, layer_wgts=[5,15,2]):
														
 
															         super().__init__()
														
@@ -188,4 +34,5 @@ class FeatureLoss4(nn.Module):
 
															         self.metrics = dict(zip(self.metric_names, self.feat_losses))
														
 
															         return sum(self.feat_losses)
														
 
															-    def __del__(self): self.hooks.remove()
														
 
															+    def __del__(self): self.hooks.remove()
														
 
															+
														
--- a/fasterai/tensorboard.py
+++ b/fasterai/tensorboard.py
@@ -10,6 +10,7 @@ import torchvision.utils as vutils
 
															 from tensorboardX import SummaryWriter
														
 
															+
														
 
															 class ModelGraphVisualizer():
														
 
															     def __init__(self):
														
 
															         return 
														
@@ -26,10 +27,10 @@ class ModelHistogramVisualizer():
 
															     def __init__(self):
														
 
															         return 
														
 
															-    def write_tensorboard_histograms(self, model:nn.Module, iter_count:int, tbwriter:SummaryWriter, name:str='model'):
														
 
															+    def write_tensorboard_histograms(self, model:nn.Module, iteration:int, tbwriter:SummaryWriter, name:str='model'):
														
 
															         try:
														
 
															             for param_name, param in model.named_parameters():
														
 
															-                tbwriter.add_histogram(name + '/weights/' + param_name, param, iter_count)
														
 
															+                tbwriter.add_histogram(name + '/weights/' + param_name, param, iteration)
														
 
															         except Exception as e:
														
 
															             print(("Failed to update histogram for model:  {0}").format(e))
														
@@ -38,7 +39,7 @@ class ModelStatsVisualizer():
 
															     def __init__(self):
														
 
															         return 
														
 
															-    def write_tensorboard_stats(self, model:nn.Module, iter_count:int, tbwriter:SummaryWriter, name:str='model'):
														
 
															+    def write_tensorboard_stats(self, model:nn.Module, iteration:int, tbwriter:SummaryWriter, name:str='model_stats'):
														
 
															         try:
														
 
															             gradients = [x.grad  for x in model.parameters() if x.grad is not None]
														
 
															             gradient_nps = [to_np(x.data) for x in gradients]
														
@@ -47,45 +48,45 @@ class ModelStatsVisualizer():
 
															                 return 
														
 
															             avg_norm = sum(x.data.norm() for x in gradients)/len(gradients)
														
 
															-            tbwriter.add_scalar(name + '/gradients/avg_norm', avg_norm, iter_count)
														
 
															+            tbwriter.add_scalar(name + '/gradients/avg_norm', avg_norm, iteration)
														
 
															             median_norm = statistics.median(x.data.norm() for x in gradients)
														
 
															-            tbwriter.add_scalar(name + '/gradients/median_norm', median_norm, iter_count)
														
 
															+            tbwriter.add_scalar(name + '/gradients/median_norm', median_norm, iteration)
														
 
															             max_norm = max(x.data.norm() for x in gradients)
														
 
															-            tbwriter.add_scalar(name + '/gradients/max_norm', max_norm, iter_count)
														
 
															+            tbwriter.add_scalar(name + '/gradients/max_norm', max_norm, iteration)
														
 
															             min_norm = min(x.data.norm() for x in gradients)
														
 
															-            tbwriter.add_scalar(name + '/gradients/min_norm', min_norm, iter_count)
														
 
															+            tbwriter.add_scalar(name + '/gradients/min_norm', min_norm, iteration)
														
 
															             num_zeros = sum((np.asarray(x)==0.0).sum() for x in  gradient_nps)
														
 
															-            tbwriter.add_scalar(name + '/gradients/num_zeros', num_zeros, iter_count)
														
 
															+            tbwriter.add_scalar(name + '/gradients/num_zeros', num_zeros, iteration)
														
 
															             avg_gradient= sum(x.data.mean() for x in gradients)/len(gradients)
														
 
															-            tbwriter.add_scalar(name + '/gradients/avg_gradient', avg_gradient, iter_count)
														
 
															+            tbwriter.add_scalar(name + '/gradients/avg_gradient', avg_gradient, iteration)
														
 
															             median_gradient = statistics.median(x.data.median() for x in gradients)
														
 
															-            tbwriter.add_scalar(name + '/gradients/median_gradient', median_gradient, iter_count)
														
 
															+            tbwriter.add_scalar(name + '/gradients/median_gradient', median_gradient, iteration)
														
 
															             max_gradient = max(x.data.max() for x in gradients) 
														
 
															-            tbwriter.add_scalar(name + '/gradients/max_gradient', max_gradient, iter_count)
														
 
															+            tbwriter.add_scalar(name + '/gradients/max_gradient', max_gradient, iteration)
														
 
															             min_gradient = min(x.data.min() for x in gradients) 
														
 
															-            tbwriter.add_scalar(name + '/gradients/min_gradient', min_gradient, iter_count)
														
 
															+            tbwriter.add_scalar(name + '/gradients/min_gradient', min_gradient, iteration)
														
 
															         except Exception as e:
														
 
															             print(("Failed to update tensorboard stats for model:  {0}").format(e))
														
 
															 class ImageGenVisualizer():
														
 
															-    def output_image_gen_visuals(self, learn:Learner, trn_batch:Tuple, val_batch:Tuple, iter_count:int, tbwriter:SummaryWriter):
														
 
															-        self._output_visuals(learn=learn, batch=val_batch, iter_count=iter_count, tbwriter=tbwriter, ds_type=DatasetType.Valid)
														
 
															-        self._output_visuals(learn=learn, batch=trn_batch, iter_count=iter_count, tbwriter=tbwriter, ds_type=DatasetType.Train)
														
 
															+    def output_image_gen_visuals(self, learn:Learner, trn_batch:Tuple, val_batch:Tuple, iteration:int, tbwriter:SummaryWriter):
														
 
															+        self._output_visuals(learn=learn, batch=val_batch, iteration=iteration, tbwriter=tbwriter, ds_type=DatasetType.Valid)
														
 
															+        self._output_visuals(learn=learn, batch=trn_batch, iteration=iteration, tbwriter=tbwriter, ds_type=DatasetType.Train)
														
 
															-    def _output_visuals(self, learn:Learner, batch:Tuple, iter_count:int, tbwriter:SummaryWriter, ds_type: DatasetType):
														
 
															+    def _output_visuals(self, learn:Learner, batch:Tuple, iteration:int, tbwriter:SummaryWriter, ds_type: DatasetType):
														
 
															         image_sets = ModelImageSet.get_list_from_model(learn=learn, batch=batch, ds_type=ds_type)
														
 
															-        self._write_tensorboard_images(image_sets=image_sets, iter_count=iter_count, tbwriter=tbwriter, ds_type=ds_type)
														
 
															+        self._write_tensorboard_images(image_sets=image_sets, iteration=iteration, tbwriter=tbwriter, ds_type=ds_type)
														
 
															-    def _write_tensorboard_images(self, image_sets:[ModelImageSet], iter_count:int, tbwriter:SummaryWriter, ds_type: DatasetType):
														
 
															+    def _write_tensorboard_images(self, image_sets:[ModelImageSet], iteration:int, tbwriter:SummaryWriter, ds_type: DatasetType):
														
 
															         try:
														
 
															             orig_images = []
														
 
															             gen_images = []
														
@@ -98,17 +99,15 @@ class ImageGenVisualizer():
 
															             prefix = str(ds_type)
														
 
															-            tbwriter.add_image(prefix + ' orig images', vutils.make_grid(orig_images, normalize=True), iter_count)
														
 
															-            tbwriter.add_image(prefix + ' gen images', vutils.make_grid(gen_images, normalize=True), iter_count)
														
 
															-            tbwriter.add_image(prefix + ' real images', vutils.make_grid(real_images, normalize=True), iter_count)
														
 
															+            tbwriter.add_image(prefix + ' orig images', vutils.make_grid(orig_images, normalize=True), iteration)
														
 
															+            tbwriter.add_image(prefix + ' gen images', vutils.make_grid(gen_images, normalize=True), iteration)
														
 
															+            tbwriter.add_image(prefix + ' real images', vutils.make_grid(real_images, normalize=True), iteration)
														
 
															         except Exception as e:
														
 
															             print(("Failed to update tensorboard images for model:  {0}").format(e))
														
 
															 #--------Below are what you actually want ot use, in practice----------------#
														
 
															-
														
 
															-
														
 
															 class LearnerTensorboardWriter(LearnerCallback):
														
 
															     def __init__(self, learn:Learner, base_dir:Path, name:str, loss_iters:int=25, weight_iters:int=1000, stats_iters:int=1000):
														
 
															         super().__init__(learn=learn)
														
@@ -122,6 +121,7 @@ class LearnerTensorboardWriter(LearnerCallback):
 
															         self.weight_vis = ModelHistogramVisualizer()
														
 
															         self.model_vis = ModelStatsVisualizer() 
														
 
															         self.data = None
														
 
															+        self.metrics_root = '/metrics/'
														
 
															     def _update_batches_if_needed(self):
														
 
															         #one_batch function is extremely slow.  this is an optimization
														
@@ -133,35 +133,26 @@ class LearnerTensorboardWriter(LearnerCallback):
 
															             self.val_batch = self.learn.data.one_batch(DatasetType.Valid, detach=True, denorm=False, cpu=False)
														
 
															     def _write_model_stats(self, iteration):
														
 
															-        self.model_vis.write_tensorboard_stats(model=self.learn.model, iter_count=iteration, tbwriter=self.tbwriter) 
														
 
															+        self.model_vis.write_tensorboard_stats(model=self.learn.model, iteration=iteration, tbwriter=self.tbwriter) 
														
 
															     def _write_training_loss(self, iteration, last_loss):
														
 
															         trn_loss = to_np(last_loss)
														
 
															-        self.tbwriter.add_scalar('/loss/trn_loss', trn_loss, iteration)
														
 
															+        self.tbwriter.add_scalar(self.metrics_root + 'train_loss', trn_loss, iteration)
														
 
															     def _write_weight_histograms(self, iteration):
														
 
															-        self.weight_vis.write_tensorboard_histograms(model=self.learn.model, iter_count=iteration, tbwriter=self.tbwriter)
														
 
															+        self.weight_vis.write_tensorboard_histograms(model=self.learn.model, iteration=iteration, tbwriter=self.tbwriter)
														
 
															-    def _write_val_loss(self, iteration, last_metrics):
														
 
															-        #TODO: Not a fan of this indexing but...what to do?
														
 
															-        val_loss = last_metrics[0]
														
 
															-        self.tbwriter.add_scalar('/loss/val_loss', val_loss, iteration)  
														
 
															-    
														
 
															-    def _write_metrics(self, iteration):
														
 
															-        rec = self.learn.recorder
														
 
															-        for i, name in enumerate(rec.names[3:]):
														
 
															-            if len(rec.metrics) == 0: continue
														
 
															-            if len(rec.metrics[-1:]) == 0: continue
														
 
															-            if len(rec.metrics[-1:][0]) == 0: continue
														
 
															-            value = rec.metrics[-1:][0][i]
														
 
															-            if value is None: continue
														
 
															-            self.tbwriter.add_scalar('/metrics/' + name, to_np(value), iteration) 
														
 
															+    def _write_metrics(self, iteration, last_metrics, start_idx:int=2):
														
 
															+        recorder = self.learn.recorder
														
 
															+        for i, name in enumerate(recorder.names[start_idx:]):
														
 
															+            if len(last_metrics) < i+1: return 
														
 
															+            value = last_metrics[i]
														
 
															+            self.tbwriter.add_scalar(self.metrics_root + name, value, iteration)  
														
 
															+  
														
 
															     def on_batch_end(self, last_loss, metrics, iteration, **kwargs):
														
 
															-        if iteration==0:
														
 
															-            return
														
 
															-
														
 
															+        if iteration==0: return
														
 
															         self._update_batches_if_needed()
														
 
															         if iteration % self.loss_iters == 0: 
														
@@ -174,8 +165,7 @@ class LearnerTensorboardWriter(LearnerCallback):
 
															             self._write_model_stats(iteration)
														
 
															     def on_epoch_end(self, metrics, last_metrics, iteration, **kwargs):
														
 
															-        self._write_val_loss(iteration, last_metrics)
														
 
															-        self._write_metrics(iteration)
														
 
															+        self._write_metrics(iteration, last_metrics)
														
 
															 class GANTensorboardWriter(LearnerTensorboardWriter):
														
@@ -186,59 +176,34 @@ class GANTensorboardWriter(LearnerTensorboardWriter):
 
															         self.visual_iters = visual_iters
														
 
															         self.img_gen_vis = ImageGenVisualizer()
														
 
															-    #override
														
 
															-    def _write_training_loss(self, iteration, last_loss):
														
 
															-        trainer = self.learn.gan_trainer
														
 
															-        recorder = trainer.recorder
														
 
															-
														
 
															-        if len(recorder.losses) > 0:      
														
 
															-            trn_loss = to_np((recorder.losses[-1:])[0])
														
 
															-            self.tbwriter.add_scalar('/loss/trn_loss', trn_loss, iteration)
														
 
															-
														
 
															     #override
														
 
															     def _write_weight_histograms(self, iteration):
														
 
															         trainer = self.learn.gan_trainer
														
 
															         generator = trainer.generator
														
 
															         critic = trainer.critic
														
 
															-
														
 
															-        self.weight_vis.write_tensorboard_histograms(model=generator, iter_count=iteration, tbwriter=self.tbwriter, name='generator')
														
 
															-        self.weight_vis.write_tensorboard_histograms(model=critic, iter_count=iteration, tbwriter=self.tbwriter, name='critic')
														
 
															+        self.weight_vis.write_tensorboard_histograms(model=generator, iteration=iteration, tbwriter=self.tbwriter, name='generator')
														
 
															+        self.weight_vis.write_tensorboard_histograms(model=critic, iteration=iteration, tbwriter=self.tbwriter, name='critic')
														
 
															     #override
														
 
															     def _write_model_stats(self, iteration):
														
 
															         trainer = self.learn.gan_trainer
														
 
															         generator = trainer.generator
														
 
															         critic = trainer.critic
														
 
															-
														
 
															-        self.model_vis.write_tensorboard_stats(model=generator, iter_count=iteration, tbwriter=self.tbwriter, name='generator')
														
 
															-        self.model_vis.write_tensorboard_stats(model=critic, iter_count=iteration, tbwriter=self.tbwriter, name='critic')
														
 
															-
														
 
															-    #override
														
 
															-    def _write_val_loss(self, iteration, last_metrics):
														
 
															-        trainer = self.learn.gan_trainer
														
 
															-        recorder = trainer.recorder 
														
 
															-
														
 
															-        if len(recorder.val_losses) > 0:
														
 
															-            val_loss = (recorder.val_losses[-1:])[0]
														
 
															-            self.tbwriter.add_scalar('/loss/val_loss', val_loss, iteration) 
														
 
															-
														
 
															+        self.model_vis.write_tensorboard_stats(model=generator, iteration=iteration, tbwriter=self.tbwriter, name='gen_model_stats')
														
 
															+        self.model_vis.write_tensorboard_stats(model=critic, iteration=iteration, tbwriter=self.tbwriter, name='crit_model_stats')
														
 
															     def _write_images(self, iteration):
														
 
															         trainer = self.learn.gan_trainer
														
 
															         recorder = trainer.recorder
														
 
															-
														
 
															         gen_mode = trainer.gen_mode
														
 
															         trainer.switch(gen_mode=True)
														
 
															         self.img_gen_vis.output_image_gen_visuals(learn=self.learn, trn_batch=self.trn_batch, val_batch=self.val_batch, 
														
 
															-                                                iter_count=iteration, tbwriter=self.tbwriter)
														
 
															+                                               iteration=iteration, tbwriter=self.tbwriter)
														
 
															         trainer.switch(gen_mode=gen_mode)
														
 
															     def on_batch_end(self, metrics, iteration, **kwargs):
														
 
															         super().on_batch_end(metrics=metrics, iteration=iteration, **kwargs)
														
 
															-
														
 
															-        if iteration==0:
														
 
															-            return
														
 
															-
														
 
															+        if iteration==0: return
														
 
															         if iteration % self.visual_iters == 0:
														
 
															             self._write_images(iteration)
														
@@ -254,7 +219,7 @@ class ImageGenTensorboardWriter(LearnerTensorboardWriter):
 
															     def _write_images(self, iteration):
														
 
															         self.img_gen_vis.output_image_gen_visuals(learn=self.learn, trn_batch=self.trn_batch, val_batch=self.val_batch, 
														
 
															-            iter_count=iteration, tbwriter=self.tbwriter)
														
 
															+            iteration=iteration, tbwriter=self.tbwriter)
														
 
															     def on_batch_end(self, metrics, iteration, **kwargs):
														
 
															         super().on_batch_end(metrics=metrics, iteration=iteration, **kwargs)