6 anos atrás · 75b3b0f775
--- a/finetune/classifier.py
+++ b/finetune/classifier.py
@@ -2,11 +2,27 @@ import chainer
 
				 import chainer.functions as F
			
 
				 import chainer.links as L
			
 
				 
			
 
				-from chainer_addons.models.base import BaseClassifier
			
 
				+from chainer_addons.models.classifier import Classifier as C
			
 
				 import logging
			
 
				 
			
 
				-class SeparateModelClassifier(BaseClassifier):
			
 
				+class Classifier(C):
			
 
				+
			
 
				+	def __init__(self, *args, **kwargs):
			
 
				+		super(Classifier, self).__init__(*args, **kwargs)
			
 
				+
			
 
				+		assert hasattr(self, "model"), \
			
 
				+			"This classifiert has no \"model\" attribute!"
			
 
				+
			
 
				+	@property
			
 
				+	def feat_size(self):
			
 
				+		if hasattr(self.model.pool, "output_dim") and self.model.pool.output_dim is not None:
			
 
				+			return self.model.pool.output_dim
			
 
				+
			
 
				+		return self.model.meta.feature_size
			
 
				+
			
 
				+class SeparateModelClassifier(Classifier):
			
 
				 	"""Classifier, that holds two separate models"""
			
 
				+
			
 
				 	def __init__(self, *args, **kwargs):
			
 
				 		super(SeparateModelClassifier, self).__init__(*args, **kwargs)
			
 
				 
			
@@ -15,9 +31,6 @@ class SeparateModelClassifier(BaseClassifier):
 
				 
			
 
				 	def init_separate_model(self):
			
 
				 
			
 
				-		assert hasattr(self, "model"), \
			
 
				-			"This classifiert has no \"model\" attribute!"
			
 
				-
			
 
				 		if hasattr(self, "separate_model"):
			
 
				 			logging.warn("Global Model already initialized! Skipping further execution!")
			
 
				 			return
			
--- a/finetune/finetuner/__init__.py
+++ b/finetune/finetuner/__init__.py
@@ -0,0 +1,2 @@
 
				+from .base import DefaultFinetuner
			
 
				+from .mpi import MPIFinetuner
			
--- a/finetune/finetuner/base.py
+++ b/finetune/finetuner/base.py
@@ -20,12 +20,6 @@ from chainer_addons.functions import smoothed_cross_entropy
 
				 from cvdatasets.annotations import AnnotationType
			
 
				 from cvdatasets.utils import new_iterator
			
 
				 
			
 
				-from finetune.core.classifier import FVEMixin
			
 
				-from finetune.core.classifier import BasePartsClassifier
			
 
				-from finetune.core.training import AlphaPoolingTrainer
			
 
				-from finetune.core.training import Trainer
			
 
				-from finetune.core.dataset import Dataset
			
 
				-
			
 
				 from functools import partial
			
 
				 from os.path import join
			
 
				 
			
@@ -36,15 +30,19 @@ def check_param_for_decay(param):
 
				 	return param.name != "alpha"
			
 
				 
			
 
				 
			
 
				+def _format_kwargs(kwargs):
			
 
				+	return " ".join([f"{key}={value}" for key, value in kwargs.items()])
			
 
				+
			
 
				 class _ModelMixin(abc.ABC):
			
 
				 	"""This mixin is responsible for optimizer creation, model creation,
			
 
				 	model wrapping around a classifier and model weights loading.
			
 
				 	"""
			
 
				 
			
 
				-	def __init__(self, classifier_cls, classifier_kwargs, *args, **kwargs):
			
 
				+	def __init__(self, classifier_cls, classifier_kwargs={}, model_kwargs={}, *args, **kwargs):
			
 
				 		super(_ModelMixin, self).__init__(*args, **kwargs)
			
 
				-		self.classifier_kwargs = classifier_kwargs
			
 
				 		self.classifier_cls = classifier_cls
			
 
				+		self.classifier_kwargs = classifier_kwargs
			
 
				+		self.model_kwargs = model_kwargs
			
 
				 
			
 
				 	def wrap_model(self, opts):
			
 
				 
			
@@ -55,10 +53,9 @@ class _ModelMixin(abc.ABC):
 
				 			loss_func=self._loss_func(opts),
			
 
				 			**kwargs)
			
 
				 
			
 
				-		kwargs_info = " ".join([f"{key}={value}" for key, value in kwargs.items()])
			
 
				 		logging.info(" ".join([
			
 
				 			f"Wrapped the model around {clf_class.__name__}",
			
 
				-			f"with kwargs: {kwargs_info}",
			
 
				+			f"with kwargs: {_format_kwargs(kwargs)}",
			
 
				 		]))
			
 
				 
			
 
				 	def _loss_func(self, opts):
			
@@ -115,12 +112,13 @@ class _ModelMixin(abc.ABC):
 
				 		self.model = ModelType.new(
			
 
				 			model_type=self.model_info.class_key,
			
 
				 			input_size=opts.input_size,
			
 
				-			pooling=opts.pooling,
			
 
				-			pooling_params=dict(
			
 
				-				init_alpha=opts.init_alpha,
			
 
				-				output_dim=8192,
			
 
				-				normalize=opts.normalize),
			
 
				-			aux_logits=False
			
 
				+			**self.model_kwargs,
			
 
				+			# pooling=opts.pooling,
			
 
				+			# pooling_params=dict(
			
 
				+			# 	init_alpha=opts.init_alpha,
			
 
				+			# 	output_dim=8192,
			
 
				+			# 	normalize=opts.normalize),
			
 
				+			# aux_logits=False
			
 
				 		)
			
 
				 
			
 
				 	def load_model_weights(self, args):
			
@@ -144,14 +142,7 @@ class _ModelMixin(abc.ABC):
 
				 				loader = partial(self.model.load_for_finetune, weights=self.weights)
			
 
				 
			
 
				 
			
 
				-		if hasattr(self.model.pool, "output_dim") and self.model.pool.output_dim is not None:
			
 
				-			feat_size = self.model.pool.output_dim
			
 
				-
			
 
				-		elif isinstance(self.clf, (BasePartsClassifier, FVEMixin)):
			
 
				-			feat_size = self.clf.outsize
			
 
				-
			
 
				-		else:
			
 
				-			feat_size = self.model.meta.feature_size
			
 
				+		feat_size = self.clf.feat_size
			
 
				 
			
 
				 		if hasattr(self.clf, "loader"):
			
 
				 			loader = self.clf.loader(loader)
			
@@ -180,10 +171,11 @@ class _DatasetMixin(abc.ABC):
 
				 			subset=subset,
			
 
				 			dataset_cls=self.dataset_cls,
			
 
				 		)
			
 
				-		if opts.use_parts:
			
 
				-			kwargs.update(dict(
			
 
				-				no_glob=opts.no_global,
			
 
				-			))
			
 
				+
			
 
				+		# if opts.use_parts:
			
 
				+		# 	kwargs.update(dict(
			
 
				+		# 		no_glob=opts.no_global,
			
 
				+		# 	))
			
 
				 
			
 
				 		if not opts.only_head:
			
 
				 			kwargs.update(dict(
			
@@ -192,13 +184,12 @@ class _DatasetMixin(abc.ABC):
 
				 				size=size,
			
 
				 				center_crop_on_val=not opts.no_center_crop_on_val,
			
 
				 
			
 
				-				# return_part_crops=args.use_parts,
			
 
				 			))
			
 
				 
			
 
				 		d = self.annot.new_dataset(**kwargs)
			
 
				 		logging.info("Loaded {} images".format(len(d)))
			
 
				 		logging.info("Data augmentation is {}abled".format("en" if augment else "dis"))
			
 
				-		logging.info("Global feature is {}used".format("not " if opts.no_global else ""))
			
 
				+		# logging.info("Global feature is {}used".format("not " if opts.no_global else ""))
			
 
				 		return d
			
 
				 
			
 
				 	def init_annotations(self, opts):
			
@@ -218,7 +209,7 @@ class _DatasetMixin(abc.ABC):
 
				 
			
 
				 		self.dataset_cls.label_shift = opts.label_shift
			
 
				 
			
 
				-		size = 112 if opts.recurrent else self.model.meta.input_size
			
 
				+		size = self.model.meta.input_size
			
 
				 
			
 
				 		self.prepare = partial(PrepareType[opts.prepare_type](self.model),
			
 
				 			swap_channels=opts.swap_channels,
			
@@ -251,16 +242,25 @@ class _TrainerMixin(abc.ABC):
 
				 	Furthermore, it implements the run method
			
 
				 	"""
			
 
				 
			
 
				-	def init_updater(self, updater_cls=StandardUpdater, updater_kwargs={}):
			
 
				-		"""Creates an updater from training iterator and the optimizer."""
			
 
				+	def __init__(self, updater_cls, updater_kwargs={}, *args, **kwargs):
			
 
				+		super(_TrainerMixin, self).__init__(*args, **kwargs)
			
 
				+		self.updater_cls = updater_cls
			
 
				+		self.updater_kwargs = updater_kwargs
			
 
				 
			
 
				-		self.updater = updater_cls(
			
 
				+	def init_updater(self):
			
 
				+		"""Creates an updater from training iterator and the optimizer."""
			
 
				+		self.updater = self.updater_cls(
			
 
				 			iterator=self.train_iter,
			
 
				 			optimizer=self.opt,
			
 
				 			device=self.device,
			
 
				-			**updater_kwargs,
			
 
				+			**self.updater_kwargs,
			
 
				+		)
			
 
				+		logging.info(" ".join([
			
 
				+			f"Using single GPU: {self.device}."
			
 
				+			f"{self.updater_cls.__name__} is initialized",
			
 
				+			f"with following kwargs: {_format_kwargs(self.updater_kwargs)}"
			
 
				+			])
			
 
				 		)
			
 
				-		logging.info(f"Using single GPU: {self.device}. {updater_cls.__name__} is initialized.")
			
 
				 
			
 
				 	def init_evaluator(self, default_name="val"):
			
 
				 		"""Creates evaluation extension from validation iterator and the classifier."""
			
@@ -272,16 +272,14 @@ class _TrainerMixin(abc.ABC):
 
				 
			
 
				 		self.evaluator.default_name = default_name
			
 
				 
			
 
				-	def run(self, opts, ex, no_observe=False):
			
 
				+	def run(self, trainer_cls, opts, *args, **kwargs):
			
 
				 
			
 
				-		trainer_cls = AlphaPoolingTrainer if opts.pooling=="alpha" else Trainer
			
 
				 		trainer = trainer_cls(
			
 
				-			ex=ex,
			
 
				 			opts=opts,
			
 
				 			updater=self.updater,
			
 
				 			evaluator=self.evaluator,
			
 
				 			weights=self.weights,
			
 
				-			no_observe=no_observe
			
 
				+			*args, **kwargs
			
 
				 		)
			
 
				 		def dump(suffix):
			
 
				 			if opts.only_eval or opts.no_snapshot:
			
@@ -309,21 +307,11 @@ class DefaultFinetuner(_ModelMixin, _DatasetMixin, _TrainerMixin):
 
				 
			
 
				 	"""
			
 
				 
			
 
				-
			
 
				 	def __init__(self, opts, *args, **kwargs):
			
 
				-		super(BaseFinetuner, self).__init__()
			
 
				+		super(DefaultFinetuner, self).__init__(*args, **kwargs)
			
 
				 
			
 
				 		self.gpu_config(opts, *args, **kwargs)
			
 
				 
			
 
				-	def gpu_config(self, opts):
			
 
				-		if -1 in opts.gpu:
			
 
				-			self.device = -1
			
 
				-		else:
			
 
				-			self.device = opts.gpu[0]
			
 
				-		cuda.get_device_from_id(self.device).use()
			
 
				-
			
 
				-	def setup(self, opts, updater_cls, updater_kwargs):
			
 
				-
			
 
				 		self.init_annotations(opts)
			
 
				 		self.init_model(opts)
			
 
				 
			
@@ -334,6 +322,13 @@ class DefaultFinetuner(_ModelMixin, _DatasetMixin, _TrainerMixin):
 
				 		self.load_model_weights(opts)
			
 
				 
			
 
				 		self.init_optimizer(opts)
			
 
				-		self.init_updater(updater_cls=updater_cls, updater_kwargs=updater_kwargs)
			
 
				+		self.init_updater()
			
 
				 		self.init_evaluator()
			
 
				 
			
 
				+	def gpu_config(self, opts, *args, **kwargs):
			
 
				+		if -1 in opts.gpu:
			
 
				+			self.device = -1
			
 
				+		else:
			
 
				+			self.device = opts.gpu[0]
			
 
				+		cuda.get_device_from_id(self.device).use()
			
 
				+
			
--- a/finetune/finetuner/mpi.py
+++ b/finetune/finetuner/mpi.py
@@ -1,6 +1,9 @@
 
				-from .base import BaseFinetuner
			
 
				+import chainermn
			
 
				+from chainermn import scatter_dataset as scatter
			
 
				 
			
 
				-class MPIFinetuner(BaseFinetuner):
			
 
				+from .base import DefaultFinetuner
			
 
				+
			
 
				+class MPIFinetuner(DefaultFinetuner):
			
 
				 
			
 
				 	@property
			
 
				 	def mpi(self):
			
@@ -21,7 +24,6 @@ class MPIFinetuner(BaseFinetuner):
 
				 
			
 
				 	def scatter_datasets(self):
			
 
				 		if self.mpi:
			
 
				-			from chainermn import scatter_dataset as scatter
			
 
				 			self.train_data = scatter(self.train_data, self.comm)
			
 
				 			self.val_data = scatter(self.val_data, self.comm)
			
 
				 
			
@@ -39,14 +41,12 @@ class MPIFinetuner(BaseFinetuner):
 
				 		super(MPIFinetuner, self).init_optimizer(opts)
			
 
				 
			
 
				 		if self.mpi:
			
 
				-			import chainermn
			
 
				 			self.opt = chainermn.create_multi_node_optimizer(self.opt, self.comm)
			
 
				 
			
 
				 	def init_evaluator(self):
			
 
				 		super(MPIFinetuner, self).init_evaluator()
			
 
				 
			
 
				 		if self.mpi:
			
 
				-			import chainermn
			
 
				 			self.evaluator = chainermn.create_multi_node_evaluator(
			
 
				 				self.evaluator, self.comm)
			
 
				 
			
--- a/finetune/parser.py
+++ b/finetune/parser.py
@@ -0,0 +1,77 @@
 
				+import os
			
 
				+
			
 
				+from chainer_addons.training import OptimizerType
			
 
				+from chainer_addons.models import PrepareType
			
 
				+
			
 
				+from cvargparse import Arg, ArgFactory
			
 
				+from cvdatasets.utils import read_info_file
			
 
				+
			
 
				+DEFAULT_INFO_FILE=os.environ.get("DATA", "/home/korsch/Data/info.yml")
			
 
				+
			
 
				+info_file = read_info_file(DEFAULT_INFO_FILE)
			
 
				+
			
 
				+def default_factory(extra_list=[]):
			
 
				+	return ArgFactory(extra_list + [
			
 
				+
			
 
				+			Arg("data", default=DEFAULT_INFO_FILE),
			
 
				+
			
 
				+			Arg("dataset", choices=info_file.DATASETS.keys()),
			
 
				+			Arg("parts", choices=info_file.PARTS.keys()),
			
 
				+			Arg("--model_type", "-mt",
			
 
				+				default="resnet", choices=info_file.MODELS.keys(),
			
 
				+				help="type of the model"),
			
 
				+
			
 
				+			Arg("--input_size", type=int, nargs="+", default=0,
			
 
				+				help="overrides default input size of the model, if greater than 0"),
			
 
				+
			
 
				+			PrepareType.as_arg("prepare_type",
			
 
				+				help_text="type of image preprocessing"),
			
 
				+
			
 
				+			Arg("--load", type=str, help="ignore weights and load already fine-tuned model"),
			
 
				+
			
 
				+			Arg("--n_jobs", "-j", type=int, default=0,
			
 
				+				help="number of loading processes. If 0, then images are loaded in the same process"),
			
 
				+
			
 
				+			Arg("--warm_up", type=int, help="warm up epochs"),
			
 
				+
			
 
				+			OptimizerType.as_arg("optimizer", "opt",
			
 
				+				help_text="type of the optimizer"),
			
 
				+
			
 
				+			Arg("--cosine_schedule", action="store_true",
			
 
				+				help="enable cosine annealing LR schedule"),
			
 
				+
			
 
				+			Arg("--l1_loss", action="store_true",
			
 
				+				help="(only with \"--only_head\" option!) use L1 Hinge Loss instead of Softmax Cross-Entropy"),
			
 
				+
			
 
				+			Arg("--from_scratch", action="store_true",
			
 
				+				help="Do not load any weights. Train the model from scratch"),
			
 
				+
			
 
				+			Arg("--label_shift", type=int, default=1,
			
 
				+				help="label shift"),
			
 
				+
			
 
				+			Arg("--swap_channels", action="store_true",
			
 
				+				help="preprocessing option: swap channels from RGB to BGR"),
			
 
				+
			
 
				+			Arg("--label_smoothing", type=float, default=0,
			
 
				+				help="Factor for label smoothing"),
			
 
				+
			
 
				+			Arg("--no_center_crop_on_val", action="store_true",
			
 
				+				help="do not center crop imaages in the validation step!"),
			
 
				+
			
 
				+			Arg("--only_head", action="store_true", help="fine-tune only last layer"),
			
 
				+			Arg("--no_progress", action="store_true", help="dont show progress bar"),
			
 
				+			Arg("--augment", action="store_true", help="do data augmentation (random croping and random hor. flipping)"),
			
 
				+			Arg("--force_load", action="store_true", help="force loading from caffe model"),
			
 
				+			Arg("--only_eval", action="store_true", help="evaluate the model only. do not train!"),
			
 
				+			Arg("--init_eval", action="store_true", help="evaluate the model before training"),
			
 
				+			Arg("--no_snapshot", action="store_true", help="do not save trained model"),
			
 
				+
			
 
				+			Arg("--output", "-o", type=str, default=".out", help="output folder"),
			
 
				+
			
 
				+		])\
			
 
				+		.seed()\
			
 
				+		.batch_size()\
			
 
				+		.epochs()\
			
 
				+		.debug()\
			
 
				+		.learning_rate(lr=1e-2, lrs=10, lrt=1e-5, lrd=1e-1)\
			
 
				+		.weight_decay(default=5e-4)
			
--- a/finetune/training/__init__.py
+++ b/finetune/training/__init__.py
@@ -0,0 +1 @@
 
				+from .trainer import Trainer
			
--- a/finetune/training/trainer.py
+++ b/finetune/training/trainer.py
@@ -0,0 +1,236 @@
 
				+import logging
			
 
				+from os.path import join, basename
			
 
				+from datetime import datetime
			
 
				+
			
 
				+import chainer
			
 
				+from chainer.training import extensions, Trainer as T
			
 
				+from chainer_addons.training import lr_shift
			
 
				+from chainer_addons.training.optimizer import OptimizerType
			
 
				+from chainer_addons.training.extensions import SacredReport
			
 
				+from chainer_addons.training.extensions.learning_rate import CosineAnnealingLearningRate
			
 
				+from chainer_addons.training.extensions import AlternateTrainable, SwitchTrainables, WarmUp
			
 
				+
			
 
				+from cvdatasets.utils import attr_dict
			
 
				+
			
 
				+def debug_hook(trainer):
			
 
				+	pass
			
 
				+	# print(trainer.updater.get_optimizer("main").target.model.fc6.W.data.mean(), file=open("debug.out", "a"))
			
 
				+
			
 
				+default_intervals = attr_dict(
			
 
				+	print =		(1,  'epoch'),
			
 
				+	log =		(1,  'epoch'),
			
 
				+	eval =		(1,  'epoch'),
			
 
				+	snapshot =	(10, 'epoch'),
			
 
				+)
			
 
				+
			
 
				+def observe_alpha(trainer):
			
 
				+	model = trainer.updater.get_optimizer("main").target.model
			
 
				+	return float(model.pool.alpha.array)
			
 
				+
			
 
				+def _is_adam(opts):
			
 
				+	return opts.optimizer == OptimizerType.ADAM.name.lower()
			
 
				+
			
 
				+class Trainer(T):
			
 
				+	_default_base_model = "model"
			
 
				+
			
 
				+	def __init__(self, opts, updater, evaluator=None, weights=None, intervals=default_intervals, no_observe=False):
			
 
				+
			
 
				+		self._only_eval = opts.only_eval
			
 
				+		if weights is None or weights == "auto":
			
 
				+			self.base_model = self._default_base_model
			
 
				+		else:
			
 
				+			self.base_model, _, _ = basename(weights).rpartition(".")
			
 
				+
			
 
				+		optimizer = updater.get_optimizer("main")
			
 
				+		# adam has some specific attributes, so we need to check this
			
 
				+		is_adam = _is_adam(opts)
			
 
				+		clf = optimizer.target
			
 
				+		model = clf.model
			
 
				+
			
 
				+		outdir = self.output_directory(opts)
			
 
				+		logging.info("Training outputs are saved under \"{}\"".format(outdir))
			
 
				+
			
 
				+		super(Trainer, self).__init__(
			
 
				+			updater=updater,
			
 
				+			stop_trigger=(opts.epochs, 'epoch'),
			
 
				+			out=outdir
			
 
				+		)
			
 
				+
			
 
				+		### Evaluator ###
			
 
				+		if evaluator is not None:
			
 
				+			self.extend(evaluator, trigger=intervals.eval)
			
 
				+
			
 
				+		### Warm up ###
			
 
				+		lr_offset = 0
			
 
				+		if opts.warm_up:
			
 
				+			assert opts.warm_up > 0, "Warm-up argument must be positive!"
			
 
				+			lr_offset = opts.warm_up
			
 
				+
			
 
				+			warm_up_lr = opts.learning_rate
			
 
				+			logging.info("Warm-up of {} epochs enabled!".format(opts.warm_up))
			
 
				+			self.extend(WarmUp(
			
 
				+				opts.warm_up, model,
			
 
				+				opts.learning_rate, warm_up_lr))
			
 
				+
			
 
				+
			
 
				+		### LR shift ###
			
 
				+		if opts.cosine_schedule:
			
 
				+			lr_shift_ext = CosineAnnealingLearningRate(
			
 
				+				attr="alpha" if is_adam else "lr",
			
 
				+				lr=opts.learning_rate,
			
 
				+				target=opts.lr_target,
			
 
				+				epochs=opts.epochs,
			
 
				+				offset=lr_offset
			
 
				+			)
			
 
				+			self.extend(lr_shift_ext)
			
 
				+		else:
			
 
				+			lr_shift_ext = lr_shift(optimizer,
			
 
				+				init=opts.learning_rate,
			
 
				+				rate=opts.lr_decrease_rate, target=opts.lr_target)
			
 
				+			self.extend(lr_shift_ext, trigger=(opts.lr_shift, 'epoch'))
			
 
				+
			
 
				+		### Code below is only for "main" Trainers ###
			
 
				+		if no_observe: return
			
 
				+
			
 
				+		self.extend(extensions.observe_lr(), trigger=intervals.log)
			
 
				+		self.extend(extensions.LogReport(trigger=intervals.log))
			
 
				+
			
 
				+		### Snapshotting ###
			
 
				+		self.setup_snapshots(opts, clf.model, intervals.snapshot)
			
 
				+
			
 
				+		### Reports and Plots ###
			
 
				+		print_values, plot_values = self.reportables(opts, model, evaluator)
			
 
				+		self.extend(extensions.PrintReport(print_values), trigger=intervals.print)
			
 
				+		for name, values in plot_values.items():
			
 
				+			ext = extensions.PlotReport(values, 'epoch', file_name='{}.png'.format(name))
			
 
				+			self.extend(ext)
			
 
				+
			
 
				+		### Progress bar ###
			
 
				+		if not opts.no_progress:
			
 
				+			self.extend(extensions.ProgressBar(update_interval=1))
			
 
				+
			
 
				+	def setup_snapshots(self, opts, obj, trigger):
			
 
				+
			
 
				+		if opts.no_snapshot:
			
 
				+			logging.warning("Models are not snapshot!")
			
 
				+		else:
			
 
				+			dump_fmt = "ft_model_epoch{0.updater.epoch:03d}.npz"
			
 
				+			self.extend(extensions.snapshot_object(obj, dump_fmt), trigger=trigger)
			
 
				+			logging.info("Snapshot format: \"{}\"".format(dump_fmt))
			
 
				+
			
 
				+
			
 
				+	def reportables(self, opts, model, evaluator):
			
 
				+		eval_name = lambda name: f"{evaluator.default_name}/{name}"
			
 
				+
			
 
				+
			
 
				+		print_values = [
			
 
				+			"elapsed_time",
			
 
				+			"epoch",
			
 
				+			# "lr",
			
 
				+
			
 
				+			"main/accuracy", eval_name("main/accuracy"),
			
 
				+			"main/loss", eval_name("main/loss"),
			
 
				+
			
 
				+		]
			
 
				+
			
 
				+		plot_values = {
			
 
				+			"accuracy": [
			
 
				+				"main/accuracy",  eval_name("main/accuracy"),
			
 
				+			],
			
 
				+			"loss": [
			
 
				+				"main/loss", eval_name("main/loss"),
			
 
				+			],
			
 
				+		}
			
 
				+
			
 
				+		# if opts.triplet_loss:
			
 
				+		# 	print_values.extend(["main/t_loss", eval_name("main/t_loss")])
			
 
				+		# 	plot_values.update({
			
 
				+		# 		"t_loss": [
			
 
				+		# 			"main/t_loss", eval_name("main/t_loss"),
			
 
				+		# 		]
			
 
				+		# 	})
			
 
				+
			
 
				+		# if opts.use_parts:
			
 
				+		# 	print_values.extend(["main/logL", eval_name("main/logL")])
			
 
				+		# 	plot_values.update({
			
 
				+		# 		"logL": [
			
 
				+		# 			"main/logL", eval_name("main/logL"),
			
 
				+		# 		]
			
 
				+		# 	})
			
 
				+
			
 
				+		# 	if not opts.no_global:
			
 
				+		# 		print_values.extend([
			
 
				+		# 			"main/glob_accu", eval_name("main/glob_accu"),
			
 
				+		# 			# "main/glob_loss", eval_name("main/glob_loss"),
			
 
				+
			
 
				+		# 			"main/part_accu", eval_name("main/part_accu"),
			
 
				+		# 			# "main/part_loss", eval_name("main/part_loss"),
			
 
				+		# 		])
			
 
				+
			
 
				+		# 		plot_values["accuracy"].extend([
			
 
				+		# 			"main/part_accu", eval_name("main/part_accu"),
			
 
				+		# 			"main/glob_accu", eval_name("main/glob_accu"),
			
 
				+		# 		])
			
 
				+
			
 
				+		# 		plot_values["loss"].extend([
			
 
				+		# 			"main/part_loss", eval_name("main/part_loss"),
			
 
				+		# 			"main/glob_loss", eval_name("main/glob_loss"),
			
 
				+		# 		])
			
 
				+
			
 
				+
			
 
				+		return print_values, plot_values
			
 
				+
			
 
				+
			
 
				+	def output_directory(self, opts):
			
 
				+
			
 
				+		result = opts.output
			
 
				+
			
 
				+		if self.base_model != self._default_base_model:
			
 
				+			result = join(result, self.base_model)
			
 
				+
			
 
				+		result = join(result, datetime.now().strftime("%Y-%m-%d-%H.%M.%S"))
			
 
				+		return result
			
 
				+
			
 
				+	def run(self, init_eval=True):
			
 
				+		if init_eval:
			
 
				+			logging.info("Evaluating initial model ...")
			
 
				+			evaluator = self.get_extension("val")
			
 
				+			init_perf = evaluator(self)
			
 
				+			logging.info("Initial accuracy: {val/main/accuracy:.3%} initial loss: {val/main/loss:.3f}".format(
			
 
				+				**{key: float(value) for key, value in init_perf.items()}
			
 
				+			))
			
 
				+		if self._only_eval:
			
 
				+			return
			
 
				+		return super(Trainer, self).run()
			
 
				+
			
 
				+class SacredTrainer(Trainer):
			
 
				+	def __init__(self, ex, *args, **kwargs):
			
 
				+		super(SacredTrainer, self).__init__(*args, **kwargs)
			
 
				+		self.extend(SacredReport(ex=ex, trigger=intervals.log))
			
 
				+
			
 
				+class AlphaPoolingTrainer(SacredTrainer):
			
 
				+
			
 
				+	def __init__(self, opts, updater, *args, **kwargs):
			
 
				+		super(AlphaPoolingTrainer, self).__init__(opts=opts, updater=updater, *args, **kwargs)
			
 
				+		model = updater.get_optimizer("main").target.model
			
 
				+		### Alternating training of CNN and FC layers (only for alpha-pooling) ###
			
 
				+		if opts.switch_epochs:
			
 
				+			self.extend(SwitchTrainables(
			
 
				+				opts.switch_epochs,
			
 
				+				model=model,
			
 
				+				pooling=model.pool))
			
 
				+
			
 
				+	def reportables(self, opts, model, evaluator):
			
 
				+		print_values, plot_values = super(AlphaPoolingTrainer, self).reportables(opts, model, evaluator)
			
 
				+		alpha_update_rule = model.pool.alpha.update_rule
			
 
				+		if _is_adam(opts):
			
 
				+			# in case of Adam optimizer
			
 
				+			alpha_update_rule.hyperparam.alpha *= opts.kappa
			
 
				+		else:
			
 
				+			alpha_update_rule.hyperparam.lr *= opts.kappa
			
 
				+
			
 
				+		self.extend(extensions.observe_value("alpha", observe_alpha), trigger=intervals.print)
			
 
				+		print_values.append("alpha")
			
 
				+		plot_values["alpha"]= ["alpha"]
			
 
				+
			
 
				+		return print_values, plot_values