3 years ago · 1e900ed8e6
--- a/cvfinetune/dataset.py
+++ b/cvfinetune/dataset.py
@@ -1,49 +1,27 @@
 
				-import numpy as np
			
 
				 import abc
			
 
				-
			
 
				-from chainer_addons.dataset import AugmentationMixin
			
 
				-from chainer_addons.dataset import PreprocessMixin
			
 
				+import numpy as np
			
 
				 
			
 
				 from cvdatasets.dataset import AnnotationsReadMixin
			
 
				-from cvdatasets.dataset import RevealedPartMixin
			
 
				 from cvdatasets.dataset import IteratorMixin
			
 
				+from cvdatasets.dataset import TransformMixin
			
 
				+from cvdatasets.dataset import UniformPartMixin
			
 
				 
			
 
				-class _pre_augmentation_mixin(abc.ABC):
			
 
				-	""" This mixin discards the parts from the ImageWrapper object
			
 
				-	and shifts the labels
			
 
				-	"""
			
 
				-
			
 
				-	label_shift = 1
			
 
				-
			
 
				-	def get_example(self, i):
			
 
				-		im_obj = super(_pre_augmentation_mixin, self).get_example(i)
			
 
				-		im, parts, lab = im_obj.as_tuple()
			
 
				-		return im, lab + self.label_shift
			
 
				-
			
 
				-class _base_mixin(abc.ABC):
			
 
				-	""" This mixin converts images,that are in range
			
 
				-	[0..1] to the range [-1..1]
			
 
				-	"""
			
 
				+class BaseDataset(TransformMixin, UniformPartMixin, AnnotationsReadMixin):
			
 
				+	"""Commonly used dataset constellation"""
			
 
				 
			
 
				-	def get_example(self, i):
			
 
				-		im, lab = super(_base_mixin, self).get_example(i)
			
 
				+	def __init__(self, *args, prepare, center_crop_on_val: bool = True, **kwargs):
			
 
				+		super().__init__(*args, **kwargs)
			
 
				+		self.prepare = prepare
			
 
				 
			
 
				+	def augment(self, im):
			
 
				 		if isinstance(im, list):
			
 
				 			im = np.array(im)
			
 
				 
			
 
				 		if np.logical_and(0 <= im, im <= 1).all():
			
 
				 			im = im * 2 -1
			
 
				 
			
 
				-		return im, lab
			
 
				-
			
 
				+		return im
			
 
				 
			
 
				-class BaseDataset(_base_mixin,
			
 
				-	# augmentation and preprocessing
			
 
				-	AugmentationMixin, PreprocessMixin,
			
 
				-	_pre_augmentation_mixin,
			
 
				-	# random uniform region selection
			
 
				-	RevealedPartMixin,
			
 
				-	# reads image
			
 
				-	AnnotationsReadMixin,
			
 
				-	IteratorMixin):
			
 
				-	"""Commonly used dataset constellation"""
			
 
				+	def transform(self, im_obj):
			
 
				+		im, parts, lab = im_obj.as_tuple()
			
 
				+		return self.prepare(im), lab + self.label_shift
			
--- a/cvfinetune/finetuner/base.py
+++ b/cvfinetune/finetuner/base.py
@@ -3,41 +3,52 @@ import logging
 
				 
			
 
				 from cvfinetune.finetuner import mixins
			
 
				 
			
 
				-class DefaultFinetuner(mixins._ModelMixin, mixins._DatasetMixin, mixins._TrainerMixin):
			
 
				+class DefaultFinetuner(
			
 
				+	mixins._ModelMixin,
			
 
				+	mixins._OptimizerMixin,
			
 
				+	mixins._ClassifierMixin,
			
 
				+	mixins._DatasetMixin,
			
 
				+	mixins._IteratorMixin,
			
 
				+	mixins._TrainerMixin):
			
 
				 	""" The default Finetuner gathers together the creations of all needed
			
 
				 	components and call them in the correct order
			
 
				 
			
 
				 	"""
			
 
				 
			
 
				-	def __init__(self, opts, *args, **kwargs):
			
 
				-		super(DefaultFinetuner, self).__init__(opts=opts, *args, **kwargs)
			
 
				+	def __init__(self, *args, gpu = [-1], **kwargs):
			
 
				+		super().__init__(*args, **kwargs)
			
 
				 
			
 
				-		self.gpu_config(opts)
			
 
				-		self.read_annotations(opts)
			
 
				+		self.gpu_config(gpu)
			
 
				+		self.read_annotations()
			
 
				 
			
 
				-		self.init_model(opts)
			
 
				-		self.init_datasets(opts)
			
 
				-		self.init_iterators(opts)
			
 
				+		self.init_model()
			
 
				+		self.init_datasets()
			
 
				+		self.init_iterators()
			
 
				 
			
 
				-		self.init_classifier(opts)
			
 
				-		self.load_weights(opts)
			
 
				+		self.init_classifier()
			
 
				+		self.load_weights()
			
 
				 
			
 
				-		self.init_optimizer(opts)
			
 
				+		self.init_optimizer()
			
 
				 		self.init_updater()
			
 
				 		self.init_evaluator()
			
 
				 
			
 
				+
			
 
				+	def _check_attr(self, attr_name, msg=None):
			
 
				+		msg = msg or f"<{type(self).__name__}> {attr_name} attribute was not initialized!"
			
 
				+		assert hasattr(self, attr_name), msg
			
 
				+
			
 
				 	def init_device(self):
			
 
				 		self.device = chainer.get_device(self.device_id)
			
 
				 		self.device.use()
			
 
				 		return self.device
			
 
				 
			
 
				-
			
 
				-	def gpu_config(self, opts):
			
 
				-		if -1 in opts.gpu:
			
 
				+	def gpu_config(self, devices):
			
 
				+		if -1 in devices:
			
 
				 			self.device_id = -1
			
 
				 		else:
			
 
				-			self.device_id = opts.gpu[0]
			
 
				+			self.device_id = devices[0]
			
 
				 
			
 
				+		device = self.init_device()
			
 
				 		logging.info(f"Using device {device}")
			
 
				-		return self.init_device()
			
 
				+		return device
			
 
				 
			
--- a/cvfinetune/finetuner/factory.py
+++ b/cvfinetune/finetuner/factory.py
@@ -1,10 +1,10 @@
 
				 import logging
			
 
				 try:
			
 
				-	import chainermn
			
 
				+    import chainermn
			
 
				 except Exception as e: #pragma: no cover
			
 
				-	_CHAINERMN_AVAILABLE = False #pragma: no cover
			
 
				+    _CHAINERMN_AVAILABLE = False #pragma: no cover
			
 
				 else:
			
 
				-	_CHAINERMN_AVAILABLE = True
			
 
				+    _CHAINERMN_AVAILABLE = True
			
 
				 
			
 
				 from cvfinetune import utils
			
 
				 from cvfinetune.finetuner.base import DefaultFinetuner
			
@@ -14,37 +14,41 @@ from cvdatasets.utils import pretty_print_dict
 
				 
			
 
				 class FinetunerFactory(object):
			
 
				 
			
 
				-	@classmethod
			
 
				-	def new(cls, opts, default=DefaultFinetuner, mpi_tuner=MPIFinetuner):
			
 
				+    @classmethod
			
 
				+    def new(cls, *,
			
 
				+            mpi: bool = False,
			
 
				+            default=DefaultFinetuner,
			
 
				+            mpi_tuner=MPIFinetuner,
			
 
				+            **kwargs):
			
 
				 
			
 
				-		if getattr(opts, "mpi", False):
			
 
				-			assert _CHAINERMN_AVAILABLE, "Distributed training is not possible!"
			
 
				-			msg1 = "MPI enabled. Creating NCCL communicator!"
			
 
				-			comm = chainermn.create_communicator("pure_nccl")
			
 
				-			msg2 = f"Rank: {comm.rank}, IntraRank: {comm.intra_rank}, InterRank: {comm.inter_rank}"
			
 
				+        if mpi:
			
 
				+            assert _CHAINERMN_AVAILABLE, "Distributed training is not possible!"
			
 
				+            msg1 = "MPI enabled. Creating NCCL communicator!"
			
 
				+            comm = chainermn.create_communicator("pure_nccl")
			
 
				+            msg2 = f"Rank: {comm.rank}, IntraRank: {comm.intra_rank}, InterRank: {comm.inter_rank}"
			
 
				 
			
 
				-			utils.log_messages([msg1, msg2])
			
 
				-			return cls(mpi_tuner, comm=comm)
			
 
				-		else:
			
 
				-			return cls(default)
			
 
				+            utils.log_messages([msg1, msg2])
			
 
				+            return cls(mpi_tuner, comm=comm, **kwargs)
			
 
				+        else:
			
 
				+            return cls(default, **kwargs)
			
 
				 
			
 
				-	def __init__(self, tuner_cls, **kwargs):
			
 
				-		super(FinetunerFactory, self).__init__()
			
 
				+    def __init__(self, tuner_cls, **kwargs):
			
 
				+        super(FinetunerFactory, self).__init__()
			
 
				 
			
 
				-		self.tuner_cls = tuner_cls
			
 
				-		self.kwargs = kwargs
			
 
				-		logging.info(f"Using {self.tuner_cls.__name__} with arguments: {pretty_print_dict(self.kwargs)}")
			
 
				+        self.tuner_cls = tuner_cls
			
 
				+        self.kwargs = kwargs
			
 
				+        logging.info(f"Using {self.tuner_cls.__name__} with arguments: {pretty_print_dict(self.kwargs)}")
			
 
				 
			
 
				-	def __call__(self, **kwargs):
			
 
				-		_kwargs = dict(self.kwargs, **kwargs)
			
 
				+    def __call__(self, opts, **kwargs):
			
 
				+        opt_kwargs = self.tuner_cls.extract_kwargs(opts)
			
 
				+        _kwargs = dict(self.kwargs, **kwargs, **opt_kwargs)
			
 
				+        return self.tuner_cls(**_kwargs)
			
 
				 
			
 
				-		return self.tuner_cls(**_kwargs)
			
 
				+    def get(self, key, default=None):
			
 
				+        return self.kwargs.get(key, default)
			
 
				 
			
 
				-	def get(self, key, default=None):
			
 
				-		return self.kwargs.get(key, default)
			
 
				+    def __getitem__(self, key):
			
 
				+        return self.kwargs[key]
			
 
				 
			
 
				-	def __getitem__(self, key):
			
 
				-		return self.kwargs[key]
			
 
				-
			
 
				-	def __setitem__(self, key, value):
			
 
				-		self.kwargs[key] = value
			
 
				+    def __setitem__(self, key, value):
			
 
				+        self.kwargs[key] = value
			
--- a/cvfinetune/finetuner/mixins/__init__.py
+++ b/cvfinetune/finetuner/mixins/__init__.py
@@ -1,10 +1,16 @@
 
				 from cvfinetune.finetuner.mixins.dataset import _DatasetMixin
			
 
				+from cvfinetune.finetuner.mixins.classifier import _ClassifierMixin
			
 
				 from cvfinetune.finetuner.mixins.model import _ModelMixin
			
 
				+from cvfinetune.finetuner.mixins.optimizer import _OptimizerMixin
			
 
				+from cvfinetune.finetuner.mixins.iterator import _IteratorMixin
			
 
				 from cvfinetune.finetuner.mixins.trainer import _TrainerMixin
			
 
				 
			
 
				 
			
 
				 __all__ = [
			
 
				 	"_DatasetMixin",
			
 
				+	"_ClassifierMixin",
			
 
				 	"_ModelMixin",
			
 
				+	"_OptimizerMixin",
			
 
				+	"_IteratorMixin",
			
 
				 	"_TrainerMixin",
			
 
				 ]
			
--- a/cvfinetune/finetuner/mixins/base.py
+++ b/cvfinetune/finetuner/mixins/base.py
@@ -0,0 +1,71 @@
 
				+import abc
			
 
				+import inspect
			
 
				+
			
 
				+
			
 
				+class BaseMixin(abc.ABC):
			
 
				+
			
 
				+	def _after_init_check(self):
			
 
				+		pass
			
 
				+
			
 
				+	@classmethod
			
 
				+	def extract_kwargs(cls, opts) -> dict:
			
 
				+
			
 
				+		kwargs = {}
			
 
				+
			
 
				+		for klass in cls.mro():
			
 
				+			sig = inspect.signature(klass.__init__)
			
 
				+			for attr, param in sig.parameters.items():
			
 
				+				if param.kind is not inspect.Parameter.KEYWORD_ONLY:
			
 
				+					continue
			
 
				+
			
 
				+				if param.name in kwargs:
			
 
				+					continue
			
 
				+
			
 
				+				if hasattr(opts, param.name):
			
 
				+					value = getattr(opts, param.name)
			
 
				+					kwargs[param.name] = value
			
 
				+		return kwargs
			
 
				+
			
 
				+
			
 
				+if __name__ == '__main__':
			
 
				+
			
 
				+	from collections import namedtuple
			
 
				+	class Foo(BaseMixin):
			
 
				+
			
 
				+		@classmethod
			
 
				+		def extract_kwargs(cls, opts) -> dict:
			
 
				+			return super().extract_kwargs(opts)
			
 
				+
			
 
				+		def __init__(self, *args, foo, bar=0, **kwargs):
			
 
				+			super().__init__(*args, **kwargs)
			
 
				+			self.foo = foo
			
 
				+			self.bar = bar
			
 
				+
			
 
				+
			
 
				+	class Bar(BaseMixin):
			
 
				+		@classmethod
			
 
				+		def extract_kwargs(cls, opts) -> dict:
			
 
				+			return super().extract_kwargs(opts)
			
 
				+
			
 
				+		def __init__(self, *args, bar2=-1, **kwargs):
			
 
				+			super().__init__(*args, **kwargs)
			
 
				+			self.bar2 = bar2
			
 
				+
			
 
				+
			
 
				+	class Final(Bar, Foo):
			
 
				+
			
 
				+
			
 
				+		def __init__(self, *args, beef=-1, **kwargs):
			
 
				+			super().__init__(*args, **kwargs)
			
 
				+			self.beef = beef
			
 
				+
			
 
				+		def __repr__(self):
			
 
				+			return str(self.__dict__)
			
 
				+
			
 
				+
			
 
				+	Opts = namedtuple("Opts", "foo foo2 bar bar2 beef1")
			
 
				+
			
 
				+	opts = Opts(1,2,3, -4, "hat")
			
 
				+	kwargs = Final.extract_kwargs(opts)
			
 
				+
			
 
				+	print(opts, Final(**kwargs))
			
--- a/cvfinetune/finetuner/mixins/classifier.py
+++ b/cvfinetune/finetuner/mixins/classifier.py
@@ -0,0 +1,67 @@
 
				+import abc
			
 
				+import logging
			
 
				+
			
 
				+from chainer import functions as F
			
 
				+from chainer_addons.functions import smoothed_cross_entropy
			
 
				+from cvdatasets.utils import pretty_print_dict
			
 
				+from functools import partial
			
 
				+
			
 
				+from cvfinetune.finetuner.mixins.base import BaseMixin
			
 
				+
			
 
				+class _ClassifierCreator:
			
 
				+
			
 
				+    def __init__(self, cls, **kwargs):
			
 
				+        super().__init__()
			
 
				+        self.cls = cls
			
 
				+        self.kwargs = kwargs
			
 
				+
			
 
				+    def __call__(self, *args, **kwargs):
			
 
				+        kwargs = dict(self.kwargs, **kwargs)
			
 
				+        return self.cls(*args, **kwargs)
			
 
				+
			
 
				+class _ClassifierMixin(BaseMixin):
			
 
				+    """
			
 
				+        This mixin implements the wrapping of the backbone model around
			
 
				+        a classifier instance.
			
 
				+    """
			
 
				+
			
 
				+    def __init__(self, *args,
			
 
				+                 classifier_cls,
			
 
				+                 classifier_kwargs: dict = {},
			
 
				+                 l1_loss: bool = False,
			
 
				+                 label_smoothing: float = 0.0,
			
 
				+                 **kwargs):
			
 
				+
			
 
				+        super().__init__(*args, **kwargs)
			
 
				+        self._clf_creator = _ClassifierCreator(classifier_cls, **classifier_kwargs)
			
 
				+
			
 
				+        self._l1_loss = l1_loss
			
 
				+        self._label_smoothing = label_smoothing
			
 
				+
			
 
				+
			
 
				+    def init_classifier(self):
			
 
				+        self._check_attr("model")
			
 
				+        self._check_attr("n_classes")
			
 
				+
			
 
				+        self.clf = self._clf_creator(model=self.model,
			
 
				+                                     loss_func=self.loss_func)
			
 
				+
			
 
				+        kwargs = self._clf_creator.kwargs
			
 
				+        logging.info(
			
 
				+            f"Wrapped the model around {type(self.clf).__name__}"
			
 
				+            f" with kwargs: {pretty_print_dict(kwargs)}"
			
 
				+        )
			
 
				+
			
 
				+    @property
			
 
				+    def loss_func(self):
			
 
				+        if self._l1_loss:
			
 
				+            return F.hinge
			
 
				+
			
 
				+        if self._label_smoothing > 0:
			
 
				+            assert self._label_smoothing < 1, "Label smoothing factor must be less than 1!"
			
 
				+
			
 
				+            return partial(smoothed_cross_entropy,
			
 
				+                           N=self.n_classes,
			
 
				+                           eps=self._label_smoothing)
			
 
				+
			
 
				+        return F.softmax_cross_entropy
			
--- a/cvfinetune/finetuner/mixins/dataset.py
+++ b/cvfinetune/finetuner/mixins/dataset.py
@@ -1,96 +1,101 @@
 
				 import abc
			
 
				 import logging
			
 
				+import typing as T
			
 
				 
			
 
				+from collections import namedtuple
			
 
				 from cvdatasets import AnnotationType
			
 
				 from cvdatasets.dataset.image import Size
			
 
				-from cvdatasets.utils import new_iterator
			
 
				 
			
 
				+from cvfinetune.finetuner.mixins.base import BaseMixin
			
 
				 
			
 
				-class _DatasetMixin(abc.ABC):
			
 
				-	"""
			
 
				-		This mixin is responsible for annotation loading and for
			
 
				-		dataset and iterator creation.
			
 
				-	"""
			
 
				 
			
 
				-	def __init__(self, opts, dataset_cls, dataset_kwargs_factory, *args, **kwargs):
			
 
				-		super(_DatasetMixin, self).__init__(opts=opts, *args, **kwargs)
			
 
				-		self.annot = None
			
 
				-		self.dataset_type = opts.dataset
			
 
				-		self.dataset_cls = dataset_cls
			
 
				-		self.dataset_kwargs_factory = dataset_kwargs_factory
			
 
				+class _DatasetMixin(BaseMixin):
			
 
				+    """
			
 
				+        This mixin is responsible for annotation loading and for
			
 
				+        dataset and iterator creation.
			
 
				+    """
			
 
				 
			
 
				-	@property
			
 
				-	def n_classes(self):
			
 
				-		return self.ds_info.n_classes + self.dataset_cls.label_shift
			
 
				+    def __init__(self,
			
 
				+                 *args,
			
 
				+                 data: str,
			
 
				+                 dataset: str,
			
 
				+                 dataset_cls: T.Type,
			
 
				+                 dataset_kwargs_factory: T.Optional[T.Callable] = None,
			
 
				 
			
 
				-	@property
			
 
				-	def data_info(self):
			
 
				-		assert self.annot is not None, "annot attribute was not set!"
			
 
				-		return self.annot.info
			
 
				+                 label_shift: int = 0,
			
 
				+                 input_size: int = 224,
			
 
				+                 part_input_size:  T.Optional[int] = None,
			
 
				+                 **kwargs):
			
 
				 
			
 
				-	@property
			
 
				-	def ds_info(self):
			
 
				-		return self.data_info.DATASETS[self.dataset_type]
			
 
				+        super().__init__(*args, **kwargs)
			
 
				+        self.annot = None
			
 
				+        self.info_file = data
			
 
				+        self.dataset_name = dataset
			
 
				+        self.dataset_cls = dataset_cls
			
 
				+        self.dataset_kwargs_factory = dataset_kwargs_factory
			
 
				 
			
 
				-	def new_dataset(self, opts, size, part_size, subset):
			
 
				-		"""Creates a dataset for a specific subset and certain options"""
			
 
				-		if self.dataset_kwargs_factory is not None and callable(self.dataset_kwargs_factory):
			
 
				-			kwargs = self.dataset_kwargs_factory(opts, subset)
			
 
				-		else:
			
 
				-			kwargs = dict()
			
 
				+        self.input_size = Size(input_size)
			
 
				 
			
 
				-		kwargs = dict(kwargs,
			
 
				-			subset=subset,
			
 
				-			dataset_cls=self.dataset_cls,
			
 
				-			prepare=self.prepare,
			
 
				-			size=size,
			
 
				-			part_size=part_size,
			
 
				-			center_crop_on_val=getattr(opts, "center_crop_on_val", False),
			
 
				-		)
			
 
				+        if part_input_size is None:
			
 
				+            self.part_input_size = self.input_size
			
 
				 
			
 
				+        else:
			
 
				+            self.part_input_size = Size(self.part_input_size)
			
 
				 
			
 
				-		ds = self.annot.new_dataset(**kwargs)
			
 
				-		logging.info("Loaded {} images".format(len(ds)))
			
 
				-		return ds
			
 
				+        self._label_shift = label_shift
			
 
				 
			
 
				 
			
 
				-	def read_annotations(self, opts):
			
 
				-		"""Reads annotations and creates annotation instance, which holds important infos about the dataset"""
			
 
				+    def read_annotations(self):
			
 
				+        """Reads annotations and creates annotation instance, which holds important infos about the dataset"""
			
 
				+        opts = namedtuple("Opt", "data dataset")(self.info_file, self.dataset_name)
			
 
				+        self.annot = AnnotationType.new_annotation(opts, load_strict=False)
			
 
				+        self.dataset_cls.label_shift = self._label_shift
			
 
				 
			
 
				-		self.annot = AnnotationType.new_annotation(opts, load_strict=False)
			
 
				-		self.dataset_cls.label_shift = opts.label_shift
			
 
				+    def init_datasets(self):
			
 
				+        self._check_attr("prepare")
			
 
				+        self._check_attr("_center_crop_on_val")
			
 
				 
			
 
				+        logging.info(" | ".join([
			
 
				+            f"Image input size: {self.input_size}",
			
 
				+            f"Parts input size: {self.part_input_size}",
			
 
				+        ]))
			
 
				 
			
 
				-	def init_datasets(self, opts):
			
 
				+        self.train_data = self.new_dataset("train")
			
 
				+        self.val_data = self.new_dataset("test")
			
 
				 
			
 
				-		size = Size(opts.input_size)
			
 
				-		part_size = getattr(opts, "parts_input_size", None)
			
 
				-		part_size = size if part_size is None else Size(part_size)
			
 
				 
			
 
				-		logging.info(" ".join([
			
 
				-			f"Image input size: {size}",
			
 
				-			f"Image parts input size: {part_size}",
			
 
				-		]))
			
 
				+    @property
			
 
				+    def n_classes(self):
			
 
				+        return self.ds_info.n_classes + self._label_shift
			
 
				 
			
 
				-		self.train_data = self.new_dataset(opts, size, part_size, "train")
			
 
				-		self.val_data = self.new_dataset(opts, size, part_size, "test")
			
 
				+    @property
			
 
				+    def data_info(self):
			
 
				+        assert self.annot is not None, "annot attribute was not set!"
			
 
				+        return self.annot.info
			
 
				 
			
 
				-	def init_iterators(self, opts):
			
 
				-		"""Creates training and validation iterators from training and validation datasets"""
			
 
				+    @property
			
 
				+    def ds_info(self):
			
 
				+        return self.data_info.DATASETS[self.dataset_name]
			
 
				 
			
 
				-		kwargs = dict(n_jobs=opts.n_jobs, batch_size=opts.batch_size)
			
 
				+    def new_dataset(self, subset: str):
			
 
				+        """Creates a dataset for a specific subset and certain options"""
			
 
				+        if self.dataset_kwargs_factory is not None and callable(self.dataset_kwargs_factory):
			
 
				+            kwargs = self.dataset_kwargs_factory(subset)
			
 
				+        else:
			
 
				+            kwargs = dict()
			
 
				 
			
 
				-		if hasattr(self.train_data, "new_iterator"):
			
 
				-			self.train_iter, _ = self.train_data.new_iterator(**kwargs)
			
 
				-		else:
			
 
				-			self.train_iter, _ = new_iterator(self.train_data, **kwargs)
			
 
				+        kwargs = dict(kwargs,
			
 
				+            subset=subset,
			
 
				+            dataset_cls=self.dataset_cls,
			
 
				+            prepare=self.prepare,
			
 
				+            size=self.input_size,
			
 
				+            part_size=self.part_input_size,
			
 
				+            center_crop_on_val=self._center_crop_on_val,
			
 
				+        )
			
 
				+
			
 
				+
			
 
				+        ds = self.annot.new_dataset(**kwargs)
			
 
				+        logging.info(f"Loaded {len(ds)} images")
			
 
				+        return ds
			
 
				 
			
 
				-		if hasattr(self.val_data, "new_iterator"):
			
 
				-			self.val_iter, _ = self.val_data.new_iterator(**kwargs,
			
 
				-				repeat=False, shuffle=False
			
 
				-			)
			
 
				-		else:
			
 
				-			self.val_iter, _ = new_iterator(self.val_data,
			
 
				-				**kwargs, repeat=False, shuffle=False
			
 
				-			)
			
 
				 
			
--- a/cvfinetune/finetuner/mixins/iterator.py
+++ b/cvfinetune/finetuner/mixins/iterator.py
@@ -0,0 +1,41 @@
 
				+import abc
			
 
				+import logging
			
 
				+import typing as T
			
 
				+
			
 
				+from cvdatasets.utils import new_iterator
			
 
				+
			
 
				+from cvfinetune.finetuner.mixins.base import BaseMixin
			
 
				+
			
 
				+class _IteratorMixin(BaseMixin):
			
 
				+
			
 
				+    def __init__(self,
			
 
				+                 *args,
			
 
				+                 batch_size: int = 32,
			
 
				+                 n_jobs: int = 1,
			
 
				+                 **kwargs):
			
 
				+    	super().__init__(*args, **kwargs)
			
 
				+
			
 
				+    	self._batch_size = batch_size
			
 
				+    	self._n_jobs = n_jobs
			
 
				+
			
 
				+
			
 
				+    def new_iterator(self, ds, **kwargs):
			
 
				+    	if hasattr(ds, "new_iterator"):
			
 
				+    		return ds.new_iterator(**kwargs)
			
 
				+    	else:
			
 
				+    		return new_iterator(ds, **kwargs)
			
 
				+
			
 
				+    def init_iterators(self):
			
 
				+        """Creates training and validation iterators from training and validation datasets"""
			
 
				+
			
 
				+        self._check_attr("val_data")
			
 
				+        self._check_attr("train_data")
			
 
				+
			
 
				+        kwargs = dict(n_jobs=self._n_jobs, batch_size=self._batch_size)
			
 
				+
			
 
				+        self.train_iter, _ = self.new_iterator(self.train_data,
			
 
				+        	                                   **kwargs)
			
 
				+
			
 
				+        self.val_iter, _ = self.new_iterator(self.val_data,
			
 
				+        	                                 repeat=False, shuffle=False,
			
 
				+        	                                 **kwargs)
			
--- a/cvfinetune/finetuner/mixins/model.py
+++ b/cvfinetune/finetuner/mixins/model.py
@@ -3,207 +3,169 @@ import chainer
 
				 import logging
			
 
				 
			
 
				 from chainer import functions as F
			
 
				-from chainer.optimizer_hooks import Lasso
			
 
				-from chainer.optimizer_hooks import WeightDecay
			
 
				-from chainer_addons.functions import smoothed_cross_entropy
			
 
				 from chainer_addons.models import PrepareType
			
 
				-from chainer_addons.training import optimizer
			
 
				-from chainer_addons.training import optimizer_hooks
			
 
				 from chainercv2.models import model_store
			
 
				 from cvdatasets.dataset.image import Size
			
 
				-from cvdatasets.utils import pretty_print_dict
			
 
				 from cvmodelz.models import ModelFactory
			
 
				 from functools import partial
			
 
				 from pathlib import Path
			
 
				 from typing import Tuple
			
 
				 
			
 
				-def check_param_for_decay(param):
			
 
				-	return param.name != "alpha"
			
 
				+from cvfinetune.finetuner.mixins.base import BaseMixin
			
 
				 
			
 
				-def enable_only_head(chain: chainer.Chain):
			
 
				-	if hasattr(chain, "enable_only_head") and callable(chain.enable_only_head):
			
 
				-		chain.enable_only_head()
			
 
				+class _ModelMixin(BaseMixin):
			
 
				+    """
			
 
				+        This mixin is responsible for model selection, model and optimizer creation,
			
 
				+        and model weights loading.
			
 
				+    """
			
 
				 
			
 
				-	else:
			
 
				-		chain.disable_update()
			
 
				-		chain.fc.enable_update()
			
 
				+    def __init__(self, *args,
			
 
				+                 model_type: str,
			
 
				+                 model_kwargs: dict = {},
			
 
				+                 pooling: str = "g_avg",
			
 
				 
			
 
				+                 prepare_type: str = "model",
			
 
				+                 center_crop_on_val: bool = True,
			
 
				+                 swap_channels: bool = False,
			
 
				 
			
 
				-class _ModelMixin(abc.ABC):
			
 
				-	"""
			
 
				-		This mixin is responsible for optimizer creation, model creation,
			
 
				-		model wrapping around a classifier and model weights loading.
			
 
				-	"""
			
 
				+                 load: str = None,
			
 
				+                 weights: str = None,
			
 
				+                 load_path: str = "",
			
 
				+                 load_strict: bool = False,
			
 
				+                 load_headless: bool = False,
			
 
				+                 pretrained_on: str = "imagenet",
			
 
				 
			
 
				-	def __init__(self, opts, classifier_cls, classifier_kwargs={}, model_kwargs={}, *args, **kwargs):
			
 
				-		super(_ModelMixin, self).__init__(opts=opts, *args, **kwargs)
			
 
				-		self.classifier_cls = classifier_cls
			
 
				-		self.classifier_kwargs = classifier_kwargs
			
 
				-		self.model_type = opts.model_type
			
 
				-		self.model_kwargs = model_kwargs
			
 
				+                 from_scratch: bool = False,
			
 
				+                 **kwargs):
			
 
				+        super().__init__(*args, **kwargs)
			
 
				 
			
 
				+        self.model_type = model_type
			
 
				+        self.model_kwargs = model_kwargs
			
 
				 
			
 
				-	@property
			
 
				-	def model_info(self):
			
 
				-		return self.data_info.MODELS[self.model_type]
			
 
				+        self._center_crop_on_val = center_crop_on_val
			
 
				+        self._swap_channels = swap_channels
			
 
				 
			
 
				-	def init_model(self, opts):
			
 
				-		"""creates backbone CNN model. This model is wrapped around the classifier later"""
			
 
				+        if model_type.startswith("chainercv2"):
			
 
				+            if prepare_type != "chainercv2":
			
 
				+                msg = f"Using chainercv2 model, but prepare_type was set to \"{prepare_type}\". "
			
 
				+                "Setting it to \"chainercv2\"!"
			
 
				+                warnings.warn(msg)
			
 
				+            prepare_type = "chainercv2"
			
 
				 
			
 
				-		self.model = ModelFactory.new(self.model_type,
			
 
				-			input_size=Size(opts.input_size),
			
 
				-			**self.model_kwargs
			
 
				-		)
			
 
				+        self._prepare_type = prepare_type
			
 
				+        self._pooling = pooling
			
 
				 
			
 
				+        self._load = load
			
 
				+        self._weights = weights
			
 
				+        self._from_scratch = from_scratch
			
 
				+        self._load_path = load_path
			
 
				+        self._load_strict = load_strict
			
 
				+        self._load_headless = load_headless
			
 
				+        self._pretrained_on = pretrained_on
			
 
				 
			
 
				-		if self.model_type.startswith("chainercv2"):
			
 
				-			opts.prepare_type = "chainercv2"
			
 
				 
			
 
				-		self.prepare = partial(PrepareType[opts.prepare_type](self.model),
			
 
				-			swap_channels=opts.swap_channels,
			
 
				-			keep_ratio=getattr(opts, "center_crop_on_val", False),
			
 
				-		)
			
 
				+    def init_model(self):
			
 
				+        """creates backbone CNN model. This model is wrapped around the classifier later"""
			
 
				 
			
 
				-		logging.info(
			
 
				-			f"Created {self.model.__class__.__name__} model "
			
 
				-			f" with \"{opts.prepare_type}\" prepare function."
			
 
				-		)
			
 
				+        self._check_attr("input_size")
			
 
				 
			
 
				+        self.model = self.new_model()
			
 
				 
			
 
				-	def init_classifier(self, opts):
			
 
				+        logging.info(
			
 
				+            f"Created {type(self.model).__name__} model "
			
 
				+            f" with \"{self._prepare_type}\" prepare function."
			
 
				+        )
			
 
				 
			
 
				-		clf_class, kwargs = self.classifier_cls, self.classifier_kwargs
			
 
				 
			
 
				-		self.clf = clf_class(
			
 
				-			model=self.model,
			
 
				-			loss_func=self._loss_func(opts),
			
 
				-			**kwargs)
			
 
				+    def load_weights(self) -> None:
			
 
				 
			
 
				-		logging.info(
			
 
				-			f"Wrapped the model around {clf_class.__name__}"
			
 
				-			f" with kwargs: {pretty_print_dict(kwargs)}"
			
 
				-		)
			
 
				+        self._check_attr("clf")
			
 
				+        self._check_attr("n_classes")
			
 
				 
			
 
				-	def _loss_func(self, opts):
			
 
				-		if getattr(opts, "l1_loss", False):
			
 
				-			return F.hinge
			
 
				+        finetune, weights = self._get_loader()
			
 
				 
			
 
				-		label_smoothing = getattr(opts, "label_smoothing", 0)
			
 
				-		if label_smoothing > 0:
			
 
				-			assert label_smoothing < 1, "Label smoothing factor must be less than 1!"
			
 
				+        self.clf.load(weights,
			
 
				+            n_classes=self.n_classes,
			
 
				+            finetune=finetune,
			
 
				 
			
 
				-			return partial(smoothed_cross_entropy, N=self.n_classes, eps=label_smoothing)
			
 
				+            path=self._load_path,
			
 
				+            strict=self._load_strict,
			
 
				+            headless=self._load_headless
			
 
				+        )
			
 
				 
			
 
				-		return F.softmax_cross_entropy
			
 
				+        self.clf.cleargrads()
			
 
				 
			
 
				-	def init_optimizer(self, opts):
			
 
				-		"""Creates an optimizer for the classifier """
			
 
				-		if not hasattr(opts, "optimizer"):
			
 
				-			self.opt = None
			
 
				-			return
			
 
				+        feat_size = self.model.meta.feature_size
			
 
				 
			
 
				-		opt_kwargs = {}
			
 
				-		if opts.optimizer == "rmsprop":
			
 
				-			opt_kwargs["alpha"] = 0.9
			
 
				+        if hasattr(self.clf, "output_size"):
			
 
				+            feat_size = self.clf.output_size
			
 
				 
			
 
				-		if opts.optimizer in ["rmsprop", "adam"]:
			
 
				-			opt_kwargs["eps"] = 1e-6
			
 
				+        ### TODO: handle feature size!
			
 
				 
			
 
				-		self.opt = optimizer(opts.optimizer,
			
 
				-			self.clf,
			
 
				-			opts.learning_rate,
			
 
				-			decay=0, gradient_clipping=False, **opt_kwargs
			
 
				-		)
			
 
				+        logging.info(f"Part features size after encoding: {feat_size}")
			
 
				 
			
 
				-		logging.info(
			
 
				-			f"Initialized {self.opt.__class__.__name__} optimizer"
			
 
				-			f" with initial LR {opts.learning_rate} and kwargs: {pretty_print_dict(opt_kwargs)}"
			
 
				-		)
			
 
				 
			
 
				-		if opts.decay > 0:
			
 
				-			reg_kwargs = {}
			
 
				-			if opts.l1_loss:
			
 
				-				reg_cls = Lasso
			
 
				 
			
 
				-			elif opts.pooling == "alpha":
			
 
				-				reg_cls = optimizer_hooks.SelectiveWeightDecay
			
 
				-				reg_kwargs["selection"] = check_param_for_decay
			
 
				+    @property
			
 
				+    def prepare_type(self):
			
 
				+        return PrepareType[self._prepare_type]
			
 
				 
			
 
				-			else:
			
 
				-				reg_cls = WeightDecay
			
 
				+    @property
			
 
				+    def prepare(self):
			
 
				+        return partial(self.prepare_type(self.model),
			
 
				+            swap_channels=self._swap_channels,
			
 
				+            keep_ratio=self._center_crop_on_val)
			
 
				 
			
 
				-			logging.info(f"Adding {reg_cls.__name__} ({opts.decay:e})")
			
 
				-			self.opt.add_hook(reg_cls(opts.decay, **reg_kwargs))
			
 
				+    def new_model(self, **kwargs):
			
 
				+        return ModelFactory.new(self.model_type,
			
 
				+            input_size=self.input_size,
			
 
				+            **self.model_kwargs, **kwargs)
			
 
				 
			
 
				-		if getattr(opts, "only_head", False):
			
 
				-			assert not getattr(opts, "recurrent", False), \
			
 
				-				"Recurrent classifier is not supported with only_head option!"
			
 
				+    @property
			
 
				+    def model_info(self):
			
 
				+        return self.data_info.MODELS[self.model_type]
			
 
				 
			
 
				-			logging.warning("========= Fine-tuning only classifier layer! =========")
			
 
				-			enable_only_head(self.clf)
			
 
				 
			
 
				 
			
 
				-	def _get_loader(self, opts) -> Tuple[bool, str]:
			
 
				-		if getattr(opts, "from_scratch", False):
			
 
				-			logging.info("Training a {0.__class__.__name__} model from scratch!".format(self.model))
			
 
				-			return None, None
			
 
				+    def _get_loader(self) -> Tuple[bool, str]:
			
 
				 
			
 
				-		if getattr(opts, "load", None):
			
 
				-			weights = getattr(opts, "load", None)
			
 
				-			logging.info(f"Loading already fine-tuned weights from \"{weights}\"")
			
 
				-			return False, weights
			
 
				+        if self._from_scratch:
			
 
				+            logging.info(f"Training a {type(self.model).__name__} model from scratch!")
			
 
				+            return None, None
			
 
				 
			
 
				-		elif getattr(opts, "weights", None):
			
 
				-			weights = getattr(opts, "weights", None)
			
 
				-			logging.info(f"Loading custom fine-tuned weights from \"{weights}\"")
			
 
				-			return True, weights
			
 
				+        if self._load:
			
 
				+            weights = self._load
			
 
				+            logging.info(f"Loading already fine-tuned weights from \"{weights}\"")
			
 
				+            return False, weights
			
 
				 
			
 
				-		else:
			
 
				-			weights = self._default_weights(opts)
			
 
				-			logging.info(f"Loading custom fine-tuned weights from \"{weights}\"")
			
 
				-			return True, weights
			
 
				+        elif self._weights:
			
 
				+            weights = self._weights
			
 
				+            logging.info(f"Loading custom fine-tuned weights from \"{weights}\"")
			
 
				+            return True, weights
			
 
				 
			
 
				-	def _default_weights(self, opts):
			
 
				-		if self.model_type.startswith("chainercv2"):
			
 
				-			model_name = self.model_type.split(".")[-1]
			
 
				-			return model_store.get_model_file(
			
 
				-				model_name=model_name,
			
 
				-				local_model_store_dir_path=str(Path.home() / ".chainer" / "models"))
			
 
				+        else:
			
 
				+            weights = self._default_weights
			
 
				+            logging.info(f"Loading custom fine-tuned weights from \"{weights}\"")
			
 
				+            return True, weights
			
 
				 
			
 
				-		else:
			
 
				-			ds_info = self.data_info
			
 
				-			model_info = self.model_info
			
 
				+    @property
			
 
				+    def _default_weights(self):
			
 
				+        if self.model_type.startswith("chainercv2"):
			
 
				+            model_name = self.model_type.split(".")[-1]
			
 
				+            return model_store.get_model_file(
			
 
				+                model_name=model_name,
			
 
				+                local_model_store_dir_path=str(Path.home() / ".chainer" / "models"))
			
 
				 
			
 
				-			base_dir = Path(ds_info.BASE_DIR)
			
 
				-			weights_dir = base_dir / ds_info.MODEL_DIR / model_info.folder
			
 
				+        else:
			
 
				+            ds_info = self.data_info
			
 
				+            model_info = self.model_info
			
 
				 
			
 
				-			weights = model_info.weights
			
 
				-			assert opts.pre_training in weights, \
			
 
				-				f"Weights for \"{opts.pre_training}\" pre-training were not found!"
			
 
				+            base_dir = Path(ds_info.BASE_DIR)
			
 
				+            weights_dir = base_dir / ds_info.MODEL_DIR / model_info.folder
			
 
				 
			
 
				-			return str(weights_dir / weights[opts.pre_training])
			
 
				+            weights = model_info.weights
			
 
				+            assert self._pretrained_on in weights, \
			
 
				+                f"Weights for \"{self._pretrained_on}\" pre-training were not found!"
			
 
				 
			
 
				+            return str(weights_dir / weights[self._pretrained_on])
			
 
				 
			
 
				-	def load_weights(self, opts) -> None:
			
 
				-
			
 
				-		finetune, weights = self._get_loader(opts)
			
 
				-
			
 
				-		self.clf.load(weights,
			
 
				-			n_classes=self.n_classes,
			
 
				-			finetune=finetune,
			
 
				-
			
 
				-			path=opts.load_path,
			
 
				-			strict=opts.load_strict,
			
 
				-			headless=opts.headless
			
 
				-		)
			
 
				-
			
 
				-		self.clf.cleargrads()
			
 
				-
			
 
				-		feat_size = self.model.meta.feature_size
			
 
				-
			
 
				-		if hasattr(self.clf, "output_size"):
			
 
				-			feat_size = self.clf.output_size
			
 
				-
			
 
				-		### TODO: handle feature size!
			
 
				-
			
 
				-		logging.info(f"Part features size after encoding: {feat_size}")
			
--- a/cvfinetune/finetuner/mixins/optimizer.py
+++ b/cvfinetune/finetuner/mixins/optimizer.py
@@ -0,0 +1,103 @@
 
				+import abc
			
 
				+import chainer
			
 
				+import logging
			
 
				+
			
 
				+from chainer.optimizer_hooks import Lasso
			
 
				+from chainer.optimizer_hooks import WeightDecay
			
 
				+from chainer_addons.training import optimizer as new_optimizer
			
 
				+from chainer_addons.training.optimizer_hooks import SelectiveWeightDecay
			
 
				+from cvdatasets.utils import pretty_print_dict
			
 
				+
			
 
				+from cvfinetune.finetuner.mixins.base import BaseMixin
			
 
				+
			
 
				+def check_param_for_decay(param):
			
 
				+    return param.name != "alpha"
			
 
				+
			
 
				+def enable_only_head(chain: chainer.Chain):
			
 
				+    if hasattr(chain, "enable_only_head") and callable(chain.enable_only_head):
			
 
				+        chain.enable_only_head()
			
 
				+
			
 
				+    else:
			
 
				+        chain.disable_update()
			
 
				+        chain.fc.enable_update()
			
 
				+
			
 
				+class _OptimizerCreator:
			
 
				+
			
 
				+    def __init__(self, opt, **kwargs):
			
 
				+        super().__init__()
			
 
				+
			
 
				+        self.opt = opt
			
 
				+        self.kwargs = kwargs
			
 
				+
			
 
				+    def __call__(self, *args, **kwargs):
			
 
				+        if self.opt is None:
			
 
				+            return None
			
 
				+
			
 
				+        kwargs = dict(self.kwargs, **kwargs)
			
 
				+        return new_optimizer(self.opt, *args, **kwargs)
			
 
				+
			
 
				+class _OptimizerMixin(BaseMixin):
			
 
				+
			
 
				+    def __init__(self, *args,
			
 
				+                 optimizer: str,
			
 
				+                 learning_rate: float = 1e-3,
			
 
				+                 weight_decay: float = 5e-4,
			
 
				+                 eps: float = 1e-2,
			
 
				+                 only_head: bool = False,
			
 
				+                 **kwargs):
			
 
				+
			
 
				+        super().__init__(*args, **kwargs)
			
 
				+
			
 
				+        optimizer_kwargs = dict(decay=0, gradient_clipping=False)
			
 
				+
			
 
				+        if optimizer in ["rmsprop", "adam"]:
			
 
				+            optimizer_kwargs["eps"] = eps
			
 
				+
			
 
				+        self._opt_creator = _OptimizerCreator(optimizer, **optimizer_kwargs)
			
 
				+        self.learning_rate = learning_rate
			
 
				+        self.weight_decay = weight_decay
			
 
				+        self._only_head = only_head
			
 
				+
			
 
				+
			
 
				+    def init_optimizer(self):
			
 
				+        """Creates an optimizer for the classifier """
			
 
				+
			
 
				+        self._check_attr("clf")
			
 
				+        self._check_attr("_pooling")
			
 
				+        self._check_attr("_l1_loss")
			
 
				+
			
 
				+        self.opt = self._opt_creator(self.clf, self.learning_rate)
			
 
				+
			
 
				+        if self.opt is None:
			
 
				+            logging.warning("========= No optimizer was initialized! =========")
			
 
				+            return
			
 
				+
			
 
				+        kwargs = self._opt_creator.kwargs
			
 
				+        logging.info(
			
 
				+            f"Initialized {type(self.opt).__name__} optimizer"
			
 
				+            f" with initial LR {self.learning_rate} and kwargs: {pretty_print_dict(kwargs)}"
			
 
				+        )
			
 
				+
			
 
				+        self.init_regularizer()
			
 
				+
			
 
				+        if self._only_head:
			
 
				+            logging.warning("========= Fine-tuning only classifier layer! =========")
			
 
				+            enable_only_head(self.clf)
			
 
				+
			
 
				+    def init_regularizer(self, **kwargs):
			
 
				+
			
 
				+        if self.weight_decay <= 0:
			
 
				+            return
			
 
				+
			
 
				+        if self._l1_loss:
			
 
				+            cls = Lasso
			
 
				+
			
 
				+        elif self._pooling == "alpha":
			
 
				+            cls = SelectiveWeightDecay
			
 
				+            kwargs["selection"] = check_param_for_decay
			
 
				+
			
 
				+        else:
			
 
				+            cls = WeightDecay
			
 
				+
			
 
				+        logging.info(f"Adding {cls.__name__} ({self.weight_decay:e})")
			
 
				+        self.opt.add_hook(cls(self.weight_decay, **kwargs))
			
--- a/cvfinetune/finetuner/mixins/trainer.py
+++ b/cvfinetune/finetuner/mixins/trainer.py
@@ -1,92 +1,124 @@
 
				 import abc
			
 
				 import logging
			
 
				 import pyaml
			
 
				+import gc
			
 
				 
			
 
				 from bdb import BdbQuit
			
 
				 from chainer.serializers import save_npz
			
 
				+from chainer.training import extension
			
 
				 from chainer.training import extensions
			
 
				+from chainer.training import updaters
			
 
				 from cvdatasets.utils import pretty_print_dict
			
 
				 from pathlib import Path
			
 
				 
			
 
				-
			
 
				-class _TrainerMixin(abc.ABC):
			
 
				-	"""This mixin is responsible for updater, evaluator and trainer creation.
			
 
				-	Furthermore, it implements the run method
			
 
				-	"""
			
 
				-
			
 
				-	def __init__(self, opts, updater_cls, updater_kwargs={}, *args, **kwargs):
			
 
				-		super(_TrainerMixin, self).__init__(*args, **kwargs)
			
 
				-		self.updater_cls = updater_cls
			
 
				-		self.updater_kwargs = updater_kwargs
			
 
				-
			
 
				-	def init_updater(self):
			
 
				-		"""Creates an updater from training iterator and the optimizer."""
			
 
				-
			
 
				-		if self.opt is None:
			
 
				-			self.updater = None
			
 
				-			return
			
 
				-
			
 
				-		self.updater = self.updater_cls(
			
 
				-			iterator=self.train_iter,
			
 
				-			optimizer=self.opt,
			
 
				-			device=self.device,
			
 
				-			**self.updater_kwargs,
			
 
				-		)
			
 
				-		logging.info(" ".join([
			
 
				-			f"Using single GPU: {self.device}.",
			
 
				-			f"{self.updater_cls.__name__} is initialized",
			
 
				-			f"with following kwargs: {pretty_print_dict(self.updater_kwargs)}"
			
 
				-			])
			
 
				-		)
			
 
				-
			
 
				-	def init_evaluator(self, default_name="val"):
			
 
				-		"""Creates evaluation extension from validation iterator and the classifier."""
			
 
				-
			
 
				-		self.evaluator = extensions.Evaluator(
			
 
				-			iterator=self.val_iter,
			
 
				-			target=self.clf,
			
 
				-			device=self.device,
			
 
				-			progress_bar=True
			
 
				-		)
			
 
				-
			
 
				-		self.evaluator.default_name = default_name
			
 
				-
			
 
				-	def _new_trainer(self, trainer_cls, opts, *args, **kwargs):
			
 
				-		return trainer_cls(
			
 
				-			opts=opts,
			
 
				-			updater=self.updater,
			
 
				-			evaluator=self.evaluator,
			
 
				-			*args, **kwargs
			
 
				-		)
			
 
				-
			
 
				-	def run(self, trainer_cls, opts, *args, **kwargs):
			
 
				-
			
 
				-		trainer = self._new_trainer(trainer_cls, opts, *args, **kwargs)
			
 
				-
			
 
				-		self.save_meta_info(opts, folder=Path(trainer.out, "meta"))
			
 
				-
			
 
				-		logging.info("Snapshotting is {}abled".format("dis" if opts.no_snapshot else "en"))
			
 
				-
			
 
				-		def dump(suffix):
			
 
				-			if opts.only_eval or opts.no_snapshot:
			
 
				-				return
			
 
				-
			
 
				-			save_npz(Path(trainer.out, f"clf_{suffix}.npz"), self.clf)
			
 
				-			save_npz(Path(trainer.out, f"model_{suffix}.npz"), self.model)
			
 
				-
			
 
				-		try:
			
 
				-			trainer.run(opts.init_eval or opts.only_eval)
			
 
				-		except (KeyboardInterrupt, BdbQuit) as e:
			
 
				-			raise e
			
 
				-		except Exception as e:
			
 
				-			dump("exception")
			
 
				-			raise e
			
 
				-		else:
			
 
				-			dump("final")
			
 
				-
			
 
				-	def save_meta_info(self, opts, folder: Path):
			
 
				-		folder.mkdir(parents=True, exist_ok=True)
			
 
				-
			
 
				-		with open(folder / "args.yml", "w") as f:
			
 
				-			pyaml.dump(opts.__dict__, f, sort_keys=True)
			
 
				+from cvfinetune.finetuner.mixins.base import BaseMixin
			
 
				+
			
 
				+@extension.make_extension(default_name="ManualGC", trigger=(1, "iteration"))
			
 
				+def gc_collect(trainer):
			
 
				+    gc.collect()
			
 
				+
			
 
				+class _TrainerMixin(BaseMixin):
			
 
				+    """This mixin is responsible for updater, evaluator and trainer creation.
			
 
				+    Furthermore, it implements the run method
			
 
				+    """
			
 
				+
			
 
				+    def __init__(self, *args,
			
 
				+                 updater_cls=updaters.StandardUpdater,
			
 
				+                 updater_kwargs: dict = {},
			
 
				+                 only_eval: bool = False,
			
 
				+                 init_eval: bool = False,
			
 
				+                 no_snapshot: bool = False,
			
 
				+
			
 
				+                 manual_gc: bool = True,
			
 
				+                 **kwargs):
			
 
				+        super(_TrainerMixin, self).__init__(*args, **kwargs)
			
 
				+        self.updater_cls = updater_cls
			
 
				+        self.updater_kwargs = updater_kwargs
			
 
				+
			
 
				+        self.only_eval = only_eval
			
 
				+        self.init_eval = init_eval
			
 
				+        self.no_snapshot = no_snapshot
			
 
				+        self.manual_gc = manual_gc
			
 
				+
			
 
				+
			
 
				+    def init_updater(self):
			
 
				+        """Creates an updater from training iterator and the optimizer."""
			
 
				+
			
 
				+        self._check_attr("opt")
			
 
				+        self._check_attr("device")
			
 
				+        self._check_attr("train_iter")
			
 
				+
			
 
				+        if self.opt is None:
			
 
				+            self.updater = None
			
 
				+            return
			
 
				+
			
 
				+        self.updater = self.updater_cls(
			
 
				+            iterator=self.train_iter,
			
 
				+            optimizer=self.opt,
			
 
				+            device=self.device,
			
 
				+            **self.updater_kwargs,
			
 
				+        )
			
 
				+        logging.info(" ".join([
			
 
				+            f"Using single GPU: {self.device}.",
			
 
				+            f"{self.updater_cls.__name__} is initialized",
			
 
				+            f"with following kwargs: {pretty_print_dict(self.updater_kwargs)}"
			
 
				+            ])
			
 
				+        )
			
 
				+
			
 
				+    def init_evaluator(self, default_name="val"):
			
 
				+        """Creates evaluation extension from validation iterator and the classifier."""
			
 
				+
			
 
				+        self._check_attr("device")
			
 
				+        self._check_attr("val_iter")
			
 
				+
			
 
				+        self.evaluator = extensions.Evaluator(
			
 
				+            iterator=self.val_iter,
			
 
				+            target=self.clf,
			
 
				+            device=self.device,
			
 
				+            progress_bar=True
			
 
				+        )
			
 
				+
			
 
				+        self.evaluator.default_name = default_name
			
 
				+
			
 
				+    def _new_trainer(self, trainer_cls, opts, *args, **kwargs):
			
 
				+        return trainer_cls(
			
 
				+            opts=opts,
			
 
				+            updater=self.updater,
			
 
				+            evaluator=self.evaluator,
			
 
				+            *args, **kwargs
			
 
				+        )
			
 
				+
			
 
				+    def run(self, trainer_cls, opts, *args, **kwargs):
			
 
				+
			
 
				+        trainer = self._new_trainer(trainer_cls, opts, *args, **kwargs)
			
 
				+
			
 
				+        if self.manual_gc:
			
 
				+            trainer.extend(gc_collect)
			
 
				+
			
 
				+        self.save_meta_info(opts, folder=Path(trainer.out, "meta"))
			
 
				+
			
 
				+        logging.info("Snapshotting is {}abled".format("dis" if self.no_snapshot else "en"))
			
 
				+
			
 
				+        def dump(suffix):
			
 
				+            if self.only_eval or self.no_snapshot:
			
 
				+                return
			
 
				+
			
 
				+            save_npz(Path(trainer.out, f"clf_{suffix}.npz"), self.clf)
			
 
				+            save_npz(Path(trainer.out, f"model_{suffix}.npz"), self.model)
			
 
				+
			
 
				+        try:
			
 
				+            trainer.run(self.init_eval or self.only_eval)
			
 
				+        except (KeyboardInterrupt, BdbQuit) as e:
			
 
				+            raise e
			
 
				+        except Exception as e:
			
 
				+            dump("exception")
			
 
				+            raise e
			
 
				+        else:
			
 
				+            dump("final")
			
 
				+
			
 
				+    def save_meta_info(self, opts, folder: Path):
			
 
				+        folder.mkdir(parents=True, exist_ok=True)
			
 
				+
			
 
				+        with open(folder / "args.yml", "w") as f:
			
 
				+            pyaml.dump(opts.__dict__, f, sort_keys=True)
			
 
				 
			
--- a/cvfinetune/finetuner/mpi.py
+++ b/cvfinetune/finetuner/mpi.py
@@ -8,9 +8,9 @@ from cvfinetune.finetuner.base import DefaultFinetuner
 
				 
			
 
				 class MPIFinetuner(DefaultFinetuner):
			
 
				 
			
 
				-	def __init__(self, opts, *args, comm, **kwargs):
			
 
				+	def __init__(self, *args, comm, **kwargs):
			
 
				 		self.comm = comm
			
 
				-		super(MPIFinetuner, self).__init__(opts, *args, **kwargs)
			
 
				+		super(MPIFinetuner, self).__init__(*args, **kwargs)
			
 
				 
			
 
				 	@property
			
 
				 	def mpi(self):
			
@@ -20,16 +20,16 @@ class MPIFinetuner(DefaultFinetuner):
 
				 	def mpi_main_process(self):
			
 
				 		return not (self.comm is not None and self.comm.rank != 0)
			
 
				 
			
 
				-	def gpu_config(self, opts):
			
 
				+	def gpu_config(self, devices):
			
 
				 
			
 
				 		if not self.mpi:
			
 
				 			msg = "Using MPIFinetuner without setting a communicator!"
			
 
				 			warnings.warn(msg)
			
 
				 			logging.warn(msg)
			
 
				-			return super(MPIFinetuner, self).gpu_config(opts)
			
 
				+			return super(MPIFinetuner, self).gpu_config(devices)
			
 
				 
			
 
				-		if len(opts.gpu) > 1:
			
 
				-			self.device_id = opts.gpu[self.comm.rank]
			
 
				+		if len(devices) > 1:
			
 
				+			self.device_id = devices[self.comm.rank]
			
 
				 		else:
			
 
				 			self.device_id += self.comm.intra_rank