4 jaren geleden · 184697051a
--- a/cvfinetune/finetuner/__init__.py
+++ b/cvfinetune/finetuner/__init__.py
@@ -1,58 +1,9 @@
 
															-
														
 
															-import logging
														
 
															-try:
														
 
															-	import chainermn
														
 
															-except Exception as e: #pragma: no cover
														
 
															-	_CHAINERMN_AVAILABLE = False #pragma: no cover
														
 
															-else:
														
 
															-	_CHAINERMN_AVAILABLE = True
														
 
															-
														
 
															-from cvfinetune import utils
														
 
															 from cvfinetune.finetuner.base import DefaultFinetuner
														
 
															+from cvfinetune.finetuner.factory import FinetunerFactory
														
 
															 from cvfinetune.finetuner.mpi import MPIFinetuner
														
 
															-from cvdatasets.utils import pretty_print_dict
														
 
															-
														
 
															-class FinetunerFactory(object):
														
 
															-
														
 
															-	@classmethod
														
 
															-	def new(cls, opts, default=DefaultFinetuner, mpi_tuner=MPIFinetuner):
														
 
															-
														
 
															-		if getattr(opts, "mpi", False):
														
 
															-			assert _CHAINERMN_AVAILABLE, "Distributed training is not possible!"
														
 
															-			msg1 = "MPI enabled. Creating NCCL communicator!"
														
 
															-			comm = chainermn.create_communicator("pure_nccl")
														
 
															-			msg2 = f"Rank: {comm.rank}, IntraRank: {comm.intra_rank}, InterRank: {comm.inter_rank}"
														
 
															-
														
 
															-			utils.log_messages([msg1, msg2])
														
 
															-			return cls(mpi_tuner, comm=comm)
														
 
															-		else:
														
 
															-			return cls(default)
														
 
															-
														
 
															-	def __init__(self, tuner_cls, **kwargs):
														
 
															-		super(FinetunerFactory, self).__init__()
														
 
															-
														
 
															-		self.tuner_cls = tuner_cls
														
 
															-		self.kwargs = kwargs
														
 
															-		logging.info(f"Using {self.tuner_cls.__name__} with arguments: {pretty_print_dict(self.kwargs)}")
														
 
															-
														
 
															-	def __call__(self, **kwargs):
														
 
															-		_kwargs = dict(self.kwargs)
														
 
															-		_kwargs.update(kwargs)
														
 
															-
														
 
															-		return self.tuner_cls(**_kwargs)
														
 
															-
														
 
															-	def get(self, key, default=None):
														
 
															-		return self.kwargs.get(key, default)
														
 
															-
														
 
															-	def __getitem__(self, key):
														
 
															-		return self.kwargs[key]
														
 
															-
														
 
															-	def __setitem__(self, key, value):
														
 
															-		self.kwargs[key] = value
														
 
															-
														
 
															 __all__ = [
														
 
															-	"get_finetuner",
														
 
															+	"FinetunerFactory",
														
 
															 	"DefaultFinetuner",
														
 
															 	"MPIFinetuner",
														
 
															 ]
														
--- a/cvfinetune/finetuner/base.py
+++ b/cvfinetune/finetuner/base.py
@@ -6,32 +6,31 @@ import abc
 
															 import logging
														
 
															 import pyaml
														
 
															+from bdb import BdbQuit
														
 
															 from chainer.backends import cuda
														
 
															 from chainer.optimizer_hooks import Lasso
														
 
															 from chainer.optimizer_hooks import WeightDecay
														
 
															 from chainer.serializers import save_npz
														
 
															 from chainer.training import extensions
														
 
															-
														
 
															-from chainercv2.model_provider import get_model
														
 
															-from chainercv2.models import model_store
														
 
															-
														
 
															 from chainer_addons.functions import smoothed_cross_entropy
														
 
															 from chainer_addons.models import Classifier
														
 
															 from chainer_addons.models import ModelType
														
 
															 from chainer_addons.models import PrepareType
														
 
															 from chainer_addons.training import optimizer
														
 
															 from chainer_addons.training import optimizer_hooks
														
 
															-
														
 
															+from chainercv2.model_provider import get_model
														
 
															+from chainercv2.models import model_store
														
 
															 from cvdatasets import AnnotationType
														
 
															 from cvdatasets.dataset.image import Size
														
 
															 from cvdatasets.utils import new_iterator
														
 
															 from cvdatasets.utils import pretty_print_dict
														
 
															-
														
 
															-from bdb import BdbQuit
														
 
															 from functools import partial
														
 
															 from pathlib import Path
														
 
															+
														
 
															+from cvfinetune.finetuner import mixins
														
 
															+
														
 
															 def check_param_for_decay(param):
														
 
															 	return param.name != "alpha"
														
@@ -43,341 +42,15 @@ def enable_only_head(chain: chainer.Chain):
 
															 		chain.disable_update()
														
 
															 		chain.fc.enable_update()
														
 
															-class _ModelMixin(abc.ABC):
														
 
															-	"""This mixin is responsible for optimizer creation, model creation,
														
 
															-	model wrapping around a classifier and model weights loading.
														
 
															-	"""
														
 
															-
														
 
															-	def __init__(self, opts, classifier_cls, classifier_kwargs={}, model_kwargs={}, *args, **kwargs):
														
 
															-		super(_ModelMixin, self).__init__(opts=opts, *args, **kwargs)
														
 
															-		self.classifier_cls = classifier_cls
														
 
															-		self.classifier_kwargs = classifier_kwargs
														
 
															-		self.model_type = opts.model_type
														
 
															-		self.model_kwargs = model_kwargs
														
 
															-
														
 
															-
														
 
															-	@property
														
 
															-	def model_info(self):
														
 
															-		return self.data_info.MODELS[self.model_type]
														
 
															-
														
 
															-	def wrap_model(self, opts):
														
 
															-
														
 
															-		clf_class, kwargs = self.classifier_cls, self.classifier_kwargs
														
 
															-
														
 
															-		self.clf = clf_class(
														
 
															-			model=self.model,
														
 
															-			loss_func=self._loss_func(opts),
														
 
															-			**kwargs)
														
 
															-
														
 
															-		logging.info(" ".join([
														
 
															-			f"Wrapped the model around {clf_class.__name__}",
														
 
															-			f"with kwargs: {pretty_print_dict(kwargs)}",
														
 
															-		]))
														
 
															-
														
 
															-	def _loss_func(self, opts):
														
 
															-		if getattr(opts, "l1_loss", False):
														
 
															-			return F.hinge
														
 
															-
														
 
															-		elif getattr(opts, "label_smoothing", 0) >= 0:
														
 
															-			assert getattr(opts, "label_smoothing", 0) < 1, \
														
 
															-				"Label smoothing factor must be less than 1!"
														
 
															-			return partial(smoothed_cross_entropy,
														
 
															-				N=self.n_classes,
														
 
															-				eps=getattr(opts, "label_smoothing", 0))
														
 
															-		else:
														
 
															-			return F.softmax_cross_entropy
														
 
															-
														
 
															-	def init_optimizer(self, opts):
														
 
															-		"""Creates an optimizer for the classifier """
														
 
															-		if not hasattr(opts, "optimizer"):
														
 
															-			self.opt = None
														
 
															-			return
														
 
															-
														
 
															-		opt_kwargs = {}
														
 
															-		if opts.optimizer == "rmsprop":
														
 
															-			opt_kwargs["alpha"] = 0.9
														
 
															-
														
 
															-		self.opt = optimizer(opts.optimizer,
														
 
															-			self.clf,
														
 
															-			opts.learning_rate,
														
 
															-			decay=0, gradient_clipping=False, **opt_kwargs
														
 
															-		)
														
 
															-
														
 
															-		if opts.decay > 0:
														
 
															-			reg_kwargs = {}
														
 
															-			if opts.l1_loss:
														
 
															-				reg_cls = Lasso
														
 
															-
														
 
															-			elif opts.pooling == "alpha":
														
 
															-				reg_cls = optimizer_hooks.SelectiveWeightDecay
														
 
															-				reg_kwargs["selection"] = check_param_for_decay
														
 
															-
														
 
															-			else:
														
 
															-				reg_cls = WeightDecay
														
 
															-
														
 
															-			logging.info(f"Adding {reg_cls.__name__} ({opts.decay:e})")
														
 
															-			self.opt.add_hook(reg_cls(opts.decay, **reg_kwargs))
														
 
															-
														
 
															-		if getattr(opts, "only_head", False):
														
 
															-			assert not getattr(opts, "recurrent", False), \
														
 
															-				"Recurrent classifier is not supported with only_head option!"
														
 
															-
														
 
															-			logging.warning("========= Fine-tuning only classifier layer! =========")
														
 
															-			enable_only_head(self.clf)
														
 
															-
														
 
															-	def init_model(self, opts):
														
 
															-		"""creates backbone CNN model. This model is wrapped around the classifier later"""
														
 
															-
														
 
															-		if self.model_type.startswith("cv2_"):
														
 
															-			model_type = args.model_type.split("cv2_")[-1]
														
 
															-		else:
														
 
															-			model_type = self.model_info.class_key
														
 
															-
														
 
															-			# model = get_model(model_type, pretrained=False)
														
 
															-
														
 
															-		self.model = ModelType.new(
														
 
															-			model_type=model_type,
														
 
															-			input_size=Size(opts.input_size),
														
 
															-			**self.model_kwargs,
														
 
															-		)
														
 
															-
														
 
															-	def load_model_weights(self, args):
														
 
															-		if getattr(args, "from_scratch", False):
														
 
															-			logging.info("Training a {0.__class__.__name__} model from scratch!".format(self.model))
														
 
															-			loader = self.model.reinitialize_clf
														
 
															-			self.weights = None
														
 
															-		else:
														
 
															-			if args.load:
														
 
															-				self.weights = args.load
														
 
															-				msg = "Loading already fine-tuned weights from \"{}\""
														
 
															-				loader_func = self.model.load_for_inference
														
 
															-			else:
														
 
															-				if args.weights:
														
 
															-					msg = "Loading custom pre-trained weights \"{}\""
														
 
															-					self.weights = args.weights
														
 
															-
														
 
															-				else:
														
 
															-					msg = "Loading default pre-trained weights \"{}\""
														
 
															-					self.weights = str(Path(
														
 
															-						self.data_info.BASE_DIR,
														
 
															-						self.data_info.MODEL_DIR,
														
 
															-						self.model_info.folder,
														
 
															-						self.model_info.weights
														
 
															-					))
														
 
															-
														
 
															-				loader_func = self.model.load_for_finetune
														
 
															-
														
 
															-			logging.info(msg.format(self.weights))
														
 
															-			kwargs = dict(
														
 
															-				weights=self.weights,
														
 
															-				strict=args.load_strict,
														
 
															-				path=args.load_path,
														
 
															-				headless=args.headless,
														
 
															-			)
														
 
															-			loader = partial(loader_func, **kwargs)
														
 
															-
														
 
															-		feat_size = self.model.meta.feature_size
														
 
															-
														
 
															-		if hasattr(self.clf, "output_size"):
														
 
															-			feat_size = self.clf.output_size
														
 
															-
														
 
															-		if hasattr(self.clf, "loader"):
														
 
															-			loader = self.clf.loader(loader)
														
 
															-
														
 
															-		logging.info(f"Part features size after encoding: {feat_size}")
														
 
															-		loader(n_classes=self.n_classes, feat_size=feat_size)
														
 
															-		self.clf.cleargrads()
														
 
															-
														
 
															-class _DatasetMixin(abc.ABC):
														
 
															-	"""
														
 
															-		This mixin is responsible for annotation loading and for
														
 
															-		dataset and iterator creation.
														
 
															-	"""
														
 
															-
														
 
															-	def __init__(self, opts, dataset_cls, dataset_kwargs_factory, *args, **kwargs):
														
 
															-		super(_DatasetMixin, self).__init__(opts=opts, *args, **kwargs)
														
 
															-		self.annot = None
														
 
															-		self.dataset_type = opts.dataset
														
 
															-		self.dataset_cls = dataset_cls
														
 
															-		self.dataset_kwargs_factory = dataset_kwargs_factory
														
 
															-
														
 
															-	@property
														
 
															-	def n_classes(self):
														
 
															-		return self.ds_info.n_classes + self.dataset_cls.label_shift
														
 
															-
														
 
															-	@property
														
 
															-	def data_info(self):
														
 
															-		assert self.annot is not None, "annot attribute was not set!"
														
 
															-		return self.annot.info
														
 
															-
														
 
															-	@property
														
 
															-	def ds_info(self):
														
 
															-		return self.data_info.DATASETS[self.dataset_type]
														
 
															-
														
 
															-	def new_dataset(self, opts, size, part_size, subset):
														
 
															-		"""Creates a dataset for a specific subset and certain options"""
														
 
															-		if self.dataset_kwargs_factory is not None and callable(self.dataset_kwargs_factory):
														
 
															-			kwargs = self.dataset_kwargs_factory(opts, subset)
														
 
															-		else:
														
 
															-			kwargs = dict()
														
 
															-
														
 
															-		kwargs = dict(kwargs,
														
 
															-			subset=subset,
														
 
															-			dataset_cls=self.dataset_cls,
														
 
															-			prepare=self.prepare,
														
 
															-			size=size,
														
 
															-			part_size=part_size,
														
 
															-			center_crop_on_val=getattr(opts, "center_crop_on_val", False),
														
 
															-		)
														
 
															-
														
 
															-
														
 
															-		ds = self.annot.new_dataset(**kwargs)
														
 
															-		logging.info("Loaded {} images".format(len(ds)))
														
 
															-		return ds
														
 
															-
														
 
															-
														
 
															-	def init_annotations(self, opts):
														
 
															-		"""Reads annotations and creates annotation instance, which holds important infos about the dataset"""
														
 
															-
														
 
															-		self.annot = AnnotationType.new_annotation(opts, load_strict=False)
														
 
															-		self.dataset_cls.label_shift = opts.label_shift
														
 
															-
														
 
															-
														
 
															-	def init_datasets(self, opts):
														
 
															-
														
 
															-		size = Size(opts.input_size)
														
 
															-		part_size = getattr(opts, "parts_input_size", None)
														
 
															-		part_size = size if part_size is None else Size(part_size)
														
 
															-
														
 
															-		self.prepare = partial(PrepareType[opts.prepare_type](self.model),
														
 
															-			swap_channels=opts.swap_channels,
														
 
															-			keep_ratio=getattr(opts, "center_crop_on_val", False),
														
 
															-		)
														
 
															-
														
 
															-		logging.info(" ".join([
														
 
															-			f"Created {self.model.__class__.__name__} model",
														
 
															-			f"with \"{opts.prepare_type}\" prepare function."
														
 
															-		]))
														
 
															-
														
 
															-		logging.info(" ".join([
														
 
															-			f"Image input size: {size}",
														
 
															-			f"Image parts input size: {part_size}",
														
 
															-		]))
														
 
															-
														
 
															-		self.train_data = self.new_dataset(opts, size, part_size, "train")
														
 
															-		self.val_data = self.new_dataset(opts, size, part_size, "test")
														
 
															-
														
 
															-	def init_iterators(self, opts):
														
 
															-		"""Creates training and validation iterators from training and validation datasets"""
														
 
															-
														
 
															-		kwargs = dict(n_jobs=opts.n_jobs, batch_size=opts.batch_size)
														
 
															-
														
 
															-		if hasattr(self.train_data, "new_iterator"):
														
 
															-			self.train_iter, _ = self.train_data.new_iterator(**kwargs)
														
 
															-		else:
														
 
															-			self.train_iter, _ = new_iterator(self.train_data, **kwargs)
														
 
															-
														
 
															-		if hasattr(self.val_data, "new_iterator"):
														
 
															-			self.val_iter, _ = self.val_data.new_iterator(**kwargs,
														
 
															-				repeat=False, shuffle=False
														
 
															-			)
														
 
															-		else:
														
 
															-			self.val_iter, _ = new_iterator(self.val_data,
														
 
															-				**kwargs, repeat=False, shuffle=False
														
 
															-			)
														
 
															-
														
 
															-
														
 
															-class _TrainerMixin(abc.ABC):
														
 
															-	"""This mixin is responsible for updater, evaluator and trainer creation.
														
 
															-	Furthermore, it implements the run method
														
 
															-	"""
														
 
															-
														
 
															-	def __init__(self, updater_cls, updater_kwargs={}, *args, **kwargs):
														
 
															-		super(_TrainerMixin, self).__init__(*args, **kwargs)
														
 
															-		self.updater_cls = updater_cls
														
 
															-		self.updater_kwargs = updater_kwargs
														
 
															-
														
 
															-	def init_updater(self):
														
 
															-		"""Creates an updater from training iterator and the optimizer."""
														
 
															-
														
 
															-		if self.opt is None:
														
 
															-			self.updater = None
														
 
															-			return
														
 
															-
														
 
															-		self.updater = self.updater_cls(
														
 
															-			iterator=self.train_iter,
														
 
															-			optimizer=self.opt,
														
 
															-			device=self.device,
														
 
															-			**self.updater_kwargs,
														
 
															-		)
														
 
															-		logging.info(" ".join([
														
 
															-			f"Using single GPU: {self.device}.",
														
 
															-			f"{self.updater_cls.__name__} is initialized",
														
 
															-			f"with following kwargs: {pretty_print_dict(self.updater_kwargs)}"
														
 
															-			])
														
 
															-		)
														
 
															-
														
 
															-	def init_evaluator(self, default_name="val"):
														
 
															-		"""Creates evaluation extension from validation iterator and the classifier."""
														
 
															-
														
 
															-		self.evaluator = extensions.Evaluator(
														
 
															-			iterator=self.val_iter,
														
 
															-			target=self.clf,
														
 
															-			device=self.device,
														
 
															-			progress_bar=True
														
 
															-		)
														
 
															-
														
 
															-		self.evaluator.default_name = default_name
														
 
															-
														
 
															-	def _new_trainer(self, trainer_cls, opts, *args, **kwargs):
														
 
															-		return trainer_cls(
														
 
															-			opts=opts,
														
 
															-			updater=self.updater,
														
 
															-			evaluator=self.evaluator,
														
 
															-			*args, **kwargs
														
 
															-		)
														
 
															-
														
 
															-	def run(self, trainer_cls, opts, *args, **kwargs):
														
 
															-
														
 
															-		trainer = self._new_trainer(trainer_cls, opts, *args, **kwargs)
														
 
															-
														
 
															-		self.save_meta_info(opts, folder=Path(trainer.out, "meta"))
														
 
															-
														
 
															-		logging.info("Snapshotting is {}abled".format("dis" if opts.no_snapshot else "en"))
														
 
															-
														
 
															-		def dump(suffix):
														
 
															-			if opts.only_eval or opts.no_snapshot:
														
 
															-				return
														
 
															-
														
 
															-			save_npz(Path(trainer.out, f"clf_{suffix}.npz"), self.clf)
														
 
															-			save_npz(Path(trainer.out, f"model_{suffix}.npz"), self.model)
														
 
															-
														
 
															-		try:
														
 
															-			trainer.run(opts.init_eval or opts.only_eval)
														
 
															-		except (KeyboardInterrupt, BdbQuit) as e:
														
 
															-			raise e
														
 
															-		except Exception as e:
														
 
															-			dump("exception")
														
 
															-			raise e
														
 
															-		else:
														
 
															-			dump("final")
														
 
															-
														
 
															-	def save_meta_info(self, opts, folder: Path):
														
 
															-		folder.mkdir(parents=True, exist_ok=True)
														
 
															-
														
 
															-		with open(folder / "args.yml", "w") as f:
														
 
															-			pyaml.dump(opts.__dict__, f, sort_keys=True)
														
 
															-
														
 
															-
														
 
															-class DefaultFinetuner(_ModelMixin, _DatasetMixin, _TrainerMixin):
														
 
															+class DefaultFinetuner(mixins._ModelMixin, mixins._DatasetMixin, mixins._TrainerMixin):
														
 
															 	""" The default Finetuner gathers together the creations of all needed
														
 
															 	components and call them in the correct order
														
 
															 	"""
														
 
															 	def __init__(self, opts, *args, **kwargs):
														
 
															-		super(DefaultFinetuner, self).__init__(*args, **kwargs)
														
 
															+		super(DefaultFinetuner, self).__init__(opts=opts, *args, **kwargs)
														
 
															 		self.gpu_config(opts)
														
 
															 		cuda.get_device_from_id(self.device).use()
														
--- a/cvfinetune/finetuner/factory.py
+++ b/cvfinetune/finetuner/factory.py
@@ -0,0 +1,50 @@
 
															+import logging
														
 
															+try:
														
 
															+	import chainermn
														
 
															+except Exception as e: #pragma: no cover
														
 
															+	_CHAINERMN_AVAILABLE = False #pragma: no cover
														
 
															+else:
														
 
															+	_CHAINERMN_AVAILABLE = True
														
 
															+
														
 
															+from cvfinetune import utils
														
 
															+from cvfinetune.finetuner.base import DefaultFinetuner
														
 
															+from cvfinetune.finetuner.mpi import MPIFinetuner
														
 
															+
														
 
															+from cvdatasets.utils import pretty_print_dict
														
 
															+
														
 
															+class FinetunerFactory(object):
														
 
															+
														
 
															+	@classmethod
														
 
															+	def new(cls, opts, default=DefaultFinetuner, mpi_tuner=MPIFinetuner):
														
 
															+
														
 
															+		if getattr(opts, "mpi", False):
														
 
															+			assert _CHAINERMN_AVAILABLE, "Distributed training is not possible!"
														
 
															+			msg1 = "MPI enabled. Creating NCCL communicator!"
														
 
															+			comm = chainermn.create_communicator("pure_nccl")
														
 
															+			msg2 = f"Rank: {comm.rank}, IntraRank: {comm.intra_rank}, InterRank: {comm.inter_rank}"
														
 
															+
														
 
															+			utils.log_messages([msg1, msg2])
														
 
															+			return cls(mpi_tuner, comm=comm)
														
 
															+		else:
														
 
															+			return cls(default)
														
 
															+
														
 
															+	def __init__(self, tuner_cls, **kwargs):
														
 
															+		super(FinetunerFactory, self).__init__()
														
 
															+
														
 
															+		self.tuner_cls = tuner_cls
														
 
															+		self.kwargs = kwargs
														
 
															+		logging.info(f"Using {self.tuner_cls.__name__} with arguments: {pretty_print_dict(self.kwargs)}")
														
 
															+
														
 
															+	def __call__(self, **kwargs):
														
 
															+		_kwargs = dict(self.kwargs, **kwargs)
														
 
															+
														
 
															+		return self.tuner_cls(**_kwargs)
														
 
															+
														
 
															+	def get(self, key, default=None):
														
 
															+		return self.kwargs.get(key, default)
														
 
															+
														
 
															+	def __getitem__(self, key):
														
 
															+		return self.kwargs[key]
														
 
															+
														
 
															+	def __setitem__(self, key, value):
														
 
															+		self.kwargs[key] = value
														
--- a/cvfinetune/finetuner/mixins/__init__.py
+++ b/cvfinetune/finetuner/mixins/__init__.py
@@ -0,0 +1,10 @@
 
															+from cvfinetune.finetuner.mixins.dataset import _DatasetMixin
														
 
															+from cvfinetune.finetuner.mixins.model import _ModelMixin
														
 
															+from cvfinetune.finetuner.mixins.trainer import _TrainerMixin
														
 
															+
														
 
															+
														
 
															+__all__ = [
														
 
															+	"_DatasetMixin",
														
 
															+	"_ModelMixin",
														
 
															+	"_TrainerMixin",
														
 
															+]
														
--- a/cvfinetune/finetuner/mixins/dataset.py
+++ b/cvfinetune/finetuner/mixins/dataset.py
@@ -0,0 +1,108 @@
 
															+import abc
														
 
															+import logging
														
 
															+
														
 
															+from chainer_addons.models import PrepareType
														
 
															+from cvdatasets import AnnotationType
														
 
															+from cvdatasets.dataset.image import Size
														
 
															+from cvdatasets.utils import new_iterator
														
 
															+from functools import partial
														
 
															+
														
 
															+
														
 
															+class _DatasetMixin(abc.ABC):
														
 
															+	"""
														
 
															+		This mixin is responsible for annotation loading and for
														
 
															+		dataset and iterator creation.
														
 
															+	"""
														
 
															+
														
 
															+	def __init__(self, opts, dataset_cls, dataset_kwargs_factory, *args, **kwargs):
														
 
															+		super(_DatasetMixin, self).__init__(opts=opts, *args, **kwargs)
														
 
															+		self.annot = None
														
 
															+		self.dataset_type = opts.dataset
														
 
															+		self.dataset_cls = dataset_cls
														
 
															+		self.dataset_kwargs_factory = dataset_kwargs_factory
														
 
															+
														
 
															+	@property
														
 
															+	def n_classes(self):
														
 
															+		return self.ds_info.n_classes + self.dataset_cls.label_shift
														
 
															+
														
 
															+	@property
														
 
															+	def data_info(self):
														
 
															+		assert self.annot is not None, "annot attribute was not set!"
														
 
															+		return self.annot.info
														
 
															+
														
 
															+	@property
														
 
															+	def ds_info(self):
														
 
															+		return self.data_info.DATASETS[self.dataset_type]
														
 
															+
														
 
															+	def new_dataset(self, opts, size, part_size, subset):
														
 
															+		"""Creates a dataset for a specific subset and certain options"""
														
 
															+		if self.dataset_kwargs_factory is not None and callable(self.dataset_kwargs_factory):
														
 
															+			kwargs = self.dataset_kwargs_factory(opts, subset)
														
 
															+		else:
														
 
															+			kwargs = dict()
														
 
															+
														
 
															+		kwargs = dict(kwargs,
														
 
															+			subset=subset,
														
 
															+			dataset_cls=self.dataset_cls,
														
 
															+			prepare=self.prepare,
														
 
															+			size=size,
														
 
															+			part_size=part_size,
														
 
															+			center_crop_on_val=getattr(opts, "center_crop_on_val", False),
														
 
															+		)
														
 
															+
														
 
															+
														
 
															+		ds = self.annot.new_dataset(**kwargs)
														
 
															+		logging.info("Loaded {} images".format(len(ds)))
														
 
															+		return ds
														
 
															+
														
 
															+
														
 
															+	def init_annotations(self, opts):
														
 
															+		"""Reads annotations and creates annotation instance, which holds important infos about the dataset"""
														
 
															+
														
 
															+		self.annot = AnnotationType.new_annotation(opts, load_strict=False)
														
 
															+		self.dataset_cls.label_shift = opts.label_shift
														
 
															+
														
 
															+
														
 
															+	def init_datasets(self, opts):
														
 
															+
														
 
															+		size = Size(opts.input_size)
														
 
															+		part_size = getattr(opts, "parts_input_size", None)
														
 
															+		part_size = size if part_size is None else Size(part_size)
														
 
															+
														
 
															+		self.prepare = partial(PrepareType[opts.prepare_type](self.model),
														
 
															+			swap_channels=opts.swap_channels,
														
 
															+			keep_ratio=getattr(opts, "center_crop_on_val", False),
														
 
															+		)
														
 
															+
														
 
															+		logging.info(" ".join([
														
 
															+			f"Created {self.model.__class__.__name__} model",
														
 
															+			f"with \"{opts.prepare_type}\" prepare function."
														
 
															+		]))
														
 
															+
														
 
															+		logging.info(" ".join([
														
 
															+			f"Image input size: {size}",
														
 
															+			f"Image parts input size: {part_size}",
														
 
															+		]))
														
 
															+
														
 
															+		self.train_data = self.new_dataset(opts, size, part_size, "train")
														
 
															+		self.val_data = self.new_dataset(opts, size, part_size, "test")
														
 
															+
														
 
															+	def init_iterators(self, opts):
														
 
															+		"""Creates training and validation iterators from training and validation datasets"""
														
 
															+
														
 
															+		kwargs = dict(n_jobs=opts.n_jobs, batch_size=opts.batch_size)
														
 
															+
														
 
															+		if hasattr(self.train_data, "new_iterator"):
														
 
															+			self.train_iter, _ = self.train_data.new_iterator(**kwargs)
														
 
															+		else:
														
 
															+			self.train_iter, _ = new_iterator(self.train_data, **kwargs)
														
 
															+
														
 
															+		if hasattr(self.val_data, "new_iterator"):
														
 
															+			self.val_iter, _ = self.val_data.new_iterator(**kwargs,
														
 
															+				repeat=False, shuffle=False
														
 
															+			)
														
 
															+		else:
														
 
															+			self.val_iter, _ = new_iterator(self.val_data,
														
 
															+				**kwargs, repeat=False, shuffle=False
														
 
															+			)
														
 
															+
														
--- a/cvfinetune/finetuner/mixins/model.py
+++ b/cvfinetune/finetuner/mixins/model.py
@@ -0,0 +1,159 @@
 
															+import abc
														
 
															+import chainer.functions as F
														
 
															+import logging
														
 
															+
														
 
															+from chainer.optimizer_hooks import Lasso
														
 
															+from chainer.optimizer_hooks import WeightDecay
														
 
															+from chainer_addons.functions import smoothed_cross_entropy
														
 
															+from chainer_addons.models import ModelType
														
 
															+from chainer_addons.training import optimizer
														
 
															+from chainer_addons.training import optimizer_hooks
														
 
															+from cvdatasets.dataset.image import Size
														
 
															+from cvdatasets.utils import pretty_print_dict
														
 
															+from functools import partial
														
 
															+from pathlib import Path
														
 
															+
														
 
															+
														
 
															+class _ModelMixin(abc.ABC):
														
 
															+	"""
														
 
															+		This mixin is responsible for optimizer creation, model creation,
														
 
															+		model wrapping around a classifier and model weights loading.
														
 
															+	"""
														
 
															+
														
 
															+	def __init__(self, opts, classifier_cls, classifier_kwargs={}, model_kwargs={}, *args, **kwargs):
														
 
															+		super(_ModelMixin, self).__init__(opts=opts, *args, **kwargs)
														
 
															+		self.classifier_cls = classifier_cls
														
 
															+		self.classifier_kwargs = classifier_kwargs
														
 
															+		self.model_type = opts.model_type
														
 
															+		self.model_kwargs = model_kwargs
														
 
															+
														
 
															+
														
 
															+	@property
														
 
															+	def model_info(self):
														
 
															+		return self.data_info.MODELS[self.model_type]
														
 
															+
														
 
															+	def wrap_model(self, opts):
														
 
															+
														
 
															+		clf_class, kwargs = self.classifier_cls, self.classifier_kwargs
														
 
															+
														
 
															+		self.clf = clf_class(
														
 
															+			model=self.model,
														
 
															+			loss_func=self._loss_func(opts),
														
 
															+			**kwargs)
														
 
															+
														
 
															+		logging.info(" ".join([
														
 
															+			f"Wrapped the model around {clf_class.__name__}",
														
 
															+			f"with kwargs: {pretty_print_dict(kwargs)}",
														
 
															+		]))
														
 
															+
														
 
															+	def _loss_func(self, opts):
														
 
															+		if getattr(opts, "l1_loss", False):
														
 
															+			return F.hinge
														
 
															+
														
 
															+		elif getattr(opts, "label_smoothing", 0) >= 0:
														
 
															+			assert getattr(opts, "label_smoothing", 0) < 1, \
														
 
															+				"Label smoothing factor must be less than 1!"
														
 
															+			return partial(smoothed_cross_entropy,
														
 
															+				N=self.n_classes,
														
 
															+				eps=getattr(opts, "label_smoothing", 0))
														
 
															+		else:
														
 
															+			return F.softmax_cross_entropy
														
 
															+
														
 
															+	def init_optimizer(self, opts):
														
 
															+		"""Creates an optimizer for the classifier """
														
 
															+		if not hasattr(opts, "optimizer"):
														
 
															+			self.opt = None
														
 
															+			return
														
 
															+
														
 
															+		opt_kwargs = {}
														
 
															+		if opts.optimizer == "rmsprop":
														
 
															+			opt_kwargs["alpha"] = 0.9
														
 
															+
														
 
															+		self.opt = optimizer(opts.optimizer,
														
 
															+			self.clf,
														
 
															+			opts.learning_rate,
														
 
															+			decay=0, gradient_clipping=False, **opt_kwargs
														
 
															+		)
														
 
															+
														
 
															+		if opts.decay > 0:
														
 
															+			reg_kwargs = {}
														
 
															+			if opts.l1_loss:
														
 
															+				reg_cls = Lasso
														
 
															+
														
 
															+			elif opts.pooling == "alpha":
														
 
															+				reg_cls = optimizer_hooks.SelectiveWeightDecay
														
 
															+				reg_kwargs["selection"] = check_param_for_decay
														
 
															+
														
 
															+			else:
														
 
															+				reg_cls = WeightDecay
														
 
															+
														
 
															+			logging.info(f"Adding {reg_cls.__name__} ({opts.decay:e})")
														
 
															+			self.opt.add_hook(reg_cls(opts.decay, **reg_kwargs))
														
 
															+
														
 
															+		if getattr(opts, "only_head", False):
														
 
															+			assert not getattr(opts, "recurrent", False), \
														
 
															+				"Recurrent classifier is not supported with only_head option!"
														
 
															+
														
 
															+			logging.warning("========= Fine-tuning only classifier layer! =========")
														
 
															+			enable_only_head(self.clf)
														
 
															+
														
 
															+	def init_model(self, opts):
														
 
															+		"""creates backbone CNN model. This model is wrapped around the classifier later"""
														
 
															+
														
 
															+		if self.model_type.startswith("cv2_"):
														
 
															+			model_type = args.model_type.split("cv2_")[-1]
														
 
															+		else:
														
 
															+			model_type = self.model_info.class_key
														
 
															+
														
 
															+		self.model = ModelType.new(
														
 
															+			model_type=model_type,
														
 
															+			input_size=Size(opts.input_size),
														
 
															+			**self.model_kwargs,
														
 
															+		)
														
 
															+
														
 
															+	def load_model_weights(self, args):
														
 
															+		if getattr(args, "from_scratch", False):
														
 
															+			logging.info("Training a {0.__class__.__name__} model from scratch!".format(self.model))
														
 
															+			loader = self.model.reinitialize_clf
														
 
															+			self.weights = None
														
 
															+		else:
														
 
															+			if args.load:
														
 
															+				self.weights = args.load
														
 
															+				msg = "Loading already fine-tuned weights from \"{}\""
														
 
															+				loader_func = self.model.load_for_inference
														
 
															+			else:
														
 
															+				if args.weights:
														
 
															+					msg = "Loading custom pre-trained weights \"{}\""
														
 
															+					self.weights = args.weights
														
 
															+
														
 
															+				else:
														
 
															+					msg = "Loading default pre-trained weights \"{}\""
														
 
															+					self.weights = str(Path(
														
 
															+						self.data_info.BASE_DIR,
														
 
															+						self.data_info.MODEL_DIR,
														
 
															+						self.model_info.folder,
														
 
															+						self.model_info.weights
														
 
															+					))
														
 
															+
														
 
															+				loader_func = self.model.load_for_finetune
														
 
															+
														
 
															+			logging.info(msg.format(self.weights))
														
 
															+			kwargs = dict(
														
 
															+				weights=self.weights,
														
 
															+				strict=args.load_strict,
														
 
															+				path=args.load_path,
														
 
															+				headless=args.headless,
														
 
															+			)
														
 
															+			loader = partial(loader_func, **kwargs)
														
 
															+
														
 
															+		feat_size = self.model.meta.feature_size
														
 
															+
														
 
															+		if hasattr(self.clf, "output_size"):
														
 
															+			feat_size = self.clf.output_size
														
 
															+
														
 
															+		if hasattr(self.clf, "loader"):
														
 
															+			loader = self.clf.loader(loader)
														
 
															+
														
 
															+		logging.info(f"Part features size after encoding: {feat_size}")
														
 
															+		loader(n_classes=self.n_classes, feat_size=feat_size)
														
 
															+		self.clf.cleargrads()
														
--- a/cvfinetune/finetuner/mixins/trainer.py
+++ b/cvfinetune/finetuner/mixins/trainer.py
@@ -0,0 +1,92 @@
 
															+import abc
														
 
															+import logging
														
 
															+import pyaml
														
 
															+
														
 
															+from bdb import BdbQuit
														
 
															+from chainer.serializers import save_npz
														
 
															+from chainer.training import extensions
														
 
															+from cvdatasets.utils import pretty_print_dict
														
 
															+from pathlib import Path
														
 
															+
														
 
															+
														
 
															+class _TrainerMixin(abc.ABC):
														
 
															+	"""This mixin is responsible for updater, evaluator and trainer creation.
														
 
															+	Furthermore, it implements the run method
														
 
															+	"""
														
 
															+
														
 
															+	def __init__(self, opts, updater_cls, updater_kwargs={}, *args, **kwargs):
														
 
															+		super(_TrainerMixin, self).__init__(*args, **kwargs)
														
 
															+		self.updater_cls = updater_cls
														
 
															+		self.updater_kwargs = updater_kwargs
														
 
															+
														
 
															+	def init_updater(self):
														
 
															+		"""Creates an updater from training iterator and the optimizer."""
														
 
															+
														
 
															+		if self.opt is None:
														
 
															+			self.updater = None
														
 
															+			return
														
 
															+
														
 
															+		self.updater = self.updater_cls(
														
 
															+			iterator=self.train_iter,
														
 
															+			optimizer=self.opt,
														
 
															+			device=self.device,
														
 
															+			**self.updater_kwargs,
														
 
															+		)
														
 
															+		logging.info(" ".join([
														
 
															+			f"Using single GPU: {self.device}.",
														
 
															+			f"{self.updater_cls.__name__} is initialized",
														
 
															+			f"with following kwargs: {pretty_print_dict(self.updater_kwargs)}"
														
 
															+			])
														
 
															+		)
														
 
															+
														
 
															+	def init_evaluator(self, default_name="val"):
														
 
															+		"""Creates evaluation extension from validation iterator and the classifier."""
														
 
															+
														
 
															+		self.evaluator = extensions.Evaluator(
														
 
															+			iterator=self.val_iter,
														
 
															+			target=self.clf,
														
 
															+			device=self.device,
														
 
															+			progress_bar=True
														
 
															+		)
														
 
															+
														
 
															+		self.evaluator.default_name = default_name
														
 
															+
														
 
															+	def _new_trainer(self, trainer_cls, opts, *args, **kwargs):
														
 
															+		return trainer_cls(
														
 
															+			opts=opts,
														
 
															+			updater=self.updater,
														
 
															+			evaluator=self.evaluator,
														
 
															+			*args, **kwargs
														
 
															+		)
														
 
															+
														
 
															+	def run(self, trainer_cls, opts, *args, **kwargs):
														
 
															+
														
 
															+		trainer = self._new_trainer(trainer_cls, opts, *args, **kwargs)
														
 
															+
														
 
															+		self.save_meta_info(opts, folder=Path(trainer.out, "meta"))
														
 
															+
														
 
															+		logging.info("Snapshotting is {}abled".format("dis" if opts.no_snapshot else "en"))
														
 
															+
														
 
															+		def dump(suffix):
														
 
															+			if opts.only_eval or opts.no_snapshot:
														
 
															+				return
														
 
															+
														
 
															+			save_npz(Path(trainer.out, f"clf_{suffix}.npz"), self.clf)
														
 
															+			save_npz(Path(trainer.out, f"model_{suffix}.npz"), self.model)
														
 
															+
														
 
															+		try:
														
 
															+			trainer.run(opts.init_eval or opts.only_eval)
														
 
															+		except (KeyboardInterrupt, BdbQuit) as e:
														
 
															+			raise e
														
 
															+		except Exception as e:
														
 
															+			dump("exception")
														
 
															+			raise e
														
 
															+		else:
														
 
															+			dump("final")
														
 
															+
														
 
															+	def save_meta_info(self, opts, folder: Path):
														
 
															+		folder.mkdir(parents=True, exist_ok=True)
														
 
															+
														
 
															+		with open(folder / "args.yml", "w") as f:
														
 
															+			pyaml.dump(opts.__dict__, f, sort_keys=True)
														
 
															+