ComputerVisionJena
/
cvdatasets


			
							1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889909192939495969798
							from os.path import join, isfile
import numpy as np
from collections import defaultdict


class Annotations(object):
	class meta:
		images_file = "images.txt"
		images_folder = "images"
		labels_file = "labels.txt"
		hierarchy_file = "hierarchy.txt"
		split_file = "train_test_split.txt"
		parts_file = join("parts", "part_locs.txt")

		structure = [
			[images_file, "_images"],
			[labels_file, "labels"],
			[hierarchy_file, "hierarchy"],
			[split_file, "_split"],
			[parts_file, "_part_locs"],
		]

	def _path(self, file):
		return join(self.root, file)

	def _open(self, file):
		return open(self._path(file))

	def read_content(self, file, attr):
		content = None
		if isfile(self._path(file)):
			with self._open(file) as f:
				content = [line.strip() for line in f if line.strip()]

		setattr(self, attr, content)

	def __init__(self, root):
		super(Annotations, self).__init__()
		self.root = root

		for fname, attr in Annotations.meta.structure:
			self.read_content(fname, attr)

		self.labels = np.array([int(l) for l in self.labels], dtype=np.int32)

		self._load_uuids()
		self._load_parts()
		self._load_split()

	def _load_uuids(self):
		assert self._images is not None, "Images were not loaded!"
		uuid_fnames = [i.split() for i in self._images]
		self.uuids, self.images = map(np.array, zip(*uuid_fnames))
		self.uuid_to_idx = {uuid: i for i, uuid in enumerate(self.uuids)}

	def _load_parts(self):
		assert self._part_locs is not None, "Part locations were not loaded!"
		# this part is quite slow... TODO: some runtime improvements?
		uuid_to_parts = defaultdict(list)
		for content in [i.split() for i in self._part_locs]:
			uuid_to_parts[content[0]].append([int(i) for i in content[1:]])
		self.part_locs = np.stack([uuid_to_parts[uuid] for uuid in self.uuids])

	def _load_split(self):
		assert self._split is not None, "Train-test split was not loaded!"
		uuid_to_split = {uuid: int(split) for uuid, split in [i.split() for i in self._split]}
		self.train_split = np.array([uuid_to_split[uuid] for uuid in self.uuids], dtype=bool)
		self.test_split = np.logical_not(self.train_split)

	def image_path(self, image):
		return join(self.root, Annotations.meta.images_folder, image)

	def image(self, uuid):
		fname = self.images[self.uuid_to_idx[uuid]]
		return self.image_path(fname)

	def label(self, uuid):
		return self.labels[self.uuid_to_idx[uuid]]

	def parts(self, uuid):
		return self.part_locs[self.uuid_to_idx[uuid]]


	def _uuids(self, split):
		return self.uuids[split]
		# for i in np.where(split)[0]:
		# 	uuid = self.image_list[i]
		# 	yield uuid

	@property
	def train_uuids(self):
		return self._uuids(self.train_split)

	@property
	def test_uuids(self):
		return self._uuids(self.test_split)