123456789 |
- \begin{center}{\sectfont\LARGE {\"U}berblick}\end{center}
- In der Biodiversit{\"a}tsforschung werden Kamerafallen zur {\"U}berwachung von Tierpopulationen eingesetzt. Diese Vorrichtungen produzieren riesige Datenmengen, wodurch es f{\"u}r Spezialisten sehr m{\"u}hsam ist, die abgelichteten Tierarten zu klassifizieren. Au{\ss}erdem f{\"u}hren Beleuchtungs{\"a}nderungen, Wind und wechselnde Wetterbedingungen zu einer gro{\ss}en Anzahl leerer Bilder ohne Tiere. In dieser Arbeit werden mehrere Ans{\"a}tze aus der Anomalieerkennung untersucht, die teilweise auf traditionellen Bildverarbeitungsmethoden (Differenzbild, Bag of Visual Words) und teilweise auf Methoden des tiefen Lernens (Autoencoder) basieren, um leere Bilder zu eliminieren. So wird die Artenklassifizierung vereinfacht und dadurch der Annotationsaufwand f{\"u}r die Spezialisten minimiert. Verschiedene Konfigurationen dieser Ans{\"a}tze werden erforscht und bewertet. Anschlie{\ss}end werden die Ans{\"a}tze f{\"u}r Bilddaten aus unterschiedlichen Kamerafallen verglichen, die im Bayerischen Wald aufgestellt wurden. Experimente zeigen, dass alle Ans{\"a}tze f{\"u}r die meisten Kamerafallen eine signifikante Anzahl leerer Bilder eliminieren k{\"o}nnen. Allerdings erweisen sich die traditionellen Methoden, die auf Differenzbildern basieren, als die zuverl{\"a}ssigsten. Abschlie{\ss}end werden f{\"u}r jeden Ansatz m{\"o}gliche Erweiterungen zur Verbesserung der Genauigkeit diskutiert.
- \vspace{\fill}
- \begin{center}{\sectfont\LARGE Abstract}\end{center}
- In biodiversity research, camera traps are used to monitor wildlife populations. Such devices produce vast amounts of data, making the process of species recognition cumbersome. Moreover, lighting changes, wind, and changing weather conditions result in a high proportion of images without animals. In this work, several approaches based on anomaly detection are proposed using traditional computer vision methods (frame differencing, Bag of Visual Words) as well as deep learning (autoencoders) to eliminate such empty images, hence aiding the subsequent species classification step and minimizing the human annotation workload. Different configurations of these approaches are explored and evaluated. Next, the approaches are compared on image data from multiple camera traps installed in the Bavarian Forest National Park in Germany. Experiments show that all proposed approaches are able to eliminate a significant number of empty images for most of the utilized image sets. However, the traditional methods based on frame differencing prove to be the most reliable. Finally, possible extensions to improve accuracy are discussed for every approach.
|