Vor einigen Tagen fand ich einen Artikel bei Technology Review, der ein Forschungsprojekt ankündigt das Kampfszenen in Videoaufnahmen erkennen können soll. Die Idee kam mir bekannt vor und dessen Probleme hab ich in einem Artikel zu einem ähnlichen Projekt in England in diesem Blog schon thematisiert. Der TR Artikel bespricht aber nicht „fightcams“ sondern das Projekt adabts das bereits 2013 abgeschlossen wurde. Einige neue Erkenntnisse gibt es daher schon, „Vorhersagen“ können sie das Verhalten allerdings nicht.

Um zu verstehen wie adabts funktioniert hab‘ ich einen Artikel1 rausgesucht in dem die Forscher*innen die Funktionweise ihres System beschrieben haben, sowie die Abschlusspräsentation des Projekts durchgeschaut.

Die Nachteile des Supervised Learning

Die getesteten Beispiele beziehen sich auf sehr stark strukturierte Orte, in denen der Algorithmus erst „normales“ Verhalten lernt und dann später davon abweichendes Erkennen soll (supervised learning) . Im konkreten Fall wurde eine Eingangshalle gefilmt die Leute entweder einfach durchqueren, dort abgeholt werden oder sich zur Rezeption begeben um von da aus irgendwo hinzugehen. 10 Bewegungsmuster konnte der Algorithmus darin erkennen die 75% der Verhaltensweisen erfassen.

Vergleich normale und anormale Bewegung in ADABTS

Der Vergleich normaler und anormaler Bewegungsmuster. aus: Gravila, Jansen „Functionalities and Applications“ – Präsentation als PDF.

Der „abnormale“ Fall war dann der Besuch von zwei „Terroristen“ von denen der erste erst den Ort auskundschaftete (also anders rumlief als die übrigen Personen) und ein zweiter dann auf jemanden vom Sicherheitsdienst losgeht. Immerhin scheint das lernen zu funktionieren. Der Algorithmus findet in den Testdaten zwei fliehende Menschen ungewöhnlich und auch das „scouten“ des ersten Terroristen fällt dem Algorithmus auf.

Click here to display content from YouTube.
Erfahre mehr in der Datenschutzerklärung von YouTube.

Tag and Track.

  1. Kooij, J.F.P., Englebienne, G., Gavrila, D.M.: A Non-parametric Hierarchical Model to Discover Behavior Dynamics from Tracks. In: Fitzgibbon, A., Lazebnik, S., Perona, P., Sato, Y., and Schmid, C. (eds.) Computer Vision – ECCV 2012. pp. 270–283. Springer Berlin Heidelberg (2012). []