Im Herbst 2014 wurde Precobs in Zürich eingeführt. In den ersten Berichten wurden damals ein Rückgang der Einbruchsdelikte von bis zu 30% vermeintlich sofort erreicht. Am Ende war der Erfolg dann auf das Jahr gerechnet statistisch kaum signifikant, da die Zahl der Einbrüche in Zürich insgesamt zurück gegangen ist. In 2015 war Precobs nun ganzjährig im Einsatz, also im Prinzip genug Zeit die ganze Macht der Vorhersagekraft zu entfalten. Halten kann Precobs die Versprechen allerdings nicht.
Page 3 of 9
Vorhersage vs. Einschätzung durch Social Media
Aus der Kategorie „Was sich aus Social Media nicht alles ‚vorhersagen‘ lässt“ stell‘ ich heute eine Studie vor, bei der Schäden, die durch Naturkatastropen verursacht wurden, anhand von Twitter vorhergesagt werden sollen. Anhand der Studie lassen sich auch gut die Grenzen der Big Data Analyse von Social Media Daten aufzeigen.
Bei Heise.de gibt es einen Update zur Nutzung von Precobs mit Infos von einem Polizeikongress.
Dort erfährt man das an einer Smartphone App für Precobs gearbeitet wird, aber auch, dass die Erfolge eher klein sind.
[Das System kann] 30 bis 40 Prozent gute Antworten für eng begrenzte Fragen bei Einbruchsserien liefern […]. „Wir stellen für manche Muster fest, dass unsere kriminalistischen Annahmen nicht stimmen. Es gibt immer wieder Enttäuschungen, wenn eine Datenrelation, die wir angenommen haben, nicht funktioniert.“
Intrado Beware und der Threat Score
In diesem Beitrag geht es um Intrado Beware, ein System, dass von Sicherheitsbehörden genutzt werden kann um für eine Person eine Threat Score oder Risk Index berechnet. Das System trifft zwar keine Vorhersagen, sondern ist eher ein Tool zu Datenaggregation, dennoch wird es als Predictive Policing beworben. Und letztendlich ist ein Score auch eine Aussagen darüber wie sich eine Person in Gegenwart und Zukunft verhalten wird.
Scoring-NG in China?
Vor einigen Wochen machte die Nachricht die Runde, in China werde ein umfassendes Social-Scoring eingeführt, bei dem der Scorewert in Zukunft über alles mögliche mitentscheiden würde. Das führt zu einem kurzen, medialen Aufschrei, dabei stimmten nicht alle Fakten und ähnliche Techniken sind heute auch schon anderswo im Einsatz. Eine Zusammenfassung.
Die Wettervorhersage ist ja per Definition in die Zukunft gerichtet, aber nicht besonders gut. Wann die Sonne wo stehen wird, ist dagegen relativ leicht zu bestimmen. Jetzt gibt’s ein Amteuerfotografie-Update: Die Vorhersage schöner Sonnenunter- und aufgänge. Erstmal allerdings nur für die USA.
Gefunden bei: nj.com
In einem kurzen Beitrag in der Finanical Times (hier nicht-paywalled zusammengefasst) wurde wieder über Social Scoring für die Berechnung der Kreditwürdigkeit berichtet.
Es scheint als wären auch amerikanische Scoring-Unternehmen noch eher an den „klassischen“ Werten interessiert und schätzen Personen die nicht häufig umziehen (andernfalls könnte das auf Probleme mit der Miethöhe hinweisen) und ihre Rechnungen zügig bezahlen. Aber auch dort würde man gerne mehr über eben jene Leute wissen, für die sich mit den klassischen Methoden nichts berechnen lässt, weil einfach keine Daten vorliegen. Viel zitiert wurde daher die Aussage das man auch Facebook-Profile beobachtet, und etwa Menschen die häufig posten das irgendwer oder irgendwas „wasted“ ist. Umgangsprachlich übersetzt es sich mit „besoffen“. Das Sprache meist mehrdeutig ist, ist für den Score erstmal egal.
“If you look at how many times a person says ‘wasted’ in their profile, it has some value in predicting whether they’re going to repay their debt,” Will Lansing, chief executive at credit rating company FICO „It’s not much, but it’s more than zero.“
Dein Einkommen laut Twitter
Was man nicht alles aus Tweets vorhersagen kann. Wir hatten hier schon den Arbeitslosigkeit, Modetrends, und den Wunsch soziale Proteste zu erkennen bevor sie auf die Straße getragen werden. Kürzlich erschien eine weitere Studie, die nun nachweist, dass sich auch das Einkommen1 anhand der Tweets eines_r Users_in schätzen lässt.
- D. Preoţiuc-Pietro, S. Volkova, V. Lampos, Y. Bachrach, und N. Aletras, „Studying User Income through Language, Behaviour and Affect in Social Media“, PLoS ONE, Bd. 10, Nr. 9, S. e0138717, Sep. 2015. [↩]
HunchLab und Risk Terrain Modeling
Über einen Bericht zu den predictive policing Plänen in New York, bin ich auf die Software HunchLab gestoßen. Die, sowie die das darin implementierte Konzept des Risk Terrain Modeling hab‘ ich mir daraufhin etwas genauer angeschaut.
Der Guardian berichtet, dass die US-Regierung vor Gericht eingestanden hat predictive analytics einzusetzen um zu bestimmen wer auf die No-Fly-Listen kommt. In den USA gibt es seit Jahren gerichtliche Auseinandersetzung um diese Listen, da auch immer wieder Menschen das Besteigen eines Flugzeugs verweigert wird, die sich nichts haben zu schulden kommen lassen. Berühmt geworden ist der Fall eines 8-jährigen, der zwar nicht auf einer No-Fly-Liste stand, aber zumindest auf einer, die vor jedem Flug eine Sonderbehandlung mit sich brachte. Im letzten Jahr sind laut Guardian zudem fünf Muslime auf der Liste gelandet, deren „Vergehen“ (nach eigener Aussage) darin bestand, sich geweigert zu haben mit dem FBI zusammen zu arbeiten.
Die genaue Technik ist zwar unbekannt aber es werden immer häufiger Details zur Arbeitsweise bekannt wie und warum Menschen das Fliegen verwehrt wird. Dabei werden offensichtlich häufig nicht (nur) tatsächlich begangenen Straftaten oder verdächtige Aussagen berücksichtigt, sondern eben auch Vermutung darüber angestellt wie gefährlich eine Person sein könnte.
Technisch ist es allerdings wirklich schwierig ein System zu bauen, dass automatisiert Einträge zu dieser Liste hinzufügt. Die Zahl der „falschen“ Einträge (false positives) muss zwangsweise sehr hoch sein, denn wie soll das System auch lernen wer Terrorist_in ist und wer nicht, besonders viele Fälle von denen gelernt werden könnte gibt es ja nicht.