Bei Deutschlandradio gab’s Anfang Juni einen Radiobeitrag zu Predictive Policing der empfehlenswert ist. Er gibt einen Überblick über die Forschungsbereiche der automatisierten und präventiven Polizeiarbeit und dem Alltag in einer Polizeieinheit die Lagebilder erstellt. In NRW soll eben solche Software zum Einsatz kommen, um Einbrüche aufzuklären.
Autor: pilpul
Metadaten & Die Signatur der Terrorist_innen 2
In einem Beitrag bei Glenn Greenwald’s „Intercept“ wird nochmal ausführlich die Praxis der targeted killings insbesondere auf Basis von Telefon-Metadaten erläutert.

More Than A Score – Initiativen gegen Data Mining an Schulen
Über Slashdot bin ich auf eine sehr gute Reportage bei Politico.com aufmerksam geworden, die sich mit dem Widerstand von Eltern gegen die Dauer-Evaluation ihrer Kindern beschäftigt. Sie kritisieren insbesondere die nicht absehbaren Folgen des Data Mining und den möglichen Verkauf der daraus entstehenden Daten und haben auch schon erste Erfolge erzielt
Moneyball / Big Data und Baseball
Neben Gesundheit und Wirtschaft wird auch der Sport durch Big Data revolutioniert werden – sind sich zumindest die Fanboys sicher. Zwar geht es auch beim Profisport eher um Geld als um Sport, aber der Unterschied zu Unternehmen wie Zynga liegt darin, dass nicht (direkt) die Auswertung von Konsument*innen-Verhalten im Mittelpunkt stehen. Viel zitiert wird die Erfolgsgeschichte der Oakland A’s, die erst als Buch und dann im Film „Moneyball“ aufbereitet wurde.
Zynga: Big Data-Gaming
Zynga ist neben Google Flu Trends eines der Vorzeigebeispiele für Big Data. Während Google Flu Trends exemplarisch sein soll für die Vorteile von Big Data für eine Gesellschaft (und ihre Gesundheit) repräsentiert Zynga die Versprechen für die Wirtschaft. Data Driven Decision Making hat Zynga innerhalb kurzer Zeit zu seinem millionenschweren Unternehmen gemacht. Wie genau Zynga mit Big Data arbeitet, damit Geld verdient und warum es vielleicht doch kein so gutes Beispiel ist folgt hier.
Beim NDR, wo sie regelmäßig über die SCHUFA und Adressehändler_innen berichten, wurden Details aus einer Präsentation veröffentlicht in der die SCHUFA darlegt welche Daten wie häufig bei der Score-Berechnung zur Kreditwürdigkeit mit einfließen. Da die SCHUFA scheinbar nur zu 9% der Leute was negatives sagen kann, werden häufiger andere Kriterien herangezogen. Und die sind klassisch konservativ: das Alter von Datensätzen (also wie lange ein Konto besteht und wie oft sich die Adresse ändert) ist das Attribut, das am häufigsten in die Berechnung einfließt. Leider weiß auch der Leak nichts über die Bewertung dieses Attributs. Liest die SCHUFA häufige Umzüge eher als „flexible und Karriereorientiert“ oder als „potentielle Mietnomanden“? Deutet ein Bankwechsel und viele Konten auf „reich und preisbewusst bei Finanzdienstleistungen“ hin oder auf „interssiert sich für Geldwäsche“?

Google Flu Trends
Googles Flu Trends ist seit Jahren eines der beliebtesten Beispiele für die vermeintliche Effektivität von Big Data. In relativ vielen Artikel stößt man auf die Googles Vorhersage für Grippewellen, die es zu einer wissenschaftlichen Veröffentlichung1 gebracht hat. In dem populärwissenschaftlichen Buch von Mayer-Schönberger & Cukier „Big data: a revolution that will transform how we live, work and think„ ist es gar das Ausgangsbeispiel für die Erklärung der viele Vorteile von Big Data und predictive Analytics.
- Ginsberg, J., Mohebbi, M. H., Patel, R. S., Brammer, L., Smolinski, M. S., & Brilliant, L. (2009). Detecting influenza epidemics using search engine query data. Nature, 457(7232), 1012–1014. doi:10.1038/nature07634 [↩]
Gerade erst entdeckt: Das Chaosradio von Ende Januar beschäftigt sich mit er Analyse und interpretation großer (Text-)Datenmengen und der Dinge die damit zusammenhängen. Besonders interessant sind die Beiträge (ab Minute 60) vom Linguisten Jochaim Scharloth, der auch blogt, über die sozio-linguistische Perspektive z.B. über die normative Macht derjenigen, die die Modelle und Hypothesen bauen.
Ein Artikel bei heise auf Basis einer Anfrage der Linkspartei Fraktion im Bundestag verweist auf zwei Projekte proaktiver Verbrechensbekämpfung
- PROACTIVE hat das Ziel der
prediction, detection, understanding and efficient response to terrorist interests, goals and courses of actions
auf Basis von städtischen Sensornetzwerken. Obwohl das Projekt schon seit 2012 läuft gibt es keine öffentlichen Berichte z.B. darüber wie die Interessen und Ziele von Terroristen ermittelt werden.
- Caper soll organisierte Kriminalität erkennen und verhindern helfen. Dabei scheint es vor allen Dingen darum zu gehen den Law Enforcement Agencies öffentlich zugängliche Daten zugänglich und nutzbar zu machen.
vielleicht später mehr

Soziale Proteste vorrausagen II
Nicht nur das GCHQ versucht vorher zu wissen wann aus Unzufriedenheit (gewaltsamer) Protest wird. Neben, denen die Predictive Policing Systeme entwickeln und verkaufen machen sich auch unabhängige Forschungseinrichtung wie das „New England Complex Systems Insitute“ mit populärwissenschaftlichen Berechnungen zitierfähig. Also Expert_innen für komplexe Systeme (Leitspruch „solving problems of science and society“) haben Sie es tatsächlich geschafft 50% einer uralten Korrelation mathematisch zu beweisen: Über längere Zeit hungrige Menschen neigen eher zur Revolten. Ok, sie wissen auch nicht genau wo es zu Revolten kommt (dazu gibt es dann doch zuviele andere Faktoren), aber zumindest reicht es um Nachrichtenartikel über soziale Proteste Weltweit mit einem Preisindex zu korrelieren und feststellen, dass es, wenn der Preis nach oben schnellt, Protest gibt.