Googles Flu Trends ist seit Jahren eines der beliebtesten Beispiele für die vermeintliche Effektivität von Big Data. In relativ vielen Artikel stößt man auf die Googles Vorhersage für Grippewellen, die es zu einer wissenschaftlichen Veröffentlichung1 gebracht hat. In dem populärwissenschaftlichen Buch von Mayer-Schönberger & Cukier  Big data: a revolution that will transform how we live, work and think ist es gar das Ausgangsbeispiel für die Erklärung der viele Vorteile von Big Data und predictive Analytics.

[..]engineers at the Internet giant Google published a remarkable paper in the scientific journal Nature. It created a splash among health officials and computer scientists but was otherwise overlooked. The authors explained how Google could “predict” the spread of the winter flu in the United States, not just nationally, but down to specific regions and even states. The company could achieve this by looking at what people were searching for on the Internet. Since Google receives more than three billion search queries every day and saves them all, it had plenty of data to work with.

[..] Strikingly, Google’s method does not involve distributing mouth swabs or contacting physicians’ offices. Instead, it is built on “big data”—the ability of society to harness information in novel ways to produce useful insights or goods and services of significant value. With it, by the time the next pandemic comes around, the world will have a better tool at its disposal to predict and thus prevent its spread.2

Neben den schon ‚klassischen‘ Vorteilen von Big Data, das keine Kausalitäten mehr braucht sondern einfach gute Ergebnisse liefert zeigt der zweite Absatz auch gleich noch die dazu gehörende Grundhaltung. Eine Absage an die vermeintlich behäbigen verstaatlichten und (immernoch) teil-manuellen und an die langsamkeit des physikalischen Raums gebundene Strukturen der Meldungen durch Ärzt_innen, die nicht mit irgendwelchen und vor allen Dingen nicht mit vielen Daten arbeiten sondern ganz gezielt auf ein Thema bezogen Krankheiten melden.

Google Flu Trends für Deutschland vom 17.03.2014

Google Flu Trends für Deutschland vom 17.03.2014

Nun haben sich Leute von der Northeastern University in Boston Google Flu Trends nach einigen Jahren nochmal angeschaut und sind zu keinem so optimistischen Ergebnis gekommen. „Google Flu Trends gets it wrong three years running“ heißt ein Artikel in New Scientist. Google Flu Trends haben in den vergangenen Jahren die Zahl der tatsächlichen Ärzt_innenbesuche regelmäßig um ein vielfaches überschätzt. Zuverlässiger sei es die Daten der Meldebehörden wenige Wochen in die Zukunft zu prognostizieren, um etwa Medikamentenbedarfe planen zu können.

Dabei wird nicht die Idee von Google Flu Trends in Frage gestellt, sondern vor allem kritisiert, dass die Berechnungen – ganz im Gegenteil zu einer der Grundideen von Big Data – zu statisch seien. Es wird zwar mit den ständig sich aktualisierende Daten der Eingaben von User_innen gearbeitet, die Analyse aber passiert scheinbar immer noch auf Basis der Suchbegriffe die 2009 ermittelt wurden. Tatsächlich müsste man wohl einige Gewichtungen verändern um die Prognosen besser zu machen. Dafür müsste man allerdings regelmäßig einen Vergleich mit den Daten anstreben, die das US Centers for Disease Control and Prevention herausgibt, um im Nachhinein zu schauen ob die eigenen Vorhersagen OK waren und gegebenenfalls gegensteuern. Klassisch kybernetisches Vorgehen eben.

Vermutlich passiert das nicht, weil Google mit dem Thema durch ist, die Leute die es entwickelt haben schon lange weg und Geld auch nicht damit zu verdienen ist. Oder aber es ist der ideologische Barriere. Die Rückkopplung an die in den Arztpraxen erhobenen Daten der CDC die notwendig wäre setzt eben jene nicht-virtuellen Strukturen voraus, die in der Big Data Ideologie von Mayer-Schöneberger als statische, unflexible, altbacken und überkommen gelten.

 

  1. Ginsberg, J., Mohebbi, M. H., Patel, R. S., Brammer, L., Smolinski, M. S., & Brilliant, L. (2009). Detecting influenza epidemics using search engine query data. Nature, 457(7232), 1012–1014. doi:10.1038/nature07634 []
  2. Mayer-Schönberger, V., & Cukier, K. (2013). Big data: a revolution that will transform how we live, work and think. London: John Murray. P 6 []