Die Spiegel Ausgabe 20/2013 hatte „Big Data“ als Aufmacher. Besonders interessant an dem Artikel fand ich den Abschnitt zum Social Scoring durch Kreditech. Scoring bezeichnet Verfahren, wie das der SCHUFA, bei dem ein Wert für die Kreditwürdigkeit berechnet wird und das sich auf die Vergabe und die Höhe der Zinsen auswirkt. Und Social meint in diesem Zusammenhang nur, dass Daten aus Sozialen Online Netzwerken in die Analyse miteinbezogen werden.

Ich hab den Spiegel lange nicht mehr gelesen – deswegen war ich doch etwas überrascht, dass „Titel“ nur bedeutet, dass es einen einzigen Artikel zu dem Thema gibt, der dann, reichlich bebildert, auch nur 9 Seiten lang ist.

Aufmerksam darauf geworden bin ich durch eine Meldung auf Datenschutz.de1 : Kredittech vergeben Minikredite bis 500 € und versprechen, dass man das Geld online in unter 15 Minuten bekommt. In der Meldung heißt es:

Datengrundlage sind die ohnehin öffentlich einsehbaren Bewertungsprofile von Ebay-Konten oder die Profile bei Facebook sowie weiteren Plattformen, z. B. Xing oder LinkedIn. […] In die Wertung einbezogen wird auch, ob die Kreditbitte von einem teuren iPad oder von einem billigen Aldi-Computer ausging. Eine Rolle spielt auch das Online-Verhalten des Antragstellers, z. B. die Zeit, die zum Ausfüllen des Fragebogens benötigt wird, oder die Fehlerhäufigkeit und der Einsatz der Löschtaste. Nach Angaben der Macher werden bis zu 8.000 Einzelinformationen vom Kreditech-Algorithmus verarbeitet

Kredittech, mit Sitz in Hamburg, macht also genau das, was die SCHUFA letztes Jahr zusammen mit dem Hasso-Plattner-Institut der Uni Potsdam machen wollte, aber dann, nach vielen Beschwerden, abgesagt hat:  mit den Informationen, die Menschen im Internet, beim Surfen und bei Webdiensten veröffentlichen zu versuchen, auf ihre Kreditwürdigkeit zu schließen. Unabhängig davon wie gut das mit der Kreditvergabe funktioniert, scheinen die Einnahmen jetzt schon zu stimmen: bei 30 Mitarbeiter*innen wurde in den letzten zwei Jahren knapp 7 Millionen € Investmentkapital eingeworben. Und ganz vom eigenen Dienst überzeugt, werden auch gleich 125 % Return on Investment versprochen. Wie man das erreichen kann? Nicht mit Immobilienspekulation, nein, mit BIG DATA!

Kreditech uses BIG DATA and complex machine-learning algorithms to make better credit decisions. The technology identifies, scores individuals from anywhere on the world in seconds and decides over an instantly paid out credit based on up to 8000 data points (anything that can be found online).

Buzzword-Blackboxing könnte man das nennen. Übersetzt: Viele Daten, kompliziert analysiert, machen irgendwas besser.


Update 14.10.2013: Bei Youtube findet man einen 9-minütigen Vortrag von Sebastian Diemer, einem der Kreditech Gründer über deren Geschäftsmodell.


Aber wofür das ganze überhaupt, wenn es doch schon die SCHUFA gibt, die BIG DATA ja schon länger machen? Das Problem: Es gibt nur wenige Länder, in denen Kreditscoring so gut funktioniert wie in Deutschland. In Spanien z.B. gibt es (nach Angaben von Kreditech) nur für 12% der Erwachsenen einen Score. Welch Missstand. Standard Lösungsansatz2 im 21 Jahrhundert: irgendwas mit Daten. Während die SCHUFA nur in Deutschland tätig ist und ihre Datenbestände über die Jahre – aus heutiger Sicht relativ gemächlich – aufbaut hat, und sich dabei vor allem auf tatsächlich gemachte Transaktionen bezieht3, will Kreditech genauso gute (oder bessere) Voraussagen nur durch den kurzen Besuch auf ihrer Webseite machen. Dazu herangezogen werden:

Location data (GPS, micro-geographical), social graph (likes, friends, locations, posts), behavioural analytics (movement and duration on the webpage), people’s e-commerce shopping behaviour and device data (Quelle)

Genauer wird es in den ganzen Artikeln irgendwie nicht, die ich gefunden habe. Auch die eigene Homepage verrät nicht viel, außer eben, dass es mindestens 8000 sein sollen. In einer hübschen Infografik sind dann aber doch die fünf Hauptpfeiler der Datenbeschaffung mit Beispielen genannt:

  • PC (Apps, Hardware, Fingerprints)
  • E-COMMERCE (Ge-/ und Verkaufte Produkte, Zahlungsverhalten)
  • MOBILE (Device, Apps, Fingerprint, GPS)
  • BROWSING BEHAVIOUR (Location, Proxy Check, Cookies)
  • SOCIAL GRAPH (Interaction, Friends, Likes, Social Fingerprint)

Fingerabdrücke meint in diesem Fall natürlich nicht die tatsächlichen Fingerabdrücke, sondern den metaphorischen Fingerabdruck des Browsers, der sich aus allen Informationen zusammensetzt die man so per Javascript abfragen kann. Dazu gehören etwa die installierten Plugins (Flash, Silverlight, Java), Schriftarten (deren Kombination auch häufig auf jedem Rechner verschieden ist), und Browser-Add-ons. Diese ‚Fingerabdrücke‘ sind in der Regel unter mehreren Millionen eindeutig. Wie genau sie etwas über die Hardware heraus finden wollen, was über die Bildschirmauflösung hinaus geht, ist mir allerdings schleierhaft.

Leider sind meine Fremdsprachenkenntnise zu gering um die polnische oder spanische Variante selbst zu testen, aber scheinbar ist kredito24 ziemlich ähnlich zum britischen Wonga.com. In deren Eingabemaske wird man dazu aufgefordert, möglichst viele Daten – vor allen Dingen – „freiwillig“ anzugeben und sich eben auch bei Facebook einzuloggen und die Wonga-Facebook-Anwendung zu installieren. Denn nur dann funktioniert der „Social“ Teil des „Social Scoring“ auch bei denen, die ihr Profil nicht auf komplett öffentlich gestellt haben. Laut SPIEGEL überprüft Kreditech so unter anderem „[…] ob Foto und Ort mit anderen Informationen etwa bei Xing oder LinkedIn übereinstimmen – und ob es unter den Freunden viele mit ähnlichen Bildungsabschlüssen gibt oder viele Kollegen, die in derselben Firma arbeiten.“  Vermutlich kriegt man den ‚Wert‘ seines Profiles nach dem Scoring nicht angezeigt, aber wen interessiert wie so etwas aussähe, kann sich eine  Facebook Netzwerk Analyse von Wolfram Alpha für sein eigenes Profil hübsch aufbereiten lassen. (Vorausgesetzt man vertraut Wolfram Alpha!)

Dabei dreht ein nicht unwesentlicher Teil der „Berechnungen“ aber auch gar nicht um das Scoring selbst, sondern den Schutz vor (automatisiertem) Missbrauch durch Bots. Die Gefahr, dass Betrüger*innen 1000 Kreditanträge über 50 € pro Minute stellen, und mit gut gefälschten Facebook-Profilen bewilligt bekommen, ist natürlich groß. Der Proxy Check gehört deswegen genauso zur Analyse wie, ob man auch bei allen Profilen das Foto vom gleichen Menschen benutzt. Vermutlich bekommt der_die Nutzer_in also nicht nur einen Score zur Kreditwürdigkeit, sondern gleichzeitig auch noch einen zur ‚Menschlichkeit‘ – je unmenschlicher = automatisierter, desto weniger kreditwürdig. Es werden also Probleme gelöst, die es offline – durch persönliche Anwesenheit in der Bank – gar nicht gäbe. Kredittech scheint sich da aber selbst nicht all zu viel zuzutrauen, andernfalls ist der geringe maximal Kredit nicht zu erklären 🙂

Und über den wesentlichen Teil der Logik, nämlich den Zusammenhang zwischen den ganzen erhobenen Daten und der Kreditwürdigkeit des- oder derjenigen, die den Rechner bedient, erfährt man allerdings wenig. Einige anschauliche Beispiele sind natürlich dabei:

Selbst die Frage, ob die Kreditbitte von einem teuren iPad aus gestellt wurde oder von einem billigen Aldi-Computer, geht mit in die Wertung ein. Auch das Verhalten der Antragsteller spielt eine Rolle – etwa die Zeit, die sie zum Ausfüllen des Fragebogens brauchen. Ebenso werden die Fehlerhäufigkeit und der Einsatz der Löschtaste nüchtern registriert.

Wie die darauf kommen, dass das Merkmale sind, die gute Kreditratenrückzahler*innen signifikant von schlechten unterscheiden? Gut, vielleicht hat Kreditech die ersten Millionen darin investiert 100% der Anträge positiv zu bescheiden, um im Nachhinein dann zu gucken, welches Datum denn in welchem Zusammenhang mit der Rückzahlungsquote steht. Unwahrscheinlich. Wahrscheinlicher ist, dass bei der Interpretation solcher Daten erst mal mehr oder weniger educated guesses zum Einsatz kommen. Es sage einem ja schon der ‚gesunde Menschenverstand‘, dass iPad-Besitzer*innen bessere Kreditrückzahler*innen seien als die, die immer noch am Aldi PC surften…

Tatsächlich werden laut Kreditech Webseite 85% der Kreditanfragen zurückgewiesen. Die Daten, die dabei anfallen, werden angeblich nicht behalten, sondern nach kurzer Frist gelöscht und nur ein Vermerk gemacht, dass man mal einen Antrag gestellt hat (der abgelehnt wurde). Achso und für Werbung werden die Daten auch verwendet. Das klingt eigentlich ganz nett und Kreditech sieht sich beim Datenschutz vor der SCHUFA, die alles dauerhaft speichern. Wie sich der „komplexe selbstlernende Algorithmus“ allerdings weiterbildet, wenn man die Daten nicht behält, ist mir unklar. Vermutlich wird der datenschutzrechtliche „Trick“ über die Anonymisierung der Daten gegangen. Die Profildaten werden von den konkreten personenbezogenen Daten wie Name und Adresse getrennt und erstere fortan als anonym eingestuft. Aus Datenschutzsicht ein erlaubtes Vorgehen. Allerdings ist es technisch äußerst aufwendig (bis unmöglich) nachzuweisen, dass Daten tatsächlich anonym sind, und da Kredio24.es auf ihrer Seite verspricht, „100% sicher“ zu sein, würd‘ mich mal interessieren, wie die das machen.

Unklar bleibt auch, wie mit den Daten der „Freund*innen“ umgegangen wird, die zwangsläufig auch gespeichert werden, wenn das Facebook-Profil bewertet wird. Hab ich direkt schlechte Karten, wenn ich mal einen Antrag stelle und ein*e Bekannte*r schon mal abgelehnt wurde, weil es in der Datenbank eine Verknüpfung zwischen uns gibt?

Was man dagegen tatsächlich glauben kann, ist, dass die Daten nicht ohne weiteres weitergegeben werden. Das Geschäftsmodell heißt schließlich „Scoring as a service“ und meint, dass Dritte (wie z.B. Online-Händler) bei Kreditech nach meinem Score, aber nicht nach meinen Daten, fragen können. Die Daten zu hüten und niemanden wissen zu lassen, wie die Blackbox funktioniert, hat aus Geschäftssicht höchste Priorität. Zumindest so lange bis die Firma für mehrere Milliarden verkauft wird.

Vielleicht wär’s doch gut gewesen, wenn die SCHUFA mit der Uni Potsdam zusammen in einem Forschungsprojekt an Social Scoring gearbeitet hätte. Dann wäre zumindest leichter etwas mehr über die Praxis zu erfahren. Übrigens hat die vermeintlich datenschutzunfreundlichere Vorratsdatenspeicherei bei der SCHUFA den positiven Nebeneffekt, dass man von seinem Recht auf Einsicht und Korrektur Gebrauch machen kann. Zwar kann man nicht den Score beeinflussen, aber zumindest nachfragen, auf welchen Daten der Score beruht und gegebenenfalls Falscheinträge (die gar nicht so selten vorkommen) korrigieren lassen.

Am Ende ist es aber zum Glück jeder*m freigestellt sich an Kreditech zu wenden. Wenn man mal dringend 100 € braucht (das ist der durchschnittliche Kredit den Kreditech zur Zeit vergibt), kann man ja auch vielleicht einfach Freund*innen fragen…

 

 

  1. Der Teil aus dem Spiegel Artikel über Kreditech findet sich auch frei bei Spiegel Online. []
  2. Solutionism hat es Mozorov getauft []
  3. das soll jetzt nicht so klingen als fänd‘ ich die SCHUFA gut. Aber das ist wohl nochmal einen eigenen Artikel wert []