Beim NDR, wo sie regelmäßig über die SCHUFA und Adressehändler_innen berichten, wurden Details aus einer Präsentation veröffentlicht in der die SCHUFA darlegt welche Daten wie häufig bei der Score-Berechnung zur Kreditwürdigkeit mit einfließen.  Da die SCHUFA scheinbar nur zu 9% der Leute was negatives sagen kann, werden häufiger andere Kriterien herangezogen. Und die sind klassisch konservativ: das Alter von Datensätzen (also wie lange ein Konto besteht und wie oft sich die Adresse ändert) ist das Attribut, das am häufigsten in die Berechnung einfließt. Leider weiß auch der Leak nichts über die Bewertung dieses Attributs. Liest die SCHUFA häufige Umzüge eher als „flexible und Karriereorientiert“ oder als „potentielle Mietnomanden“? Deutet ein Bankwechsel und viele Konten auf „reich und preisbewusst bei Finanzdienstleistungen“ hin oder auf „interssiert sich für Geldwäsche“?

[UPDATE 13.04.2014] Interessant ist auch, dass sich in den Top 10 der verwendeten Attribute gleich mehrere finden, die sich vor allem auf die Datensammlung an sich beziehen und nicht auf den Inhalt der Daten, also quasi Meta-Daten. Auf Platz 1. das oben schon erwähnte Alter der Datensätze und auf Platz 7 die Anzahl der Merkmale, die über eine Person bekannt sind. Auf der andere Seite scheinen Informationen die mit dem tatsächlichen Kreditrückzahlungsverhalten zu tun haben, weniger wichtig. Nach „Negativinformationen“ auf Platz 5 der verwendeten Merkmale folgt eigentlich erst auf Platz 10 mit der „Kredithäufigkeit“ eine Information die tatsächlich etwas mit Krediten zu tun hat.Darüber hinaus lässt sich, so die Quellen vertrauenswürdig sind, auch erkennen, dass die SCHUFA-Scores vor allem mit leicht quantifizierbare Merkmale arbeiten. Also die Anzahl der Kreditanfragen, das Alter (z.B. in Tagen) eines Eintrags, die Anzahl vorheriger Adressen oder das binäre Merkmal ob der Geburtstort bekannt ist oder nicht. Merkmale die einer größeren Interpretation bedürfen wie z.B. das Kreditvolumen und die Laufzeiten (die auch abhängig sind z.B. von aktuellen Leitzinssätzen oder sowas) fließen viel seltener in die Score Berechnung mit ein. Genauso wie, und das ja glücklicherweise, die „mikrogeographischen Daten“ also Informationen über das Wohnumfeld.