1// WIE WIR DATENKUNDIG WERDEN
Essenzielle Werkzeuge für den digitalen Bürger
Wie arbeiten Datenraffinerien – und was sind ihnen unsere Daten wert?
»Im 18. Jahrhundert zählte ein Mensch, der vertraute Stellen aus der Bibel oder einem Katechismus laut vorlesen konnte, als schriftkundig; heute würde jemand, der nicht mehr zuwege brächte als das, als funktioneller Analphabet eingestuft – unfähig, das Material zu lesen, das für das wirtschaftliche Überleben entscheidend ist.«
George Miller
Dass Daten den Menschen zugutekommen sollen, ist nicht irgendein hohles Schlagwort. Jeden Tag erhalten wir Datenprodukte und -dienstleistungen in Form von Ranglisten und Empfehlungen, die auf sozialen Daten basieren. An die Stelle der »Mad Men« des Marketings, also der traditionellen Werbeleute, sind heute Datenforscher getreten, die über eine gewaltige Fülle verschiedenartiger digitaler Spuren, die tagtäglich von einer Milliarde Menschen hinterlassen werden, Algorithmen laufen lassen. Sogar noch wichtiger als das exponentielle Wachstum unserer Daten ist die Veränderung unserer Denkweise. Um uneingeschränkt an der Datenrevolution teilnehmen zu können, müssen wir unsere alte Haltung als passive »Konsumenten«, die akzeptieren, was immer man ihnen vorsetzt, überwinden und uns eine neue Denkweise zu eigen machen, indem wir uns als aktive Mitschöpfer sozialer Daten verstehen. Das Machtgleichgewicht zwischen Verkäufern und Käufern, Bankiers und Kreditnehmern, Arbeitgebern und Arbeitnehmern, Ärzten und Patienten, Lehrenden und Studierenden ist im Begriff, sich zu verschieben. In dieser Weise werden die Daten, die den Menschen gehören und von ihnen erzeugt werden, ihnen selbst zugutekommen.
Daten zum Wohl der Menschen: Das ist tatsächlich eine Forderung, die nicht wichtiger sein könnte. Daten sind der bedeutendste Rohstoff des 21. Jahrhunderts, Daten sind das neue Erdöl. Diese Analogie ist in vieler Hinsicht erhellend. Über ein Jahrhundert lang wurden unsere Wirtschaft und unsere Gesellschaft in starkem Maße von der Entdeckung des Erdöls und der Entwicklung von Techniken geformt, welche zur Förderung, Lagerung, zum Transport und zur Raffination dieses Rohstoffs dienen, um Produkte zu erzeugen, die von allen Menschen auf diesem Planeten genutzt werden. Heute verändert die Fähigkeit, Rohdaten in Produkte und Dienstleistungen umzuwandeln, unser Leben in einer Weise, die in ihrer Tragweite mit der industriellen Revolution wetteifern wird.
Rohöl kann nicht in seiner Rohform genutzt werden. Es muss zu Benzin, Plastik und vielen anderen chemischen Produkten raffiniert werden. Raffiniertes Öl wiederum war und ist vielfach bis heute der Treibstoff für die Maschinen des Industriezeitalters und spielt eine Rolle bei der Herstellung der meisten physischen Produkte der modernen Wirtschaft. In ähnlicher Weise sind Rohdaten für sich genommen ziemlich nutzlos. Der Wert von Daten wird erst von den Raffinerien geschaffen, die sie sammeln, analysieren, vergleichen, filtern und neue Datenprodukte und -dienstleistungen vertreiben. Statt den Apparat der industriellen Revolution zu befeuern, treiben veredelte Daten den Apparat der Datenrevolution voran.
Zum Glück unterscheiden sich Daten von Erdöl in grundlegender Weise. Die Ölmenge auf der Welt ist begrenzt, und je weniger von dieser Ressource übrig ist, desto stärker klettern die Kosten für ihre Erschließung in die Höhe. Im Gegensatz dazu nimmt die Menge der erzeugten Daten zu, während die Kosten der für Kommunikation und Verarbeitung nötigen Technologie sinken. Bis Ende 2015 besaßen über 50 Prozent der Erwachsenen ein Smartphone. Ein durchschnittlicher Amerikaner verbringt durchschnittlich zwei Stunden pro Tag an seinem Handy. Schätzungen zufolge berühren wir unsere Handys zwischen 200 und 300 Mal pro Tag – das ist mehr, als die meisten von uns ihren Partner während eines ganzen Monats berühren. Und jedes Mal, wenn wir unser Handy benutzen, erzeugen wir Daten. Im Gegensatz zu Erdöl werden uns die Daten niemals ausgehen.
Unsere Nutzung des Erdöls ist beschränkt durch die Tatsache, dass es knapp ist und ein physikalischer Stoff; unsere Datennutzung muss dem Umstand Rechnung tragen, dass Daten heute in Hülle und Fülle verfügbar und digital sind. Nur jeweils eine Instanz besitzt das Zugriffsrecht auf einen Lagerbestand von Erdöl oder ein daraus raffiniertes Produkt, während viele gleichzeitig auf einen Datenbestand zugreifen und viele verschiedene Produkte daraus erzeugen können. Unsere Gesetze und sozialen Normen gründen auf der Vorstellung, dass Waren ein knappes Gut sind. Zum Beispiel erfanden die Menschen in Abwesenheit reichlich vorhandener Daten die Versicherung – ein Weg, um uns gegen die Kosten und Folgen von Schadensfällen und schrecklichen Ereignisse zu schützen, die uns im Leben widerfahren können. Weil man unmöglich die Wahrscheinlichkeit kennen konnte, mit der eine bestimmte Person Opfer eines Einbruchs wird oder vom Arzt die Diagnose Diabetes erhält, teilten die Versicherungsgesellschaften die Menschen in Gruppen ein, auf die das Risiko verteilt wurde, und berechneten jedem Mitglied für die Versicherung einen durchschnittlichen Tarif. Angesichts der wachsenden Datenproduktion wird es bald möglich werden, individuelle Risikovorhersagen zu treffen – und dann auch individuelle Tarife zu erhalten. Wir können unsere Augen davor verschließen und so tun, als gäbe es die Daten nicht, oder wir können anerkennen, dass sie existieren, und darüber nachdenken, wie dies unsere Art zu leben verändern könnte. Welche Art von Welt möchten wir mit dieser neuen Ressource schaffen?
Neue Technologien können uns zu größerer Handlungsfähigkeit und Verfügungsgewalt über unser Leben verhelfen, wenn wir die Werkzeuge besitzen, sie zu nutzen. Bevor Gutenberg den Buchdruck erfand, waren Bücher knapp, und die Weitergabe von Neuigkeiten an ein weit verstreutes Publikum war kostspielig. Die Mehrheit der Bevölkerung zog keinen Nutzen daraus, viele Stunden mit dem Erlernen des Lesens zu verbringen. Vor Erfindung des Internets schrieb George Miller, damals Psychologieprofessor an der Universität Princeton, über moderne Standards der Lese- und Schreibkundigkeit. Er war besorgt, dass zu viele Schüler die Schule verließen, ohne das erforderliche fortgeschrittene Niveau der Lesefähigkeit und die notwendigen mathematischen und naturwissenschaftlichen Kenntnisse erlangt zu haben, um in der von der »Wissensindustrie« beherrschten Gesellschaft noch einen Job zu finden. Heute gibt es, wie ich glaube, ein weiteres, ebenso dringliches Erfordernis: Datenkundigkeit – Fähigkeiten wie das Verständnis, wie Datenraffinerien arbeiten, welche Parameter verändert und nicht verändert werden können, die Fähigkeit, Fehler zu interpretieren und Unsicherheit zu verstehen, sowie das Bewusstsein der möglichen Konsequenzen, die das Teilen unserer sozialen Daten nach sich ziehen kann. Solche Datenkundigkeit ist notwendig in einer Welt, in der wir uns bei den meisten unserer Entscheidungen von den Empfehlungen und Analysen von Datenraffinerien leiten lassen werden.
Der Prozess der Datenveredelung
Es ist nicht überraschend, dass eine der ersten bedeutenden Datenraffinerien, Amazon, im Einzelhandelssektor tätig ist. Um als Einzelhändler erfolgreich zu sein, muss man wissen, welche Produkte man für seine wahrscheinlichen Kunden ins Sortiment nehmen und vorrätig halten muss, und dazu gehört, laufend Daten über Lagerbestände, Preise, Werbung und Kaufgewohnheiten der Kundschaft auszuwerten.
Vor 200 Jahren bestand das Gros der Daten eines Ladenbesitzers im Inventar der Waren in seinen Regalen und dem Geld in seiner Kasse, eine Summe, die am Ende eines jeden Tages mit dem Federhalter in ein papiernes Journal eingetragen wurde. Standen die Kunden vor ähnlichen Produkten mit vergleichbaren Preisen, mussten sie ihre Kaufentscheidung nach der Glaubwürdigkeit der Produktversprechungen, der Attraktivität der Verpackung und der Autorität der Nachbarn, Familienmitglieder und Freunde treffen. Vor etwa 150 Jahren beglückten einige Firmen – am bekanntesten Montgomery Ward und Sears & Roebuck Company – ihre Kunden in den Kleinstädten ganz Amerikas mit Katalogen, in denen über zehntausend Waren verzeichnet waren, die man sich mit der Post nach Hause bestellen konnte. Diese innovativen Unternehmen wussten, welche Artikel ein bestimmter Kunde bestellte und wohin er sie sich schicken ließ, und sie sahen, welche Produkte sich in welchen Regionen gut verkauften. Vor 100 Jahren eröffneten die Versandhändler Ausstellungsräume und Läden und beschäftigten eine Armee von Auswertern, die alte Verkaufsdaten durchforsteten und daraus die künftige Verbrauchernachfrage prognostizierten, um ihre Lagerbestände kosteneffizient zu verwalten. Vor 50 Jahren änderte sich die Einzelhandelslandschaft abermals. Die Versandhändler und ihre Verkaufsstellen vor Ort konnten die amerikanischen Kunden besser charakterisieren, indem sie sich des neu eingeführten Postleitzahlsystems bedienten. In den folgenden Jahrzehnten gewannen die Unternehmen detaillierte demografische Erkenntnisse über die Menschen, die in diesen geografischen Einheiten lebten. Die Einführung von Kreditkarten in den Vereinigten Staaten Mitte der 1960er-Jahre bot gleichzeitig eine Methode zur effizienten Sammlung von Transaktionsdaten individueller Kunden – das Maximum personalisierter Datenerhebung vor dem Internet, durch das die Firmen herausbekamen, wer wo lebte und wo wie viel ausgab.
Der Datenhändler Acxiom, gegründet 1969, und andere Unternehmen sezierten die Daten der Haushalte bis ins Kleinste, beleuchteten sie von allen Seiten und gruppierten die Einzelnen zu Konsumentensegmenten wie »gut gebildete Mittelschichtfamilien und Eigenheimbesitzer« (»Apple Pie Families«), »reiche Vorstadtvillenbewohner« (»Blue Blood Estates«), »waffentragende Pick-up-Fahrer« (»Shotguns and Pick-ups«) oder »Vorstadtmütter mit viel Zeit für die Kinderbetreuung« (»Suburban Soccer Moms«) – neben mehreren Dutzend weiteren Etikettierungen. Diese Klassifizierungen – manche davon noch krassere Stereotype – wurden entwickelt, als Datenhändle...