Die Transparenzarchive von Facebook, Google und Twitter: Ein Einblick

Dan McCoy auf der Borg-Stage des 35c3 mit “Explaining Online US Political Advertising” CC-BY 4.0 CCC Video Operation Center Der Datenskandal um Cambridge Analytica hat eine Debatte über Desinformation in sozialen Medien ins Rollen gebracht. Auf öffentlichen Druck schufen Facebook , Google und Twitter im Sommer 2018 eigene Archive für politische Werbung. Darin zeigen die Firmen über eine Suchmaske einige Informationen über Quelle, Reichweite und ungefähren finanziellen Aufwand von politische Anzeigen. Bisher sind diese Tools nur für die USA und Großbritannien verfügbar. Vor der EU-Wahl im Mai kündigten Google und Facebook dies auch für Europa an. Die Archive sollen ab März verfügbar sein.

Laura Edelson, Shikhar Sakhuja, Ratan Dey und Damon McCoy von der New York University (NYU) sammelten, analysierten und veröffentlichten eine Recherche über die Transparenzarchive . Ihre Ergebnisse präsentierten sie am 35C3 : Bis zur vollständigen Transparenz bedarf es weiteren Drucks auf die Plattformen, da diese meist erst reaktiv Schritte in Richtung mehr Transparenz unternehmen.

document.createElement(‘video’);

Dan McCoy präsentierte die Recherche-Ergebnisse seines Teams auf dem 35. Chaos Communciaton Congress. Weiter Formate auf media.ccc.de .

Microtargeting

In sozialen Netzwerken verraten wir unsere Interessen und Neigungen durch Likes oder Seiten, denen wir folgen. Die dadurch entstehenden Profile werden von Plattformbetreiber:innen mit Daten angereichert, die sie als Third-Party-Tracker gewinnen. Aus diesem Datenmonopol wird dann Kapital geschlagen: Unter anderem Unternehmen, Wahlkampfbüros und Werbeagenturen haben gegen Bezahlung die Möglichkeit, ihre Werbung auf diesen Plattformen gezielt an die Timelines jeder gewünschten Zielgruppe mit erschreckender Präzision auszuspielen. Diese Form der gezielten Werbung (gezielte Werbung, targeted Ads ) bei kleinen Ausschnitten der Bevölkerung wird als Microtargeting bezeichnet.

Politische Werbung und Manipulation

Politische Werbung auf Facebook wurde im Rahmen der Präsidentschaftswahlen in den USA 2016 für die Verbreitung von Desinformation und Falschnachrichten und zur gezielten Manipulation der Wähler:innen eingesetzt. Der Cambridge-Analytica-Skandal machte die Gefahr deutlich: Unter dem Vorwand wissenschaftlicher Recherche wurden Persönlichkeitsprofile von Millionen von Facebook-Nutzer:innen erstellt und ausgebaut, die dann als Nährboden für politisches Micro-Targeting durch die Trump-Kampagne herhielten. Facebook steht seither in der Kritik, zu wenig für den Schutz seiner Nutzer:innen und deren Nutzerdaten vor Manipulation durch Microtargeting zu tun. Unter anderem in nachfolgenden Anhörungen und Posts und Pressekonferenzen stellten sich jedoch viele von Facebook vorgeschlagene Lösungsansätze zu oft bloß als leere Versprechen und PR-Aktionen heraus.

Transparenz-Archive

Eine Initiative ist die Archivierung politischer Werbung in den USA auf Facebook. Das entstehende Archiv wurde zuerst nur für Nutzer:innen von Facebook, später der gesamten digitalen Öffentlichkeit als Website zur Verfügung gestellt. Google und Twitter zogen nach und veröffentlichten eigene Transparenzarchive, die die auf ihren Plattformen ausgespielte Werbung öffentlich durchsuchbar macht. Die von Google bereitgestellten Daten beziehen sich dabei auf Werbung, die über Googles Werbedienst Google Ad Services verbreitet wurden.

Facebooks im Mai 2018 veröffentlichtes Transparenz-Archiv für die USA umfasst Werbeanzeigen, die „politisch sind oder sich auf Geschehnisse des öffentlichen Interesses auf nationaler Ebene“ beziehen. Die Inhalte werden dabei höchstens sieben Jahre vorgehalten und lassen sich per Schlüsselwortsuchmaske seit dem siebten Mai 2018 abfragen. Pro Werbeanzeige lässt sich darin neben dem ungefähren finanziellen Aufwand auch grob einsehen, in welchen Regionen und von welchen Altersgruppen diese gesehen wurde.

Twitter veröffentlichte am 27. Juni 2018 ein eigenes Ad-Transparency-Archive , in dem sowohl politische als auch nicht-politische Werbung gesammelt wird. Bei politischer Werbung sind dabei wesentlich mehr und spezifischere Informationen über Ausgaben und Reichweite enthalten, als bei unpolitischer Werbung oder als sich in Facebooks Archiv abfragen lässt. Abfragen lassen sich die Archiveinträge per Suche nach den Sponsoren Accounts, für die dann die Werbeanzeigen gerade der letzten sieben Tage gelistete werden. Eine Programmschnittstelle zur automatischen Abfrage existiert nicht.

Googles Archiv wurde August 2018 veröffentlicht und speichert „Anzeigen zu Wahlen oder anderen Themen mit Bezug zu Kandidaten oder Amtsinhabern auf Bundesebene“ von politisch Werbetreibenden in den USA. In der Suchmaske lässt sich, falls vorhanden, nach der von der zugehörigen Werbekampagne gewählten Zielgruppe filtern, und es sind grobe Informationen zur Reichweite und zu den Ausgaben enthalten.

Sammeln und verteilen

Die Wissenschaftler:innen nahmen die Veröffentlichung der Transparenzarchive zum Anlass, die dort bereitgestellten Daten eines halben Jahres zu sammeln. Dazu haben sie Web-Scraper gebaut , also Programme, die Webseiten automatisch öffnen und relevante Informationen extrahieren und speichern. Doch ihre Aktivitäten blieben nicht unbemerkt: Facebook leitete noch während der Datensammlung technische Schritte ein, um die automatisierte Abfrage ihres Archivs massiv zu erschweren. Ende des Liedes war eine Einigung zwischen McCoys Team und Facebook, die Daten per Schnittstelle direkt, aber paradoxerweise aber nur unter einem Geheimhaltungsvertrag abzufragen. Insgesamt war das Team so in der Lage, für den genannten Zeitraum immerhin rund 80 Prozent der Daten aus Facebooks Archiv zu ziehen, die Archive von Twitter und Google liegen ihnen für die etwa 6 Monate komplett vor. Auf Github stellen sie den Datensatz zum Download bereit und hier gibt es den gesamten Report zum Nachlesen.

Druck für mehr Transparenz

Die Veröffentlichung der Transparenzarchive durch die Plattformbetreiber:innen sind ein guter und nötiger Schritt, um politisch werbende Akteure in sozialen Netzwerken besser zu verstehen und deren Kampagnen transparenter zu machen, schließen die Forscher:innen. Trotzdem gibt es Nachbesserungsbedarf in Sachen Vollständigkeit und Verfügbarkeit. Insbesondere Schnittstellen für automatisierte Abfragen fehlen gänzlich, oder werden im Einzelfall Facebook nur unter Geheimhaltungsverträgen bereitgestellt. Für großangelegte Auswertungen der archivierten Daten bleibt zumindest bei Facebook und Twitter dann nur das regelmäßige Scrapen der Archiv-Websites, was sich unter Einschaltung von Anti-Scraping-Technologien seitens der Plattformen oft zu einem Katz-und-Maus-Spiel entwickelt. McCoy problematisiert zudem die Tatsache, dass die Plattformbetreiber:innen oft nur reaktiv auf Druck der Öffentlichkeit und gesetzlichen Regulierungen reaktiv Schritte zum Ausbau der Transparenz auf ihren Plattformen unternehmen.

Hilf mit! Mit Deiner finanziellen Hilfe unterstützt Du unabhängigen Journalismus.