Studie zu Plattformen für autonomes Fahren: Crowdwork – Menschen trainieren Algorithmen, für ein bis zwei Euro die Stunde

Seit 2017 steigt die Nachfrage nach hochpräzisen Trainingsdaten für die Modelle Künstlicher Intelligenz (KI) der Automobilindustrie stark an. Enorme Mengen dieser Daten sind nötig, um das ehrgeizige Ziel des autonomen Fahrens zu erreichen. Damit aus selbstlernenden Algorithmen selbstlenkende Fahrzeuge werden können, braucht es zunächst viel menschliche Arbeit, die von Crowdworkern auf der ganzen Welt geleistet wird. Sie bringen den lernenden Maschinen das Hören, das Sehen und das umsichtige Fahren bei, indem sie Millionen Bilddateien mit Verkehrssituationen präzise so aufbereiten, dass sie für die KI zu verarbeiten sind. Da die Qualitätsanforderungen hoch sind, haben sich spezialisierte Plattformen etabliert, die den dort arbeitenden Online-Arbeitskräften teils eine höhere Bezahlung und bessere Arbeitsbedingungen bieten als das beim Gros der etablierten Crowdwork-Plattformen üblich ist. Durch den weltweiten harten Wettbewerb unter Crowdworkerinnen und Crowdworkern gerät dieses höhere Niveau aber bereits wieder unter Druck. Auch, weil derzeit Hunderttausende gut qualifizierte notleidende Menschen aus Venezuela ihre Arbeit zu sehr niedrigen Preisen anbieten.

Auf manchen der neuen Plattformen stellt diese Gruppe inzwischen 75 Prozent der Arbeitskräfte (siehe auch die Infografik; Link unten). Obwohl die Auftraggeber der Datenaufbereitung zahlungskräftig sind, kommen Crowdworker aus Europa oder den USA nur in Nischenbereichen zum Zuge oder wenn sie als „Hobbyisten“, die auf das Geld nicht angewiesen sind, eine sehr niedrige Bezahlung akzeptieren. Zu diesen Ergebnissen kommt eine aktuelle, von der Hans-Böckler-Stiftung geförderte Studie.

Prof. Dr. Florian Alexander Schmidt von der Hochschule für Technik und Wirtschaft Dresden durchleuchtet in seiner Studie den neuen Trend in der Crowdsourcing-Branche auf Basis von ausführlichen Interviews mit den Chefs neuer Spezial-Plattformen und mit einigen dort arbeitenden Crowdworkern. Zudem hat der Wissenschaftler die öffentlich beobachtbaren Angebots- und Nachfragedaten auf Crowdplattformen quantitativ ausgewertet.

Die KI braucht Millionen hochpräzise Daten

Als Kunden für crowdproduzierte Trainingsdaten treten laut Schmidt Dutzende gut finanzierte Firmen auf, die in den entstehenden Markt für das autonome Fahren drängen. Neben den großen Automarken und deren etablierten Zulieferern sind auch große Hardware- und Softwarefirmen wie Intel und Nvidia, Google und Apple aktiv, die bisher wenig mit Autos zu tun hatten. Hinzu kommen zahlreiche risikokapitalfinanzierte Start-ups. 2018 verfügten bereits 55 Firmen über eine Lizenz zum Testen eigener autonomer Fahrzeuge in Kalifornien, Tendenz steigend.

Sie alle, erklärt der Experte für Designkonzeption und Medientheorie, sind für das Funktionieren ihrer Algorithmen auf präzise beschriftete – „annotierte“ – Trainingsdaten angewiesen. Sie brauchen Millionen von Fotos aus dem Straßenverkehr, bei denen jedes abgebildete Pixel einer Szene einem Objekt zugeordnet wurde. Fahrbahnmarkierungen, Fahrzeuge, und Fußgänger müssen trennscharf voneinander abgegrenzt und mit Zusatzinformationen versehen werden, damit im Zuge des maschinellen Lernens daraus Regeln abgeleitet und Softwaremodelle entwickelt werden können.

Durch die deutlich gestiegenen Qualitätsanforderungen dieser neuen Kunden verändert sich ein Teil der Crowdsourcing-Branche, analysiert der Wissenschaftler. Zwar finde die Produktion von KI-Trainingsdaten auch über herkömmliche Plattformen wie Amazon Mechanical Turk statt, zugleich haben sich jedoch eine Reihe Plattformen entweder extra zu diesem Zweck neu gegründet oder ihr Angebot und ihre Prozesse komplett auf die Anforderungen der Autoindustrie umgestellt. Zu den großen, deren Chefs Schmidt interviewen konnte, gehören Mighty AI, understand.ai, Playment, Hive und clickworker.

Die Neuen investieren mehr in ihre Arbeiter

Die neuen Plattformen betreiben mehr Qualitätsmanagement, indem sie den Kunden nicht mehr einfach nur Zugang zu Zehn- oder Hunderttausenden Crowdworkern verschaffen, sondern die Prozesse viel stärker orchestrieren. Außerdem müssen sie präzisere Werkzeuge für die Arbeit entwickeln und die Crowd anlernen. „Durch die Investition in das Training der Crowd kennen die Plattformbetreiber ihre Arbeiterschaft besser und haben ein größeres Interesse daran, sie auf der Plattform zu halten“, konstatiert Schmidt. Kunden und Crowdworker kommen hingegen nicht mehr direkt in Kontakt.

Im Zuge dieser Veränderung versuche die Branche auch, sich ein moderneres Image zu geben. Der Begriff der „Crowd“ gerät aus der Mode und wird durch den Zusatz „AI“ als vielversprechende Formel in den Firmennamen der Plattformen ersetzt. Zwar gehe es weiterhin um billige Arbeitskräfte, die hinter den Kulissen die künstlichen Intelligenzen mittels menschlicher Intelligenz trainieren und anleiten, betont Forscher Schmidt. Die Crowdplattformen setzten zugleich jedoch tatsächlich auch selbst mehr KI-Technologien zur Optimierung ein. Teile der Arbeit könnten bereits von Machine-Learning-Systemen übernommen werden, so dass die Crowdworker oft nur noch die Ergebnisse der KI überprüfen und korrigieren.

Crowdworker erfahren bessere Standards, doch Löhne bleiben unter Druck

Die für die Studie befragten Arbeiterinnen und Arbeiter sehen sich von den neuen Plattformen respektvoller behandelt und verlässlicher bezahlt als von herkömmlichen Anbietern. Auch könnten sie sich besser auf Teilaufgaben spezialisieren, die ihnen besonders liegen, und dadurch innerhalb der Plattform aufsteigen. Insgesamt erschienen sie zufriedener, so Schmidt. Allerdings könnte es sich dabei auch nur um eine Momentaufnahme handeln. Denn die Befragten klagen darüber, dass sie nicht genug Zugang zu dieser Art Arbeit bekämen und sie immer schlechter bezahlt werde. Dies hängt damit zusammen, dass sich immer mehr Menschen auf der Suche nach Arbeit auf besagten Plattformen anmelden, was zu einem stetigen Überangebot an Arbeitskraft und sinkender Entlohnung führt. Qualifizierte Vollzeitarbeitskräfte berichten über Stundenverdienste von umgerechnet ein bis zwei Euro.

Trotz der höheren Qualitätsanforderungen und des größeren Interesses von Plattformen, Arbeitskräfte zu binden, handele es sich bei Crowdwork weiterhin um einen extrem volatilen globalen Arbeitsmarkt, betont Forscher Schmidt. „Der Wert der Arbeit ist permanent aus zwei Richtungen bedroht: Durch das ständige Wettrennen mit der Automatisierung und dadurch, dass die Arbeit dynamisch zu jenen Menschen auf der Welt fließt, welche die niedrigsten Löhne zu akzeptieren bereit sind – sei es, weil es sich um Hobbyisten handelt oder weil ihre wirtschaftliche Not besonders groß ist.“

Crowdworkerinnen und Crowdworker aus Industrieländern, die ernsthaft Geld verdienen wollen, könnten so nach Schmidts Beobachtung auch auf den neuen Plattformen meist nur in Nischenbereichen konkurrieren. Etwa, wenn sensible Daten aus Sicherheitsgründen nur in bestimmten Regionen bearbeitet werden dürften oder bei Audiodaten besondere Sprach- oder Dialektkenntnisse gefragt seien.

Chancen und Risiken des globalen Wettbewerbs im Plattformkapitalismus zeigt besonders plastisch Schmidts Analyse zu den Menschen, die ihre Dienste auf Plattformen für Trainingsdaten anbieten: 2018 waren dort mindestens 200.000 Menschen aus Venezuela auf der Suche nach Arbeit – „einem Land mit gut ausgebildeter und gut vernetzter, jedoch von Hyperinflation völlig ausgezehrter Bevölkerung“, schreibt der Forscher. Für viele Venezolaner sei Crowdarbeit „zur Devisen bringenden Lebensader geworden. Sie selbst sind heute Teil eines Heers von digitalen Wanderarbeiterinnen und -arbeitern, die wie Erntehelfer zwischen den neuen Plattformen hin und her ziehen.“

 

 

 

Weitere Informationen:

Florian Alexander Schmidt: Crowdproduktion von Trainingsdaten – Zur Rolle von Online-Arbeit beim Trainieren autonomer Fahrzeuge (pdf), Study der Hans-Böckler-Stiftung Nr. 417.

Infografik zum Download

Bild: gew.de