
Ethical AI - Warum es nicht reicht die KI Outputs fair gestalten zu wollen | Barbara Lampl
UNF#CK YOUR DATA
Intro
In diesem Kapitel wird die Bedeutung der Menschen beleuchtet, die an der Entwicklung von Ethical AI arbeiten, und die oft fehlende Anerkennung für ihre Leistungen. Zudem wird erörtert, wie man das Datenchaos bewältigen und die Rolle der Daten in der heutigen Unternehmenslandschaft verstehen kann.
TRIGGERWARNUNG – Wir sprechen unmenschliche Arbeitsbedingungen und Menschen die mit unangemessene Inhalte sichten und prüfen müssen.
Wenn Daten doch die Grundlage von KI sind und wir eine ethical AI mal Ende zu Ende betrachten wollen, dann müssen wir doch eigentlich genau an der Quelle anfangen. Aber warum wird darüber so wenig gesprochen? Und was läuft hier schon alles falsch?
Darüber spricht Christian Krug, der Host des Podcasts „Unf*ck Your Data“ mit Barbara Lampl, Geschäftsführerin von Empathic Business.
Wenn es um das Thema Ethical AI geht, dann betrachten die meisten Menschen gerne die Outputs. Also dass hier eine faire und ausgewogene Mischung an Ergebnissen repräsentiert wird. Manchmal wagt man noch den Blick darauf wie die Daten für das Training zusammengestellt werden.
Aber wie genau diese Daten zugänglich gemacht oder erfasst wurden, darüber wird nur selten berichtet. Denn das ist ein Bereich, den die großen Tech Unternehmen oft nur zu gerne unsichtbar halten würden.
Barbara Lampl nimmt uns mit auf eine Geschichtsstunde durch das Datalabeling oder Dataannotation. Denn Daten und Informationen waren schon immer ein Wettbewerbsvorteil. In der digitalen vernetzten Welt wird dies besonders schnell sichtbar. Angefangen von Yahoo deren Surfer das frühe Internet kartografiert haben bis zu den heutigen Taskern, die die Grundlage für die modernen KI Systeme legen. Data is king!
Gut sortierte, kategorisierte und beschriftete Daten sind der entscheidenden Vorteil. Vom Labeling für KI Modelle bis zur Content Moderation auf den sozialen Medien. Wer die besten Daten hat, hat die zuverlässigsten Algorithmen.
Das Bizarre: Die Menschen die die Grundlagen dafür legen, dass andere Milliardäre werden, verdienen oft nur wenige Dollar die Stunde. Und das für Arbeit im Sekundentakt die oft unter prekären Bedingungen stattfindet und bei der die Menschen zum Teil ohne Ausbildung oder Betreuung mit extremen Inhalten konfrontiert werden.
Kein Wunder, dass diese Karawane immer weiter zieht, denn Ausbeutung ist nicht nachhaltig und viele der Tasker lernen schnell die Systeme die sie aufbauen selbst zu nutzen um ihre Arbeit zu erleichtern.
Doch auch dieser unbequemen Wahrheit müssen wir uns stellen, wenn wir KI Systeme nutzen. Und uns manchmal fragen – Warum sind die Ergebnisse so seltsam?
▬▬▬▬▬▬ Profile: ▬▬▬▬
Zum LinkedIn-Profil von AI Babsi: https://www.linkedin.com/in/barbaralampl/
Zum LinkedIn-Profil von Christian: https://www.linkedin.com/in/christian-krug/
Christians Wonderlink: https://wonderl.ink/@christiankrug
UNF#CK YOUR DATA auf Linkedin: https://www.linkedin.com/company/unfck-your-data
▬▬▬▬▬▬ Buchempfehlung: ▬▬▬▬
Buchempfehlung von Barbara: Feeding the Machine – Mark Graham
Alle Empfehlungen in Melenas Bücherladen:
https://gunzenhausen.buchhandlung.de/unfuckyourdata
▬▬▬▬▬▬ Hier findest Du Unf*ck Your Data: ▬▬▬▬
Zum Podcast auf Spotify: https://open.spotify.com/show/6Ow7ySMbgnir27etMYkpxT?si=dc0fd2b3c6454bfa
Zum Podcast auf iTunes: https://podcasts.apple.com/de/podcast/unf-ck-your-data/id1673832019
Zum Podcast auf Deezer: https://deezer.page.link/FnT5kRSjf2k54iib6
Zum Podcast auf Youtube: https://www.youtube.com/@unfckyourdata
▬▬▬▬▬▬ Merch: ▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
https://unfckyourdata-shop.de/
▬▬▬▬▬▬ Kontakt: ▬▬▬▬
E-Mail: christian@uyd-podcast.com
▬▬▬▬▬▬ Timestamps: ▬▬▬▬▬▬▬▬▬▬▬▬▬
00:00 Einführung in Ethical AI und Datenverantwortung
04:00 Die Rolle der Daten im KI-Training
09:51 Geschichte der Datenannotation und Crowdsourcing
15:46 Content Moderation und ihre ethischen Herausforderungen
24:03 Die Herausforderungen der Polizeiarbeit
26:59 Die Realität der Clickworker
30:14 Die ethischen Implikationen der Datenannotation
32:59 Die Problematik der Edge-Cases in KI
36:14 Die Rolle des Menschen im KI-Training
38:58 Die Herausforderungen der Textbewertung in KI
43:19 Kulturelle Wahrnehmung und Sprache
44:05 Absurdistan: Die Herausforderungen der Datenverarbeitung
45:50 Die Rolle von Clickworkern in der Datenlabeling-Welt
48:34 Die Dimensionen des Datenlabelings
51:45 Die Herausforderungen der Content Moderation
54:57 Die ethischen Implikationen von KI und Daten
57:32 Faire Bedingungen in der KI-Wertschöpfungskette