Mittwoch, Mai 8, 2024

Das böse Büro

Uriel Fanellis Blog in deutscher Sprache

Uriel Fanelli

Immer noch auf ChatGPT

Ich habe vor einiger Zeit über die Beziehung zwischen der Arbeitswelt und Formen des maschinellen Lernens, der Datenanalyse und den neuen Automatisierungstechnologien gesprochen, die in Unternehmen Einzug halten. Und schon wenn man auf meine Äußerungen verärgert reagierte, erinnerte ich mich immer wieder an die unterschiedliche Haltung der Arbeiterklasse und der Angestellten.

Es ist nicht das erste Mal, dass eine neue Technologie Einzug hält und die Arbeitsweise der Industrie verändert. Die sogenannte „Arbeiterklasse“ hat sich inzwischen daran gewöhnt und regt sich nicht mehr groß auf, sondern geht zu Auffrischungskursen über neue Technologien.

Wenn diesen „Revolutionen“ inzwischen eine gewisse Distanzierung von einer ziemlich gewohnten Arbeiterklasse gegenübersteht, so entstand das Problem, als die Revolution die Angestellten berührte.

Aber das war eine Eigenart: Gewohnt, sich für unersetzlich zu halten, sahen die Angestellten ihren Hauptwert unter Druck, nämlich die Annahme, dass keine Maschine sie jemals ersetzen könnte, indem sie ihre "Konzeptarbeit" erledigte.

Doch das ist nun Vergangenheit, denn heute ist die Technik höher gestiegen: Wurden früher die niedrigen Stockwerke der Angestellten berührt, werden seit einiger Zeit höhere Stockwerke ins Visier genommen, und jetzt haben wir das Dachgeschoss des Büros ins Visier genommen Gebäude oder die "Künstler".

Und wenn sich Angestellte über diese neue Welle der Unternehmensautomatisierung empört fühlen, stellen Sie sich ein wenig diesen Haufen aufgeblasener, nutzloser Schurken vor, die sich als „Künstler“ ausgeben und entdecken, dass eine KI Gedichte schreiben, Lieder schreiben und malen kann.


Aus historischen Gründen können wir uns an ein Datum erinnern:

Am 3. August 2022 nimmt ein gewisser Jason M. Allen an einem Kunstwettbewerb teil, dessen Thema realistische Kunst ist (nicht abstrakte oder andere bizarre Flecken an der Wand). Die Jury setzt sich aus „Kunstexperten“ zusammen. Seine Arbeit gewinnt, und es stellt sich heraus, dass sie von DALL-E 2 erstellt wurde, aber nicht mit der üblichen Schnittstelle, sondern unter Verwendung seiner Schnittstelle auf Discord, genannt Midjourney.

Tz, ta, pum!

Natürlich kommt die Empörung auf. Und diese Empörung entspringt einem schlechten Gewissen. Das schlechte Gewissen derer, die sich eingeredet hatten, etwas so Superfeines, Kreatives, Erhabenes, Transzendentes zu tun, dass eine Maschine (geschweige denn der „Algorithmus“) ihre Höchstleistungen niemals hätte erreichen können.

Aber was sie noch mehr berührt, ist, dass die Richter, die ihnen sagen können, dass sie verstehen, was Kunst ist, und wissen, ob sie es vor sich haben oder nicht, dieses bloße Produkt einer Maschine ohne Gefühle, einen bloßen Algorithmus, verwirrt haben "leidet nicht" (sic! Ich habe es gerade in einer italienischen Zeitung gelesen), mit einem wahren "Kunstwerk".

Und das ist noch schlimmer, denn an diesem Punkt wird es schwierig zu verstehen, was Kunst ist, wenn nicht einmal Kunstexperten sie von der Realität unterscheiden können.


Was könnte das wirtschaftlich bedeuten? Es gibt zwei Fälle:

  1. eine Fülle von Inhalten
  2. harter Wettbewerb

Ich meine, ich habe DALL-E auf meiner GPU ausprobiert und es stolpert ein bisschen. Aber wir wissen, dass die GPUs im Laufe der Zeit in der Lage sein werden, dies zu unterstützen. Ich weiß also, dass ich bei diesem Tempo nächstes Jahr in der Lage sein werde, die Science-Fiction-Bücher, die ich geschrieben habe, in Comics zu verwandeln, indem ich einfach der KI erkläre, was ich zeichnen muss.

Nicht schlecht. Und es ist nicht schlimm, wenn man bedenkt, dass ich in fünf Jahren mit einer normalen GPU direkt genauso viele Filme daraus machen kann.

Das nenne ich „die Verbreitung von Inhalten“: Ich werde sicherlich nicht der Einzige sein, der darüber nachdenkt, und es werden wahrscheinlich auch Ad-hoc-Programme dazu herauskommen.

Wenn wir nur an ChatGPT denken, kann ich mir vorstellen, dass ich, sobald es in einer "papable"-Version für meine GPU veröffentlicht wird, meine Bücher sicherlich in verschiedene Sprachen übersetzen werde, um sie an den lokalen Markt anzupassen.

Da ich sicherlich nicht der Einzige sein werde, der so etwas in Erwägung zieht, ist klar, dass wir Zeuge einer plötzlichen Verbreitung von Inhalten werden würden. Bisher machen die meisten „Content Creators“ auf OnlyFans nichts anderes, als sich auszuziehen, aber wenn eine KI die Möglichkeit gibt, Comics oder Videos einfach zu zeichnen, würde sich das Spiel erheblich verändern.

Und die eigentliche Frage wird höchstens lauten: "Aber wer konsumiert und/oder kauft all diese Inhalte?"


Unter „rücksichtsloser Wettbewerb“ finden Sie die Tatsache, dass Netflix, Amazon Prime, Disney & Co. diese Technologien ebenfalls zur Verfügung haben können, nur dass sie im Gegensatz zu mir alle GPUs haben werden, die sie wollen. In diesem Fall müssen wir uns darauf einstellen, dass die Produktion von Videos und Filmen immer billiger wird und Schauspieler immer weniger unverzichtbar sind. Ich persönlich schätze, dass es bei diesem Tempo in sieben/acht Jahren keine echten Schauspieler mehr geben wird.

Wer es nicht glaubt, hier ist es:

Wie Sie sehen, ist der Schritt von hier zu einem echten Film nur ein kleiner Schritt. Stellen Sie sich vor, Sie könnten so etwas wie Avatar 2 in zwei, drei Wochen machen.


Stehen wir an einem Wendepunkt? Meiner Meinung nach noch nicht. Lassen Sie mich erklären: Alle diese KIs laufen (zumindest für den Lernteil) auf GPUs. Die GPU ist kein sehr unterschiedliches Konzept von der CPU: Sicher, sie ist spezialisiert, sicher hat sie oft eine MIMD-Architektur, aber architektonisch ist sie keine sehr neue Sache.)

Der Wendepunkt wird kommen, wenn diese KIs „as is“, also mit der passenden Topologie, auf Silizium übertragen werden. Auf diese Weise werden die Leistungen denen von jetzt weit überlegen sein.

Lassen Sie es mich besser erklären: Stellen Sie sich vor, Sie möchten ein Video senden. Um Daten zu sparen, rendern Sie sie in 256 Graustufen bei 640 × 480. Auf diese Weise erhalten Sie ein beschissenes Video, aber vergessen wir, dass wir auf der anderen Seite der Grafikkarte eine KI haben, die dieses beschissene Filmmaterial auf 4K oder höher zurückbringen kann.

Der Kompressionseffekt ist offensichtlich und jedem Codec überlegen. Damit meine ich, dass von diesem Moment an ein Stück Silizium mit der spezifischen Fähigkeit, Videos mit geringer Qualität zu „revitalisieren“, direkt in der Netzwerkkarte ankommen könnte.

Dann könnten Sie Komponenten haben, die die alten Filme „modernisieren“, wodurch Sie den Look der Schauspieler und der Umgebung modernisieren und ins Jahr 2023 bringen können. Auch das ist nicht sehr kompliziert.

Durch das Hinzufügen könnte es auch dazu führen, dass Grafikkarten zu echten "Anzeigekarten" werden, die sich damit befassen, eine eher ungenaue Eingabe anzuzeigen, möglicherweise reduziert auf viele verstreute Pixel ("Stable Diffusion").

Das wird meiner Meinung nach der Wendepunkt sein, an dem jeder mit einem normalen Computer einfach die Grafikkarte auffordern kann, etwas zu tun, was er im Sinn hat, und es in Worten beschreiben kann.

Von diesem Moment an wird die Welt der bildenden Kunst und wahrscheinlich auch der Klangkunst nie mehr wirklich dieselbe sein.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert