Freitag, April 19, 2024

Das böse Büro

Uriel Fanellis Blog in deutscher Sprache

Uriel Fanelli

Stochastische Papageien und wo sie zu finden sind.

Es wird viel über die Ketzer gesprochen, die Stable Diffusion und GPT-3 gebaut haben, weil sie in die Gotha derer eingetreten sind, die Sie angewidert haben, auf Sie herabblicken und es gewagt haben, den Wert des Künstlers (nicht der Kunst) in Frage zu stellen und der Wert des Schriftsteller-Kreativen (aber nicht des Schreibens oder der Kreativität).

Zu ihrer Rettung kommen Schriften, die auf der Suche nach einer akademischen Allianz mit einer bestimmten humanistischen Welt diesen künftigen Arbeitslosen zu Hilfe kommen, von denen einer das, was diese Netzwerke oder erweiterten Sprachmodelle tun, als "stochastischen Papagei" definiert. Da noch nie jemand eine echte technische oder kommerzielle Definition von „stochastischem Papagei“ gegeben hat, können wir nur das Papier lesen und sehen, was der Autor meint.

Papier ist scheiße. https://dl.acm.org/doi/10.1145/3442188.3445922

Nicht weil es falsch ist (es sagt nichts aus, was falsifizierbar ist oder irgendwelche Daten oder Tatsachen enthält), nicht weil die Zahlen falsch sind (es gibt keine Zahlen oder Mengen im Skript) oder irgendetwas (das Skript sammelt einen Haufen Scheiße und ist aufgewacht spricht über Risiken, die er nicht quantifiziert, und Modelle, die „zu groß“ sind, ohne „zu viel“ zu definieren).

Es ist scheiße, weil es keine Wissenschaft ist. Es ist der Abkömmling einer Abteilung für Geschlechterforschung, die in einer sicheren Zone arbeitet, wo es verboten ist, dem Sprecher zu widersprechen, um seine Gefühle nicht zu verletzen.

Das eigentliche Problem mit diesem Dokument ist nicht, was es schreibt, was lächerlich, dumm, oberflächlich und hollywoodreif ist: Das Problem ist, dass es als Wissenschaft ausgegeben wird, nur weil es ein Papier ist.

Es zeichnet sich nicht durch das Geschriebene aus, sondern durch das, was NICHT Geschriebenes ist, d. h. alles, was ein Mindestmaß an wissenschaftlichem Denken zeigt.


Lassen Sie mich erklären: ChatGPT wurde trainiert, indem es mit früheren Schriften gefüttert wurde. Wenn chatGPT nur mit Skripten gefüttert wurde, die auf ihre eigene Weise von stochastischen Papageien geschrieben wurden, wird die Ausgabe offensichtlich das Äquivalent von so vielen stochastischen Papageien haben:

Müll rein, Müll raus.

Wenn ich zum Beispiel die gesamte journalistische Produktion irgendeines Landes einfügen würde, würde ich genau den gleichen Satz bekommen: stochastische Papageien. Sie alle kopieren von den Agenturen, sie kopieren die Nachrichten, Schriften und Konzepte der anderen, und Nation für Nation, sogar die Voreingenommenheit wird oft auf zwei Positionen reduziert: Traditionalisten/Progressive, rechts/links usw.

Das Papier beabsichtigt nicht, diese Messung vorzunehmen, und sagt stattdessen "Hey, das ist ein stochastischer Papagei" (es wäre schön, wenn sie wüssten, was der Fachbegriff Stochastik bedeutet, aber unter Geisteswissenschaftlern ist es Mode, technische oder wissenschaftliche Begriffe dafür zu verwenden Zweck, sich einen Anstrich von Seriosität zu geben – was viel aussagt). Außerdem verwechseln sie GPT immer wieder mit einem dummen Markovianer.

Der erste Punkt, der in dem, was geschrieben steht, leicht angefochten werden kann, ist die Masse an aufgewecktem Bullshit, ohne Beweise, Beweise, Maßnahmen.

Das zweite ist, dass er beim Sprechen so viele Zitate hinzufügt, dass eine Peer-Review unmöglich wird, außer von jemandem, der eine positive Peer-Review durchführt, weil er ein Freund der Gruppe ist, die dieses Dokument schreibt.


Hier sind wir beim ersten Punkt: Wenn ChatGPT ein stochastischer Papagei ist, weil es „Inhalte aus einem gigantischen Sprachmodell entnimmt, das aus einer immensen Menge von Schriften besteht“, trifft die Definition perfekt auf dieses Papier zu, das „Inhalte aus einem gigantischen Archiv entnimmt von akademisch akzeptablem Inhalt, bestehend aus einer immensen Menge an Schriften“

Hoppla. Angesichts der Menge an Zitaten in diesem Artikel kann ich mit Sicherheit sagen, dass der Autor des Artikels ein stochastischer Papagei ist, der von einer enormen Menge an Zitaten aus anderen Schriften gefüttert wird. Dieses Schreiben ist angesichts der Anzahl der Zitate das Produkt eines stochastischen Papageis.

Damit berühre ich offensichtlich zu Recht eine andere Elite des Schnupfens: die akademische. Denn anhand des Begriffs „stokastischer Papagei“ stellen wir fest, dass durch die exzessive Verwendung von Zitaten praktisch JEDE wissenschaftliche Arbeit zumindest zu großen Teilen ein stochastischer Papagei oder ein stochastischer Papagei ist.

Hier werden diejenigen kommen, die mir sagen: „Außerdem fügt mein Aufsatz, auch wenn er ziemlich voll von Zitaten aus anderen Werken ist, etwas zu dem hinzu, was bisher bekannt war.“

Hier können wir entscheiden, ob wir dieser Information Glauben schenken oder nicht. Ich meine, wenn es sich um eine wissenschaftliche Entdeckung handelt (die einzigen, die etwas hinzufügen), muss sie eine Reihe experimenteller Daten enthalten, die für die Formulierung und Demonstration der Entdeckung notwendig sind.

Das Problem ist, wenn Sie ein Experiment gemacht haben, dann ist das Experiment NICHT in Ihrem Kopf passiert. Die Daten, die Sie eingeben, sind also wie ein Zitat: Sie zitieren einfach die experimentellen Daten.

Aber wenn das der Fall ist, dann haben Sie gerade Daten zu Ihrem Sprachmodell hinzugefügt und sind wieder ein stochastischer Papagei.


Was ist die Moral dieser Geschichte?

Die Moral ist, dass die Nicht-Definition von stochastischem Papagei, die auch von diesem Dokument verwendet wird, sich auf jedes einzelne menschliche Gehirn beziehen zu können scheint, weil es so weit geöffnet ist, dass alles hindurchgeht.

Alle befreien? Nein, nicht unbedingt. In dem Sinne, dass ein System wie ChatGPT eine endliche Kardinalität hat, weil es eine endliche Menge von Beispielen verwendet. Und das Komische ist, dass dasselbe System, das die richtigen Fragen stellt, sich dessen bewusst zu sein scheint.

Da unser Verstand in der Lage ist, Sprachen mit unendlicher Kardinalität zu verstehen und zu beschreiben, während ChatGPT eine endliche Kardinalität hat, ist klar, dass es immer noch einen Unterschied zu ChatGPT gibt, aber ich habe noch keinen einzigen Text gefunden, der darauf hinweist dieser einfache Unterschied. (obwohl die Axiomatisierung nicht die Aussage jedes Theorems abdeckt oder darauf hinausläuft)

In Wirklichkeit ist ChatGPT in seiner Antwort "optimistisch" (das heißt, es ist falsch), da es nicht einmal, wenn es eine Sprache von unendlicher Kraft hätte, wirklich alle möglichen Sätze erzeugen könnte (Gödel, et al), aber der Punkt ist das es ist der einzige im Netz existierende Text, der die Frage nach der Kardinalität und Macht des Sprachmodells stellt. Und du wirst keinen anderen finden.

Anscheinend ist ChatGPT ein stochastischer Papagei, der von anderen stochastischen Papageien angegriffen wird.


Abgesehen davon werden sich die Humanisten jetzt gegenseitig anstupsen und sagen: „Hast du gesehen? Der Mensch ist überlegen“. Dabei führen sie einen Trugschluss ein, der darin besteht, die Menschheit mit ihren Vorkämpfern zu vergleichen.

Wenn also ein (menschlicher) Meister einer intellektuellen Disziplin einen Computer schlägt, wie es beim Schach passiert ist (jetzt passiert es nicht mehr), heißt es, dass Maschinen niemals in der Lage sein werden, sich mit Menschen zu vergleichen. Aber es gibt ein Problem, das ich so formulieren würde:

  • „Kein Computer wird je wie Michelangelo sein“
  • Sie werden auch nie wie Michelangelo sein.

Da der Computer sogar absurderweise festgestellt hat, dass er mit Michelangelo nicht konkurrieren kann, müssen wir feststellen, mit wie vielen Menschen er konkurrieren kann und mit wem. Und mit wie vielen.

Ich bin sicher, dass ChatGPT niemals ein so guter Journalist sein wird wie Enzo Biagi, aber wir müssen uns fragen, wie viele Enzo Biagis es gibt und wie viele Sciandivasci es gibt. Ich mache Sciandivasci auf meinem Handy mit einem Markovian, wenn ich will.

Und wenn es zufällig nicht viel braucht, um besser als Sciandivasci zu schreiben, muss man verstehen, dass Enzo Biagis Job ja sicher ist (auch weil er tot ist), aber ich würde nicht auf Sciandivascis wetten.

Dennoch:

Jetzt sind die großen Reporter auf Buzzfeed wahrscheinlich nicht in Gefahr, aber 12% verloren ihren Job, als sie sie durch ChatGPT ersetzten.

Das Problem ist also einfach: Kann ChatGPT einen Menschen ersetzen? Nein. Aber es kann auf jeden Fall sofort mindestens 12 % der Inhaltsersteller von Buzzfeed ersetzen. Kurz gesagt, die Sciandivasci der Situation.


Und das stellt zumindest im Journalismus ein Problem dar: Wie viel moderner Journalismus fällt in die Kategorie „stochastischer Papagei“? Nun, wir können einen Test machen:

  1. Gehen Sie an den Ort, an dem Dinge passieren, um mit Menschen zu sprechen, Nachforschungen anzustellen, Informationen zu sammeln und dabei manchmal Risiken einzugehen?
  2. sitzt du den ganzen tag in der redaktion, fährst am weitesten in den urlaub und bekommst nachrichten „von den agenturen“?

Wenn die Antwort „1“ ist, sind Sie wahrscheinlich kein stochastischer Papagei oder zumindest ein aktiver stochastischer Papagei, insofern Sie selbst nach Daten für Ihr Modell suchen.

Wenn die Antwort „2“ lautet, sind Sie selbst ein stochastischer Papagei: als hätten wir ChatGPT mit den Agenturen verbunden und ihnen dann gesagt, sie sollen Artikel schreiben.

Stochastische Papageien, einfach ausgedrückt, findet man in Redaktionen, Hochschulen für freie Künste und an anderen Orten. Und wenn wir Leute sehen, die darüber empört sind, dass "ein Computer NIE wie ein Kreativer sein wird", wissen wir, was passiert: Diese Bewohner des Dachbodens des Wissens sehen einen stochastischen Papagei wie sie, nur dass er nicht krank wird streikt nicht, es kostet viel weniger, und sie haben Angst, dass es ihren Platz einnehmen wird.

Und es wird.

https://futurism.com/the-byte/ai-david-cronenberg-movie

Dieselbe alte Geschichte. Als würden es stochastische Papageien schreiben.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert