Demokratisierung der Techberufe durch Midjourney und ChatGPT


Erpel Ölgemälde

Ich bin froh, dass ich aktuell kein Student der Medieninformatik mehr bin. Denn die neue Entwicklung im Bereich der künstlichen Intelligenz wird sich nicht nur dank ChatGPT auf die Berufe auswirken, die mit strukturierten Texten oder Code arbeiten. Also Entwickler, Journalisten, Juristen, Kundendienstmitarbeiter, Übersetzer und alle, die schon immer eine Doktorarbeit schreiben wollten. Auch die Erzeugung von Bildern kann durch Schreiben von Maschinen übernommen werden. Und zwar dank Tools wie Midjourney, Dall-e-2 oder Stable Diffusion.

Programmieren lernen konnte jeder

In seinem Blog hat ben_ 2009 etwas geschrieben, was sich in mein Hirn eingebrannt hat:

„Wir Programmierer und Webdesigner verwenden für unsere Arbeit die gleichen Qwertz-Tastaturen, wie alle anderen auch.“

Benjamin Birkenhake aus Wir schreiben Maschinen

Damals habe ich das Zitat so verstanden: Jeder kann programmieren lernen. So habe ich auch gelebt. Egal, ob es Softwareentwicklung oder 3D-Design war: Ich wollte es ausprobieren und warum? Weil es nur einen Mausklick entfernt war. Das Internet war meine Bibliothek. Genau so Wände mauern oder Philosophie liegt das Wissen offen im Internet herum.

Alles wird einfacher

Die Technologie in der vergangenen Jahren ging immer nur in eine Richtung: Zugänglich für jeden. Es fing an mit dem Browser auf den Handys, mit denen plötzlich jeder online war. Dann durfte jeder Journalist spielen und auf Facebook, Instagram und Twitter ein potenzielles Millionenpublikum erreichen. Mit Gutenberg für WordPress kann jeder seine Webseite umfassend gestalten. Ohne Kenntnisse von CSS, HTML oder php und ohne einen externen Service nutzen zu müssen.

KI wird Menschen nicht ersetzen. Aber Menschen mit KI werden Menschen ohne KI ersetzen.

Keine Vorkenntnisse mehr nötig

Nun hilft uns ChatGPT Software zu entwickeln und Midjourney Fotos zu erzeugen. Vorher nutzen wir dafür auch nur die Tastatur an unseren Computern. Nun reicht das Mobiltelefon in euren Taschen, um ein Ölgemälde von einem Erpel in einem Anzug zu erzeugen:

Döner Kebab wie aus der Burger King Werbung
Döner Kebab wie aus der Burger King Werbung

Oder ein leckeres Bild von einem Döner Kebab im Burger King Style mit dem schwarzen Hintergrund. Dies war der Prompt für Midjourney. Hochskaliert wurde es in Pixelmator Pro.

Automatisierte Erstellung von 3D Grafiken

Damals wollte ich auch 3D-Modellierungssoftware wie 3D Studio Max oder Maya beherrschen. Immerhin hatte meine Bachelorarbeit dann auch etwas damit zu tun. Mein Level war allerdings mehr als dilettantisch. Mit Midjourney stecken wir noch in den Kinderschuhen, aber die Ergebnisse sind jetzt schon unglaublich.

Links: Original, Mitte: Entfernen des Objektes durch Dall-e-2, Rechts: Das neue Bild aus Midjourney

Man kann Midjourney auch ein Bild mitgeben und dann auf dieser Basis etwas Neues erschaffen. Dabei habe ich Objekt aus dem ursprünglichen Bild mithilfe von Dall-e-2 rausgeschnitten und ersetzt. Dann habe ich grob in ChatGPT das gewünschte Bild in Umgangssprache beschrieben und gesagt, dass das Ergebnis für eine KI zur Bildgenerierung gedacht ist. Das hier war dann der finale Prompt:

Natürlich hat es ein paar Versuche gedauert, bis ich zufrieden war. Der Begriff „Ambient Occlusion“ kam dann noch manuell rein, um die Schattierungen in den Ecken hinzubekommen.

Was bedeutet das alles für die Entwicklung von Videospielen?

Es gibt sehr wenig YouTube-Kanäle, die ich regelmäßig schaue. Darunter ist Digital Foundry. Der Redakteur Oliver Mackenzie hat dort kürzlich einen Ausblick gegeben, wie die Entwicklung von Videospielen nicht nur massiv beschleunigt, sondern auch verändert werden könnte.

Jeder macht mal Fehler

Wie kleine Kinder machen ChatGPT, Midjourney und Co sehr viele Fehler. Aber für meine Einsatzzwecke reicht es. ChatGPT hat mein erfolgreiches WordPress-Plugin SimpleTOC komplett überarbeitet. Und zwar war so, dass ich den Code nun wieder selbst verstehe. Denn es hat ihn kommentiert und mir noch mal erklärt. Natürlich gab es dabei auch Probleme, aber die konnte ich lösen. Bei Midjourney bin ich daran gescheitert, das Airbrush-Gemälde aus dem Deichkind-Song „Leider geil“ zu erzeugen:

Ein Drache und ein Krieger kämpfen auf dem Berg
Ein Drache und ein Krieger kämpfen auf dem Berg – Versuch 13
Ein Drache und ein Krieger kämpfen auf dem Berg
Ein Drache und ein Krieger kämpfen auf dem Berg – Versuch 22

Der Drache soll Feuer speien und der Krieger soll ihn bitte angreifen. Vielleicht wurde hier schon etwas reguliert, damit man keine Gewalt abbilden kann.

Und selbst mit etwas mehr „Metal“ klappte es nicht:

Bitte nicht verbieten!

In Italien wurde ChatGTP bereits verboten. Es laufen schon Gespräche in Deutschland, ob es aus demselben Grund ebenfalls gesperrt werden soll: Datenschutz. Dabei sollte jetzt schon klar sein, dass wir uns nach der Erfindung des Internets jetzt in der 56k-Modem-Ära der künstlichen Intelligenz befinden. Jeder Mensch sollte das nicht nur verstehen, sondern müsste zumindest in der Lage sein, die Entwicklung aktiv mitzugestalten. Verbote und Einschränkungen bringen niemanden weiter. Auch die Urheberrechtsfrage schwebt wie das Damoklesschwert über uns. Wenn bald das Urheberrecht von Disney an Micky Maus erlischt, könnte jeder seine eigenen Micky Maus Malbücher oder Comics per KI erstellen. Zumindest wenn sie auf der Version von Steamboat Willie basieren, die dann 2024 zur Public Domain wird. Es wird also spannend, wie sich die Welt in Zukunft verhalten wird. Denn eines steht fest: künstliche Intelligenz wird die Welt nachhaltig verändern.


Beitrag veröffentlicht

in

von

Kommentare

2 Antworten zu „Demokratisierung der Techberufe durch Midjourney und ChatGPT“

  1. Avatar von ben_
    ben_

    Ich bin sehr gerührt, dass Du meinen 14 Jahre alten Artikel in so guter Erinnerung behalten hast. Was den Einsatz von KIs insbesondere in Techberufen angeht, bin ich ein bisken vorsichtiger. Selbst als Programmierer ist es oft schwierig genug, im Sinne der Aufgabe die richtigen Entscheidungen zu fällen, schon ohne, dass die Nicht-Programmierer, für die man das macht, eine präzise Idee davon haben, was sie eigentlich wollen. Ich kann mir vorstellen, dass die Arbeit, die Programmierer künftig machen, sich deutlich verändert, aber ich fürchte, gebraucht werden sie evtl. sogar mehr denn je, denn das ist ja das Problem mit den KIs – wir wissen nicht und werden nie wissen, warum sie etwas so tun, wie sie es tun. Die Konsequenzen von KI gebauten Code korrekt abzuschätzen wird also eine vermutlich anspruchsvolle Aufgabe als ehedem das Programmieren selbst.

    1. Avatar von Marc
      Marc

      Latürnich erinnere ich mich an alles. „Das Internet steht gerade am Scheideweg.“ ;-)

      Und ja, im Kern teile ich deine Ansicht. Man wird Entwickler benötigen. Aber die Aufgabe wird sich verschieben. Allerdings befähigt diese Technik finde ich schon eine Generation von cleveren Leuten, die nie entwickeln gelernt haben, zur Entwicklung von Software und Medien, die das vorher nur mit anderen Menschen geschafft hätten. Du kennst sicherlich die Beispiele wie Leute da ganze Spiele wie Flappy Bird und so von 0 auf in Unity zusammenstellen und sich die Grafiken generieren lassen. Denn nun kann man ja nachfragen bei der KI, wie das geht. Oder was der Fehler auf dem Screen bedeutet. Ich kann mir nun denken, warum Stackoverflow verkauft wurde. =)

      Aber: grandiose und spannende Zeiten!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert