Lokale Diffusion
Von Aron Petau • 7 Minuten gelesen •
Kernfragen
Ist es möglich, eine Graphic Novel mit generativer KI zu erstellen? Was bedeutet es, diese neuen Medien in Zusammenarbeit mit anderen zu nutzen? Und warum sind ihre lokalen und offline-Anwendungen wichtig?
Offizielle Workshop-Dokumentation | Workshop-Ausschreibung
Workshop-Ziele & Struktur
Fokus: Theoretische und spielerische Einführung in A.I.-Tools
Der Workshop verfolgte ein doppeltes Ziel:
- Niedrigschwelliger Einstieg: Anfänger*innen einen zugänglichen Einstieg in die Text-to-Image-KI ermöglichen
- Kritische Diskussion: Eine differenzierte politische Diskussion über die ethischen Auswirkungen dieser Tools anstoßen und bewusste Entscheidungsoptionen aufzeigen (wie lokal installierte Tools)
Das Lernformat wurde offen, praxisnah und experimentell gestaltet, wobei der Schwerpunkt auf dem kreativen Output der Teilnehmer*innen lag. Konkret wurden sie aufgefordert, in Gruppen zu arbeiten und gemeinsam mit der KI eine kurze Graphic Novel mit 4-8 Panels zu erstellen. Dabei mussten sie den Algorithmus aktiv verändern und sich mit den verschiedenen Funktionen und Schnittstellen vertraut machen.
Workshop-Ablauf
Der Workshop war in zwei Hauptteile gegliedert:
Teil 1: Theoretische Einführung (45 Min.)
- Entmystifizierung der Prozesse, die im Hintergrund ablaufen
- Einführung in den Stable Diffusion Algorithmus
- Verständnis des Diffusionsprozesses und der Noise Reduction
- Unterschiede zu älteren Generative Adversarial Networks (GANs)
- Ethische Implikationen des Einsatzes von KI-Tools
Teil 2: Praktische Übungen (2+ Stunden)
- "Stadt-Land-Fluss"-Spiel zur Prompt-Konstruktion
- Erstellung einer Graphic Novel mit 4-8 Panels
- Experimentieren mit Parametern und Schnittstellen
- Nachbearbeitungstechniken (Upscaling, Maskieren, Inpainting, Pose Redrawing)
- Gruppenpräsentationen und Diskussion
Das "Stadt-Land-Fluss"-Aufwärmspiel
Um die anfängliche Angst vor dem Prompting zu überwinden, spielten die Teilnehmer*innen eine Runde "Stadt-Land-Fluss" (Kategorien). Sie mussten vordefinierte Prompting-Unterkategorien wie "Thema", "Farbe", "Stil" und "Auflösung" mit Worten füllen, die mit bestimmten Buchstaben beginnen. Dieses Spiel fordert die Teilnehmenden heraus, sich in die kreative Gestaltung eines Prompts hineinzudenken, jenseits von vorgefertigten Sätzen, wie sie online zu finden sind.
Warum lokale KI-Tools verwenden?
Bewusst ethische und datenschutzrechtliche Faktoren miteinbeziehen
Eine zentrale Idee des Workshops war, die ethischen Implikationen des Einsatzes von KI-Tools in den Fokus zu rücken und Konsequenzen von lokaler Rechenleistung im Gegensatz zum Cloud-Computing hervorzuheben. Der Workshop thematisierte zwei wesentliche Unterschiede bei der Anwendung derselben KI-Modelle und -Algorithmen:
Option 1: Proprietäre Cloud-Dienste
- Populäre Plattformen wie Midjourney
- Schnittstelle von privaten Unternehmen bereitgestellt
- Oft gebührenpflichtig
- Ergebnisse auf Unternehmensservern gespeichert
- Daten für weiteres KI-Modell-Training verwendet
- Begrenzte Benutzerkontrolle und Transparenz
Option 2: Lokale Installation
- Selbst installierte Apps auf privaten Computern
- Selbst installierte GUIs oder Front-Ends über Browser zugänglich
- Vollständige Datensouveränität
- Keine Datenweitergabe an Dritte
- Offline-Fähigkeit
Option 3: Universitäts-gehostete Dienste
- Transparente Anbieter (z.B. UdK Berlin Server)
- Schneller und zuverlässiger als proprietäre Cloud-Dienste
- Daten weder an Dritte weitergegeben noch für Training verwendet
- Besser als proprietäre Dienste bei gleichzeitiger Zugänglichkeit
Aus Perspektive des Datenschutzes sind lokale und universitäts-gehostete Lösungen bei weitem die bewussteren Wahlen. Auch wenn UdK-Dienste technisch gesehen ebenfalls Cloud-Dienste mit auf einem Server gespeicherten Daten sind, stellen sie einen großen Unterschied zur Nutzung proprietärer Dienste wie OpenAI dar.
Visuelles Erzählen mit Stable Diffusion
Die Teilnehmer*innen haben sich mit großer Begeisterung auf den Workshop-Prozess eingelassen. Sie probierten viele verschiedene Prompts und Einstellungen aus und produzierten Ergebnisse mit einer großen Vielfalt an ästhetischen und visuellen Erzählungen.
Der Workshop endete mit einer abschließenden Diskussion über:
- Die ethischen Implikationen des Einsatzes von KI-Tools
- Die Auswirkungen auf die verschiedenen kreativen Disziplinen
- Die Frage, ob eine vollständige Abschaffung dieser Tools notwendig oder überhaupt machbar ist
Technischer Rahmen
Mit zunehmender Demokratisierung von KI und der Integration GPT-ähnlicher Strukturen in den Alltag behindert die Black-Box-Vorstellung der mysteriösen allmächtigen Intelligenz die aufschlussreiche und effektive Nutzung aufkommender Tools. Ein besonders praxisnahes Beispiel sind KI-generierte Bilder.
Vorgestellte Tools & Schnittstellen
- Stable Diffusion: Der Kern-Algorithmus
- ComfyUI: Node-basiertes Front-End für Stable Diffusion
- automatic1111: GUI verfügbar auf UdK Berlin Servern
- DiffusionBee: Lokale Anwendungsoption
- ControlNet: Für detaillierte Pose- und Kompositionskontrolle
Lernergebnisse
Die Teilnehmer*innen erlangten die Fähigkeit:
- Mehrere Varianten des Stable Diffusion Algorithmus zu nutzen
- Ein nicht-mathematisches Verständnis von Parametern und deren Effekten zu entwickeln
- Nachbearbeitungstechniken anzuwenden (Upscaling, Maskieren, Inpainting, Pose Redrawing)
- Effektive Text-Prompts zu konstruieren
- Online-Referenzdatenbanken zu nutzen
- Parameter zu manipulieren, um gewünschte Qualitäten zu optimieren
- ControlNet für detaillierte Pose- und Kompositionssteuerung zu verwenden
Erfahrungsbericht von Aron Petau
Die Student-als-Lehrer Perspektive
Über Vorbereitung und Herausforderungen
"Die Vorbereitung eines Workshops fühlte sich definitiv wie eine große Aufgabe an, weil ich das Bedürfnis hatte, Fragen zu Tools zu beantworten, die ich selbst gerade erst entdecke. Eine Sorge war, dass ich die Antwort auf ein fortgeschrittenes technisches Problem nicht geben kann. Dies stellte sich letztendlich als kein großes Problem heraus, was wahrscheinlich an der begrenzten Dauer des Workshops lag.
Was die Erfahrung mit einem KI-Workshop angeht, so bin ich der Meinung, dass es mehr als 3 Stunden braucht, um gemeinsam mit den Menschen in solche komplexen Werkzeuge einzutauchen. Selbst durch die Ausweitung des erklärenden/theoretischen Teils habe ich es nicht geschafft, alle Konzepte abzudecken, die ich im Vorfeld für wertvoll eingestuft habe... Dennoch erscheint mir die Dauer von 3–4 Stunden für einen Einführungsworkshop angemessen, da sich bei längeren Zeitspannen Fehler im Zeitmanagement summieren und hier vielleicht auch mehr Lehrerfahrung nötig wäre."
Über Workshop-Format und Atmosphäre
"Gut gefallen hat mir der eher hierarchiearme Rahmen des Workshops, bei dem klar war, dass es sich eher um ein Skillsharing und nicht um ein Vorlesungsformat handelt. Vor allem bei so praktischen Dingen wie der Bilderzeugung konnte ich, wenn ich die Wirkung eines Promptes oder von einem Parameter nicht kannte – wie auch, das ist ja Sinn der Sache – den Effekt einfach gemeinsam mit den Workshop-Teilnehmer*innen ausprobieren und dann die Ergebnisse untersuchen.
Die Teilnehmerinnen schienen das gewählte Format und den Schwierigkeitsgrad zu mögen, bei dem nicht zu viel Mathematik und Formeln vermittelt wurden, sondern eine Intuition für den zugrunde liegenden Prozess. Die Teilnehmerinnen beteiligten sich auch aktiv an der kritischen Diskussion über den ethischen Einsatz von KI und brachten Perspektiven aus ihren eigenen Bereichen ein, was ich sehr zu schätzen wusste."
Über das Erlernen didaktischer Praxis
"Während der Vorbereitung dieses Workshops hatte ich die Möglichkeit, selbständig zu arbeiten und meine Workshop-Termine selbst zu bestimmen und zu organisieren. Diese Freiheit und Autorität habe ich sehr geschätzt, aber ein etwas stärkerer Druck auf einen endgültigen Termin hätte mir geholfen, die Bedenken bezüglich der Lehrsituation schneller zu verlieren.
Jetzt freue ich mich auf eine mögliche Runde 2 – eine nächste Iteration, in der wir tiefer in die Tiefen von ComfyUI eintauchen können, einer Schnittstelle, die ich absolut liebe, während ihre Macht mir manchmal auch Angst macht."
Empowerment durch Verständnis
Empower yourself against readymade technology!
Lass nicht andere darüber entscheiden, was deine Best Practices sind. Beteilige dich an der Modifikation des Algorithmus und lass dich von endlosen kreativen Möglichkeiten überraschen. Durch die Erkundung lokaler KI-Tools können wir:
- Schritte hin zu einer kritischen und transparenten Nutzung von KI-Tools durch Künstler*innen gehen
- Die Handlungsmacht der Nutzer*innen erhöhen
- Techno-soziale Abhängigkeiten und Machtverhältnisse sichtbar machen
- Fragen des digitalen Kolonialismus ansprechen
- Datensouveränität und Privatsphäre bewahren
Während wir auf der Datenproduktionsseite nicht viel tun können und viele ethische Dilemmata rund um den digitalen Kolonialismus bestehen bleiben, ist lokales Computing ein Schritt hin zu einer kritischen und transparenten Nutzung von KI-Tools durch Künstler*innen.