Generative Füllung: Blick über den Schachtelrand

  • Durch den Artikel Generative Füllung: Blick über den Schachtelrand - kulturgutspiel.de - Magazin für Spielkultur und der Veränderung des Messe-Maskottchens möchte ich hier gerne eine Galerie eröffnen für die größere Welt der Brettspiel(cover). Wer also ein Künstler ohne Talent ist, der kann sich hier voll austoben. :)


    verv

    Generative Fill liefert auch hier:


    Diese Bilder sind auch in dem bereits angegebenen Link zu finden.



    Edit: #Sommerloch ;)

  • Man merkt aber schon, dass das Ergänzen bei stilisierten Illustrationen deutlich schlechter gelingt als bei naturalistischeren Darstellungen. Cascadia ist zum Beispiel fast tadellos, während das oben gezeigte Heat oder auch Ozeane offenbar zu abstrahiert und verspielt sind, um in alle Richtungen sinnvoll erweitert zu werden:

  • Da bin ich beruhigt, dass die "KI" bisher nur kopieren und ergänzen kann, aber von den gezeigten Details nix versteht.

    Content-Nachschlag gefällig? Brettspieltag.de – Das etwas andere Boulevard-Magazin der versammelten Brettspiel-Szene


  • Ich habe auch mal kurz rumgespielt, die Ergebnisse sind nicht immer gut aber immer verblüffend ^^

    Bei einem anderen Foto hat die KI plötzlich Menschen dazu gedichtet, die sahen allerdings bei näherer Betrachtung sehr zerquetscht aus …

  • Was passiert, wenn man die erzeugten Bilder wieder als Quelle benutzt und das immer wieder wiederholt? Dann könnte man ein Riesenbild/eine ganze Welt erhalten in das man dann ala Google Earth rein zoomen kann. :/


    Oder steigt die KI dann irgendwann aus und produziert nur noch Nebel/Rauschen?

  • in das man dann ala Google Earth rein zoomen kann. :/

    hineinzoomen geht nicht weil die Auflösung zumindest derzeit auf 1200x800 begrenzt ist

    Das stimmt, aber man kann ein Bild natürlich häppchenweise immer weiter erweitern. Ich nehme an, dass das irgendwann aber eine ziemliche Flüsterpost wird. Man sieht ja z.B. an dem Cascadia-Beispiel, dass Generative Fill das blaue FlatOut Games-Logo in Form eines Schilds in der Wiese repliziert hat. Solche Fehlinterpretationen würden sich vermutlich mehr und mehr häufen, so dass die Erweiterungen irgendwann vermutlich ziemlich weit von dem Ausgangsbild entfernt sein dürften.

  • Was passiert, wenn man die erzeugten Bilder wieder als Quelle benutzt und das immer wieder wiederholt?

    Es gibt witzigerweise langsam erste Stimmen, die das ansprechen:
    Da der Kopier-Algorithmus solcher Programme sich immer aus bereits existierenden Bildern speist, und es immer mehr mit solchen Kopier-Algorithmen erzeugte Bilder gibt, beginnen die Algorithmen inzwischen auch, die bereits durch Algorithmen erzeugten Bilder zu kopieren. Kurz: Sie fangen an, die (minderwertigen) Kopien als Quelle für ihre Kopien zu nutzen, wodurch die Qualität noch weiter leidet.

  • Ich hab hier mal eine Version von Cascadia gemacht, nicht mit PS sondern mit einem Tool das auf Stable Diffusion basiert mal als Vergleich was ohne Adobe so geht

    Das sieht ja doch recht ähnlich aus. Was mich daran erinnert hat, dass Generative Fill ja immer gleich 3 Vorschläge generiert. Hier also (aus der gleichen .psd-Datei) zu Heat und Ozeane nicht die jeweils erste, sondern die nach meinem Dafürhalten beste Erweiterung:


  • IamSalvation Twilight Struggle finde ich ganz spannend, da wird der rot-blaue Streifen nicht fortgesetzt, sondern es kommen einfach Bäume dazu ^^


    Kurz: Sie fangen an, die (minderwertigen) Kopien als Quelle für ihre Kopien zu nutzen, wodurch die Qualität noch weiter leidet.

    Ich frage mich auch schon die ganze Zeit, was dabei heraus kommen wird, wenn die Programme in großem Umfang oder über mehrere Schichten hinweg mit dem Output anderer Programme angelernt werden (entweder absichtlich oder weil nicht gezielt selektiert wird), oder Programme sich gegenseitig die Eingabe-Befehle generieren...

  • Das ganze wird "schlimmer", wenn man die gesamte Information betrachtet. Manche AI Experten sprechen von zunehmender "Verschmutzung" der echten Information durch AI-generierte "Information", und sagen eine Informationsapokalypse voraus, weil wir nicht mehr oder nur sehr schwer zwischen beidem unterscheiden können.

  • Ich habe nochmal ein wenig mit Illustrationen gespielt, die eine dichtere, kleinteiligere Szene darstellen. Und dort merkt man die Limitationen gewaltig! Generative Fill funktioniert gut, wenn große Objekte, Landschaften, Gebäude, etc. vorhersagbar ergänzt werden können. In diesen Beispielen will Generative Fill die Szene detailreich erweitern, aber anstatt dass neue Details erschaffen werden, entstehen nur verschmierte Farbflächen, die zwar visuell ähnlich unruhig sind aber sich vor tatsächlich neu erstellten Elementen drücken. Und mindestens im Fall der Quacksalber von Quedlinburg wird dadurch auch der Stil nicht gut kopiert. Das erweiterte Bild hat doch einen anderen Look – schmutziger, weniger Farbenfroh, weniger comichaft.


    Einmal editiert, zuletzt von verv ()

  • Ich frage mich auch schon die ganze Zeit, was dabei heraus kommen wird, wenn die Programme in großem Umfang oder über mehrere Schichten hinweg mit dem Output anderer Programme angelernt werden (entweder absichtlich oder weil nicht gezielt selektiert wird), oder Programme sich gegenseitig die Eingabe-Befehle generieren...

    Du meinst, wenn man Bot1 darum bittet, Anweisungstexte für Bot2 zu schreiben, die damit Bot3 anweisen soll, eine Anweisung für Bot4 zu generieren? :D

    André Zottmann / Thygra Spiele - u. a. viel für Pegasus Spiele tätig
    Ich gebe hier generell immer meine eigene, ganz persönliche Meinung von mir.

    Einmal editiert, zuletzt von Thygra ()

  • Ich frage mich auch schon die ganze Zeit, was dabei heraus kommen wird, wenn die Programme in großem Umfang oder über mehrere Schichten hinweg mit dem Output anderer Programme angelernt werden (entweder absichtlich oder weil nicht gezielt selektiert wird), oder Programme sich gegenseitig die Eingabe-Befehle generieren...

    Du meinst, wenn man Bot1 darum bittet, Anweisungstexte für Bot2 zu schreiben, die damit Bot3 anweisen soll, eine Anweisung für Bot4 zu generieren? :D

    Ja genau so war es gemeint... finde ich jetzt nicht so abwegig wie es vielleicht auf den ersten Blick scheint.

    Das ganze wird "schlimmer", wenn man die gesamte Information betrachtet. Manche AI Experten sprechen von zunehmender "Verschmutzung" der echten Information durch AI-generierte "Information", und sagen eine Informationsapokalypse voraus, weil wir nicht mehr oder nur sehr schwer zwischen beidem unterscheiden können.

    Ja das ist eine gute Beschreibung für das Szenario. Und auch ohne KI-generierte Texte ist es ja schon schwer genug, wahre von falschen Informationen zu unterscheiden. Anders herum gesehen steigt dann der Wert von Daten mit belegbaren Quellen.

  • Man merkt aber schon, dass das Ergänzen bei stilisierten Illustrationen deutlich schlechter gelingt als bei naturalistischeren Darstellungen. Cascadia ist zum Beispiel fast tadellos, während das oben gezeigte Heat oder auch Ozeane offenbar zu abstrahiert und verspielt sind, um in alle Richtungen sinnvoll erweitert zu werden:

    Ozeane hatte ich auch mal durchlaufen lassen, aber das Ergebnis sieht doch deutlich anders aus. Interessante Spielerei auf jeden Fall.

  • der nicht versteht, was er da tut.

    Wie viel versteht der Mensch von dem, was er tut? Wie viel von dem meint er nur zu verstehen? Das soll kein Widerspruch zu deinen Ausführungen sein, ich musste nur bei dem Teil des Satzes schmunzeln. Wie viele Entscheidungen treffen wir aus einem verzerrten schnellen Denken und meinen, damit auf dem richtigen Pfad zu sein?

  • der nicht versteht, was er da tut.

    Wie viel versteht der Mensch von dem, was er tut? Wie viel von dem meint er nur zu verstehen? Das soll kein Widerspruch zu deinen Ausführungen sein, ich musste nur bei dem Teil des Satzes schmunzeln. Wie viele Entscheidungen treffen wir aus einem verzerrten schnellen Denken und meinen, damit auf dem richtigen Pfad zu sein?

    Das ist zwar wahr, aber eine andere Ebene. Du hebst das auf eine philosophische, ja fast schon metaphysische Ebene.

    Ich meine das ganz schlicht: Wenn du eine Ente malst, weißt du, dass du eine Ente malst.

    Wenn du dem Kopier-Algorithmus sagst: "Mal mir eine Ente", hat er keine Ahnung, dass er eine Ente malt. Er weiß nicht mal, dass er malt. Oder dass er ist. Oder dass du ihm was gesagt hast. Er oder was tut.
    Ein Toaster mag das schönste und knusprigste Toast der Welt zaubern, ein wahres Kunstwerk, das noch in Generationen die Menschen verzaubert, vielleicht sogar mit einem Abbild von Elvis oder Kurt Cobain oder so. Aber der Toaster weiß nicht, was er tut. Er weiß nicht, dass er toastet, er weiß nicht, dass er ein Toaster ist.
    Ein Kopier-Algorithmus hat dieselbe Bewusstheitsstufe und "künstliche Intelligenz" wie ein Toaster. Was am Ende rauskommt, mag UNS wie Magie und cleveres Handeln vorkommen, aber der Algorithmus weiß nicht mal, dass er das gemacht hat.

    Das heißt, wir wissen vielelicht nicht, was wir aufgrund von verzerrtem schnellen Denken tun, oder warum, aber ein Toaster denkt nicht mal, weder schnell, noch langsam. Er erfüllt die Aufgabe aufgrund rein mechanischer Mittel. Und ein Kopier-Algorithmus tut auch nur das.
    Das heißt, es ist dann doch noch eine andere Art von "Verstehen" als in deinen Gedanken. :)

  • Ich möchte nicht, dass mein Toaster ein Bewusstsein hat oder bekommt. =O


    Wäre dann Stoff für eine Black Mirror Folge.

    Content-Nachschlag gefällig? Brettspieltag.de – Das etwas andere Boulevard-Magazin der versammelten Brettspiel-Szene

  • Ich möchte nicht, dass mein Toaster ein Bewusstsein hat oder bekommt. =O

    Ein toller Prompt für ChatGPT ;)

    Zitat

    Schreibe bitte eine sehr gruselige Kurzgeschichte über den Brettspieler RAVN, dessen Toaster ein Bewusstsein entwickelt.

    Das Ergebnis: es geht nicht gut für dich aus, ravn :lachwein: :lachwein: :lachwein:

  • Huutini Natürlich wissen diese KIs nichts. Wir sind nicht bei Iron Man und J.A.R.V.I.S., der zu Vision wird. Und mir ging es durchaus um die philosophische Idee hinter deinem Satz, den ich im Zusammenhang mit uns Menschen amüsant fand.


    Zur Ente. Wenn meine Frau einen Igel malt, dann sieht das aus wie ein Schaf. Weiß sie das? Nein. Für sie ist es ein Igel. Das kann ganz schön problematisch sein, wenn man etwas über sich denkt. Versteht also meine Frau was sie da tut? Sie malt immerhin ganz offensichtlich ein Schaf.


    Das technische Grundgerüst sollten allen klar sein, die solch einen Algorithmus benutzen, daher finde ich die Unterhaltung darüber eher uninteressant und wollte es nur etwas weiterspinnen.

  • (...) Das technische Grundgerüst sollten allen klar sein, die solch einen Algorithmus benutzen, (...)

    Da stimme ich Dir zu, ist es aber offenbar nicht, da sehr viele Menschen den als Marketing-Tag verwendeten "KI"-Begriff übernehmen. Insofern ist Huutini s Anmerkung berechtigt, und wir sollten und werden sie noch viel häufiger wiederholen.

    UpLive [bgg for trade] - einfach anschreiben, wenn Dich davon was interessiert!

  • Generative Fill funktioniert gut, wenn große Objekte, Landschaften, Gebäude, etc. vorhersagbar ergänzt werden können.

    ...

    Das erweiterte Bild hat doch einen anderen Look – schmutziger, weniger Farbenfroh, weniger comichaft.

    Ich finde gerade diese Cover noch interessanter als die "vorhersagbaren" Erweiterungen eines Bildes. Es entsteht dadurch ein surreales Bild (der Brettspielwelt).

    Wenn am Rand des Covers nur Teile der Personen oder Tiere zu sehen sind, so wie bei "Ein Fest für Odin", dann finde ich das Resultat der Erweiterung doch überraschend und witzig.