Diskussion om AI-genererade bilder

CapnZapp

Myrmidon
Joined
3 Apr 2008
Messages
4,003
Detta ämne är superintressant, men om man är intresserad av exempelvis SLP illustrationer som jag, verkar det som att man behöver vänta några månader till. De databaser som de neurala nätverken har haft tillgång till verkar vara begränsade vad gäller sådant som "hur många ben har en människa", och har huvudsakligen varit Safe For Work.

Men detta ändras i rasande hastighet 👍
 

CapnZapp

Myrmidon
Joined
3 Apr 2008
Messages
4,003
Vänta bara tills vi ser en film med realtidsskapad story och bilder i UltraK upplösning. Unik för dig och din filmsmak.
Ars Technica spekulerade att vi snart har massiv komprimering - istället för att tanka hem flera gigabyte av data för senaste långfilmen laddar du bara hem dess manus, samt ett seedvärde*, så fixar AIn själva bilderna. :)

*) så alla får samma resultat
 
Joined
28 Nov 2006
Messages
2,417
Location
Nirvana
Detta ämne är superintressant, men om man är intresserad av exempelvis SLP illustrationer som jag, verkar det som att man behöver vänta några månader till. De databaser som de neurala nätverken har haft tillgång till verkar vara begränsade vad gäller sådant som "hur många ben har en människa", och har huvudsakligen varit Safe For Work.

Men detta ändras i rasande hastighet 👍
Följer du några av de grupper om AI-bilder som finns på FB? Rena mugshots av god kvalitet är ganska enkla att få fram. Vad som däremot fortfarande är svårt är att regissera specifika scener och få dem att se vettiga ut. Men du har förstås rätt i att utvecklingen går fort. Det händer saker varje vecka. Nya filter och funktioner, snyggare och mer varierade bilder.
 
Last edited:

Troberg

Sinister eater
Joined
27 Jun 2001
Messages
17,579
Här ser vi också en nackdel med Midjourney just nu. Alla ansikten blir likadana.
Jag kör StableDiffusion, och där hjälper det att nämna några kända personers namn. Har man flera namn så mixar den ihop dem så att det inte syns vem det är, men det blir olika ansikten, och den blir bättre på att göra bra ansikten (färre mysko ögon och sånt).
 

Lemur

Chatbot som låtsas vara en lemur
Joined
7 Sep 2015
Messages
2,317
Sista dagen på mitt 30$-prenumeration. Här var en riktigt bra genomgång i prompts för Midjourney:

Hur funkade $30 prenumerationen? Kunde du göra hur många bilder som helst då fast i långsam takt? Hur funkade det isf?
 

Rickard

Superhero
Joined
15 Oct 2000
Messages
17,469
Location
Helsingborg
Hur funkade $30 prenumerationen? Kunde du göra hur många bilder som helst då fast i långsam takt? Hur funkade det isf?
Lifetime Usage: 791 images (14.43 hours)
Relaxed Usage: 591 images (11.06 hours)
Fast Time Remaining: 12.37/15 hours (82.46%)

Som du kan se hade jag kunnat köra "fast mode" under hela månaden för alla 800 bilder. Körde 0.3 till 3 i kvalitet där mesta delen var 1 eller 2.

Du ser ett antal i rollformulärstråden.

"fast/relaxed" spelar inte så stor roll då jag genererade bilder medan jag kollade på annat. Tror jag hade mest nytta av att kunna se andras prompter.
 
Joined
28 Nov 2006
Messages
2,417
Location
Nirvana
Lifetime Usage: 791 images (14.43 hours)
Relaxed Usage: 591 images (11.06 hours)
Fast Time Remaining: 12.37/15 hours (82.46%)

Som du kan se hade jag kunnat köra "fast mode" under hela månaden för alla 800 bilder. Körde 0.3 till 3 i kvalitet där mesta delen var 1 eller 2.

Du ser ett antal i rollformulärstråden.

"fast/relaxed" spelar inte så stor roll då jag genererade bilder medan jag kollade på annat. Tror jag hade mest nytta av att kunna se andras prompter.
Ok, jag har inte provat MJ ännu, men ska. Wombo Dream, som jag har använt, ger inte riktigt lika spektakulära bilder än så länge, men å andra sidan obegränsat många så länge man har abonnemang. Där behöver man inte heller ha lika exakta prompts för att få vettiga bilder. Möjligen gör det också slumpen större.

Hur enkelt tycker du att det har varit att bli bra på prompts?
 

Rickard

Superhero
Joined
15 Oct 2000
Messages
17,469
Location
Helsingborg
Hur enkelt tycker du att det har varit att bli bra på prompts?
Bra och bra? Tja, tyckte det inte tog så lång tid, men jag är mycket (på grund av mitt yrke som programmerare) för att testa och sedan sitta och läsa innan jag testar på nytt.

Jag har inte heller några krav på hur bilden ska se ut, utan ville alltid bli överraskad av resultatet. Det går inte att sitta och ha en klar bild i huvudet och få ut den på "papper". Videon ovan hade varit guld att kunna innan, särskilt att man kan skriva [holy tree, gold, purple] + [universe inside full portrait david bowie, teal, cyan, lightyellow] --q 2 --ar 687:425

Fast nu när jag testade så verkade hakparenteser [ ] inte fungera så särskilt bra. Midjourney tog prompter från ena och lade in i den andra.

Annars är det mest att sitta och testa. Att använda kända namn är ett plus, för ansiktena blir annars likadana. Att kunna färglägga bilder med alla sorts färger (men inte glömma "black, white") är schysst för att skapa personlighet eller slänga dit "epic scene, dramatic light" för att generera undersköna bilder eller kombinera olika konstnärer. Det gäller dock att generera flera versioner för att till slut hitta en bra.

Har börjat använda --stylized mer mot slutet för att få mer variation i de fyra rutorna som kommer.

Prompten jag skrev ovan fick jag förändra något och generera några gånger för att få detta:
[holy tree, gold, purple]::2 + [universe inside david bowie, full portrait, teal, cyan, lightyellow]::3, dramatic lighting, watercolor, ink splash --ar 425:687 --s 15000
 

Attachments

Lemur

Chatbot som låtsas vara en lemur
Joined
7 Sep 2015
Messages
2,317
Lifetime Usage: 791 images (14.43 hours)
Relaxed Usage: 591 images (11.06 hours)
Fast Time Remaining: 12.37/15 hours (82.46%)

Som du kan se hade jag kunnat köra "fast mode" under hela månaden för alla 800 bilder. Körde 0.3 till 3 i kvalitet där mesta delen var 1 eller 2.

Du ser ett antal i rollformulärstråden.

"fast/relaxed" spelar inte så stor roll då jag genererade bilder medan jag kollade på annat. Tror jag hade mest nytta av att kunna se andras prompter.
Jag kör $10 abonnemang och känner tyvärr att jag måste lägga band på mig för att inte mina kretider ska sina.
 

Rickard

Superhero
Joined
15 Oct 2000
Messages
17,469
Location
Helsingborg
Jag kör $10 abonnemang och känner tyvärr att jag måste lägga band på mig för att inte mina kretider ska sina.
Ja, jag har genererat bilder för fyra rollspelsprojekt, en hemsida och två logotyper. :) Ville inte heller känna "stressen" över att behöva tänka på begränsningar, så för mig var det värt 20$ extra trots att jag mest ville sitta och testa.
 
Joined
28 Nov 2006
Messages
2,417
Location
Nirvana
Bra och bra? Tja, tyckte det inte tog så lång tid, men jag är mycket (på grund av mitt yrke som programmerare) för att testa och sedan sitta och läsa innan jag testar på nytt.

Jag har inte heller några krav på hur bilden ska se ut, utan ville alltid bli överraskad av resultatet. Det går inte att sitta och ha en klar bild i huvudet och få ut den på "papper". Videon ovan hade varit guld att kunna innan, särskilt att man kan skriva [holy tree, gold, purple] + [universe inside full portrait david bowie, teal, cyan, lightyellow] --q 2 --ar 687:425

Fast nu när jag testade så verkade hakparenteser [ ] inte fungera så särskilt bra. Midjourney tog prompter från ena och lade in i den andra.

Annars är det mest att sitta och testa. Att använda kända namn är ett plus, för ansiktena blir annars likadana. Att kunna färglägga bilder med alla sorts färger (men inte glömma "black, white") är schysst för att skapa personlighet eller slänga dit "epic scene, dramatic light" för att generera undersköna bilder eller kombinera olika konstnärer. Det gäller dock att generera flera versioner för att till slut hitta en bra.

Har börjat använda --stylized mer mot slutet för att få mer variation i de fyra rutorna som kommer.

Prompten jag skrev ovan fick jag förändra något och generera några gånger för att få detta:
[holy tree, gold, purple]::2 + [universe inside david bowie, full portrait, teal, cyan, lightyellow]::3, dramatic lighting, watercolor, ink splash --ar 425:687 --s 15000
Bra, då förstår jag mer vad skillnaden mellan MJ och Wombo Dream är. Hakparenteser har jag inte alls använt mig av. Jag kommer förmodligen att köpa ett lite större paket för att kunna göra många bilder på MJ. Alltför begränsat verkar dåligt.

Även för mig finns det en fördel i processen att pröva sig fram. En del av poängen ligger också i att resultatet ofta blir överraskande. Många som blir besvikna verkar bli det för att de inte enkelt kan klicka fram något väldigt specifikt och på förhand planerat. Jag tycker snarare att det är bra att det inte blir så. Gjorde ett par hundra bilder i Wombo för några veckor sedan och de bilder jag blev mest nöjd med är de som tolkade mina prompts på sätt jag inte kunde förutse. Det återstår att se om jag tycker att de är tillräckligt bra för att använda i några av mina kommande rollspelsprodukter. Tanken är att bygga upp en egen databas av bilder att välja mellan.

Till saken hör också att Wombo Dream har blivit klart bättre sedan dess. De verkar också ha integrerat Stable Diffiusion (var det väl?) i något eller några av sina filter. Ska testa att blanda olika kända personer för att undvika att få samma ansikten. Isometriska bilder vore också bra att få till, men jag vet inte hur svårt det är att få till det med AI.

En månad med Wombo tror jag kostade sju dollar (med obegränsat antal bilder), så det är möjligen mer prisvärt, beroende på exakt vad man är ute efter. Det verkar dock svårt att få till liggande format.
 
Last edited:

Troberg

Sinister eater
Joined
27 Jun 2001
Messages
17,579
Innan ni köper något, ta en titt på Stable Diffusion. Det är gratis, ni kan köra helt lokalt på er dator, och det finns ingen censur (typ, som Dall-E, som inte tillåter något som har med vapen, våld, sex, nakenhet eller liknande, inklusive att den inte kan skilja på "shot" som i att skjuta och som i att fotografera...). Det finns många bra frontends, i och med att den är open source, som är "ladda ner, installera, kör".

Istället för att fundera "Vad kostar den här bilden?", så kan man köra igång den på kvällen på "Generera 1000 varianter på den här prompten" och hittar alltid en packe bra bilder på morgonen.

Utvecklingstakten på den är enorm, det är massor av folk som gör stuff till den.
 

Genesis

Ni dés ni maître
Joined
17 Aug 2000
Messages
14,734
Location
Göteborg
Innan ni köper något, ta en titt på Stable Diffusion. Det är gratis, ni kan köra helt lokalt på er dator, och det finns ingen censur (typ, som Dall-E, som inte tillåter något som har med vapen, våld, sex, nakenhet eller liknande, inklusive att den inte kan skilja på "shot" som i att skjuta och som i att fotografera...). Det finns många bra frontends, i och med att den är open source, som är "ladda ner, installera, kör".

Istället för att fundera "Vad kostar den här bilden?", så kan man köra igång den på kvällen på "Generera 1000 varianter på den här prompten" och hittar alltid en packe bra bilder på morgonen.

Utvecklingstakten på den är enorm, det är massor av folk som gör stuff till den.
Mm, funderar på att göra ett försök. Verkar krångligt att installera på OSX, men det finns ett par guider.
 
Top