AI-genererade bilder

Genesis

Pa' ti 泣き, chicken teriyaki
Joined
17 Aug 2000
Messages
11,860
Location
Göteborg
Någon som vet vad q-faktorn gör, mer exakt? Vad är det som blir bättre? Jag har bara basic-planen just nu och vill inte slösa på GPU-tid, men jag får väldigt mycket skräp. Typ människor med två näsor, sneda hus som flyger i luften, armar som förvandlas till knivar, och så vidare. Är det q 2 samt låg s som gäller? Eller är det bara att man behöver generera en herrans massa alternativ för att hitta något användbart? Typ landskap är det som har funkat för mig hittills. Allt annat blir typ skräp.
 

Rickard

Superhero
Joined
15 Oct 2000
Messages
15,372
Jag har bara basic-planen just nu och vill inte slösa på GPU-tid, men jag får väldigt mycket skräp.
En annan sak jag brukar göra är att skriva --seed 1000 --q 0.3 för att snabbt generera bilder. Blir de bra så använder jag samma seed fast med en högre quality. Behöver inte så mycket väntetid heller.

Här är dokumentationen.
 

Genesis

Pa' ti 泣き, chicken teriyaki
Joined
17 Aug 2000
Messages
11,860
Location
Göteborg
En annan sak jag brukar göra är att skriva --seed 1000 --q 0.3 för att snabbt generera bilder. Blir de bra så använder jag samma seed fast med en högre quality. Behöver inte så mycket väntetid heller.
Hm, detta verkar inte funka. Samma seed med olika kvalitetsvärden ger dramatiskt olika bilder för mig. Däremot skulle man kunna använda ”stop” för att avbryta innan bilderna är klara.

q-värdet verkar i alla fall påverka typ detaljer och ”lokal snygghet”, men det är fortfarande svårt att göra bilder som inte är skräp.

Tror att det mycket handlar om vad för sorts bild man vill ha. Landskap, generiska fantasy- eller scifi-bilder, concept art-grejer går nog bra. Men utanför det området verkar det vara ganska kasst. Den är väl tränad på typ DeviantArt eller nå’t.:gremtongue: Jag har använt mycket ”retro poster”, ”albert solon”, ”alphonse mucha” och ”photography”. MidJourney klarar av att fixa dessa stilar väldigt väl, men resultatet verkar typ alltid bli nonsensbilder. Gissar att om man använder mer populära concept-art-stilar så har algoritmen mer data och kan då göra typ människor som ser ut som människor.

Men utvecklingen går ju fort, och DALL-E 2verkar ju kunna göra riktigt imponerande grejer. Om ett år eller två kanske detta blir mer användbart.

Eller så är det bara jag som är kass på att skriva prompter.:gremeek:
 

Rickard

Superhero
Joined
15 Oct 2000
Messages
15,372
Samma seed med olika kvalitetsvärden ger dramatiskt olika bilder för mig.
Ja, jag menade mer att du ser att prompten blir rätt. Tog mig 4-5 olika prompter för att få till en bild som denna, exempelvis.

data flows through the mind of an intruder, closeup, mellow



Sedan handlar det väl om att inte ha en allt för stark composition i huvudet, utan istället ett öppet sinne. Jag tycker folk som säger att det här "ersätter" någonting annat är lite båg, för det här är ett verktyg som passar vissa typer av arbetsflöden.

När AI blir bättre i framtiden kommer de antagligen också anpassa sig mer till användarens egen stil.
 
Last edited:

Genesis

Pa' ti 泣き, chicken teriyaki
Joined
17 Aug 2000
Messages
11,860
Location
Göteborg
Ja, jag menade mer att du ser att prompten blir rätt. Tog mig 4-5 olika prompter för att få till en bild som denna, exempelvis.
Okej, men vad får du ut av att skriva in ett visst seed i så fall?


Sedan handlar det väl om att inte ha en allt för stark composition i huvudet, utan istället ett öppet sinne. Jag tycker folk som säger att det här "ersätter" någonting annat är lite båg, för det här är ett verktyg som passar vissa typer av arbetsflöden. När AI blir bättre i framtiden kommer de att anpassa sig mer till användarens egen stil.
Ja, helt klart. Just nu kämpar jag mest för att få något som går att känna igen överhuvudtaget. Skriver jag ”fire-breathing dragon” så får jag en halv brinnande fladdermusvinge med tänder som sitter fast i ett moln, typ.

Det jag saknar mest är att kunna jobba vidare med en bild på annat sätt än bara ”variationer av detta”. Typ att kunna säga ”Som den här, fast gör om vänsterhanden”. Tror att det blir nästa genombrott, att kunna hålla en konversation med botten.
 

Rickard

Superhero
Joined
15 Oct 2000
Messages
15,372
Okej, men vad får du ut av att skriva in ett visst seed i så fall?
Att prompten blir rätt och inte en halvt brinnande fladdermusvinge med tänder som sitter fast i ett moln. :)

Det jag saknar mest är att kunna jobba vidare med en bild på annat sätt än bara ”variationer av detta”. Typ att kunna säga ”Som den här, fast gör om vänsterhanden”. Tror att det blir nästa genombrott, att kunna hålla en konversation med botten.
Ja, det hade varit intressant att testa DALL-E också, för där kan man göra sådana saker. Man målar över och sedan skriver en prompt om vad den ska fylla i området med.
 
Last edited:

clarence redd

FrostByte Books
Joined
23 May 2014
Messages
990
Location
Göteborg
Ja, det hade varit intressant att testa DALL-E också, för där kan man göra sådana saker. Man målar över och sedan skriver en prompt om vad den ska fylla i området med.
Inpainting funkar bra, men bara ibland. Det blir mycket trial and error även där, trots den begränsade ytan. Och jag håller med @Genesis om att det känns helt omöjligt att få fram vettiga bilder i perioder. Särskilt i MJ. Man får liksom banka in vissa saker med extra emfas. Det är därför man ser kombinationer som ”photorealistic, octane render, HD, super detailed, 4k, postprocessing” - AI:n är galet trög på att fatta ibland. Med Dall E kan man vara mer sparsmakad.

Har du testat att lägga in namnet på någon känd illustratör som gör drakar? Jag känner mig inte så bekväm med att snylta stilar på det sättet, men ibland verkar det vara svårt att undvika.
 

Rickard

Superhero
Joined
15 Oct 2000
Messages
15,372
Man får liksom banka in vissa saker med extra emfas.
Använder ni tyngd-kommandot? Jag har börjat med det för att kunna finjustera saker - gärna tillsammans med seed så att jag ser att det faktiskt blir ändringar på samma bild.

woman with high cheekbones long::2 pointy::4 ears

Jag har märkt att skillnaden mellan "realistic" och "hyperrealistic" är att den senare gör rakare saker. :D Fast det blev också tråkigare bilder, eftersom ojämnheten gjorde bilderna mer intressanta.

Jag var nöjd med bilderna jag fick till Mutant men då var jag mer nyfiken på vad den skulle generera på theme park of settlement in a postapocalyptic world, wood, bricks, black and white watercolor, realistic - just "theme park" gör rätt go´a bilder.

Jag har också tagit fram (cool inspiration till) logotyper, bårder till böcker och även utkast till hemsidor. Vissa kan jag till och med ta rakt av.
 
Last edited:

Genesis

Pa' ti 泣き, chicken teriyaki
Joined
17 Aug 2000
Messages
11,860
Location
Göteborg
Efter en massa joxande med prompter och genererande av varianter får jag rätt schyssta bilder på min himalayiska stad, som jag ville generera för Se och göra i Aliatra:

nepalese city street::photography::photo::photograph::DSLR::nepal::india::tibet::city::buildings --no people, painting --q 2 --ar 6:9

EDIT: Ja, ni fattar ju vad som hände där … Orkar inte fixa det.

1660763165582.png

Problemet är att jag inte för mitt liv kan få MJ att generera annat än målningar. Allting ser ut som en tavla, oavsett hur mycket vikt och taggar man lägger om att det ska se ut som ett fotografi. Hade ovanstående bild sett ut som ett foto så hade det varit perfa. Så jag har satt upp mig på väntelistan för DALL-E 2, som dels verkar vara mycket bättre än MJ på att förstå prompter, och dels kan generera saker som inte ser ut som tradrollspelsillustrationer. :gremtongue:

Har avslutat prenumerationen på MJ, men har lite tid och grafikkortskraft kvar att spendera, så jag kanske leker lite mer och ser vad jag kan få ut. Kanske taggar som "render" och "photorealistic" funkar bättre än "photograph"?
 

Rickard

Superhero
Joined
15 Oct 2000
Messages
15,372
Problemet är att jag inte för mitt liv kan få MJ att generera annat än målningar.
Du kan kolla på andras prompter på https://www.midjourney.com/app/feed/all/ när du loggat in för att se hur de får fotokvalitet.

Markera bilden du gillade med ett ✉ så får du ungefär samma bild genom att använda dess seed.

Jag testade följande med respektive resultat.

nepalese city street, Arnold render, exquisite details, 8k, photorealistic --seed 12686

nepalese city street, highly detailed, hyperreal, octane render --seed 12686

nepalese city street, cinematic lighting, hyper realistic, photographic --seed 12686
 

Attachments

Last edited:

Genesis

Pa' ti 泣き, chicken teriyaki
Joined
17 Aug 2000
Messages
11,860
Location
Göteborg
Du kan kolla på andras prompter på https://www.midjourney.com/app/feed/all/ när du loggat in för att se hur de får fotokvalitet.

Markera bilden du gillade med ett ✉ så får du ungefär samma bild genom att använda dess seed.

Jag testade följande med respektive resultat.

nepalese city street, Arnold render, exquisite details, 8k, photorealistic --seed 12686

nepalese city street, highly detailed, hyperreal, octane render --seed 12686

nepalese city street, cinematic lighting, hyper realistic, photographic --seed 12686
Ja, den första där ser ju lite vagt ut som ett foto om man kisar lite. De andra är ju ganska tydligt målningar och inte fotografier. Och på community feeden kan jag inte hitta några bilder som ser ut som foton. Det bästa jag hittar är detta:

1660800789713.png

… Men det har prompten "perfume vanilla in a crystal bottle with a beautiful woman hand on it when outside is snowing". Så om jag inte ska lägga till "with a beautiful woman hand on it when outside is snowing" så hjälper det inte. :gremgrin:

Men ja, kanske lite ord som inte indikerar fotografier (eftersom MidJourney inte verkar ha tränats med fotografier utan med typ DeviantArt-bilder?) utan renderingar, så kanske man kan få till något. Kan ju som sagt leka lite till innan mitt konto tar slut. Tack för tipsen!
 

Måns

Hipsteranka
Joined
12 Nov 2001
Messages
14,129
Location
Athos
Jag undrar om det kommer att bli lite som med lens flares. Det ser asfräckt ut, men efter ett tag börjar man känna igen stilen och tecknen, och så kommer man att tycka att det ser lite ostigt ut. "Uppenbarligen AI-genererad".
Jag befinner mig där. Alla mina feeds översvämmas av AI-genererade bilder (och AI-designad inredning etc) och jag har redan tröttnat. Jag följer såklart trenden med nyfikenhet men det krävs betydligt mer förfining. Vi kommer säkert dit, men vi är inte där än.
 

Herr Grönstedt

Swordsman
Joined
29 Dec 2000
Messages
414
Location
Linköping
Alla mina feeds översvämmas av AI-genererade bilder (och AI-designad inredning etc) och jag har redan tröttnat.
Som jag tror jag sagt tidigare i tråden: jag tror att det kan användas som en en källa bland andra flera att skapa inspiration, mönster, färgskalor, och kompositioner, o.dyl.

Jag tror att jag ska pitcha det som en exjobb till våra studenter i grafisk design och kommunikation till våren.
 

Rickard

Superhero
Joined
15 Oct 2000
Messages
15,372
Jag har genererat runt 500 bilder (många i 2x2-format) och jag börjar nu känna igen byggnader men framförallt ansikten. Antagligen krävs olika typer av beskrivningsord men jag är lite trött på det. Ska generera lite bilder till ett spel och sedan se vart jag tar det.
 
Top