Diskussion om AI-genererade bilder

Genesis · 11 Aug 2022

Någon som vet vad q-faktorn gör, mer exakt? Vad är det som blir bättre? Jag har bara basic-planen just nu och vill inte slösa på GPU-tid, men jag får väldigt mycket skräp. Typ människor med två näsor, sneda hus som flyger i luften, armar som förvandlas till knivar, och så vidare. Är det q 2 samt låg s som gäller? Eller är det bara att man behöver generera en herrans massa alternativ för att hitta något användbart? Typ landskap är det som har funkat för mig hittills. Allt annat blir typ skräp.

Oscar Silferstjerna · 11 Aug 2022

Har någon använt sig av (flera olika) bilder som referensmaterial istället för skrivna prompts? Det verkar ge helt andra och snyggare resultat, åtminstone på Midjourney.

Rickard · 11 Aug 2022

Genesis said:
Typ människor med två näsor,

Jag slänger alltid in "beautiful" när jag genererar människor. Har även sett andra skriva "symmetrical face".

Rickard · 11 Aug 2022

Genesis said:
Jag har bara basic-planen just nu och vill inte slösa på GPU-tid, men jag får väldigt mycket skräp.

En annan sak jag brukar göra är att skriva --seed 1000 --q 0.3 för att snabbt generera bilder. Blir de bra så använder jag samma seed fast med en högre quality. Behöver inte så mycket väntetid heller.

Här är dokumentationen.

User Manual - Midjourney Documentation

midjourney.gitbook.io

Oscar Silferstjerna · 11 Aug 2022

Några intressanta reflektioner i ämnet:

Welcome Our Robot Overlords: Why I Think AI Creative Apps Are About to Disrupt the Business of Content

I believe we are about to see an ability to promote the computer from tool to collaborator.

www.rollingstone.com

Genesis · 11 Aug 2022

Rickard said:
En annan sak jag brukar göra är att skriva --seed 1000 --q 0.3 för att snabbt generera bilder. Blir de bra så använder jag samma seed fast med en högre quality. Behöver inte så mycket väntetid heller.

Hm, detta verkar inte funka. Samma seed med olika kvalitetsvärden ger dramatiskt olika bilder för mig. Däremot skulle man kunna använda ”stop” för att avbryta innan bilderna är klara.

q-värdet verkar i alla fall påverka typ detaljer och ”lokal snygghet”, men det är fortfarande svårt att göra bilder som inte är skräp.

Tror att det mycket handlar om vad för sorts bild man vill ha. Landskap, generiska fantasy- eller scifi-bilder, concept art-grejer går nog bra. Men utanför det området verkar det vara ganska kasst. Den är väl tränad på typ DeviantArt eller nå’t. :gremtongue:

Jag har använt mycket ”retro poster”, ”albert solon”, ”alphonse mucha” och ”photography”. MidJourney klarar av att fixa dessa stilar väldigt väl, men resultatet verkar typ alltid bli nonsensbilder. Gissar att om man använder mer populära concept-art-stilar så har algoritmen mer data och kan då göra typ människor som ser ut som människor.

Men utvecklingen går ju fort, och DALL-E 2verkar ju kunna göra riktigt imponerande grejer. Om ett år eller två kanske detta blir mer användbart.

Eller så är det bara jag som är kass på att skriva prompter. :gremeek:

Rickard · 11 Aug 2022

Genesis said:
Samma seed med olika kvalitetsvärden ger dramatiskt olika bilder för mig.

Ja, jag menade mer att du ser att prompten blir rätt. Tog mig 4-5 olika prompter för att få till en bild som denna, exempelvis.

data flows through the mind of an intruder, closeup, mellow

Rickard_data_flows_through_the_mind_of_an_intruder_closeup_mell_39f5463c-9387-46e2-afa7-6c105e387a87.png

Sedan handlar det väl om att inte ha en allt för stark composition i huvudet, utan istället ett öppet sinne. Jag tycker folk som säger att det här "ersätter" någonting annat är lite båg, för det här är ett verktyg som passar vissa typer av arbetsflöden.

När AI blir bättre i framtiden kommer de antagligen också anpassa sig mer till användarens egen stil.

Genesis · 11 Aug 2022

Rickard said:
Ja, jag menade mer att du ser att prompten blir rätt. Tog mig 4-5 olika prompter för att få till en bild som denna, exempelvis.

Okej, men vad får du ut av att skriva in ett visst seed i så fall?

Rickard said:
Sedan handlar det väl om att inte ha en allt för stark composition i huvudet, utan istället ett öppet sinne. Jag tycker folk som säger att det här "ersätter" någonting annat är lite båg, för det här är ett verktyg som passar vissa typer av arbetsflöden. När AI blir bättre i framtiden kommer de att anpassa sig mer till användarens egen stil.

Ja, helt klart. Just nu kämpar jag mest för att få något som går att känna igen överhuvudtaget. Skriver jag ”fire-breathing dragon” så får jag en halv brinnande fladdermusvinge med tänder som sitter fast i ett moln, typ.

Det jag saknar mest är att kunna jobba vidare med en bild på annat sätt än bara ”variationer av detta”. Typ att kunna säga ”Som den här, fast gör om vänsterhanden”. Tror att det blir nästa genombrott, att kunna hålla en konversation med botten.

Rickard · 11 Aug 2022

Genesis said:
Okej, men vad får du ut av att skriva in ett visst seed i så fall?

Att prompten blir rätt och inte en halvt brinnande fladdermusvinge med tänder som sitter fast i ett moln.

Genesis said:
Det jag saknar mest är att kunna jobba vidare med en bild på annat sätt än bara ”variationer av detta”. Typ att kunna säga ”Som den här, fast gör om vänsterhanden”. Tror att det blir nästa genombrott, att kunna hålla en konversation med botten.

Ja, det hade varit intressant att testa DALL-E också, för där kan man göra sådana saker. Man målar över och sedan skriver en prompt om vad den ska fylla i området med.

clarence redd · 11 Aug 2022

Rickard said:
Ja, det hade varit intressant att testa DALL-E också, för där kan man göra sådana saker. Man målar över och sedan skriver en prompt om vad den ska fylla i området med.

Inpainting funkar bra, men bara ibland. Det blir mycket trial and error även där, trots den begränsade ytan. Och jag håller med @Genesis om att det känns helt omöjligt att få fram vettiga bilder i perioder. Särskilt i MJ. Man får liksom banka in vissa saker med extra emfas. Det är därför man ser kombinationer som ”photorealistic, octane render, HD, super detailed, 4k, postprocessing” - AI:n är galet trög på att fatta ibland. Med Dall E kan man vara mer sparsmakad.

Har du testat att lägga in namnet på någon känd illustratör som gör drakar? Jag känner mig inte så bekväm med att snylta stilar på det sättet, men ibland verkar det vara svårt att undvika.

Ram · 11 Aug 2022

Gör den sig kanske bäst för att generera inspirationsbilder? Jag tycker också att det är ganska svårt att få AIn att generera det som jag vill ha, men samtidigt så går jag ganska ofta igång på det som den faktiskt spottar ur sig.

Rickard · 11 Aug 2022

clarence redd said:
Man får liksom banka in vissa saker med extra emfas.

Använder ni tyngd-kommandot? Jag har börjat med det för att kunna finjustera saker - gärna tillsammans med seed så att jag ser att det faktiskt blir ändringar på samma bild.

woman with high cheekbones long::2 pointy::4 ears

Jag har märkt att skillnaden mellan "realistic" och "hyperrealistic" är att den senare gör rakare saker.

Fast det blev också tråkigare bilder, eftersom ojämnheten gjorde bilderna mer intressanta.

Jag var nöjd med bilderna jag fick till Mutant men då var jag mer nyfiken på vad den skulle generera på theme park of settlement in a postapocalyptic world, wood, bricks, black and white watercolor, realistic - just "theme park" gör rätt go´a bilder.

Jag har också tagit fram (cool inspiration till) logotyper, bårder till böcker och även utkast till hemsidor. Vissa kan jag till och med ta rakt av.

Rickard · 11 Aug 2022

Här är förresten mitt galleri. Man måste vara inloggad på betalkonto för att kunna se det

https://www.midjourney.com/app/users/300176658592301058/

Genesis · 11 Aug 2022

Rickard said:
woman with high cheekbones long::2 pointy::4 ears

Ger inte det där:
”Woman with high cheekbones long” med vikt 2
”Pointy” med vikt 4
”Ears” med vikt 1
?

”::” är ju hård avgränsning (hårdare än kommatecken).

Genesis · 17 Aug 2022

Efter en massa joxande med prompter och genererande av varianter får jag rätt schyssta bilder på min himalayiska stad, som jag ville generera för Se och göra i Aliatra:

nepalese city street:hotography:hoto:hotograph:SLR::nepal::india::tibet::city::buildings --no people, painting --q 2 --ar 6:9

EDIT: Ja, ni fattar ju vad som hände där … Orkar inte fixa det.

Problemet är att jag inte för mitt liv kan få MJ att generera annat än målningar. Allting ser ut som en tavla, oavsett hur mycket vikt och taggar man lägger om att det ska se ut som ett fotografi. Hade ovanstående bild sett ut som ett foto så hade det varit perfa. Så jag har satt upp mig på väntelistan för DALL-E 2, som dels verkar vara mycket bättre än MJ på att förstå prompter, och dels kan generera saker som inte ser ut som tradrollspelsillustrationer. :gremtongue:

Har avslutat prenumerationen på MJ, men har lite tid och grafikkortskraft kvar att spendera, så jag kanske leker lite mer och ser vad jag kan få ut. Kanske taggar som "render" och "photorealistic" funkar bättre än "photograph"?

Rickard · 17 Aug 2022

Genesis said:
Problemet är att jag inte för mitt liv kan få MJ att generera annat än målningar.

Du kan kolla på andras prompter på https://www.midjourney.com/app/feed/all/ när du loggat in för att se hur de får fotokvalitet.

Markera bilden du gillade med ett ✉ så får du ungefär samma bild genom att använda dess seed.

Jag testade följande med respektive resultat.

nepalese city street, Arnold render, exquisite details, 8k, photorealistic --seed 12686

nepalese city street, highly detailed, hyperreal, octane render --seed 12686

nepalese city street, cinematic lighting, hyper realistic, photographic --seed 12686

Genesis · 18 Aug 2022

Rickard said:
Du kan kolla på andras prompter på https://www.midjourney.com/app/feed/all/ när du loggat in för att se hur de får fotokvalitet.

Markera bilden du gillade med ett ✉ så får du ungefär samma bild genom att använda dess seed.

Jag testade följande med respektive resultat.

nepalese city street, Arnold render, exquisite details, 8k, photorealistic --seed 12686

nepalese city street, highly detailed, hyperreal, octane render --seed 12686

nepalese city street, cinematic lighting, hyper realistic, photographic --seed 12686

Ja, den första där ser ju lite vagt ut som ett foto om man kisar lite. De andra är ju ganska tydligt målningar och inte fotografier. Och på community feeden kan jag inte hitta några bilder som ser ut som foton. Det bästa jag hittar är detta:

… Men det har prompten "perfume vanilla in a crystal bottle with a beautiful woman hand on it when outside is snowing". Så om jag inte ska lägga till "with a beautiful woman hand on it when outside is snowing" så hjälper det inte. :gremgrin:

Men ja, kanske lite ord som inte indikerar fotografier (eftersom MidJourney inte verkar ha tränats med fotografier utan med typ DeviantArt-bilder?) utan renderingar, så kanske man kan få till något. Kan ju som sagt leka lite till innan mitt konto tar slut. Tack för tipsen!

Mogger · 18 Aug 2022

Genesis said:
Jag undrar om det kommer att bli lite som med lens flares. Det ser asfräckt ut, men efter ett tag börjar man känna igen stilen och tecknen, och så kommer man att tycka att det ser lite ostigt ut. "Uppenbarligen AI-genererad".

Jag befinner mig där. Alla mina feeds översvämmas av AI-genererade bilder (och AI-designad inredning etc) och jag har redan tröttnat. Jag följer såklart trenden med nyfikenhet men det krävs betydligt mer förfining. Vi kommer säkert dit, men vi är inte där än.

Herr Grönstedt · 18 Aug 2022

Måns said:
Alla mina feeds översvämmas av AI-genererade bilder (och AI-designad inredning etc) och jag har redan tröttnat.

Som jag tror jag sagt tidigare i tråden: jag tror att det kan användas som en en källa bland andra flera att skapa inspiration, mönster, färgskalor, och kompositioner, o.dyl.

Jag tror att jag ska pitcha det som en exjobb till våra studenter i grafisk design och kommunikation till våren.

Rickard · 18 Aug 2022

Jag har genererat runt 500 bilder (många i 2x2-format) och jag börjar nu känna igen byggnader men framförallt ansikten. Antagligen krävs olika typer av beskrivningsord men jag är lite trött på det. Ska generera lite bilder till ett spel och sedan se vart jag tar det.

Diskussion om AI-genererade bilder

Ni dés ni maître

Semla Lagerlöf

Urverk speldesign

Urverk speldesign

Semla Lagerlöf

Ni dés ni maître

Urverk speldesign

Ni dés ni maître

Urverk speldesign

FrostByte Books

Skev

Urverk speldesign

Urverk speldesign

Ni dés ni maître

Ni dés ni maître

Urverk speldesign

Attachments

Ni dés ni maître

Hipsteranka

Swordsman

Urverk speldesign