När du trollar fram AI-bilder via olika webbverktyg är det för närvarande oftast någon av de mer välkända generatorerna DALL·E 3 (som genererat försättsbilden), Midjourney eller Stable Diffusion som står för det tekniska. Vissa är kostnadsfria att använda i begränsad utsträckning, medan andra är kostar en slant baserat på kvantitet och/eller kvalitet.
Ett tredje alternativ är att köra en AI-bildgenerator lokalt, det vill säga på egen dator, vilket eliminerar sådana begränsningar. Fram till nyligen har det varit ungefär så krångligt som det låter, men så är inte fallet längre. Easy Diffusion bygger som namnet antyder på just Stable Diffusion och har ett enkelt gränssnitt men också många alternativ att experimentera med.
Systemkrav för Stable Diffusion
Även om det är fullt möjligt att generera AI-bilder med enbart datorns processor (CPU) är det väldigt långsamt – även med de jämförelsevis enkla och effektiva grundinställningarna. Om du dessutom vill använda mer avancerade alternativ är det i nära nog oanvändbart utan en grafikkrets (GPU) som tar hand om de tunga beräkningarna.
Ett nyare grafikkort är därför att rekommendera, helst från Nvidia, men det finns även stöd för de integrerade grafikkretsarna i Apples M1/M2-processorer. Via Linux har jag även fått Easy Diffusion att fungera utmärkt med AMD-grafikkort.
Du behöver också minst 8 GB RAM, men betydligt mer är att föredra åtminstone om du använder M1-Mac där internminne och grafikminne är ett och samma.
Installera Easy Diffusion
För Windowsanvändare är installationen inte svårare än att köra installationsfilen från GitHub-sidan.
Installation i MacOS (och Linux)
Installationen i MacOS och Linux fungerar på i princip samma sätt. Tyvärr är det lite krångligare eftersom dessa Unixbaserade operativsystem är lite mindre överseende än Windows med vad du installerar och hur.
1. Packa upp zipfilen du laddade ner från GitHub. Ett tips är att sedan flytta mappen till någon mer praktisk plats än Nedladdat-mappen. Detta eftersom allt som laddas ner i nästa steg hamnar i easy-diffusion-mappen.
2. Öppna mappen i ett Terminal-fönster. Det gör du snabbast genom att högerklicka på sökvägen i Finder och välja att öppna i Terminal.
3. I terminalfönstret startar du scriptet med ./start.sh, vilket påbörjar nedladdning av allt som behövs för att köra Stable Diffusion.
4. När nedladdningen är klar öppnas Easy Diffusion i ett webbläsarfönster.
Det är egentligen det hela, och för att starta igen kör du scriptet igen som ovan (du behöver inte ladda ner allt igen).
Inställningar och alternativ
Standardinställningarna i Easy Diffusion resulterar inte nödvändigtvis i några häpnadsväckande verk i kombination med en enkel prompt. Men gränssnittet har också närmast oändliga inställningsmöjligheter som är fullt i klass med kommersiella webbbaserade verktyg.
Som standard genereras bilder genom att du berättar för Stable Diffusion vad det ska generera (text-till-bild), men du kan också använda bild-till-bild-generering och det finns ett stort antal förinställda image modifiers som inkluderas i prompten.
Bland de mer avancerade inställningarna kan du också byta ut den tensor (matematisk modell) som används för att generera bilder, vilket kan ha stor effekt på både tidsåtgång och resultat. Safetensor-filer placeras i mappen easy-diffusion/models/stable-diffusion och kan sedan väljas i gränssnittet.
Valet av sampler ger också varierande resultat, men för tidsåtgången är antalet inference steps avgörande. Stable Diffusion påbörjar bildgenereringen med brus och skapar sedan bilden i en stegvis process. Tiden från start till mål ökar linjärt med antalet steg.
Kvaliteten på resultatet ökar däremot inte linjärt med antalet steg. Exemplet ovan visar skillnaden mellan 25, 50 och 75 steg. Att lägga till fler steg kan med andra ord vara ett sätt att finputsa bilder du i grunden är nöjd med, men skillnaden i det övre spannet, t.ex. mellan 50 och 100 steg, är sällan dramatisk.
I vilket fall som helst kan det vara riktigt underhållande att prova sig fram och experimentera, med metoder du sällan har tillgång till i webbaserade alternativ. Gränssnittet i Easy Diffusion är dessutom pedagogiskt överlag och förklarar ungefär vad du kan förvänta dig av de olika alternativen.