De 5 beste AI-bildegeneratorene med åpen kildekode

De 5 beste AI-bildegeneratorene med åpen kildekode

Hurtigkoblinger

AI-baserte tekst-til-bilde-genereringsmodeller er overalt og blir lettere tilgjengelige daglig. Selv om det er enkelt bare å besøke et nettsted og generere bildet du leter etter, er åpen kildekode tekst-til-bilde-generatorer det beste alternativet hvis du vil ha mer kontroll over generasjonsprosessen.





MAKEUSE AV DAGENS VIDEO RULL FOR Å FORTSETTE MED INNHOLD

Det er dusinvis av gratis og åpen kildekode AI tekst-til-bilde-generatorer tilgjengelig på internett som spesialiserer seg på spesifikke typer bilder. Så vi har siktet gjennom haugen og funnet de beste åpen kildekode AI tekst-til-bilde-generatorene du kan prøve akkurat nå.





1 Fargestift

  craiyon-hjemmeside

Craiyon er en av de lettest tilgjengelige AI-bildegeneratorene med åpen kildekode. Den er basert på DALL-E Mini, og mens du kan klone Github-depot og installere modellen lokalt på datamaskinen din, ser det ut til at Craiyon har droppet denne tilnærmingen til fordel for nettstedet sitt.





hvordan finne wifi -passord for android

Det offisielle Github-depotet har ikke blitt oppdatert siden juni 2022, men den nyeste modellen er fortsatt tilgjengelig gratis på offisielle Craiyon-side . Det finnes heller ingen Android- eller iOS-apper.

Når det gjelder funksjonalitet, vil du se alle de vanlige alternativene du forventer fra en AI-bildegenerator. Når du skriver inn spørsmålet og får et bilde, kan du bruke oppskaleringsfunksjonen for å få en kopi med høyere oppløsning. Det er tre stiler å velge mellom: kunst, foto og tegning. Du kan også velge alternativet 'Ingen' hvis du vil at modellen skal bestemme.



  craiyon-generert-bilde

I tillegg lar 'Ekspertmodus' deg inkludere negative ord, som forteller modellen å unngå spesifikke elementer. Det er også en prompt-prediksjonsfunksjon, som bruker ChatGPT for å hjelpe brukere med å skrive de beste og mest detaljerte ledetekstene. Til slutt kan de AI-drevne fjerningsbakgrunnsfunksjonene hjelpe deg med å spare tid og krefter på å beskjære bakgrunner fra bilder.

Og det er omtrent alt Craiyon gjør. Det er ikke den mest sofistikerte AI-bildegenereringsmodellen, men den gjør seg godt som en grunnleggende modell hvis du ikke vil ha noe detaljert eller realistisk.





Modellen er gratis å bruke, men gratisbrukere er begrenset til ni gratis bilder om gangen innen et minutt. Du kan abonnere på deres Supporter- eller Professional-nivåer (priset til henholdsvis og i måneden, og faktureres årlig) for å få ingen annonser eller vannmerker, raskere generering og muligheten til å holde de genererte bildene dine private. Et tilpasset abonnementsnivå tillater også tilpassede modeller, integrasjon, dedikert støtte og private servere.

2 Stabil diffusjon 1.5

Stabil diffusjon er kanskje en av de mest populære modellene for generering av tekst-til-bilde med åpen kildekode. Den driver også andre modeller, inkludert de tre bildegeneratorene nevnt nedenfor. Den ble utgitt i 2022 og har hatt mange implementeringer siden.





  stabil-diffusjon-web-ui

Jeg skal spare deg for de altfor tekniske detaljene om hvordan modellen fungerer (som du kan sjekke ut deres offisielle Github-depot ), men modellen er enkel å installere selv for helt nybegynnere og fungerer bra så lenge du har en dedikert GPU med minst 4 GB minne. Du kan også få tilgang Stabil diffusjon online, og vi har deg dekket hvis du vil kjøre Stable Diffusion på en Mac .

Det er flere sjekkpunkter (betrakt dem som versjoner) tilgjengelig for bruk for stabil diffusjon. Mens vi testet ut versjon 1.5, versjon 2.1 er også i aktiv utvikling og er mer presis.

  dreamshaper-ai-generert-bilde
Yadullah Abidi/MakeUseOf/DreamShaper

Å kjøre modellen er også ganske enkelt. Vi testet det med AUTOMATIC1111 Stable Diffusion web brukergrensesnitt , og alle kontroller og parametere fungerer bra. Den er også ganske NSFW-sikker takket være LAION-5B-databasen som modellen trente på (selv om den ikke er perfekt, vel å merke). Selv om generasjonstiden i seg selv vil variere basert på maskinvaren din, kan du forvente at bildene dine er detaljerte og realistiske selv med grunnleggende spørsmål.

3 DreamShaper

DreamShaper er en bildegenereringsmodell basert på Stable Diffusion. Det var ment som et åpen kildekode-alternativ til MidJourney og fokuserer på fotorealisme i de genererte bildene, selv om det kan håndtere anime- og malestiler like godt med noen få justeringer.

Modellen er mer kapabel enn Stable Diffusion, og gir brukerne mer frihet over den endelige utgangen, alt fra lynforbedringer til løsere NSFW-restriksjoner. Å kjøre modellen er også enkelt, med en nedlastbar, forhåndsopplært versjon tilgjengelig online for lokal tilgang og en rekke nettsteder, inkludert Sinkin.ai , RandomSeed , og Mage.space (krever et grunnleggende abonnement) som lar deg kjøre modellen med GPU-akselerasjon.

  dreamshaper-stablediffusjon-sammenligning

Som du sikkert kan gjette nå, har bilder generert av DreamShaper en tendens til å se mer realistiske ut sammenlignet med Stable Diffusion. Selv om du kjører samme prompt på begge modellene, vil DreamShaper-modellen sannsynligvis være mer realistisk, detaljert og bedre opplyst.

Dette gjelder spesielt for portretter eller karakterer, noe jeg syntes manglet stabil diffusjon sammenlignet med den samme ledeteksten. Hvis bildene dine blir for realistiske, er her fire måter å identifisere et AI-generert bilde på .

Du trenger ikke en gigantisk PC for å kjøre modellen heller. Min GTX 1650Ti med 4 GB VRAM kjørte modellen perfekt. Generasjonstiden var litt lengre, men det så ikke ut til å påvirke den faktiske produksjonen. Når det er sagt, kan det hende du trenger GPUer med mer VRAM for å kjøre DreamShaper XL, som er basert på Stable Diffusion XL-modellen.

4 InvokeAI

Invoke AI er en annen AI-basert bildegenereringsmodell basert på Stable Diffusion, med en XL-versjon basert på Stable Diffusion XL. Den har også sitt eget web- og kommandolinjebrukergrensesnitt, noe som betyr at du ikke trenger å hoppe over ting som Stable Diffusion web UI.

  invokeai-brukergrensesnitt-med-bilde

Modellen fokuserer på å la brukere lage visuelle bilder basert på deres immaterielle rettigheter med tilpassede arbeidsflyter. InvokeAI er en av de beste AI-bildegenereringsmodellene med åpen kildekode for opplæring av tilpassede modeller og arbeid med åndsverk.

Det er offisielle Github-depot viser to installasjonsmetoder: installasjon via InvokeAIs installasjonsprogram eller bruk av PyPI hvis du er komfortabel med en terminal og Python og trenger mer kontroll over pakkene som er installert med modellen.

Den ekstra kontrollen gir imidlertid noen få begrensninger, spesielt strengere maskinvarekrav. InvokeAI anbefaler en dedikert GPU med minst 4 GB minne, med seks til åtte GB anbefalt for å kjøre XL-varianten. VRAM-kravene gjelder både for AMD og Nvidia GPUer. Du trenger også minst 12 GB RAM og 12 GB ledig diskplass for modellen, dens avhengigheter og Python.

  invoke-ai-generert-bilde
Yadullah Abidi/MakeUseOf/InvokeAI

Selv om dokumentasjonen ikke anbefaler Nvidias GTX 10 Series og 16 Series GPUer for deres mangel på videominne, fungerte det medfølgende installasjonsprogrammet helt fint. Selv om kjørelengden din kan variere, hvis du bruker en lavere GPU, kan du forvente å vente lenger for å se at spørsmålene dine blir omgjort til bilder. Til slutt, hvis du er på Windows, kan du bare bruke en Nvidia GPU, siden det ikke er støtte for AMD GPUer for øyeblikket.

For bildegenereringsdelen har modellen en tendens til å lene seg mer mot kunstneriske stiler enn fotorealisme. Selvfølgelig kan du trene modellen på datasettet ditt og få det til å generere bilder nærmere det du ønsker, selv om det involverer fotorealistiske bilder, spesielt hvis du jobber med produktdesign, arkitektur eller butikklokaler. En viktig ting å huske på er imidlertid at InvokeAI først og fremst er en bildegenereringsmotor, noe som betyr at du sannsynligvis må bruke dine egne modeller for de beste resultatene (enkelt å finne via modellbehandleren i nettgrensesnittet) som standard modellen er ganske lik Stable Diffusion selv.

5 Openjourney

Openjourney er en gratis, åpen kildekode AI-bildegenereringsmodell basert nok en gang på Stable Diffusion. Hvis du lurer på hvorfor modellen heter Openjourney, er det fordi den ble trent på Midjourney-bilder og kan etterligne stilen i bildene den genererer.

SpørgHero , selskapet bak Openjourney, lar deg teste modellen sammen med andre modeller, inkludert Stable Diffusion (versjon 1.5 og 2), DreamShaper og Realistic Vision. Når du registrerer deg, får du 25 gratis kreditter (en kreditt for hvert bilde som genereres), deretter må du abonnere på deres Pro-abonnement, som koster i måneden og gir deg tilgang til 300 kreditter hver måned med andre eksklusive funksjoner.

  åpen reise-stabil diffusjon-sammenligning

Men hvis du vil kjøre det lokalt og gratis, kan du last ned modellfilen fra HuggingFace og kjør den ved å bruke Stable Diffusion web UI. Openjourney er også den nest mest nedlastede AI-bildegenereringsmodellen på HuggingFace, rett bak Stable Diffusion.

Openjourney viser ingen spesifikke maskinvarekrav for å kjøre modellen lokalt på nettsiden sin, men du kan forvente lignende maskinvarekrav som Stable Diffusion. Dette betyr en dedikert GPU med 4 GB VRAM, 16 GB RAM og rundt 12 til 15 GB ledig plass på datamaskinen din for å lagre modellen og dens avhengigheter.

  openjourney-ai-generert-bilde
Yadullah Abidi/MakeUseOf/OpenJourney

Bilder generert av Openjourney har en tendens til å være balansert mellom fotorealisme og kunst med mindre annet er spesifisert. Hvis du leter etter en allsidig modell og foretrekker Midjourney-utseendet uten å betale for abonnementet, er Openjourney et av de beste alternativene.