in ,

Midjourney: Viskas, ką reikia žinoti apie AI menininką

Vidurinė kelionė: kas tai? Naudojimas, apribojimai ir alternatyvos

Midjourney: Viskas, ką reikia žinoti apie AI menininką
Midjourney: Viskas, ką reikia žinoti apie AI menininką

Midjourney yra AI vaizdų generatorius, kuriantis vaizdus iš teksto aprašymų. Tai tyrimų laboratorija, kuriai vadovauja Davidas Holzas, vienas iš „Leap Motion“ įkūrėjų. „Midjourney“ siūlo svajingesnį menišką stilių, atitinkantį jūsų poreikius, ir atrodo gotiškesnė, palyginti su kitais AI generatoriais. Šiuo metu įrankis yra atviroje beta versijoje ir gali būti pasiekiamas tik naudojant „Discord“ robotą oficialioje „Discord“.

Norėdami generuoti vaizdus, ​​vartotojai naudoja komandą / imagine ir įveda eilutę, o robotas pateikia keturių vaizdų rinkinį. Tada vartotojai gali pasirinkti, kurių vaizdų mastelį jie nori keisti. „Midjourney“ taip pat dirba su žiniatinklio sąsaja.

Įkūrėjas Davidas Holzas menininkus laiko „Midjourney“ klientais, o ne konkurentais. Menininkai naudoja „Midjourney“, norėdami greitai sukurti koncepcinio meno prototipą, kurį pristato savo klientams prieš pradėdami dirbti patys. Kadangi visose „Midjourney“ grupėse gali būti autorių teisių saugomų menininkų kūrinių, kai kurie menininkai apkaltino „Midjourney“ nuvertinus originalų kūrybinį darbą.

Į „Midjourney“ paslaugų teikimo sąlygas įtraukta DMCA panaikinimo politika, leidžianti atlikėjams prašyti, kad jų darbai būtų pašalinti iš rinkinio, jei jie mano, kad autorių teisių pažeidimas yra akivaizdus. Reklamos pramonė taip pat panaudojo AI įrankius, tokius kaip „Midjourney“, „DALL-E“ ir „Stable Diffusion“, kurie leidžia reklamuotojams kurti originalų turinį ir greitai sugalvoti idėjas.

„Midjourney“ naudojo įvairūs žmonės ir įmonės, kurdami vaizdus ir meno kūrinius, įskaitant „The Economist“ ir „Corriere della Sera“. Tačiau „Midjourney“ sulaukė kritikos iš kai kurių menininkų, kurie mano, kad tai atima darbus iš menininkų ir pažeidžia jų autorių teises. „Midjourney“ taip pat buvo menininkų komandos ieškinio dėl autorių teisių pažeidimo objektas.

Norėdami pradėti naudoti „Midjourney“, vartotojai turi prisijungti prie „Discord“ ir apsilankyti „Midjourney“ svetainėje, kad prisijungtų prie beta versijos. Priėmę naudotojai gaus pakvietimą į „Discord Midjourney“ ir galės pradėti kurti vaizdus, ​​įvesdami /imagine ir norimą raginimą.

Midjourney neatskleidė daug informacijos apie savo kilmę ir mokymą, tačiau spėjama, kad jis naudoja sistemą, panašią į Dall-E 2 ir Stable Diffusion, braukdamas paveikslėlius ir tekstą iš interneto, kad galėtų juos apibūdinti, treniruotėms panaudodamas milijonus paskelbtų vaizdų. .

Procesas, kurį „Midjourney“ naudoja vaizdams iš tekstinių raginimų generuoti

„Midjourney“ naudoja teksto į vaizdą AI modelį, kad generuotų vaizdus iš teksto raginimų. „Midjourney“ robotas raginimo žodžius ir frazes suskaido į mažesnes dalis, vadinamas žetonais, kuriuos galima palyginti su mokymo duomenimis ir naudoti vaizdui generuoti. Gerai suplanuotas raginimas gali padėti sukurti unikalius ir įdomius vaizdus [0].

Norėdami sukurti vaizdą su Midjourney, vartotojai turi įvesti aprašymą, kaip jie nori, kad vaizdas atrodytų, naudodami komandą „/imagine“ kanale „Midjourney Discord“. Kuo konkretesnis ir aprašomesnis pranešimas, tuo AI galės duoti gerų rezultatų. Tada „Midjourney“ per minutę pagal raginimą sukurs kelias skirtingas vaizdo versijas. Vartotojai gali pasirinkti gauti alternatyvias bet kurio iš šių vaizdų versijas arba bet kurią iš jų padidinti, kad gautų didesnį ir aukštesnės kokybės vaizdą. „Midjourney“ siūlo greitus ir atsipalaidavusius režimus, o greitasis režimas yra būtinas norint pasiekti maksimalų padidinimą ir sukurti daugiau vaizdų per trumpesnį laiką.

„Midjourney“ AI modelis naudoja difuziją, kuri apima vaizdo pridėjimą triukšmo, o tada duomenų gavimo procesą apverčia atvirkščiai. Šis procesas kartojamas be galo, todėl modelis prideda triukšmo, o tada vėl jį pašalina, o galiausiai sukuria tikroviškus vaizdus, ​​atlikdamas nedidelius vaizdo variantus. Midjourney ieškojo vaizdų ir teksto, kad juos apibūdintų, naudodamas milijonus paskelbtų treniruočių vaizdų.

„Midjourney“ AI modelis yra pagrįstas stabiliu srautiniu perdavimu, kuris yra apmokytas 2,3 milijardo vaizdų ir teksto aprašymų porų. Naudodami tinkamus žodžius raginime, vartotojai gali sukurti beveik viską, kas tik šauna į galvą. Tačiau kai kurie žodžiai yra draudžiami, o „Midjourney“ tvarko šių žodžių sąrašą, kad piktybiški žmonės nekurtų raginimų. „Midjourney's Discord“ bendruomenė gali teikti tiesioginę pagalbą ir daug pavyzdžių vartotojams.

Vaizdų naudojimas ir generavimas

Norėdami nemokamai naudotis „Midjourney AI“, turite turėti „Discord“ paskyrą. Jei jo neturite, prisiregistruokite nemokamai „Discord“. Tada apsilankykite „Midjourney“ svetainėje ir pasirinkite Join Beta. Taip pateksite į „Discord“ kvietimą. Priimkite Discord kvietimą į Midjourney ir pasirinkite Continue on Discord. 

Jūsų „Discord“ programa bus automatiškai atidaryta, o kairiajame meniu galėsite pasirinkti laivo formos „Midjourney“ piktogramą. „Midjourney“ kanaluose suraskite naujus kambarius ir pasirinkite vieną iš jų, kad pradėtumėte. Kai būsite pasiruošę, savo naujokų kambario Discord pokalbyje įveskite „/imagine“. 

Taip bus sukurtas raginimo laukas, kuriame galėsite įvesti vaizdo aprašymą. Kuo konkretesnis aprašas, tuo geriau AI galės duoti gerų rezultatų. Būkite aprašomasis ir, jei ieškote konkretaus stiliaus, įtraukite jį į savo aprašymą. „Midjourney“ kiekvienam vartotojui siūlo 25 bandymus žaisti su AI. 

Po to, norėdami tęsti, turėsite užsiregistruoti kaip visateisis narys. Jei nenorite leisti pinigų, pravartu skirti šiek tiek laiko ir pagalvoti, ką norite sukurti per Midjourney. 

Jei norite, galite įvesti „/help“, kad gautumėte patarimų, kurių reikia laikytis, sąrašą. Prieš naudojant „Midjourney AI“ būtina žinoti draudžiamų žodžių sąrašą, nes nesilaikant elgesio kodekso bus uždrausta.

>> Taip pat skaitykite - 27 geriausios nemokamos dirbtinio intelekto svetainės (dizainas, tekstų rašymas, pokalbiai ir kt.)

/įsivaizduok komandą

Komanda /imagine yra viena iš pagrindinių Midjourney komandų, leidžiančių vartotojams generuoti AI sukurtus vaizdus pagal jų poreikius. Štai kaip tai veikia:

  1. Vartotojai įveda komandą /imagine Discord pokalbyje ir prideda norimus naudoti nustatymus.
  2. Midjourney AI algoritmas analizuoja raginimą ir generuoja vaizdą pagal įvestį.
  3. Sugeneruotas vaizdas rodomas Discord pokalbyje, o vartotojai gali pateikti atsiliepimų ir patikslinti savo pranešimus naudodami Remix funkciją.
  4. Naudotojai taip pat gali naudoti papildomus nustatymus, norėdami pakoreguoti sukurto vaizdo stilių, versiją ir kitus aspektus.

Komanda /imagine priima ir vaizdo, ir teksto raginimus. Vartotojai gali pridėti raginimus kaip vaizdus, ​​pateikdami norimų generuoti vaizdų URL arba priedą. Tekstiniai raginimai gali apimti vaizdų, kuriuos naudotojai nori generuoti, aprašymus, pvz., objektus, fonus ir stilius. Vartotojai taip pat gali pridėti papildomų parametrų prie komandos, norėdami pakoreguoti norimo naudoti algoritmo versiją, įjungti Remix funkciją ir pan.

Vaizdų, kuriuos gali sukurti „Midjourney AI“, tipų pavyzdžiai

Midjourney AI gali sukurti daugybę įvairių stilių vaizdų, įskaitant, bet tuo neapsiribojant:

  • Vaikų knygų iliustracijos, pavyzdžiui, „Paršelio nuotykio“ pavyzdys.
  • Realistiški žmonių, gyvūnų ir daiktų portretai.
  • Siurrealistiniai ir abstraktūs meno kūriniai, kuriuose susimaišo skirtingi elementai ir stiliai.
  • Kraštovaizdžiai ir miesto vaizdai, galintys sukelti skirtingas nuotaikas ir emocijas.
  • Nespalvota fotografija su sudėtingomis detalėmis ir kino efektais.
  • Vaizdai, iliustruojantys futuristines ar mokslinės fantastikos temas, pvz., senos moters, pagamintos iš robotų dalių ir dėvinčios dujokaukę, pavyzdys.

Svarbu pažymėti, kad „Midjourney AI“ sugeneruotų vaizdų kokybė ir stilius gali skirtis priklausomai nuo raginimų kokybės, naudojamo algoritmo versijos ir kitų veiksnių. Norėdami gauti norimų rezultatų, vartotojai turėtų eksperimentuoti su skirtingais raginimais ir nustatymais.

Sujunkite vaizdus „Midjourney“.

Norėdami sujungti du ar daugiau vaizdų „Midjourney“, galite atlikti šiuos veiksmus:

  1. Pasirinkite vaizdus, ​​kuriuos norite sujungti, ir įkelkite juos į „Discord“.
  2. Nukopijuokite nuorodas į vaizdus ir pridėkite jas į /imagine raginimą kaip vaizdo raginimą.
  3. Jei 4 versija neįjungta pagal numatytuosius nustatymus, pridėkite „-v 4“.
  4. Pateikite komandą ir palaukite, kol vaizdas bus sugeneruotas.

Pavyzdžiui, norėdami sujungti du vaizdus, ​​galite naudoti šią komandą: /imagine – 1

Taip pat galite pridėti papildomos informacijos, įskaitant objektus, foną ir bendrą meno stilių, kad sukurtumėte visiškai naują vaizdą su savo stiliumi. Pavyzdžiui: /imagine , animacinio filmo stilius, linksma minia fone, Tesla logotipas ant krūtinės, -ne kostiumas -v 1

„Midjourney“ taip pat pristatė naują funkciją – komandą /blend, kuri leidžia sujungti iki penkių vaizdų, nereikia kopijuoti ir įklijuoti URL. Galite įjungti komandą /blend į savo eilutę įtraukę vėliavėlę –blend.

Svarbu pažymėti, kad ši funkcija veikia tik su 4 Midjourney algoritmo versija, o vaizdų derinimui nereikia papildomo teksto, tačiau pridėjus informaciją dažniausiai gaunamos geresnės nuotraukos. Geriausi rezultatai paprastai pasiekiami eksperimentuojant su meno stiliais ir koreguojant vaizdus naudojant Remix režimą.

Sujunkite daugiau nei du vaizdus

„Midjourney“ leidžia vartotojams sujungti iki penkių vaizdų naudojant /blend komandą. Tačiau, jei naudotojams reikia sujungti daugiau nei penkis vaizdus, ​​jie gali naudoti komandą /imagine ir į eilę įklijuoti viešųjų vaizdų URL. Norėdami sujungti daugiau nei du vaizdus naudodami komandą /imagine, vartotojai prie komandos gali pridėti raginimų. Pavyzdžiui, norint sujungti tris vaizdus, ​​komanda būtų /imagine – 1.

Norėdami sujungti daugiau vaizdų, vartotojai gali pridėti daugiau komandų eilučių. Svarbu pažymėti, kad į raginimą įtraukus papildomos informacijos, įskaitant objektus, foną ir bendrą meno stilių, galima sukurti visiškai naują savo stiliaus vaizdą. Geriausi rezultatai pasiekiami eksperimentuojant su meno stiliais ir koreguojant vaizdus naudojant Remix režimą

Command / blend in Midjourney

„Midjourney“ komanda /blend leidžia vartotojams sujungti iki penkių vaizdų, pridedant lengvai naudojamų vartotojo sąsajos elementų tiesiai į „Discord“ sąsają. Vartotojai gali vilkti ir mesti vaizdus į sąsają arba pasirinkti juos tiesiai iš standžiojo disko. Vartotojai taip pat gali pasirinkti vaizdo, kurį nori matyti sugeneruotą, matmenis. Jei vartotojai naudoja pasirinktines priesagas, jie gali pasirinktinai įtraukti jas į komandos pabaigą, kaip ir bet kurią įprastą komandą /imagine.

„Midjourney“ komanda sukūrė komandą /blend, kad efektyviai išnagrinėtų vartotojų vaizdų „sąvokas“ ir „nuotaiką“ ir bandytų juos sujungti. Dėl to kartais gaunami stebėtinai viliojantys vaizdai, o kitais atvejais vartotojai gauna siaubingus vaizdus. Tačiau komanda /blend nepalaiko tekstinių raginimų.

Komanda /blend turi apribojimų. Akivaizdžiausias dalykas yra tai, kad vartotojai gali pridėti tik penkias skirtingas vaizdo nuorodas. Nors komanda / imagine techniškai priima daugiau nei penkis vaizdus, ​​kuo daugiau nuorodų naudotojai prideda, tuo kiekvienas iš jų yra mažiau svarbus. Tai bendra problema, susijusi su problemų praskiedimu, o ne specifinė / mišinio problema. Kitas svarbus apribojimas yra tas, kad Midjourney blend komanda neveikia su tekstiniais nurodymais. Tai gali būti gaila pažengusiems vartotojams, kurie retai sumaišo du vaizdus. Tačiau vartotojams, norintiems kurti mišinius, šis apribojimas nėra labai svarbus.

Pagerinkite kūrimo laiką

yra būdų, kaip pagerinti arba optimizuoti „Midjourney AI“ vaizdo kūrimo laiką. Štai keletas patarimų, kurie gali jums padėti:

  • Naudokite konkrečius ir išsamius raginimus: „Midjourney“ generuoja vaizdus pagal vartotojo raginimus. Kuo konkretesnis ir išsamesnis raginimas, tuo geresni rezultatai. Tai taip pat sumažina laiką, kurio reikia vaizdui sukurti, nes AI algoritmas tiksliau supranta, ko vartotojas nori.
  • Eksperimentuokite su skirtingais kokybės nustatymais: parametras –quality koreguoja vaizdo kokybę ir laiką, kurio reikia jam sugeneruoti. Dėl žemesnės kokybės nustatymų vaizdai sukuriami greičiau, o aukštesnės kokybės nustatymai gali užtrukti ilgiau, tačiau rezultatai bus geresni. Norint rasti tinkamą kokybės ir greičio balansą, svarbu eksperimentuoti su skirtingais nustatymais.
  • Naudokite „Relax Mode“: standartinio ir „Pro“ plano abonentai gali naudoti „Relax Mode“, kuris nieko nekainuoja vartotojo GPU laikui, tačiau užduotys pateikiamos į eilę pagal įrenginio naudojimo dažnumą. Atsipalaidavimo režimo laukimo laikas yra dinamiškas, bet paprastai yra nuo 0 iki 10 minučių vienai užduočiai. Atsipalaidavimo režimo naudojimas gali būti geras būdas optimizuoti kūrimo laiką, ypač vartotojams, kurie kiekvieną mėnesį sukuria daug vaizdų.
  • Įsigykite daugiau Greitos valandos: spartusis režimas yra aukščiausio prioriteto apdorojimo lygis ir naudojamas mėnesio GPU laikas nuo naudotojo prenumeratos. Naudotojai gali įsigyti daugiau greitųjų valandų savo Midjourney.com/accounts puslapyje, kuris padeda užtikrinti, kad jų vaizdai būtų generuojami greitai ir efektyviai.
  • Naudokite „Fast Relax“: „Fast Relax“ yra nauja „Midjourney“ funkcija, leidžianti vartotojams greičiau generuoti vaizdus, ​​​​paaukojus tam tikrą kokybę. Greito atsipalaidavimo režimu sukuriami maždaug 60 % kokybės vaizdai, o tai gali būti geras kompromisas vartotojams, norintiems greitai generuoti vaizdus, ​​bet nenorintiems aukoti per daug kokybės.

Apibendrinant galima pasakyti, kad yra keletas būdų, kaip pagerinti arba optimizuoti vidurio AI vaizdų kūrimo laiką, įskaitant konkrečių raginimų naudojimą, eksperimentavimą su skirtingais kokybės nustatymais, režimo „Relax“ naudojimą arba greitesnių valandų pirkimą ir „Fast Relax“ režimo naudojimą.

Kiek tikslūs yra vaizdai, sukurti naudojant Midjourney AI modelį?

Vaizdų, sukurtų naudojant Midjourney AI modelį, tikslumas gali skirtis priklausomai nuo raginimo ir treniruočių duomenų kokybės. Vartotojai gali pagerinti sugeneruotų vaizdų tikslumą, būdami konkretūs ir išsamūs savo užklausose. Kuo konkretesnis ir aprašomesnis raginimas, tuo geriau AI galės duoti gerų rezultatų. „Midjourney“ AI modelis buvo apmokytas naudojant milijonus vaizdų ir teksto aprašymų, gautų iš interneto, o tai taip pat gali turėti įtakos generuojamų vaizdų tikslumui.

„Midjourney“ AI modelis naudoja difuziją, kuri apima vaizdo pridėjimą triukšmo, o tada duomenų gavimo procesą apverčia atvirkščiai. Šis procesas kartojamas be galo, todėl modelis prideda triukšmo, o tada vėl jį pašalina, o galiausiai sukuria tikroviškus vaizdus, ​​atlikdamas nedidelius vaizdo variantus.

„Midjourney“ AI modelis yra pagrįstas stabiliu srautiniu perdavimu, kuris yra apmokytas 2,3 milijardo vaizdų ir teksto aprašymų porų. Naudodami tinkamus žodžius raginime, vartotojai gali sukurti beveik viską, kas tik šauna į galvą. Tačiau kai kurie žodžiai yra draudžiami, o „Midjourney“ tvarko šių žodžių sąrašą, kad piktybiški žmonės nekurtų raginimų. „Midjourney's Discord“ bendruomenė gali teikti tiesioginę pagalbą ir daug pavyzdžių vartotojams.

Reikėtų pažymėti, kad dirbtinio intelekto sukurti „Midjourney“ vaizdai buvo ginčų objektas dėl autorių teisių pažeidimo ir meninio originalumo. Kai kurie menininkai apkaltino „Midjourney“ nuvertinus originalų kūrybinį darbą, o kiti tai laiko greito koncepcijos meno prototipų kūrimo įrankiu, kurį reikia parodyti klientams prieš pradedant dirbti su savimi.

Kaip „Midjourney“ sprendžia susirūpinimą dėl autorių teisių pažeidimo ir dirbtinio intelekto sukurtų vaizdų originalumo?

Midjourney: autorių teisių pažeidimas ir dirbtinio intelekto sukurtų vaizdų originalumas

„Midjourney“ ėmėsi veiksmų, kad išspręstų susirūpinimą dėl autorių teisių pažeidimo ir dirbtinio intelekto sukurtų vaizdų originalumo. „Midjourney“ atidžiai patikrina kiekvieną raginimą ir kiekvieną vaizdą, kad įsitikintų, jog nėra problemų dėl autorių teisių, naudojamas tik licencijuotas arba viešasis turinys ir atlieka papildomus tyrimus arba, jei kyla neaiškumų, prašo teisėto savininko leidimo.

„Midjourney“ taip pat skatina savo vartotojų atsakomybę, ragindama juos gerbti autorių teisių įstatymus ir naudoti tik vaizdus ir raginimus, kuriuos jie turi teisę naudoti. Jei naudotojas suabejoja įrašo ar vaizdo šaltiniu, platforma imasi skubių veiksmų, kad ištirtų ir pašalintų bet kokį autorių teises pažeidžiantį turinį pagal 1998 m. Skaitmeninio tūkstantmečio autorių teisių įstatymą (DMCA).

DMCA numato apsaugos nuostatas internetinių paslaugų teikėjams, pvz., „Midjourney“, kurie sąžiningai pašalina teises pažeidžiantį turinį, kai apie tai praneša autorių teisių turėtojas. „Midjourney“ taip pat turi DMCA panaikinimo politiką, pagal kurią atlikėjai gali prašyti, kad jų darbas būtų pašalintas iš rinkinio, jei jie mano, kad autorių teisių pažeidimas yra akivaizdus. [2][4].

„Midjourney“ požiūris į pažeidimo išvengimą atitinka Aukščiausiojo Teismo bylas, pvz., Feist Publications, Inc. v. Rural Telephone Service Co., Inc. (1991), kur Teismas nusprendė, kad originalumas, o ne naujumas, yra esminis autorių teisių apsaugos reikalavimas, ir Oracle America, Inc. v. Google LLC (2018), kur Teismas nusprendė, kad originalaus kūrinio kopijavimas net ir kitu tikslu vis tiek gali būti laikomas autorių teisių pažeidimu.

„Midjourney“ dirbtinio intelekto sukurti vaizdai buvo ginčų objektas dėl autorių teisių pažeidimo ir meninio originalumo. Kai kurie menininkai apkaltino „Midjourney“ nuvertinus originalų kūrybinį darbą, o kiti tai laiko greito koncepcijos meno prototipų kūrimo įrankiu, kurį reikia parodyti klientams prieš pradedant dirbti su savimi. Į „Midjourney“ paslaugų teikimo sąlygas įtraukta DMCA panaikinimo politika, pagal kurią atlikėjai gali prašyti, kad jų darbas būtų pašalintas iš rinkinio, jei jie mano, kad yra autorių teisių pažeidimo.

Kaip „Midjourney“ užtikrina, kad visas licencijuotas arba viešojo domeno turinys, naudojamas kuriant dirbtinio intelekto sukurtus vaizdus, ​​būtų tinkamai priskirtas?

Neaišku, kaip „Midjourney“ užtikrina, kad visas licencijuotas arba viešojo domeno turinys, naudojamas kuriant dirbtinio intelekto sukurtus vaizdus, ​​būtų tinkamai priskirtas. Tačiau „Midjourney“ atidžiai patikrina kiekvieną įrašą ir vaizdą, kad įsitikintų, jog nėra problemų dėl autorių teisių, naudoja tik licencijuotą ar viešą turinį ir atlieka papildomus tyrimus arba, jei kyla neaiškumų, prašo teisėto savininko leidimo. 

„Midjourney“ taip pat skatina savo vartotojų atsakomybę, ragindama juos gerbti autorių teisių įstatymus ir naudoti tik vaizdus ir raginimus, kuriuos jie turi teisę naudoti. Jei naudotojas suabejoja įrašo ar vaizdo šaltiniu, platforma imasi skubių veiksmų, kad ištirtų ir pašalintų bet kokį autorių teises pažeidžiantį turinį pagal 1998 m. Skaitmeninio tūkstantmečio autorių teisių įstatymą (DMCA). 

„Midjourney“ taip pat turi DMCA panaikinimo politiką, pagal kurią atlikėjai gali prašyti, kad jų darbas būtų pašalintas iš serijos, jei jie mano, kad yra aiškus autorių teisių pažeidimas.

Reikėtų pažymėti, kad dirbtinio intelekto sukurti „Midjourney“ vaizdai buvo ginčų objektas dėl autorių teisių pažeidimo ir meninio originalumo. Kai kurie menininkai apkaltino „Midjourney“ nuvertinus originalų kūrybinį darbą, o kiti tai laiko greito koncepcijos meno prototipų kūrimo įrankiu, kurį reikia parodyti klientams prieš pradedant dirbti su savimi.

Taisyklės, kurių vartotojai turi laikytis vidurio kelionės metu

„Midjourney“ nustatė taisyklių rinkinį, kurių vartotojai turi laikytis, kad užtikrintų svetingą ir įtraukią bendruomenę visiems. Šios taisyklės yra tokios: [0][1][2] :

  • Būkite malonūs ir gerbkite kitus bei darbuotojus. Nekurkite vaizdų ir nenaudokite tekstinių raginimų, kurie iš prigimties yra nepagarbūs, agresyvūs ar kitaip įžeidžiantys. Bet koks smurtas ar priekabiavimas nebus toleruojamas.
  • Jokio suaugusiesiems skirto turinio ar kruvinų scenų. Venkite vizualiai įžeidžiančio ar trikdančio turinio. Kai kurie teksto įrašai blokuojami automatiškai.
  • Neatgaminti kitų žmonių kūrinių viešai be jų leidimo.
  • Atkreipkite dėmesį į dalijimąsi. Galite bendrinti savo kūrinius už Midjourney bendruomenės ribų, tačiau pagalvokite, kaip kiti galėtų peržiūrėti jūsų turinį.
  • Bet koks šių taisyklių pažeidimas gali būti pašalintas iš paslaugos.
  • Šios taisyklės taikomos visam turiniui, įskaitant vaizdus, ​​padarytus privačiuose serveriuose, privačiu režimu ir tiesioginiuose pranešimuose su Midjourney Bot.

„Midjourney“ taip pat turi sąrašą draudžiamų žodžių, kurie neleidžiami pranešimuose. Į draudžiamų žodžių sąrašą įtraukiami žodžiai, tiesiogiai arba netiesiogiai susiję su smurtu, priekabiavimu, kruvinumu, suaugusiesiems skirtu turiniu, narkotikais ar neapykantą kurstančia kalba. Be to, neleidžiami raginimai, kurie apima agresiją ir smurtą arba yra su ja susiję.

Jei žodis yra draudžiamų žodžių sąraše arba jei jis yra glaudžiai ar nuotoliniu būdu susijęs su uždraustu žodžiu, Midjourney neleis raginimo. Kelionės vidurio naudotojai turėtų pakeisti draudžiamus žodžius panašiais, bet leidžiamais žodžiais, vengti vartoti žodžių, kurie yra glaudžiai ar nuotoliniu būdu susiję su draudžiamais žodžiais, arba apsvarstyti galimybę naudoti sinonimą ar kitą formuluotę.

Uždrausti žodžiai vidurio kelionėje

„Midjourney“ įdiegė filtrą, kuris automatiškai filtruoja ir uždraudžia tikslius ar panašius žodžius draudžiamų žodžių sąraše. Draudžiamų žodžių sąraše yra žodžiai, kurie yra tiesiogiai arba netiesiogiai susiję su smurtu, priekabiavimu, kruvinumu, suaugusiesiems skirtu turiniu, narkotikais ar neapykantos kurstymu. Be to, neleidžiami raginimai, apimantys agresiją ir piktnaudžiavimą arba su jais susiję.

Draudžiamų žodžių sąrašas nebūtinai yra baigtinis, o sąraše gali būti daug kitų terminų, kurių dar nėra. „Midjourney“ nuolat atnaujina draudžiamų žodžių sąrašą. Šis sąrašas yra nuolat peržiūrimas ir nėra viešas. Tačiau yra bendruomenės valdomas sąrašas, kurį vartotojai gali pasiekti ir, jei nori, prisidėti. [0][1].

Jei žodis yra draudžiamų žodžių sąraše arba jei jis yra glaudžiai ar nuotoliniu būdu susijęs su uždraustu žodžiu, Midjourney neleis raginimo. Kelionės vidurio naudotojai turėtų pakeisti uždraustus žodžius panašiais, bet leidžiamais žodžiais, vengti vartoti žodį, kuris net silpnai susijęs su draudžiamu žodžiu, arba apsvarstyti galimybę naudoti sinonimą ar alternatyvią formuluotę. Kelionės vidurio vartotojai visada turėtų patikrinti #rules kanalą prieš pateikdami savo pranešimą, nes komanda nuolat atnaujina draudžiamų žodžių sąrašą [2].

Midjourney turi elgesio kodeksą, kurio vartotojai turi laikytis. Elgesio kodeksas apima ne tik PG-13 turinio sekimą, bet ir malonumą bei pagarbą kitiems ir darbuotojams. Taisyklių pažeidimas gali būti sustabdytas arba pašalintas iš paslaugos. „Midjourney“ yra atvira „Discord“ bendruomenė, todėl labai svarbu laikytis elgesio kodekso. Net jei vartotojai naudojasi paslauga „/privačiu“ režimu, jie turi laikytis elgesio kodekso.

Apibendrinant galima pasakyti, kad „Midjourney“ taiko griežtą turinio moderavimo politiką ir draudžia bet kokį smurtą ar priekabiavimą, bet kokį suaugusiesiems skirtą ar kruviną turinį, taip pat bet kokį vizualiai įžeidžiantį ar trikdantį turinį. „Midjourney“ įdiegė filtrą, kuris automatiškai filtruoja ir uždraudžia tikslius ar panašius žodžius draudžiamų žodžių sąraše, į kurį įtraukiami žodžiai, tiesiogiai arba netiesiogiai susiję su smurtu, priekabiavimu, kruvinumu, suaugusiems skirtu turiniu, narkotikais ar neapykantos kurstymu. Kelionės vidurio vartotojai turėtų laikytis elgesio kodekso ir patikrinti #rules kanalą prieš pateikdami savo pranešimą, nes komanda nuolat atnaujina draudžiamų žodžių sąrašą.

Atnaujintas draudžiamų žodžių sąrašas

Midjourney periodiškai koreguoja draudžiamų žodžių sąrašą ir sąrašas yra nuolat peržiūrimas. Draudžiamų žodžių sąrašas nėra viešas, tačiau yra bendruomenės sudarytas sąrašas, kurį vartotojai gali pasiekti ir prie jo prisidėti. „Midjourney“ siekia suteikti PG-13 patirtį visoje Paslaugoje, todėl žodžiai ir turinys, susijęs su smurtu, kruvinumu, priekabiavimu, narkotikais, suaugusiesiems skirtu turiniu ir apskritai įžeidžiančiomis temomis, yra draudžiami. Draudžiamų žodžių sąrašas suskirstytas į kelias kategorijas, apimančias aukščiau paminėtą temų spektrą. Svarbu pažymėti, kad vidurio kelionės draudžiamų žodžių sąrašas nebūtinai yra baigtinis ir kad gali būti daug kitų terminų, kurių sąraše dar nėra.

Vidurinės kelionės uždraudimas ir sustabdymas

Midjourney turi griežtą elgesio kodeksą, kurio vartotojai turi laikytis. Taisyklių pažeidimas gali būti sustabdytas arba pašalintas iš paslaugos. Tačiau neaišku, ar vartotojai gali apskųsti uždraudimą arba sustabdymą iš Midjourney. Šaltiniuose nėra aiškiai minimas apeliacijos procesas arba kaip susisiekti su „Midjourney“ komanda dėl uždraudimo ar sustabdymo. Labai svarbu laikytis elgesio kodekso, kad nebūtų uždrausta arba sustabdyta paslauga. Jei naudotojai turi kokių nors rūpesčių ar klausimų dėl paslaugos, jie gali susisiekti su Midjourney komanda per savo Discord serverį [1][2].

Ar „Midjourney“ gali generuoti tam tikro dydžio ar skiriamosios gebos vaizdus?

„Midjourney“ turi tam tikrus numatytuosius vaizdo dydžius ir skiriamąją gebą, kuriuos vartotojai gali sukurti. Numatytasis „Midjourney“ vaizdo dydis yra 512 x 512 pikselių, kuriuos galima padidinti iki 1024 x 1024 pikselių arba 1664 x 1664 pikselių naudojant /imagine komandą Discord. Taip pat yra beta parinktis, pavadinta „Beta Upscale Redo“, kuri gali padidinti vaizdų dydį iki 2028 x 2028 pikselių, tačiau gali sumažinti kai kurias detales.

Vartotojai gali keisti mastelį iki didžiausios skiriamosios gebos tik atlikę bent pagrindinį vaizdo mastelį [1]. Maksimalus failo dydis, kurį gali sukurti „Midjourney“, yra 3 megapikseliai, o tai reiškia, kad vartotojai gali kurti vaizdus bet kokiu formatu, tačiau galutinis vaizdo dydis negali viršyti 3 000 000 pikselių. Vidurinės kelionės skiriamoji geba yra pakankama pagrindiniams nuotraukų spaudiniams, tačiau jei naudotojai nori spausdinti ką nors didesnio, jiems gali tekti naudoti išorinį AI keitiklį, kad gautų gerų rezultatų.

Kuo „Midjourney“ skiriasi nuo kitų AI vaizdo generatorių, tokių kaip DALL-E ir „Stable Diffusion“?

Šaltinių teigimu, „Midjourney“ yra dirbtinio intelekto vaizdų generatorius, kuris iš tekstinių raginimų sukuria meniškus ir svajingus vaizdus. Jis lyginamas su kitais generatoriais, tokiais kaip DALL-E ir Stable Diffusion. Pranešama, kad „Midjourney“ siūlo ribotą stilių spektrą nei kiti du, tačiau jo vaizdai vis tiek yra tamsesni ir meniškesni. Atrodo, kad „Midjourney“ nesutampa su DALL-E ir „Stable Diffusion“, kai kalbama apie fotorealizmą [1][2].

„Stable Diffusion“ lyginama su „Midjourney“ ir „DALL-E“ ir, kaip teigiama, yra kažkur tarp jų naudojimo paprastumo ir produkcijos kokybės požiūriu. „Stable Diffusion“ siūlo daugiau parinkčių nei DALL-E, pavyzdžiui, skalę, leidžiančią nustatyti, kaip gerai generatorius seka pagalbinius žodžius, ir parinktis, susijusias su išvesties formatu ir dydžiu. Tačiau „Stable Diffusion“ darbo eiga nesutampa su DALL-E, kuri grupuoja vaizdus ir siūlo rinkinių aplankus. Teigiama, kad „Stable Diffusion“ ir „DALL-E“ turi tuos pačius fotorealizmo trūkumus – abiems nepavyksta priartėti prie „Midjourney's Discord“ žiniatinklio programos. [0].

Remiantis Fabian Stelzer lyginamuoju testu, Midjourney visada yra tamsesnis nei DALL-E ir Stable Diffusion. Nors „DALL-E“ ir „Stable Diffusion“ sukuria tikroviškesnius vaizdus, ​​„Midjourney“ pasiūlymai pasižymi menine, svajinga kokybe. „Midjourney“ lyginamas su „Moog“ analoginiu sintezatoriumi su maloniais artefaktais, o „DALL-E“ – su skaitmeninės darbo vietos sintezatoriumi, turinčiu platesnį diapazoną.

„Stable Diffusion“ lyginama su sudėtingu moduliniu sintezatoriumi, kuris gali išgauti beveik bet kokį garsą, tačiau jį paleisti sunkiau. Kalbant apie vaizdo skiriamąją gebą, „Midjourney“ gali generuoti 1792 x 1024 raiškos vaizdus, ​​o DALL-E yra šiek tiek labiau apribotas – 1024 x 1024. Tačiau Stelzer pažymi, kad atsakymas, kuris generatorius yra geriausias, yra visiškai subjektyvus ir priklauso nuo asmeninių pageidavimų.

Yra žinoma, kad DALL-E sukuria fotorealistiškesnius vaizdus, ​​​​netgi tuos, kurie nesiskiria nuo nuotraukų. Teigiama, kad jis turi geresnį supratimą ar supratimą nei kiti AI generatoriai. Tačiau „Midjourney“ sukurtas ne fotorealistiniams vaizdams kurti, o svajingiems ir meniniams vaizdams kurti. Todėl pasirinkimas tarp dviejų generatorių galiausiai priklauso nuo vartotojo poreikių ir pageidavimų.

Kaip ribotas „Midjourney“ stilių diapazonas veikia jo naudojimą, palyginti su DALL-E ir stabiliu srautiniu perdavimu?

Pasak šaltinių, ribotas „Midjourney“ stilių diapazonas gali turėti įtakos jo naudojimui, palyginti su DALL-E ir „Stable Diffusion“. „Midjourney“ vaizdai laikomi estetiškesniais, tačiau jo stilių diapazonas yra ribotesnis nei „DALL-E“ ir „Stable Diffusion“. „Midjourney“ stilius apibūdinamas kaip svajingas ir meniškas, o DALL-E yra žinomas dėl to, kad sukuria daugiau fotorealistiškų vaizdų, kurių negalima atskirti nuo nuotraukų. 

„Stable Diffusion“ naudojimo paprastumas ir rezultatų kokybė yra kažkur tarp jų. „Stable Diffusion“ siūlo daugiau parinkčių nei DALL-E, pavyzdžiui, skalę, leidžiančią nustatyti, kaip generatorius seka siūlomus žodžius, taip pat parinktis, susijusias su rezultatų formatu ir dydžiu. „Midjourney“ lyginamas su analoginiu „Moog“ sintezatoriumi su maloniais artefaktais, o „DALL-E“ – su platesnio diapazono skaitmeniniu darbo vietos sintezatoriumi. „Stable Diffusion“ yra lyginamas su sudėtingu moduliniu sintezatoriumi, kuris gali skleisti beveik bet kokį garsą, tačiau jį suaktyvinti sunkiau. [1][2].

Teigiama, kad DALL-E yra lankstesnis nei „Midjourney“, galintis pasiūlyti įvairesnių vizualinių stilių. DALL-E taip pat geriau kuria tikroviškas, „normalias“ nuotraukas, kurios puikiai atrodytų žurnale ar įmonės svetainėje. DALL-E taip pat siūlo galingus įrankius, kurių Midjourney neturi, pvz., dažų perdangą, apkarpymą ir įvairų vaizdų įkėlimą, kurie yra būtini norint išradingesnio dirbtinio intelekto naudojimo.

DALL-E modelis turi mažiau nuomonių, todėl jis imlesnis stiliaus pasiūlymams, ypač jei tas stilius nėra toks gražus. Todėl labiau tikėtina, kad DALL-E tiksliai reaguos į konkretų užklausą, pvz., pikselių meną. DALL-E taip pat siūlo tikrą žiniatinklio programą, leidžiančią vartotojams tiesiogiai dirbti su DALL-E, o tai gali būti mažiau paini nei „Discord“ diegimas.

Palyginti su „Midjourney“, „Stable Diffusion“ turėtų būti visiškai nemokama, todėl ji yra prieinamesnė tiems, kurie negali sau leisti dirbtinio intelekto vaizdo generatoriaus. Tačiau „Stable Diffusion“ galima tik kaip „Discord“ robotą, todėl vartotojai turi pateikti paraišką, kad ją pasiektų. Taip pat manoma, kad „Stable Diffusion“ yra sunkiau paleisti nei „Midjourney“, kurią lengviau naudoti dėl pasirinkto formato koeficiento ir viešosios galerijos. „Midjourney“ taip pat siūlo „AutoArchive“, kuri sukuria visų vaizdų atsargines kopijas, ir 2x2 išsaugotų miniatiūrų tinklelį, todėl darbą lengva valdyti. „Midjourney's Discord“ programa taip pat veikia geriau mobiliajame telefone nei DALL-E svetainė, todėl lengviau generuoti vaizdus keliaujant. Dėl unikalaus „Midjourney“ stiliaus jis puikiai tinka greitai sukurti daugybę malonių vaizdų, nereikia tobulinti pranešimo.

Apibendrinant galima pasakyti, kad kiekvienas dirbtinio intelekto vaizdų generatorius turi savo privalumų ir trūkumų, o kiekvienas žmogus gali turėti skirtingus pageidavimus ir poreikius. Ribotas „Midjourney“ stilių pasirinkimas gali turėti įtakos jo naudojimui, palyginti su DALL-E ir „Stable Diffusion“, tačiau dėl unikalaus stiliaus jis idealiai tinka svajingiems, meniniams vaizdams kurti. DALL-E yra lankstesnis ir įgudęs kurti fotorealistinius vaizdus, ​​o „Stable Diffusion“ yra visiškai nemokama ir siūlo daugiau galimybių nei DALL-E. Galiausiai pasirinkimas tarp generatorių priklauso nuo vartotojo poreikių ir pageidavimų.

Ar yra reikšmingų trijų AI vaizdo generatorių gautų rezultatų kokybės skirtumų?

Šaltiniai nemini jokių reikšmingų išvesties kokybės skirtumų tarp trijų AI vaizdo generatorių (Midjourney, DALL-E ir Stable Diffusion). Tačiau šaltiniuose minima, kad kiekvienas generatorius turi savo stipriąsias ir silpnąsias puses, ir kiekvienas gali būti geriau pritaikytas skirtingiems vaizdų ar stilių tipams. Pavyzdžiui, sakoma, kad „Midjourney“ sukuria svajingus ir meniškus vaizdus, ​​o žinoma, kad DALL-E sukuria labiau fotorealistiškus vaizdus, ​​​​kurie nesiskiria nuo nuotraukų. „Stable Diffusion“ yra tarp šių dviejų naudojimo paprastumo ir rezultatų kokybės požiūriu. Galiausiai pasirinkimas tarp generatorių priklauso nuo vartotojo poreikių ir pageidavimų.

Patarimai, kaip pasirinkti geriausią generatorių konkrečiam projektui ar programai

Pasak šaltinių, geriausio AI vaizdo generatoriaus pasirinkimas konkrečiam projektui ar programai priklauso nuo vartotojo poreikių ir pageidavimų. Vartotojas turi atsižvelgti į tokius veiksnius, kaip norimų sukurti vaizdų tipas, jam reikalingas detalumo ir tikroviškumo lygis, generatoriaus naudojimo paprastumas, tokių funkcijų kaip dažymas, įvairių vaizdų apkarpymas ir įkėlimas. , taip pat generatoriaus kaina.

Jei vartotojas nori sukurti svajingus ir meniškus vaizdus, ​​Midjourney yra geriausias pasirinkimas. Jei vartotojas nori sukurti fotorealistiškus vaizdus, ​​DALL-E yra geresnis pasirinkimas. „Stable Diffusion“ yra tarp šių dviejų naudojimo paprastumo ir rezultatų kokybės požiūriu. „Stable Diffusion“ siūlo daugiau parinkčių nei DALL-E, pavyzdžiui, skalę, leidžiančią nustatyti, kaip generatorius laikosi nurodymų, taip pat parinktis, susijusias su rezultatų formatu ir dydžiu. Tačiau „Stable Diffusion“ darbo eiga nepalyginama su „DALL-E“, kuri grupuoja vaizdus ir siūlo rinkinių aplankus.

Vartotojas taip pat turėtų apsvarstyti, ar generatorius yra nemokamas, ar mokamas, ir ar jis pasiekiamas kaip žiniatinklio programa, ar kaip „Discord“ robotas. „Stable Diffusion“ yra visiškai nemokama ir prieinama kaip „Discord“ robotas, o „Midjourney“ ir „DALL-E“ yra mokami ir pasiekiami kaip žiniatinklio programos arba „Discord“ robotai.

Galiausiai pasirinkimas tarp generatorių priklauso nuo vartotojo poreikių ir pageidavimų. Vartotojas turėtų ištirti ir palyginti kiekvieno generatoriaus savybes ir išvesties kokybę, prieš pasirinkdamas geriausiai jo poreikius atitinkantį generatorių.

Kurso vidurio alternatyvos.

Kaip minėta anksčiau, Midjourney yra populiarus AI vaizdų generatorius, kuriantis vaizdus iš teksto aprašymų. Tačiau jis siūlo tik 25 minutes nemokamo atvaizdavimo laiko, tai yra apie 30 vaizdų. Jei ieškote nemokamos „Midjourney“ alternatyvos, galite išbandyti keletą variantų.

Štai keletas nemokamų „Midjourney“ alternatyvų:

  • kreidelė : Tai nemokamas atvirojo kodo sprendimas, siūlantis gerą „Midjourney“ alternatyvą.
  • DALL-E : tai dar vienas vaizdų generatorius, panašus į Midjourney ir prieinamas nemokamai. Jį sukūrė OpenAI.
  • Jasper: Tai nemokamas atvirojo kodo vaizdų generatorius, kuris gali būti naudojamas kaip Midjourney alternatyva.
  • stebėtis : Tai nemokamas atvirojo kodo vaizdų generatorius, kuris gali būti naudojamas kaip Midjourney alternatyva.
  • Iškvieskite AI : Tai gražiai suprojektuotas vaizdų generatorius su intuityvia sąsaja, kurį galima naudoti kaip Midjourney alternatyvą.
  • Disco Diffusion: Tai debesies pagrindu sukurta teksto į vaizdą konvertavimo sistema, kurią lengva naudoti ir kurią galima naudoti kaip Midjourney alternatyvą.

Jei ieškote kažko konkretesnio ar pritaikomo, stabilus srautas (SD) gali būti geras pasirinkimas. [3]. Tačiau norint pasiekti gerų rezultatų, SD reikia daugiau pastangų ir jį naudoti nėra taip paprasta, kaip „Midjourney“. Be to, yra keletas kitų nemokamų teksto į vaizdą konvertavimo sistemų, tokių kaip Wombo's Dream, Hotpot's AI Art Maker, SnowPixel, CogView, StarryAI, ArtBreeder ir ArtFlow.

Apibendrinant, jei ieškote nemokamos „Midjourney“ alternatyvos, yra keletas variantų, tokių kaip „Craiyon“, „DALL-E“, „Jasper“, „Wonder“, „Invoke AI“, „Disco Diffusion“ ir „Stable Diffusion“. Šios sistemos siūlo skirtingus pritaikymo laipsnius ir naudojimo paprastumą, todėl turėtumėte išbandyti kelias ir išsiaiškinti, kuri jums labiausiai tinka.

Šis straipsnis parašytas bendradarbiaujant su komanda Gilus AI et Orgs.

[Iš viso: 0 Reiškia: 0]

Parašyta Dieteris B.

Žurnalistas, aistringas naujoms technologijoms. Dieteris yra apžvalgų redaktorius. Anksčiau jis buvo „Forbes“ rašytojas.

Komentuoti

Jūsų el. Pašto adresas nebus paskelbtas. Privalomi laukai yra pažymėti *

Ką manote?

386 Kredito taškai
Aukštyn Perkelti