in ,

Midjourney: Minden, amit az AI-művészről tudni kell

Midjourney: Mi az? Használat, korlátozások és alternatívák

Midjourney: Minden, amit az AI-művészről tudni kell
Midjourney: Minden, amit az AI-művészről tudni kell

A Midjourney egy mesterséges intelligencia képgenerátor, amely szöveges leírásokból képeket hoz létre. Ez egy kutatólaboratórium, amelyet David Holz, a Leap Motion társalapítója vezet. A Midjourney álomszerűbb művészi stílust kínál az Ön igényeinek, és gótikusabb megjelenésű a többi AI-generátorhoz képest. Az eszköz jelenleg nyílt bétaverzióban van, és csak egy Discord-boton keresztül érhető el a hivatalos Discord-on.

A képek generálásához a felhasználók az /imagine parancsot használják, és beírnak egy promptot, és a bot négy képből álló készletet ad vissza. A felhasználók ezután kiválaszthatják, hogy mely képeket kívánják átméretezni. A Midjourney webes felületen is dolgozik.

Az alapító, David Holz a művészekre a Midjourney ügyfeleiként tekint, nem pedig versenytársaira. A művészek a Midjourney-t használják koncepcióművészeti alkotások gyors prototípusának elkészítésére, amelyet bemutatnak ügyfeleiknek, mielőtt önállóan dolgoznának. Mivel a Midjourney összes felállása tartalmazhat szerzői jogvédelem alatt álló művészek műveit, egyes művészek azzal vádolják Midjourneyt, hogy leértékeli az eredeti kreatív munkát.

A Midjourney Általános Szerződési Feltételei tartalmazzák a DMCA eltávolítási szabályzatát, amely lehetővé teszi az előadók számára, hogy kérjék munkáik eltávolítását a készletből, ha úgy vélik, hogy nyilvánvaló a szerzői jogok megsértése. A reklámipar olyan mesterséges intelligencia eszközöket is felkarolt, mint például a Midjourney, a DALL-E és a Stable Diffusion, amelyek lehetővé teszik a hirdetők számára, hogy eredeti tartalmat hozzanak létre, és gyorsan ötleteljenek.

A Midjourney-t különféle emberek és cégek használták képek és műalkotások készítésére, köztük a The Economist és a Corriere della Sera. A Midjourney-t azonban bírálták néhány művésztől, akik úgy érzik, hogy elveszi a munkát a művészektől, és megsérti szerzői jogaikat. A Midjourney ügyben egy művészcsapat is pert indított szerzői jogok megsértése miatt.

A Midjourney használatának megkezdéséhez a felhasználóknak be kell jelentkezniük a Discordba, és fel kell lépniük a Midjourney webhelyére, hogy csatlakozzanak a bétaverzióhoz. Az elfogadás után a felhasználók meghívót kapnak a Discord Midjourney programra, és megkezdhetik a képek generálását az /imagine beírásával, majd a kívánt prompt beírásával.

Midjourney nem árult el sok információt a hátteréről és a képzéséről, de a feltételezések szerint a Dall-E 2-hez és a Stable Diffusion-hoz hasonló rendszert használ, képeket és szöveget kaparva le az internetről, hogy leírja őket, és több millió közzétett képet használ edzésre. .

Tartalomjegyzék

A Midjourney által használt folyamat szöveges promptokból képeket generál

A Midjourney szöveg-kép AI-modellt használ a képek szöveges promptokból történő létrehozásához. A Midjourney bot egy promptban kisebb darabokra, úgynevezett tokenekre bontja a szavakat és kifejezéseket, amelyek összehasonlíthatók a betanítási adatokkal, majd felhasználhatók kép létrehozására. Egy jól megtervezett felszólítás segíthet egyedi és izgalmas képek létrehozásában [0].

A Midjourney segítségével kép létrehozásához a felhasználóknak a Midjourney Discord csatornában a „/imagine” paranccsal be kell írniuk, hogy hogyan nézzenek ki a kép. Minél konkrétabb és leíróbb az üzenet, az AI annál inkább képes jó eredményeket produkálni. A Midjourney ezután egy percen belül létrehozza a kép több különböző verzióját a felszólítás alapján. A felhasználók választhatnak, hogy beszerezhetik e képek bármelyikének alternatív változatát, vagy bármelyiket felnagyíthatják, hogy nagyobb, jobb minőségű képet kapjanak. A Midjourney gyors és nyugodt módokat kínál, a gyors mód pedig szükséges a maximális nagyítás eléréséhez és több kép elkészítéséhez rövidebb idő alatt.

A Midjourney mesterséges intelligencia modellje diffúziót használ, amely során zajt adnak a képhez, majd megfordítják a folyamatot az adatok lekéréséhez. Ez a folyamat a végtelenségig megismétlődik, aminek hatására a modell zajt ad hozzá, majd ismét eltávolítja azt, és végül valósághű képeket hoz létre a kép kis eltéréseivel. Midjourney képeket és szövegeket keresett az interneten, hogy leírja őket, több millió közzétett edzéskép segítségével.

A Midjourney mesterséges intelligencia modellje stabil adatfolyamon alapul, amelyet 2,3 milliárd képpárra és szöveges leírásra tanítanak. A megfelelő szavak használatával a felhasználók szinte bármit létrehozhatnak, ami eszébe jut. Néhány szó azonban tilos, és a Midjourney listát vezet ezekről a szavakról, hogy megakadályozza, hogy rosszindulatú emberek üzeneteket hozzanak létre. A Midjourney Discord közössége elérhető, hogy élő segítséget és rengeteg példát nyújtson a felhasználóknak.

Képek használata és generálása

A Midjourney AI ingyenes használatához Discord-fiókkal kell rendelkeznie. Ha még nem rendelkezik ilyennel, regisztráljon ingyenesen a Discordon. Ezután látogasson el a Midjourney webhelyre, és válassza a Csatlakozás Bétához lehetőséget. Ezzel egy Discord-meghívóra kerülsz. Fogadd el a Midjourney Discord-meghívást, és válaszd a Continue on Discord lehetőséget. 

A Discord alkalmazás automatikusan megnyílik, és a bal oldali menüből kiválaszthatod a hajó alakú Midjourney ikont. A Midjourney csatornákban keresse meg az újonnan érkező szobákat, és kezdéshez válasszon közülük. Ha készen áll, írja be a „/imagine” szót az újoncok szobájához tartozó Discord chatbe. 

Ezzel létrehoz egy prompt mezőt, ahol megadhatja a kép leírását. Minél pontosabb a leírásod, annál jobban tud az AI jó eredményeket produkálni. Legyen leíró jellegű, és ha egy adott stílust keres, vegye fel a leírásába. A Midjourney minden felhasználónak 25 kísérletet kínál az AI-val való játékhoz. 

Ezt követően a folytatáshoz teljes jogú tagként kell regisztrálnia. Ha nem szeretnél pénzt költeni, érdemes egy kis időt szánni és átgondolni, hogy mit szeretnél létrehozni a Midjourney-n. 

Ha szeretné, írja be a „/help” parancsot, hogy megkapja a követendő tippek listáját. A Midjourney AI használata előtt feltétlenül ismerje meg a tiltott szavak listáját, mivel a magatartási kódex be nem tartása eltiltást von maga után.

>> Olvassa el még - A 27 legjobb ingyenes mesterséges intelligencia webhely (tervezés, szövegírás, csevegés stb.)

/képzeld el a parancsot

Az /imagine parancs a Midjourney egyik fő parancsa, amely lehetővé teszi a felhasználók számára, hogy AI által generált képeket állítsanak elő igényeik alapján. Így működik:

  1. A felhasználók beírják az /imagine parancsot a Discord chatbe, és hozzáadják a használni kívánt beállításokat.
  2. A Midjourney AI algoritmus elemzi a promptot, és a bemenet alapján képet generál.
  3. A generált kép megjelenik a Discord chatben, a felhasználók pedig visszajelzést adhatnak és finomíthatják üzeneteiket a Remix funkció segítségével.
  4. A felhasználók további beállításokkal is módosíthatják a létrehozott kép stílusát, verzióját és egyéb szempontjait.

Az /imagine parancs kép- és szöveges promptokat is elfogad. A felhasználók az általuk generálni kívánt képek URL-címének vagy mellékletének megadásával promptokat adhatnak hozzá képként. A szöveges promptok tartalmazhatják a felhasználók által generálni kívánt képek leírását, például objektumokat, háttereket és stílusokat. A felhasználók további paramétereket is hozzáadhatnak a parancshoz, hogy beállítsák a használni kívánt algoritmus verzióját, engedélyezzék a Remix funkciót stb.

Példák a Midjourney AI által létrehozható képek típusaira

A Midjourney AI képek széles skáláját képes létrehozni különböző stílusokban, beleértve, de nem kizárólagosan:

  • Illusztrációk gyerekkönyvekhez, mint például az „Egy malacka kalandja”.
  • Valósághű portrék emberekről, állatokról és tárgyakról.
  • Szürreális és absztrakt műalkotások, amelyek különböző elemeket és stílusokat kevernek.
  • Különböző hangulatokat, érzelmeket kiváltó tájak és városképek.
  • Fekete-fehér fényképezés bonyolult részletekkel és filmes hatásokkal.
  • Futurisztikus vagy sci-fi témákat illusztráló képek, például egy félig robotalkatrészekből készült, gázálarcot viselő öregasszony példája.

Fontos megjegyezni, hogy a Midjourney AI által generált képek minősége és stílusa a promptok minőségétől, a használt algoritmus verziójától és egyéb tényezőktől függően változhat. A felhasználóknak különféle promptokkal és beállításokkal kell kísérletezniük a kívánt eredmények elérése érdekében.

Kombinálja a képeket a Midjourney-ben

Ha két vagy több képet szeretne kombinálni a Midjourney-ben, kövesse az alábbi lépéseket:

  1. Válassza ki az egyesíteni kívánt képeket, és töltse fel őket a Discordra.
  2. Másolja ki a képek hivatkozásait, és adja hozzá őket az /imagine prompthoz képpromptként.
  3. Adja hozzá a "-v 4"-et a prompthoz, ha a 4-es verzió alapértelmezés szerint nincs engedélyezve.
  4. Adja el a parancsot, és várja meg, amíg a kép létrejön.

Például két kép egyesítéséhez a következő parancsot használhatja: /imagin -v 1

További információkat is hozzáadhat, például objektumokat, hátteret és általános művészeti stílust, hogy teljesen új képet hozzon létre saját stílusával. Például: /imagin , rajzfilm stílusú, vidám tömeg a háttérben, Tesla logó a mellkason, -nem jelmez -v 1

A Midjourney egy új funkciót is elindított, a /blend parancsot, amely lehetővé teszi akár öt kép egyesítését anélkül, hogy URL-eket kellene másolni és beilleszteni. Engedélyezheti a /blend parancsot a –blend jelzővel a promptba.

Fontos megjegyezni, hogy ez a funkció csak a Midjourney algoritmus 4-es verziójával működik, és a képek kombinálása nem igényel további szöveget, de információk hozzáadása általában jobb képeket eredményez. A legjobb eredményeket általában a művészeti stílusokkal való kísérletezéssel és a képek Remix móddal történő módosításával érheti el.

Kombináljon kettőnél több képet

A Midjourney lehetővé teszi a felhasználók számára, hogy legfeljebb öt képet keverjenek a /blend paranccsal. Ha azonban a felhasználóknak ötnél több képet kell kombinálniuk, használhatják az /imagine parancsot, és beilleszthetik egy sorba a nyilvános képek URL-címeit. Ha kettőnél több képet szeretne kombinálni az /imagine paranccsal, a felhasználók promptokat adhatnak a parancshoz. Például három kép kombinálásához a parancs a /imagin -v 1.

A felhasználók további parancssorokat adhatnak hozzá több kép kombinálásához. Fontos megjegyezni, hogy további információk hozzáadása a prompthoz, beleértve az objektumokat, a hátteret és az általános művészeti stílust, segíthet egy teljesen új, saját stílussal rendelkező képet létrehozni. A legjobb eredményeket a művészeti stílusokkal való kísérletezéssel és a képek Remix móddal történő módosításával érheti el

Command / Blend in Midjourney

A Midjourney /blend parancsa lehetővé teszi a felhasználók számára, hogy akár öt képet is keverjenek azáltal, hogy könnyen használható felhasználói felületelemeket adnak hozzá közvetlenül a Discord felülethez. A felhasználók áthúzhatják a képeket a felületre, vagy közvetlenül a merevlemezükről választhatják ki őket. A felhasználók kiválaszthatják a generált kép méretét is. Ha a felhasználók egyéni utótagokat használnak, akkor tetszőlegesen hozzáadhatják azokat a parancs végéhez, mint bármely normál /imagine parancs esetében.

A Midjourney csapata úgy tervezte meg a /blend parancsot, hogy hatékonyan megvizsgálja a felhasználók képeinek „fogalmait” és „hangulatát”, és megpróbálja összekeverni őket. Ez néha meglepően csábító képeket eredményez, más esetekben pedig a felhasználók rémisztő képeket készítenek. A /blend parancs azonban nem támogatja a szöveges promptokat.

A /blend parancsnak vannak korlátai. A legnyilvánvalóbb az, hogy a felhasználók csak öt különböző képreferenciát adhatnak hozzá. Bár az /imagine parancs technikailag ötnél több képet fogad el, minél több hivatkozást adnak hozzá a felhasználók, annál kevésbé fontosak mindegyik. Ez egy általános probléma a problémás hígítással, és nem egy /blend specifikus probléma. A másik fő korlátozás az, hogy a Midjourney blend parancs nem működik szöveges promptokkal. Ez sajnálatos lehet a haladó felhasználók számára, akik ritkán kevernek össze két képet. Azonban a mashupokat létrehozni kívánó felhasználók számára ez a korlátozás nem sokat számít.

Javítsa az építési időt

vannak módok a Midjourney AI képalkotási idő javítására vagy optimalizálására. Íme néhány tipp, amelyek segíthetnek:

  • Használjon konkrét és részletes utasításokat: A Midjourney a felhasználói utasítások alapján képeket generál. Minél pontosabb és részletesebb a felszólítás, annál jobb az eredmény. Lecsökkenti a kép létrehozásához szükséges időt is, mivel az AI algoritmus pontosabb képet alkot arról, hogy mit akar a felhasználó.
  • Kísérletezzen különböző minőségi beállításokkal: A –quality paraméter beállítja a kép minőségét és a létrehozásához szükséges időt. Az alacsonyabb minőségi beállítások gyorsabban készítik a képeket, míg a magasabb minőségi beállítások hosszabb időt vehetnek igénybe, de jobb eredményeket hoznak. Fontos, hogy kísérletezzen a különböző beállításokkal, hogy megtalálja a megfelelő egyensúlyt a minőség és a sebesség között.
  • Relax mód használata: A normál és a Pro előfizetők használhatják a Relax módot, amely nem kerül semmibe a felhasználó GPU-idejébe, de az eszköz használatának gyakorisága alapján sorba helyezi a feladatokat. A Relax mód várakozási ideje dinamikus, de jellemzően 0 és 10 perc között van feladatonként. A Relax mód használata jó módja lehet az építési idő optimalizálásának, különösen azoknak a felhasználóknak, akik havonta nagy számú képet készítenek.
  • Vásároljon többet Gyors órák: A gyors mód a legmagasabb prioritású feldolgozási szint, és a felhasználó előfizetéséből származó havi GPU-időt használja. A felhasználók további gyorsórákat vásárolhatnak a Midjourney.com/accounts oldalukon, ami segít a képeik gyors és hatékony létrehozásában.
  • A Fast Relax használata: A Fast Relax a Midjourney új funkciója, amely lehetővé teszi a felhasználók számára, hogy a minőség feláldozásával gyorsabban készítsenek képeket. A Fast Relax mód 60% körüli minőségű képeket készít, ami jó kompromisszum lehet azoknak a felhasználóknak, akik gyorsan szeretnének képeket generálni, de nem akarnak túl sokat feláldozni a minőségről.

Összefoglalva, többféleképpen lehet javítani vagy optimalizálni a Midjourney AI-képek elkészítési idejét, ideértve a specifikus promptokat, a különböző minőségi beállításokkal való kísérletezést, a Relax mód használatát vagy további gyors órák vásárlását, valamint a Fast Relax mód használatát.

Mennyire pontosak a Midjourney AI modellje által generált képek?

A Midjourney AI modellje által generált képek pontossága a felszólítástól és a képzési adatok minőségétől függően változhat. A felhasználók javíthatják a generált képek pontosságát, ha pontosak és részletesek lekérdezéseikben. Minél pontosabb és leíróbb a prompt, annál jobban tud az AI jó eredményeket produkálni. A Midjourney mesterséges intelligencia modelljét több millió képre és az internetről letöltött szöveges leírásra képezték ki, ami szintén befolyásolhatja a generált képek pontosságát.

A Midjourney mesterséges intelligencia modellje diffúziót használ, amely során zajt adnak a képhez, majd megfordítják a folyamatot az adatok lekéréséhez. Ez a folyamat a végtelenségig megismétlődik, aminek hatására a modell zajt ad hozzá, majd ismét eltávolítja azt, végül valósághű képeket hoz létre a kép kis eltéréseivel.

A Midjourney mesterséges intelligencia modellje stabil adatfolyamon alapul, amelyet 2,3 milliárd képpárra és szöveges leírásra tanítanak. A megfelelő szavak használatával a felhasználók szinte bármit létrehozhatnak, ami eszébe jut. Néhány szó azonban tilos, és a Midjourney listát vezet ezekről a szavakról, hogy megakadályozza, hogy rosszindulatú emberek üzeneteket hozzanak létre. A Midjourney Discord közössége elérhető, hogy élő segítséget és rengeteg példát nyújtson a felhasználóknak.

Meg kell jegyezni, hogy a Midjourney mesterséges intelligencia által generált képei viták tárgyát képezték a szerzői jogok megsértése és a művészi eredetiség tekintetében. Egyes művészek azzal vádolják Midjourney-t, hogy leértékeli az eredeti kreatív munkát, míg mások a koncepcióművészet gyors prototípus-készítésének eszközét látják benne, amelyet meg kell mutatni az ügyfeleknek, mielőtt elkezdenének dolgozni magukon.

Hogyan kezeli a Midjourney a szerzői jogok megsértésével és az AI által generált képek eredetiségével kapcsolatos aggályokat?

Midjourney: Szerzői jogok megsértése és az AI által generált képek eredetisége

A Midjourney lépéseket tett a szerzői jogok megsértésével és a mesterséges intelligencia által generált képek eredetiségével kapcsolatos aggályok kezelésére. A Midjourney gondosan ellenőriz minden felszólítást és minden képet, hogy megbizonyosodjon arról, hogy nincs-e szerzői jogi probléma, csak licencelt vagy nyilvános tartalmat használ, és további kutatásokat végez, vagy bizonytalanság esetén a jogos tulajdonos felhatalmazását kéri.

A Midjourney arra is ösztönzi a felhasználók felelősségét, hogy a szerzői jogi törvények tiszteletben tartására buzdítja őket, és csak olyan képeket és felszólításokat használnak, amelyek használatához jogukban áll. Ha a felhasználó megkérdőjelezi egy bejegyzés vagy kép forrását, a platform azonnali lépéseket tesz a jogsértő tartalom kivizsgálása és eltávolítása érdekében, az 1998-as Digital Millennium Copyright Act (DMCA) értelmében.

A DMCA védelmi rendelkezéseket biztosít az online szolgáltatók, például a Midjourney számára, akik jóhiszeműen járnak el a jogsértő tartalom eltávolítása érdekében, ha a szerzői jog tulajdonosa értesíti erről. A Midjourney rendelkezik egy DMCA eltávolítási szabályzattal is, amely lehetővé teszi az előadók számára, hogy kérjék munkáik eltávolítását a sorozatból, ha úgy vélik, hogy a szerzői jogok megsértése nyilvánvaló. [2][4].

A Midjourney megközelítése a jogsértés elkerülésére összhangban van a Legfelsőbb Bíróság eseteivel, mint például a Feist Publications, Inc. v. Rural Telephone Service Co., Inc. (1991), ahol a Bíróság megállapította, hogy az eredetiség, nem pedig az újdonság a szerzői jogi védelem alapvető követelménye, valamint az Oracle America, Inc. v. Google LLC (2018), ahol a Bíróság megállapította, hogy az eredeti mű másolása, még ha más célból is, továbbra is szerzői jogsértésnek tekinthető.

A Midjourney mesterséges intelligencia által generált képei vita tárgyát képezik a szerzői jogok megsértése és a művészi eredetiség miatt. Egyes művészek azzal vádolják Midjourney-t, hogy leértékeli az eredeti kreatív munkát, míg mások a koncepcióművészet gyors prototípus-készítésének eszközét látják benne, amelyet meg kell mutatni az ügyfeleknek, mielőtt elkezdenének dolgozni magukon. A Midjourney Általános Szerződési Feltételei tartalmazzák a DMCA eltávolítási szabályzatát, amely lehetővé teszi az előadók számára, hogy kérjék munkáik eltávolítását a készletből, ha úgy vélik, hogy megsértették a szerzői jogokat.

Hogyan biztosítja a Midjourney, hogy a mesterséges intelligencia által generált képek létrehozásához használt összes licencelt vagy köztulajdonban lévő tartalom megfelelően legyen hozzárendelve?

Nem világos, hogy a Midjourney hogyan biztosítja, hogy a mesterséges intelligencia által generált képek létrehozásához felhasznált összes licencelt vagy köztulajdonban lévő tartalom megfelelően legyen hozzárendelve. Mindazonáltal a Midjourney minden bejegyzést és képet gondosan ellenőriz, hogy megbizonyosodjon arról, hogy nincs-e szerzői jogi probléma, csak licencelt vagy nyilvános tartalmat használ, és további kutatásokat végez, vagy bizonytalanság esetén a jogos tulajdonos felhatalmazását kéri. 

A Midjourney arra is ösztönzi a felhasználók felelősségét, hogy a szerzői jogi törvények tiszteletben tartására buzdítja őket, és csak olyan képeket és felszólításokat használnak, amelyek használatához jogukban áll. Ha a felhasználó megkérdőjelezi egy bejegyzés vagy kép forrását, a platform azonnali lépéseket tesz a jogsértő tartalom kivizsgálása és eltávolítása érdekében, az 1998-as Digital Millennium Copyright Act (DMCA) értelmében. 

A Midjourney rendelkezik egy DMCA eltávolítási szabályzattal is, amely lehetővé teszi az előadók számára, hogy kérjék munkáik eltávolítását a sorozatból, ha úgy vélik, hogy nyilvánvaló szerzői jogsértés történt.

Meg kell jegyezni, hogy a Midjourney mesterséges intelligencia által generált képei viták tárgyát képezték a szerzői jogok megsértése és a művészi eredetiség tekintetében. Egyes művészek azzal vádolják Midjourney-t, hogy leértékeli az eredeti kreatív munkát, míg mások a koncepcióművészet gyors prototípus-készítésének eszközét látják benne, amelyet meg kell mutatni az ügyfeleknek, mielőtt elkezdenének dolgozni magukon.

Azok a szabályok, amelyeket a felhasználóknak be kell tartaniuk a Midjourney során

A Midjourney szabályokat hozott létre, amelyeket a felhasználóknak be kell tartaniuk, hogy mindenki számára barátságos és befogadó közösséget biztosítsanak. Ezek a szabályok a következők: [0][1][2] :

  • Legyen kedves és tisztelje másokat és a személyzetet. Ne hozzon létre képeket, és ne használjon olyan szöveges felszólításokat, amelyek természetüknél fogva tiszteletlenek, agresszívek vagy más módon sértőek. Semmiféle erőszak vagy zaklatás nem tolerálható.
  • Nincs felnőtt tartalom vagy véres jelenetek. Kérjük, kerülje a vizuálisan sértő vagy zavaró tartalmat. Egyes szöveges bejegyzések automatikusan blokkolva vannak.
  • Ne reprodukálja nyilvánosan mások alkotásait az engedélyük nélkül.
  • Ügyeljen a megosztásra. Alkotásait a Midjourney közösségen kívül is megoszthatja, de fontolja meg, hogy mások hogyan tekinthetik meg tartalmait.
  • E szabályok megsértése a szolgáltatásból való kizárást vonhatja maga után.
  • Ezek a szabályok minden tartalomra vonatkoznak, beleértve a privát szervereken, privát módban és a Midjourney Bottal küldött közvetlen üzenetekben készült képeket is.

A Midjourney tartalmaz egy listát a tiltott szavakról, amelyek nem megengedettek az üzenetekben. A tiltott szavak listája olyan szavakat tartalmaz, amelyek közvetlenül vagy közvetve kapcsolódnak az erőszakhoz, zaklatáshoz, vérzéshez, felnőtteknek szóló tartalomhoz, drogokhoz vagy gyűlöletbeszédhez. Ezenkívül nem engedélyezi az agressziót és erőszakot magában foglaló vagy azokhoz kapcsolódó felszólításokat.

Ha egy szó szerepel a tiltott szavak listáján, vagy ha szorosan vagy távoli kapcsolatban áll egy tiltott szóval, a Midjourney nem engedélyezi a felszólítást. A Midourney felhasználóknak a tiltott szavakat hasonló, de engedélyezett szavakra kell cserélniük, kerülniük kell a tiltott szavakhoz közeli vagy távoli rokonságban álló szavak használatát, vagy fontolóra kell venniük szinonimák vagy más megfogalmazások használatát.

Tiltott szavak a Midjourney-ben

A Midjourney olyan szűrőt implementált, amely automatikusan kiszűri és kitiltja a tiltott szavak listáján szereplő pontos vagy hasonló szavakat. A tiltott szavak listája olyan szavakat tartalmaz, amelyek közvetlenül vagy közvetve kapcsolódnak az erőszakhoz, a zaklatáshoz, a vérzéshez, a felnőtteknek szóló tartalomhoz, a drogokhoz vagy a gyűlöletkeltéshez. Ezenkívül nem engedélyezi az agressziót és visszaélést magukban foglaló vagy azokkal kapcsolatos felszólításokat.

A tiltott szavak listája nem feltétlenül teljes, és sok más kifejezés is lehet, amely még nem szerepel a listán. A Midjourney folyamatosan frissíti a tiltott szavak listáját. Ez a lista folyamatosan felülvizsgálat alatt áll, és nem nyilvános. Van azonban egy közösség által vezetett lista, amelyhez a felhasználók hozzáférhetnek és hozzájárulhatnak, ha akarnak. [0][1].

Ha egy szó szerepel a tiltott szavak listáján, vagy ha szorosan vagy távoli kapcsolatban áll egy tiltott szóval, a Midjourney nem engedélyezi a felszólítást. A Midjourney felhasználóknak le kell cserélniük a tiltott szavakat hasonló, de engedélyezett szavakra, kerülniük kell olyan szavak használatát, amelyek akár csak lazán is kapcsolódnak egy tiltott szóhoz, vagy fontolóra kell venniük szinonima vagy alternatív megfogalmazás használatát. A Midjourney felhasználóknak mindig ellenőrizniük kell a #rules csatornát az üzenet elküldése előtt, mivel a csapat folyamatosan frissíti a tiltott szavak listáját [2].

A Midjourney-nek van egy magatartási kódexe, amelyet a felhasználóknak követniük kell. A Magatartási Kódex nem csak a PG-13 tartalmának követéséről szól, hanem arról is, hogy kedvesek legyünk, tiszteljünk másokat és a személyzetet. A szabályok megsértése a szolgáltatás felfüggesztését vagy kitiltását vonhatja maga után. A Midjourney egy nyitott Discord közösség, és elengedhetetlen a magatartási kódex betartása. Még akkor is, ha a felhasználók „/privát” módban használják a szolgáltatást, tiszteletben kell tartaniuk a magatartási kódexet.

Összefoglalva, a Midjourney szigorú tartalommoderálási szabályzatot alkalmaz, és tiltja az erőszak vagy zaklatás minden formáját, a felnőtteknek szóló vagy véres tartalom, valamint a vizuálisan sértő vagy zavaró tartalmat. A Midjourney bevezetett egy szűrőt, amely automatikusan kiszűri és letiltja a pontos vagy hasonló szavakat a tiltott szólistáról, amely tartalmazza az erőszakkal, zaklatással, vérrel, felnőtteknek szóló tartalommal, droggal vagy gyűlöletkeltéssel közvetlenül vagy közvetve kapcsolatos szavakat. A Midjourney felhasználóknak be kell tartaniuk a magatartási kódexet, és üzenetük elküldése előtt ellenőrizniük kell a #rules csatornát, mivel a csapat folyamatosan frissíti a tiltott szavak listáját.

A tiltott szavak frissített listája

A Midjourney időszakonként módosítja a tiltott szavak listáját, és a lista folyamatos felülvizsgálat alatt áll. A tiltott szavak listája nem nyilvános, de van egy közösség által vezetett lista, amelyhez a felhasználók hozzáférhetnek és hozzájárulhatnak. A Midjourney arra törekszik, hogy a teljes Szolgáltatásban PG-13 élményt nyújtson, ezért tilos az erőszakkal, vérrel, zaklatással, drogokkal, felnőtteknek szóló tartalmakkal és általában sértő témákkal kapcsolatos szavak és tartalmak. A tiltott szavak listája több kategóriára oszlik, amelyek lefedik a fent említett témák spektrumát. Fontos megjegyezni, hogy a Midjourney tiltott szavak listája nem feltétlenül teljes, és sok más kifejezés is előfordulhat, amelyek még nem szerepelnek a listán.

A Midjourney betiltása és felfüggesztése

A Midjourney-nek szigorú magatartási kódexe van, amelyet a felhasználóknak követniük kell. A szabályok megsértése a szolgáltatás felfüggesztését vagy kitiltását vonhatja maga után. Nem világos azonban, hogy a felhasználók fellebbezhetnek-e a Midjourney programból való kitiltás vagy felfüggesztés ellen. A források nem említenek kifejezetten fellebbezési eljárást vagy azt, hogy hogyan lehet kapcsolatba lépni a Midjourney csapatával egy kitiltással vagy felfüggesztéssel kapcsolatban. Elengedhetetlen a magatartási kódex tiszteletben tartása a szolgáltatásból való kitiltás vagy felfüggesztés elkerülése érdekében. Ha a felhasználóknak a szolgáltatással kapcsolatos aggályai vagy kérdéseik vannak, felvehetik a kapcsolatot a Midjourney csapattal a Discord szerveren keresztül [1][2].

A Midjourney képes bizonyos méretű vagy felbontású képeket generálni?

A Midjourney speciális alapértelmezett képméretekkel és felbontásokkal rendelkezik, amelyeket a felhasználók generálhatnak. A Midjourney alapértelmezett képmérete 512x512 pixel, amely 1024x1024 képpontra vagy 1664x1664 pixelre növelhető a Discord /imagine paranccsal. Létezik egy „Beta Upscale Redo” nevű béta opció is, amely akár 2028x2028 pixelre is növelheti a képek méretét, de egyes részleteket elmoshat.

A felhasználók csak akkor skálázhatnak a maximális felbontásra, ha elvégezték a kép legalább alapszintű átméretezését [1]. A Midjourney maximális fájlmérete 3 megapixel, ami azt jelenti, hogy a felhasználók bármilyen képarányú képeket készíthetnek, de a végső képméret nem haladhatja meg a 3 000 000 pixelt. A Midjourney felbontása elegendő az alapvető fotónyomatokhoz, de ha a felhasználók valami nagyobbat szeretnének nyomtatni, akkor előfordulhat, hogy külső AI konvertert kell használniuk a jó eredmények eléréséhez.

Miben hasonlít a Midjourney más mesterséges intelligencia-képgenerátorokhoz, mint például a DALL-E és a Stable Diffusion?

A források szerint a Midjourney egy mesterséges intelligencia képgenerátor, amely szöveges promptokból művészi és álomszerű képeket állít elő. Összehasonlítják más generátorokkal, mint például a DALL-E és a Stable Diffusion. A Midjourney állítólag a stílusok korlátozottabb skáláját kínálja, mint a másik kettő, de a képei még mindig sötétebbek és művésziesebbek. Úgy tűnik, hogy a Midjourney nem illik a DALL-E-hez és a Stable Diffusion-hoz, ha a fotorealizmusról van szó [1][2].

A Stable Diffusion a Midjourney-vel és a DALL-E-vel hasonlítható össze, és állítólag valahol a kettő között van a könnyű használat és a kimenet minősége tekintetében. A Stable Diffusion több lehetőséget kínál, mint a DALL-E, például egy skálát annak meghatározására, hogy a generátor mennyire követi nyomon az útmutató szavakat, valamint a kimeneti formátumra és méretre vonatkozó lehetőségeket. A Stable Diffusion munkafolyamata azonban nem egyezik a DALL-E munkafolyamatával, amely képeket csoportosít és gyűjteménymappákat kínál. Állítólag a Stable Diffusion és a DALL-E ugyanazokkal a hiányosságokkal rendelkezik a fotorealizmus terén, mindkettő nem közelíti meg a Midjourney Discord webalkalmazást. [0].

Fabian Stelzer összehasonlító tesztje szerint a Midjourney mindig sötétebb, mint a DALL-E és a Stable Diffusion. Míg a DALL-E és a Stable Diffusion valósághűbb képeket generál, a Midjourney kínálata művészi, álomszerű minőséget képvisel. A Midjourney-t egy Moog analóg szintetizátorhoz hasonlítják, kellemes műtermékekkel, míg a DALL-E-t egy szélesebb hatótávolságú digitális munkaállomási szintetizátorhoz hasonlítják.

A Stable Diffusion egy összetett moduláris szintetizátorhoz hasonlítható, amely szinte bármilyen hangot képes produkálni, de nehezebb kiváltani. Ami a képfelbontást illeti, a Midjourney 1792x1024-es felbontásban képes képeket generálni, míg a DALL-E valamivel korlátozottabb 1024x1024-es felbontásban. Stelzer azonban megjegyzi, hogy a válasz arra, hogy melyik a legjobb generátor, teljesen szubjektív, és a személyes preferenciákon múlik.

A DALL-E fotorealisztikusabb képeket készít, még olyan képeket is, amelyek megkülönböztethetetlenek a fényképektől. Állítólag jobb megértéssel vagy tudatossággal rendelkezik, mint a többi AI-generátor. A Midjourney azonban nem fotorealisztikus képek készítésére szolgál, hanem álomszerű és művészi képek készítésére. Ezért a két generátor közötti választás végső soron a felhasználó igényeitől és preferenciáitól függ.

Hogyan befolyásolja a Midjourney korlátozott stílusválasztéka a használhatóságát a DALL-E-hez és a stabil streaminghez képest?

A források szerint a Midjourney korlátozott stílusválasztéka hatással lehet a használhatóságára a DALL-E-hez és a Stable Diffusion-hoz képest. A Midjourney képeit esztétikusabbnak tartják, de stílusválasztéka korlátozottabb, mint a DALL-E és a Stable Diffusion. A Midjourney stílusát álomszerűnek és művészinek írják le, míg a DALL-E arról ismert, hogy fotorealisztikusabb képeket készít, amelyek megkülönböztethetetlenek a fényképektől. 

A stabil diffúzió a könnyű használat és az eredmények minősége szempontjából valahol a kettő között van. A Stable Diffusion több lehetőséget kínál, mint a DALL-E, például egy skálát annak meghatározására, hogy a generátor mennyire követi a javasolt szavakat, valamint az eredmények formátumára és méretére vonatkozó lehetőségeket. A Midjourney-t egy analóg Moog szintetizátorhoz hasonlítják, kellemes műalkotásokkal, míg a DALL-E-t egy szélesebb hatótávolságú digitális munkaállomás-szintetizátorral. A Stable Diffusion egy összetett moduláris szintetizátorhoz hasonlítható, amely szinte bármilyen hangot képes előállítani, de nehezebb elindítani [1][2].

A DALL-E rugalmasabb, mint a Midjourney, és a vizuális stílusok szélesebb választékát kínálja. A DALL-E arra is alkalmas, hogy valósághű, "normál" fényképeket készítsen, amelyek jól mutatnak egy magazinban vagy egy vállalati weboldalon. A DALL-E olyan hatékony eszközöket is kínál, amelyekkel a Midjourney nem rendelkezik, mint például a festékfedés, a vágás és a különféle képfeltöltés, amelyek elengedhetetlenek az AI művészet ötletesebb felhasználásához.

A DALL-E modellje kevesebb véleménnyel rendelkezik, ami fogékonyabbá teszi a stílusjavaslatokat, különösen, ha ez a stílus kevésbé azonnali szép. Ezért a DALL-E nagyobb valószínűséggel ad pontos választ egy adott kérésre, mint például a pixel art. A DALL-E egy valódi webalkalmazást is kínál, amely lehetővé teszi a felhasználók számára, hogy közvetlenül a DALL-E-vel dolgozzanak, ami kevésbé zavaró lehet, mint a Discord telepítése.

A Midjourney-hez képest a Stable Diffusion állítólag teljesen ingyenes, így elérhetőbbé válik azok számára, akik nem engedhetik meg maguknak az AI képgenerátort. A Stable Diffusion azonban csak Discord botként érhető el, és a felhasználóknak jelentkezniük kell a hozzáféréshez. A Stable Diffusion elindítása is nehezebb, mint a Midjourney, amely könnyebben használható a választott képaránynak és a nyilvános galériának köszönhetően. A Midjourney az összes képről biztonsági másolatot készítő AutoArchive-ot és a mentett miniatűrök 2x2-es rácsát is kínálja, ami megkönnyíti a munka kezelését. A Midjourney Discord alkalmazás mobilon is jobban működik, mint a DALL-E webhelye, így könnyebben készíthet képeket útközben. A Midjourney egyedi stílusa ideálissá teszi nagyszámú, tetszetős kép gyors létrehozásához anélkül, hogy finomítani kellene az üzenetet.

Összefoglalva, minden mesterséges intelligencia-képgenerátornak megvannak a maga előnyei és hátrányai, és minden személynek eltérő preferenciái és igényei lehetnek. A Midjourney korlátozott stílusválasztéka hatással lehet a használhatóságára a DALL-E-hez és a Stable Diffusion-hoz képest, de egyedi stílusa ideálissá teszi álomszerű, művészi képek létrehozásához. A DALL-E rugalmasabb és ügyesebb a fotorealisztikus képek létrehozásában, míg a Stable Diffusion teljesen ingyenes, és több lehetőséget kínál, mint a DALL-E. Végső soron a generátorok közötti választás a felhasználó igényeitől és preferenciáitól függ.

Van-e szignifikáns különbség a három mesterséges intelligencia képgenerátor által kapott eredmények minőségében?

A források nem tesznek említést a három mesterséges intelligencia képgenerátor (Midjourney, DALL-E és Stable Diffusion) kimeneti minőségében tapasztalható szignifikáns különbségről. A források azonban megemlítik, hogy minden generátornak megvannak a maga erősségei és gyengeségei, és mindegyik jobban illeszkedik a különböző típusú képekhez vagy stílusokhoz. Például a Midjourney állítólag álomszerű és művészi képeket készít, míg a DALL-E fotorealisztikusabb képeket készít, amelyek megkülönböztethetetlenek a fényképektől. A Stable Diffusion a könnyű használat és az eredmények minősége tekintetében a kettő közé esik. Végső soron a generátorok közötti választás a felhasználó igényeitől és preferenciáitól függ.

Tippek a legjobb generátor kiválasztásához egy adott projekthez vagy alkalmazáshoz

A források szerint a legjobb AI képgenerátor kiválasztása egy adott projekthez vagy alkalmazáshoz a felhasználó igényeitől és preferenciáitól függ. A felhasználónak figyelembe kell vennie olyan tényezőket, mint a létrehozni kívánt képek típusa, a részletgazdagság és a valósághűség, amire szüksége van, a generátor könnyű használhatósága, az olyan funkciók elérhetősége, mint a festés, a különböző képek kivágása és feltöltése. , valamint a generátor költségét.

Ha a felhasználó álomszerű és művészi képeket szeretne létrehozni, a Midjourney a legjobb megoldás. Ha a felhasználó fotorealisztikus képeket szeretne készíteni, a DALL-E jobb választás. A Stable Diffusion a könnyű használat és az eredmények minősége tekintetében a kettő közé esik. A Stable Diffusion több lehetőséget kínál, mint a DALL-E, például egy skálát annak meghatározására, hogy a generátor mennyire követi az útmutató szavakat, valamint az eredmények formátumára és méretére vonatkozó lehetőségeket. A Stable Diffusion munkafolyamata azonban nem hasonlítható össze a DALL-E munkafolyamatával, amely képeket csoportosít és gyűjteménymappákat kínál.

A felhasználónak azt is mérlegelnie kell, hogy a generátor ingyenes vagy fizetős-e, és hogy elérhető-e webalkalmazásként vagy Discord botként. A Stable Diffusion teljesen ingyenes, és Discord botként érhető el, míg a Midjourney és a DALL-E fizetős és webalkalmazásként vagy Discord botként érhető el.

Végső soron a generátorok közötti választás a felhasználó igényeitől és preferenciáitól függ. A felhasználónak kutatnia kell és össze kell hasonlítania az egyes generátorok jellemzőit és kimeneti minőségét, mielőtt kiválasztaná az igényeinek leginkább megfelelőt.

Alternatívák a kurzus közepén.

Mint korábban említettük, a Midjourney egy népszerű mesterséges intelligencia képgenerátor, amely szöveges leírásokból képeket hoz létre. Azonban csak 25 perc ingyenes renderelési időt kínál, ami körülbelül 30 kép. Ha ingyenes alternatívát keres a Midjourney helyett, több lehetőséget is kipróbálhat.

Íme néhány ingyenes alternatíva a Midjourney számára:

  • zsírkréta : Ez egy ingyenes és nyílt forráskódú megoldás, amely jó alternatívát kínál a Midjourney számára.
  • DALL-E : Ez egy másik képgenerátor, amely hasonló a Midjourney-hoz, és ingyenesen elérhető. Az OpenAI készítette.
  • Jasper: Ez egy ingyenes és nyílt forráskódú képgenerátor, amely a Midjourney alternatívájaként használható.
  • Csoda : Ez egy ingyenes és nyílt forráskódú képgenerátor, amely a Midjourney alternatívájaként használható.
  • AI meghívása : Ez egy gyönyörűen megtervezett képgenerátor intuitív felülettel, amely a Midjourney alternatívájaként használható.
  • Disco Diffusion: Ez egy felhő alapú szöveg-kép konvertáló rendszer, amely könnyen használható, és a Midjourney alternatívájaként használható.

Ha valami konkrétabbat vagy személyre szabhatóat keres, a Stable Streaming (SD) jó választás lehet. [3]. Az SD azonban több erőfeszítést igényel a jó eredmények elérése érdekében, és nem olyan egyszerű használni, mint a Midjourney-t. Ezenkívül számos más ingyenes szöveg-kép konvertáló rendszer létezik, mint például a Wombo's Dream, a Hotpot's AI Art Maker, a SnowPixel, a CogView, a StarryAI, az ArtBreeder és az ArtFlow.

Összefoglalva, ha a Midjourney ingyenes alternatíváját keresi, számos lehetőség áll rendelkezésre, mint például a Craiyon, a DALL-E, a Jasper, a Wonder, az Invoke AI, a Disco Diffusion és a Stable Diffusion. Ezek a rendszerek különböző fokú testreszabást és egyszerű használatot kínálnak, ezért érdemes többfélét is kipróbálnia, és megtudni, melyik a legmegfelelőbb az Ön számára.

Ez a cikk a csapattal együttműködve készült Mély AI et Orgs.

[Teljes: 0 Átlagos: 0]

Írta Dieter B.

Az új technológiák iránt szenvedélyes újságíró. Dieter a Reviews szerkesztője. Korábban a Forbes írója volt.

Szólj hozzá

Az e-mail címed nem kerül nyilvánosságra. Kötelező kitölteni *

Mit gondolsz?