in ,

Midjourney: tot el que necessiteu saber sobre l'artista d'IA

Mitjà viatge: què és? Ús, limitacions i alternatives

Midjourney: tot el que necessiteu saber sobre l'artista d'IA
Midjourney: tot el que necessiteu saber sobre l'artista d'IA

Midjourney és un generador d'imatges d'IA que crea imatges a partir de descripcions de text. Aquest és un laboratori de recerca dirigit per David Holz, cofundador de Leap Motion. Midjourney ofereix un estil artístic més oníric a les vostres demandes i té un aspecte més gòtic en comparació amb altres generadors d'IA. Actualment, l'eina es troba en beta oberta i només es pot accedir mitjançant un bot de Discord al seu Discord oficial.

Per generar imatges, els usuaris utilitzen l'ordre /imagine i introdueixen un indicador i el bot retorna un conjunt de quatre imatges. Els usuaris poden triar quines imatges volen escalar. Midjourney també està treballant en una interfície web.

El fundador David Holz veu els artistes com a clients de Midjourney, no com a competidors. Els artistes utilitzen Midjourney per crear prototips ràpids d'art conceptual que presenten als seus clients abans de començar a treballar pel seu compte. Com que totes les alineacions de Midjourney poden incloure obres amb drets d'autor d'artistes, alguns artistes han acusat Midjourney de devaluar el treball creatiu original.

Les Condicions del servei de Midjourney inclouen una política de retirada de la DMCA, que permet als artistes sol·licitar que les seves obres siguin retirades del plató, si creuen que la infracció dels drets d'autor és evident. El sector de la publicitat també ha adoptat eines d'IA com Midjourney, DALL-E i Stable Diffusion, entre d'altres, que permeten als anunciants crear contingut original i tenir idees ràpidament.

Midjourney ha estat utilitzat per diverses persones i empreses per crear imatges i obres d'art, com ara The Economist i Corriere della Sera. No obstant això, Midjourney ha rebut crítiques per part d'alguns artistes que consideren que està prenent feina als artistes i infringint els seus drets d'autor. Midjourney també va ser objecte d'una demanda presentada per un equip d'artistes per infracció dels drets d'autor.

Per començar a utilitzar Midjourney, els usuaris han d'iniciar sessió a Discord i dirigir-se al lloc web de Midjourney per unir-se a la versió beta. Un cop acceptats, els usuaris rebran una invitació a Discord Midjourney i poden començar a generar imatges escrivint /imagine seguit de la indicació desitjada.

Midjourney no ha revelat gaire informació sobre els seus antecedents i formació, però s'especula que utilitza un sistema similar al Dall-E 2 i Stable Diffusion, rascant imatges i text d'Internet per descriure'ls, utilitzant milions d'imatges publicades per a la formació. .

El procés utilitzat per Midjourney per generar imatges a partir d'indicacions de text

Midjourney utilitza un model d'IA de text a imatge per generar imatges a partir d'indicacions de text. El bot Midjourney desglossa les paraules i les frases d'una indicació en peces més petites, anomenades fitxes, que es poden comparar amb les seves dades d'entrenament i després utilitzar-les per generar una imatge. Un missatge ben dissenyat pot ajudar a crear imatges úniques i emocionants [0].

Per generar una imatge amb Midjourney, els usuaris han d'escriure una descripció de com volen que sembli la imatge mitjançant l'ordre "/imagine" al canal Midjourney Discord. Com més específic i descriptiu sigui el missatge, més la IA serà capaç de produir bons resultats. A continuació, Midjourney crearà diverses versions diferents de la imatge segons la indicació en un minut. Els usuaris poden optar per obtenir versions alternatives de qualsevol d'aquestes imatges o ampliar qualsevol d'elles per obtenir una imatge més gran i de més qualitat. Midjourney ofereix modes ràpids i relaxats, i el mode ràpid és necessari per aconseguir la màxima ampliació i produir més imatges en menys temps.

El model d'IA de Midjourney utilitza la difusió, que implica afegir soroll a una imatge i després invertir el procés per recuperar les dades. Aquest procés es repeteix sense parar, fent que el model afegeix soroll i després l'elimini de nou, creant finalment imatges realistes fent petites variacions a la imatge. Midjourney va buscar a Internet imatges i text per descriure-les, utilitzant milions d'imatges d'entrenament publicades.

El model d'IA de Midjourney es basa en una transmissió estable, que s'entrena en 2,3 milions de parells d'imatges i descripcions de text. Mitjançant l'ús de les paraules adequades a l'indicador, els usuaris poden crear gairebé qualsevol cosa que se us passi al cap. No obstant això, algunes paraules estan prohibides i Midjourney manté una llista d'aquestes paraules per evitar que persones malintencionades creïn indicacions. La comunitat Discord de Midjourney està disponible per proporcionar ajuda en directe i molts exemples per als usuaris.

Ús i generació d'imatges

Per utilitzar Midjourney AI de manera gratuïta, heu de tenir un compte de Discord. Si no en tens cap, registra't gratuïtament a Discord. A continuació, visiteu el lloc web de Midjourney i seleccioneu Uniu-vos a la beta. Això us portarà a una invitació de Discord. Accepta la invitació de Discord a Midjourney i tria Continuar amb Discord. 

La vostra aplicació Discord s'obrirà automàticament i podeu seleccionar la icona Midjourney en forma de vaixell al menú de l'esquerra. Als canals Midjourney, localitzeu les sales de nouvinguts i seleccioneu-ne una per començar. Quan estigueu preparat, escriviu "/imagine" al xat de Discord per a la vostra sala de nouvinguts. 

Això crearà un camp d'indicació on podeu introduir la descripció de la imatge. Com més específic siguis a la teva descripció, millor serà la IA capaç de produir bons resultats. Sigueu descriptius i, si busqueu un estil en particular, incloeu-lo a la vostra descripció. Midjourney ofereix a cada usuari 25 intents per jugar amb l'IA. 

Després d'això, haureu de registrar-vos com a membre de ple dret per continuar. Si prefereixes no gastar diners, és una bona idea dedicar-te una estona i pensar què vols crear a Midjourney. 

Si voleu, podeu escriure "/help" per obtenir una llista de consells a seguir. És essencial conèixer la llista de paraules prohibides abans d'utilitzar Midjourney AI, ja que l'incompliment del codi de conducta comportarà una prohibició.

>> Llegeix també - 27 millors llocs web gratuïts d'intel·ligència artificial (disseny, redacció, xat, etc.)

/imagina l'ordre

L'ordre /imagine és una de les ordres principals de Midjourney que permet als usuaris generar imatges generades per IA en funció de les seves demandes. Així és com funciona:

  1. Els usuaris escriuen l'ordre /imagine al xat de Discord i afegeixen la configuració que volen utilitzar.
  2. L'algoritme Midjourney AI analitza la indicació i genera una imatge basada en l'entrada.
  3. La imatge generada es mostra al xat de Discord i els usuaris poden proporcionar comentaris i refinar els seus missatges mitjançant la funció Remix.
  4. Els usuaris també poden utilitzar paràmetres addicionals per ajustar l'estil, la versió i altres aspectes de la imatge generada.

L'ordre /imagine accepta tant les indicacions d'imatge com de text. Els usuaris poden afegir indicacions com a imatges proporcionant un URL o un fitxer adjunt per a les imatges que volen generar. Les sol·licituds de text poden incloure descripcions de la imatge que els usuaris volen generar, com ara objectes, fons i estils. Els usuaris també poden afegir paràmetres addicionals a l'ordre per ajustar la versió de l'algorisme que volen utilitzar, habilitar la funció Remix, etc.

Exemples dels tipus d'imatges que Midjourney AI pot crear

Midjourney AI pot crear una àmplia gamma d'imatges en diferents estils, inclosos, entre d'altres:

  • Il·lustracions per a llibres infantils, com l'exemple d'"Aventura d'un porquet".
  • Retrats realistes de persones, animals i objectes.
  • Obres d'art surrealistes i abstractes que barregen diferents elements i estils.
  • Paisatges i paisatges urbans que poden evocar diferents estats d'ànim i emocions.
  • Fotografia en blanc i negre amb detalls complexos i efectes cinematogràfics.
  • Imatges que il·lustren temes futuristes o de ciència-ficció, com l'exemple d'una dona gran feta mig de peces robòtiques i que porta una màscara de gas.

És important tenir en compte que la qualitat i l'estil de les imatges generades per Midjourney AI poden variar en funció de la qualitat de les indicacions, la versió de l'algorisme utilitzat i altres factors. Els usuaris haurien d'experimentar amb diferents indicacions i configuracions per obtenir els resultats desitjats.

Combina imatges a Midjourney

Per combinar dues o més imatges a Midjourney, podeu seguir aquests passos:

  1. Trieu les imatges que voleu combinar i pengeu-les a Discord.
  2. Copieu els enllaços a les imatges i afegiu-los al vostre indicador /imagine com a indicacions d'imatge.
  3. Afegiu "-v 4" al vostre indicador si la versió 4 no està activada per defecte.
  4. Envieu l'ordre i espereu que es generi la imatge.

Per exemple, per combinar dues imatges, podeu utilitzar l'ordre següent: /imagine -v 1

També podeu afegir informació addicional, com ara objectes, fons i estil d'art general, per crear una imatge completament nova amb el seu propi estil. Per exemple: /imagina , estil de dibuixos animats, multitud alegre al fons, logotip de Tesla al pit, -no vestit -v 1

Midjourney també va llançar una nova funció, l'ordre /blend, que permet fusionar fins a cinc imatges sense haver de copiar i enganxar URL. Podeu habilitar l'ordre /blend si inclou el senyalador –blend al vostre indicador.

És important tenir en compte que aquesta funció només funciona amb la versió 4 de l'algorisme Midjourney, i la combinació d'imatges no requereix text addicional, però afegir informació normalment dóna com a resultat millors imatges. Normalment, els millors resultats s'aconsegueixen experimentant amb estils artístics i ajustant imatges amb el mode Remix.

Combina més de dues imatges

Midjourney permet als usuaris combinar fins a cinc imatges mitjançant l'ordre /blend. Tanmateix, si els usuaris necessiten combinar més de cinc imatges, poden utilitzar l'ordre /imagine i enganxar els URL de les imatges públiques en una fila. Per combinar més de dues imatges mitjançant l'ordre /imagine, els usuaris poden afegir indicacions a l'ordre. Per exemple, per combinar tres imatges, l'ordre seria /imagine -v 1.

Els usuaris poden afegir més indicacions d'ordres per combinar més imatges. És important tenir en compte que afegir informació addicional a l'indicador, com ara objectes, fons i estil d'art general, pot ajudar a crear una imatge completament nova amb el seu propi estil. Els millors resultats s'aconsegueixen experimentant amb estils artístics i ajustant imatges amb el mode Remix

Comandament/mescla a Midjourney

L'ordre /blend de Midjourney permet als usuaris combinar fins a cinc imatges afegint elements d'IU fàcils d'utilitzar directament a la interfície de Discord. Els usuaris poden arrossegar i deixar anar imatges a la interfície o seleccionar-les directament des del seu disc dur. Els usuaris també poden triar les dimensions de la imatge que volen veure generada. Si els usuaris utilitzen sufixos personalitzats, poden afegir-los opcionalment al final de l'ordre, com amb qualsevol ordre normal /imagine.

L'equip de Midjourney va dissenyar l'ordre /blend per examinar eficaçment els "conceptes" i l'"estat d'ànim" de les imatges dels usuaris i intentar combinar-les. Això de vegades resulta en imatges sorprenentment atractives i, en altres casos, els usuaris acaben amb imatges horroroses. Tanmateix, l'ordre /blend no admet sol·licituds de text.

L'ordre /blend té limitacions. El més evident és que els usuaris només poden afegir cinc referències d'imatges diferents. Tot i que l'ordre /imagine accepta tècnicament més de cinc imatges, com més referències afegeixen els usuaris, menys important és cadascuna. Aquest és un problema general amb la dilució del problema i no un problema específic de /blend. L'altra limitació important és que l'ordre de combinació Midjourney no funciona amb sol·licituds de text. Això pot ser lamentable per als usuaris avançats que poques vegades només barregen dues imatges. Tanmateix, per als usuaris que busquen crear mashups, aquesta limitació no té gaire importància.

Millora el temps de construcció

hi ha maneres de millorar o optimitzar el temps de generació per a la creació d'imatges mitjançant Midjourney AI. Aquí teniu alguns consells que us poden ajudar:

  • Utilitzeu indicacions específiques i detallades: Midjourney genera imatges basades en les indicacions de l'usuari. Com més específic i detallat sigui el missatge, millors són els resultats. També redueix el temps que triga a generar una imatge, ja que l'algoritme d'IA té una idea més precisa del que vol l'usuari.
  • Experimenta amb diferents paràmetres de qualitat: el paràmetre –quality ajusta la qualitat de la imatge i el temps que triga a generar-la. Els paràmetres de qualitat més baixa produeixen imatges més ràpidament, mentre que els paràmetres de qualitat més alta poden trigar més, però donar millors resultats. És important experimentar amb diferents configuracions per trobar l'equilibri adequat entre qualitat i velocitat.
  • Utilitzeu el mode Relax: els subscriptors del pla estàndard i Pro poden utilitzar el mode Relax, que no costa res pel temps de la GPU de l'usuari, però col·loca els treballs en una cua en funció de la freqüència amb què s'utilitza el dispositiu. Els temps d'espera per al mode Relax són dinàmics, però solen ser d'entre 0 i 10 minuts per tasca. L'ús del mode Relax pot ser una bona manera d'optimitzar el temps de creació, especialment per als usuaris que generen un gran nombre d'imatges cada mes.
  • Compra més hores ràpides: el mode ràpid és el nivell de processament de màxima prioritat i utilitza el temps mensual de la GPU de la subscripció de l'usuari. Els usuaris poden comprar més hores ràpides a la seva pàgina Midjourney.com/accounts, la qual cosa ajuda a garantir que les seves imatges es generin de manera ràpida i eficient.
  • Utilitzeu Fast Relax: Fast Relax és una nova característica de Midjourney que permet als usuaris generar imatges més ràpidament sacrificant una mica de qualitat. El mode Fast Relax genera imatges amb una qualitat al voltant del 60%, que pot ser un bon compromís per als usuaris que volen generar imatges ràpidament però no volen sacrificar massa qualitat.

En resum, hi ha diverses maneres de millorar o optimitzar el temps de creació per crear imatges de Midjourney AI, com ara l'ús d'indicacions específiques, l'experimentació amb diferents paràmetres de qualitat, l'ús del mode Relax o la compra d'hores més ràpides i l'ús del mode Fast Relax.

Quina precisió són les imatges generades pel model d'IA de Midjourney?

La precisió de les imatges generades pel model d'IA de Midjourney pot variar en funció de la sol·licitud i de la qualitat de les dades d'entrenament. Els usuaris poden millorar la precisió de les imatges generades sent específics i detallats en les seves consultes. Com més específic i descriptiu sigui el missatge, millor serà la IA capaç de produir bons resultats. El model d'IA de Midjourney es va entrenar amb milions d'imatges i descripcions de text recuperades d'Internet, que també poden afectar la precisió de les imatges generades.

El model d'IA de Midjourney utilitza la difusió, que implica afegir soroll a una imatge i després invertir el procés per recuperar les dades. Aquest procés es repeteix sense parar, fent que el model afegeix soroll i després l'elimini de nou, creant finalment imatges realistes fent petites variacions a la imatge.

El model d'IA de Midjourney es basa en una transmissió estable, que s'entrena en 2,3 milions de parells d'imatges i descripcions de text. Mitjançant l'ús de les paraules adequades a l'indicador, els usuaris poden crear gairebé qualsevol cosa que se us passi al cap. No obstant això, algunes paraules estan prohibides i Midjourney manté una llista d'aquestes paraules per evitar que persones malintencionades creïn indicacions. La comunitat Discord de Midjourney està disponible per proporcionar ajuda en directe i molts exemples per als usuaris.

Cal tenir en compte que les imatges de Midjourney generades per IA han estat objecte de controvèrsia pel que fa a la infracció dels drets d'autor i l'originalitat artística. Alguns artistes han acusat Midjourney de devaluar el treball creatiu original, mentre que d'altres ho veuen com una eina per a la creació de prototips ràpids d'art conceptual per mostrar als clients abans que comencin a treballar en ells mateixos.

Com aborda Midjourney les preocupacions sobre la infracció dels drets d'autor i l'originalitat de les imatges generades amb IA?

Midjourney: infracció dels drets d'autor i originalitat de les imatges generades amb IA

Midjourney ha pres mesures per resoldre les preocupacions sobre la infracció dels drets d'autor i l'originalitat de les imatges generades amb IA. Midjourney comprova acuradament cada indicació i cada imatge per assegurar-se que no hi ha problemes de drets d'autor, utilitzant només contingut amb llicència o de domini públic i fent investigacions addicionals o demanant l'autorització del propietari legítim en cas d'incertesa.

Midjourney també fomenta la responsabilitat dels seus usuaris, instant-los a respectar les lleis de drets d'autor i a utilitzar només imatges i indicacions que tenen dret a utilitzar. Si un usuari qüestiona l'origen d'una publicació o una imatge, la plataforma pren mesures ràpides per investigar i eliminar qualsevol contingut infractor, d'acord amb la Digital Millennium Copyright Act (DMCA) de 1998.

La DMCA ofereix disposicions de protecció per als proveïdors de serveis en línia, com ara Midjourney, que actuen de bona fe per eliminar el contingut infractor quan ho notifiquen un titular dels drets d'autor. Midjourney també té una política de retirada de la DMCA que permet als artistes sol·licitar que la seva obra sigui retirada del plató si creuen que la infracció dels drets d'autor és evident. [2][4].

L'enfocament de Midjourney per evitar la infracció és coherent amb casos de la Cort Suprema com Feist Publications, Inc. v. Rural Telephone Service Co., Inc. (1991), on el Tribunal va considerar que l'originalitat, no la novetat, és el requisit essencial per a la protecció dels drets d'autor, i Oracle America, Inc. v. Google LLC (2018), on el Tribunal va considerar que copiar una obra original, fins i tot amb un propòsit diferent, encara es pot considerar una infracció dels drets d'autor.

Les imatges generades per IA de Midjourney han estat objecte de controvèrsia per la infracció dels drets d'autor i l'originalitat artística. Alguns artistes han acusat Midjourney de devaluar el treball creatiu original, mentre que d'altres ho veuen com una eina per a l'art conceptual de prototipatge ràpid per mostrar als clients abans que comencin a treballar en ells mateixos. Les Condicions del servei de Midjourney inclouen una política de retirada de la DMCA, que permet als artistes sol·licitar que la seva obra sigui retirada del conjunt si creuen que hi ha una infracció dels drets d'autor.

Com s'assegura Midjourney que tot el contingut amb llicència o de domini públic utilitzat per crear imatges generades amb IA s'atribueix correctament?

No està clar com Midjourney garanteix que tot el contingut amb llicència o de domini públic utilitzat per crear les imatges generades per IA s'atribueixi correctament. Tanmateix, Midjourney comprova acuradament cada publicació i imatge per assegurar-se que no hi ha problemes de drets d'autor, utilitzant només contingut amb llicència o de domini públic i realitzant investigacions addicionals o demanant l'autorització del propietari legítim en cas d'incertesa. 

Midjourney també fomenta la responsabilitat dels seus usuaris, instant-los a respectar les lleis de drets d'autor i a utilitzar només imatges i indicacions que tenen dret a utilitzar. Si un usuari qüestiona l'origen d'una publicació o una imatge, la plataforma pren mesures ràpides per investigar i eliminar qualsevol contingut infractor, d'acord amb la Digital Millennium Copyright Act (DMCA) de 1998. 

Midjourney també té una política de retirada DMCA, que permet als artistes sol·licitar que la seva obra sigui retirada de la sèrie si creuen que hi ha una infracció clara dels drets d'autor.

Cal tenir en compte que les imatges de Midjourney generades per IA han estat objecte de controvèrsia pel que fa a la infracció dels drets d'autor i l'originalitat artística. Alguns artistes han acusat Midjourney de devaluar el treball creatiu original, mentre que d'altres ho veuen com una eina per a la creació de prototips ràpids d'art conceptual per mostrar als clients abans que comencin a treballar en ells mateixos.

Les normes que els usuaris han de respectar a Midjourney

Midjourney ha establert un conjunt de normes que els usuaris han de seguir per garantir una comunitat acollidora i inclusiva per a tothom. Aquestes regles són les següents: [0][1][2] :

  • Sigues amable i respecta els altres i el personal. No creeu imatges ni utilitzeu indicacions de text que siguin inherentment irrespectuosos, agressius o abusius d'una altra manera. No es tolerarà la violència ni l'assetjament de cap mena.
  • Sense contingut per a adults ni escenes sagnants. Si us plau, eviteu contingut visualment ofensiu o molest. Algunes entrades de text es bloquegen automàticament.
  • No reproduïu públicament les creacions d'altres persones sense el seu permís.
  • Presta atenció a compartir. Pots compartir les teves creacions fora de la comunitat Midjourney, però considera com els altres poden veure el teu contingut.
  • Qualsevol infracció d'aquestes normes pot comportar l'exclusió del servei.
  • Aquestes regles s'apliquen a tot el contingut, incloses les imatges fetes en servidors privats, en mode privat i en missatges directes amb el bot Midjourney.

Midjourney també té una llista de paraules prohibides que no es permeten als missatges. La llista de paraules prohibides inclou paraules directament o indirectament relacionades amb violència, assetjament, sang, contingut per a adults, drogues o discurs d'odi. A més, no permet indicacions que incloguin o estiguin relacionades amb l'agressió i la violència.

Si una paraula es troba a la llista de paraules prohibides o si està estreta o remotament relacionada amb una paraula prohibida, Midjourney no permetrà la sol·licitud. Els usuaris de mig viatge haurien de substituir paraules prohibides per paraules semblants però permeses, evitar utilitzar paraules que estiguin estretament o remotament relacionades amb paraules prohibides, o considerar l'ús d'un sinònim o una altra paraula.

Paraules prohibides a mig viatge

Midjourney ha implementat un filtre que filtra i prohibeix automàticament les paraules exactes o similars a la llista de paraules prohibides. La llista de paraules prohibides inclou paraules que estan directament o indirectament relacionades amb la violència, l'assetjament, la sang, el contingut per a adults, les drogues o la incitació a l'odi. A més, no permet indicacions que incloguin o estiguin relacionades amb l'agressió i l'abús.

La llista de paraules prohibides no és necessàriament exhaustiva, i pot ser que hi hagi molts altres termes que encara no estiguin a la llista. Midjourney actualitza constantment la llista de paraules prohibides. Aquesta llista està en constant revisió i no és pública. Tanmateix, hi ha una llista gestionada per la comunitat a la qual els usuaris poden accedir i contribuir si ho desitgen. [0][1].

Si una paraula es troba a la llista de paraules prohibides o si està estreta o remotament relacionada amb una paraula prohibida, Midjourney no permetrà la sol·licitud. Els usuaris de mig viatge haurien de substituir les paraules prohibides per paraules similars però permeses, evitar utilitzar una paraula que fins i tot estigui vagament relacionada amb una paraula prohibida o considerar l'ús d'un sinònim o una paraula alternativa. Els usuaris de mig viatge sempre haurien de comprovar el canal #rules abans d'enviar el seu missatge, ja que l'equip està actualitzant constantment la llista de paraules prohibides. [2].

Midjourney té un codi de conducta que els usuaris han de seguir. El Codi de Conducta no només consisteix en seguir el contingut del PG-13, sinó també en ser amable i respectar els altres i el personal. L'incompliment de les normes pot comportar la suspensió o l'exclusió del servei. Midjourney és una comunitat de Discord oberta i seguir el codi de conducta és essencial. Encara que els usuaris utilitzin el servei en mode '/privat', han de respectar el codi de conducta.

En conclusió, Midjourney aplica una estricta política de moderació de contingut i prohibeix qualsevol forma de violència o assetjament, qualsevol contingut per a adults o gore, així com qualsevol contingut visualment ofensiu o pertorbador. Midjourney ha implementat un filtre que filtra i prohibeix automàticament les paraules exactes o similars a la llista de paraules prohibides, que inclou paraules directament o indirectament relacionades amb violència, assetjament, sang, contingut per a adults, drogues o incitació a l'odi. Els usuaris de Midjourney han de complir el codi de conducta i consultar el canal #regles abans d'enviar el seu missatge, ja que l'equip està constantment actualitzant la llista de paraules prohibides.

Llista actualitzada de paraules prohibides

Midjourney ajusta periòdicament la llista de paraules prohibides i la llista està en constant revisió. La llista de paraules prohibides no és pública, però hi ha una llista gestionada per la comunitat a la qual els usuaris poden accedir i a la qual poden contribuir. Midjourney s'esforça per oferir una experiència PG-13 a tot el seu Servei, per això es prohibeixen les paraules i continguts relacionats amb violència, gore, assetjament, drogues, contingut per a adults i temes generalment ofensius. La llista de paraules prohibides es divideix en diverses categories que cobreixen l'espectre de temes esmentats anteriorment. És important tenir en compte que la llista de paraules prohibides a Midjourney no és necessàriament exhaustiva i que pot haver-hi molts altres termes que encara no estan a la llista.

Prohibició i suspensió del mig viatge

Midjourney té un codi de conducta estricte que els usuaris han de seguir. L'incompliment de les normes pot comportar la suspensió o l'exclusió del servei. Tanmateix, no està clar si els usuaris poden apel·lar una prohibició o una suspensió de Midjourney. Les fonts no mencionen explícitament un procés d'apel·lació ni com contactar amb l'equip de Midjourney sobre una prohibició o suspensió. És fonamental respectar el codi de conducta per evitar ser prohibit o suspès del servei. Si els usuaris tenen dubtes o preguntes sobre el servei, poden contactar amb l'equip de Midjourney a través del seu servidor de Discord [1][2].

Pot Midjourney generar imatges en mides o resolucions específiques?

Midjourney té mides i resolucions d'imatge predeterminades específiques que els usuaris poden generar. La mida de la imatge predeterminada per a Midjourney és de 512 x 512 píxels, que es pot augmentar a 1024 x 1024 píxels o 1664 x 1664 píxels mitjançant l'ordre /imagine a Discord. També hi ha una opció beta anomenada "Beta Upscale Redo", que pot augmentar la mida de les imatges fins a 2028x2028 píxels, però pot desenfocar alguns detalls.

Els usuaris només poden escalar a la màxima resolució després de fer almenys l'escalat bàsic d'una imatge [1]. La mida màxima del fitxer que pot generar Midjourney és de 3 megapíxels, la qual cosa significa que els usuaris poden crear imatges amb qualsevol relació d'aspecte, però la mida final de la imatge no pot superar els 3 de píxels. La resolució de Midjourney és suficient per a impressions fotogràfiques bàsiques, però si els usuaris volen imprimir alguna cosa més gran, potser hauran d'utilitzar un convertidor d'IA extern per obtenir bons resultats.

Com es compara Midjourney amb altres generadors d'imatges d'IA com DALL-E i Stable Diffusion?

Segons les fonts, Midjourney és un generador d'imatges d'IA que produeix imatges artístiques i oníriques a partir d'indicacions de text. Es compara amb altres generadors com DALL-E i Stable Diffusion. Midjourney ofereix una gamma d'estils més limitada que els altres dos, però les seves imatges encara són més fosques i més artístiques. Midjourney no sembla coincidir amb DALL-E i Stable Diffusion quan es tracta de fotorealisme [1][2].

Stable Diffusion es compara amb Midjourney i DALL-E, i es diu que està a un punt intermedi pel que fa a la facilitat d'ús i la qualitat de la sortida. Stable Diffusion ofereix més opcions que DALL-E, com ara una escala per determinar fins a quin punt el generador fa un seguiment de les paraules guia i opcions pel que fa al format i la mida de la sortida. Tanmateix, el flux de treball de Stable Diffusion no coincideix amb el de DALL-E, que agrupa imatges i ofereix carpetes de col·lecció. Es diu que Stable Diffusion i DALL-E tenen les mateixes deficiències pel que fa al fotorealisme, tots dos no s'acosten a l'aplicació web Discord de Midjourney. [0].

Segons una prova comparativa de Fabian Stelzer, Midjourney és sempre més fosc que DALL-E i Stable Diffusion. Mentre que DALL-E i Stable Diffusion generen imatges més realistes, les ofertes de Midjourney tenen una qualitat artística i onírica. Midjourney es compara amb un sintetitzador analògic Moog, amb artefactes agradables, mentre que DALL-E es compara amb un sintetitzador d'estació de treball digital amb una gamma més àmplia.

Stable Diffusion es compara amb un sintetitzador modular complex que pot produir gairebé qualsevol so, però és més difícil d'activar. Pel que fa a la resolució d'imatge, Midjourney pot generar imatges amb una resolució de 1792x1024, mentre que DALL-E és una mica més limitat a 1024x1024. Tanmateix, Stelzer assenyala que la resposta a quin és el millor generador és totalment subjectiva i es redueix a les preferències personals.

Se sap que DALL-E produeix imatges més fotorealistes, fins i tot imatges que no es poden distingir de les fotos. Es diu que té una millor comprensió o consciència que altres generadors d'IA. Tanmateix, Midjourney no està dissenyat per produir imatges fotorealistes, sinó per produir imatges oníriques i artístiques. Per tant, l'elecció entre els dos generadors depèn en última instància de les necessitats i preferències de l'usuari.

Com afecta la gamma limitada d'estils de Midjourney a la seva usabilitat en comparació amb DALL-E i la transmissió estable?

Segons les fonts, la gamma limitada d'estils de Midjourney pot afectar la seva usabilitat en comparació amb DALL-E i Stable Diffusion. Les imatges de Midjourney es consideren més estèticament agradables, però la seva gamma d'estils és més limitada que la de DALL-E i Stable Diffusion. L'estil de Midjourney es descriu com a oníric i artístic, mentre que DALL-E és conegut per produir imatges més fotorealistes que no es poden distingir de les fotos. 

La difusió estable es troba en un punt intermedi pel que fa a la facilitat d'ús i la qualitat dels resultats. Stable Diffusion ofereix més opcions que DALL-E, com ara una escala per determinar fins a quin punt el generador segueix les paraules suggerides, així com opcions pel que fa al format i la mida dels resultats. Midjourney es compara amb un sintetitzador Moog analògic, amb artefactes agradables, mentre que DALL-E es compara amb un sintetitzador d'estació de treball digital amb una gamma més àmplia. Stable Diffusion es compara amb un sintetitzador modular complex que pot produir gairebé qualsevol so, però és més difícil d'activar. [1][2].

Es diu que DALL-E és més flexible que Midjourney, capaç d'oferir una varietat més àmplia d'estils visuals. DALL-E també és millor per crear fotografies realistes i "normals" que quedarien molt bé en una revista o en un lloc web corporatiu. DALL-E també ofereix eines potents que Midjourney no té, com ara la superposició de pintura, el retall i la càrrega d'imatges diverses, que són essencials per a usos més inventius de l'art d'IA.

El model de DALL-E té menys opinions, la qual cosa el fa més receptiu als suggeriments d'estil, sobretot si aquest estil és menys bonic immediatament. Per tant, és més probable que DALL-E proporcioni una reacció precisa a una sol·licitud específica, com ara pixel art. DALL-E també ofereix una aplicació web real, que permet als usuaris treballar directament amb DALL-E, cosa que pot ser menys confús que instal·lar Discord.

En comparació amb Midjourney, se suposa que Stable Diffusion és completament gratuïta, cosa que la fa més accessible per a aquells que no es poden permetre un generador d'imatges d'IA. Tanmateix, Stable Diffusion només està disponible com a bot de Discord i els usuaris han de sol·licitar-hi accedir. Stable Diffusion també es considera més difícil de llançar que Midjourney, que és més fàcil d'utilitzar gràcies a la seva elecció de relació d'aspecte i galeria pública. Midjourney també ofereix AutoArchive, que fa una còpia de seguretat de totes les imatges, i una graella de 2x2 de miniatures desades, cosa que facilita la gestió del treball. L'aplicació Discord de Midjourney també funciona millor al mòbil que al lloc web de DALL-E, cosa que facilita la generació d'imatges en moviment. L'estil únic de Midjourney el fa ideal per generar ràpidament un gran nombre d'imatges agradables, sense necessitat de refinar el missatge.

En conclusió, cada generador d'imatges d'IA té els seus propis avantatges i desavantatges, i cada persona pot tenir preferències i necessitats diferents. La gamma limitada d'estils de Midjourney pot afectar la seva usabilitat en comparació amb DALL-E i Stable Diffusion, però el seu estil únic el fa ideal per generar imatges artístiques oníriques. DALL-E és més flexible i habilitat per crear imatges fotorealistes, mentre que Stable Diffusion és completament gratuït i ofereix més opcions que DALL-E. En definitiva, l'elecció entre generadors depèn de les necessitats i preferències de l'usuari.

Hi ha diferències significatives en la qualitat dels resultats obtinguts pels tres generadors d'imatges d'IA?

Les fonts no esmenten cap diferència significativa en la qualitat de sortida entre els tres generadors d'imatges d'IA (Midjourney, DALL-E i Stable Diffusion). No obstant això, les fonts esmenten que cada generador té els seus propis punts forts i febles, i cadascun pot ser més adequat per a diferents tipus d'imatges o estils. Per exemple, es diu que Midjourney produeix imatges oníriques i artístiques, mentre que DALL-E produeix imatges més fotorealistes que no es poden distingir de les fotos. La difusió estable es troba entre les dues pel que fa a la facilitat d'ús i la qualitat dels resultats. En definitiva, l'elecció entre generadors depèn de les necessitats i preferències de l'usuari.

Consells per triar el millor generador per a un projecte o aplicació concret

Segons les fonts, escollir el millor generador d'imatges d'IA per a un projecte o aplicació específic depèn de les necessitats i preferències de l'usuari. L'usuari ha de tenir en compte factors com el tipus d'imatges que vol crear, el nivell de detall i realisme que necessita, la facilitat d'ús del generador, la disponibilitat de funcions com la pintura, el retall i la càrrega de diverses imatges. , així com el cost del generador.

Si l'usuari vol crear imatges oníriques i artístiques, Midjourney és la millor opció. Si l'usuari vol crear imatges fotorealistes, DALL-E és una millor opció. La difusió estable es troba entre les dues pel que fa a la facilitat d'ús i la qualitat dels resultats. Stable Diffusion ofereix més opcions que DALL-E, com ara una escala per determinar fins a quin punt el generador segueix les paraules guia, així com opcions pel que fa al format i la mida dels resultats. Tanmateix, el flux de treball de Stable Diffusion no és comparable al de DALL-E, que agrupa imatges i ofereix carpetes de col·lecció.

L'usuari també ha de considerar si el generador és gratuït o de pagament, i si està disponible com a aplicació web o com a bot de Discord. Stable Diffusion és completament gratuït i està disponible com a bot de Discord, mentre que Midjourney i DALL-E són de pagament i estan disponibles com a aplicacions web o bots de Discord.

En definitiva, l'elecció entre generadors depèn de les necessitats i preferències de l'usuari. L'usuari ha d'investigar i comparar les característiques i la qualitat de sortida de cada generador abans de triar el que millor s'adapti a les seves necessitats.

Alternatives a mig curs.

Com s'ha esmentat anteriorment, Midjourney és un popular generador d'imatges d'IA que crea imatges a partir de descripcions de text. Tanmateix, només ofereix 25 minuts de temps de renderització gratuït, que són unes 30 imatges. Si busqueu una alternativa gratuïta a Midjourney, hi ha diverses opcions que podeu provar.

Aquí hi ha algunes alternatives gratuïtes a Midjourney:

  • Llapis de color : Aquesta és una solució gratuïta i de codi obert que ofereix una bona alternativa a Midjourney.
  • LLOSA : Aquest és un altre generador d'imatges similar a Midjourney i disponible de forma gratuïta. Està fet per OpenAI.
  • Jasper: Aquest és un generador d'imatges gratuït i de codi obert que es pot utilitzar com a alternativa a Midjourney.
  • Preguntar- : Aquest és un generador d'imatges gratuït i de codi obert que es pot utilitzar com a alternativa a Midjourney.
  • Invoca la IA : Aquest és un generador d'imatges molt dissenyat amb una interfície intuïtiva que es pot utilitzar com a alternativa a Midjourney.
  • Disco Diffusion: es tracta d'un sistema de conversió de text a imatge basat en núvol que és fàcil d'utilitzar i es pot utilitzar com a alternativa a Midjourney.

Si busqueu alguna cosa més específica o personalitzable, Stable Streaming (SD) pot ser una bona opció. [3]. Tanmateix, SD requereix més esforç per obtenir bons resultats i no és tan fàcil d'utilitzar com Midjourney. A més, hi ha diversos altres sistemes gratuïts de conversió de text a imatge, com Wombo's Dream, Hotpot's AI Art Maker, SnowPixel, CogView, StarryAI, ArtBreeder i ArtFlow.

En conclusió, si busqueu una alternativa gratuïta a Midjourney, hi ha diverses opcions disponibles, com ara Craiyon, DALL-E, Jasper, Wonder, Invoke AI, Disco Diffusion i Stable Diffusion. Aquests sistemes ofereixen diferents graus de personalització i facilitat d'ús, per la qual cosa hauríeu de provar-ne diversos i veure quin us funciona millor.

Aquest article ha estat escrit en col·laboració amb l'equip IA profunda et Orgs.

[Total: 0 Significar: 0]

Escrit per Dieter B.

Periodista apassionat de les noves tecnologies. Dieter és l'editor de Reviews. Anteriorment, va ser escriptor a Forbes.

Deixa un comentari

La seva adreça de correu electrònic no es publicarà. Els camps necessaris estan marcats *

Què et sembla?