A media xornada: que é? Uso, limitacións e alternativas

Midjourney é un xerador de imaxes AI que crea imaxes a partir de descricións de texto. Este é un laboratorio de investigación dirixido por David Holz, cofundador de Leap Motion. Midjourney ofrece un estilo artístico máis onírico para as túas demandas e ten un aspecto máis gótico en comparación con outros xeradores de IA. A ferramenta está actualmente en beta aberta e só se pode acceder a través dun bot de Discord no seu Discord oficial.

Para xerar imaxes, os usuarios usan o comando /imagine e introducen unha solicitude e o bot devolve un conxunto de catro imaxes. Os usuarios poden escoller que imaxes queren escalar. Midjourney tamén está a traballar nunha interface web.

O fundador David Holz ve aos artistas como clientes de Midjourney, non como competidores. Os artistas usan Midjourney para a creación rápida de prototipos de arte conceptual que presentan aos seus clientes antes de comezar a traballar por conta propia. Dado que todas as formacións de Midjourney poden incluír obras con copyright de artistas, algúns artistas acusaron a Midjourney de desvalorizar o traballo creativo orixinal.

As Condicións de servizo de Midjourney inclúen unha política de retirada da DMCA, que permite aos artistas solicitar que as súas obras sexan eliminadas do set, se consideran que a infracción dos dereitos de autor é evidente. A industria da publicidade tamén adoptou ferramentas de intelixencia artificial como Midjourney, DALL-E e Stable Diffusion, entre outras, que permiten aos anunciantes crear contido orixinal e crear ideas rapidamente.

Midjourney foi utilizado por varias persoas e empresas para crear imaxes e obras de arte, incluíndo The Economist e Corriere della Sera. Non obstante, Midjourney foi criticado por algúns artistas que consideran que lles está a quitar traballos aos artistas e infrinxir os seus dereitos de autor. Midjourney tamén foi obxecto dunha demanda presentada por un equipo de artistas por infracción de dereitos de autor.

Para comezar a usar Midjourney, os usuarios deben iniciar sesión en Discord e dirixirse ao sitio web de Midjourney para unirse á versión beta. Unha vez aceptado, os usuarios recibirán unha invitación a Discord Midjourney e poderán comezar a xerar imaxes escribindo /imaxina seguido da indicación desexada.

Midjourney non revelou moita información sobre os seus antecedentes e adestramento, pero especúlase que usa un sistema similar ao Dall-E 2 e Stable Diffusion, raspando imaxes e textos de Internet para describilos, ao usar millóns de imaxes publicadas para adestrar. .

Índice

O proceso utilizado por Midjourney para xerar imaxes a partir de solicitudes de texto

Midjourney usa un modelo de IA de texto a imaxe para xerar imaxes a partir de indicacións de texto. O bot Midjourney descompón as palabras e as frases nun aviso en anacos máis pequenos, chamados tokens, que se poden comparar cos seus datos de adestramento e despois usar para xerar unha imaxe. Un aviso ben deseñado pode axudar a crear imaxes únicas e emocionantes [0].

Para xerar unha imaxe con Midjourney, os usuarios deben escribir unha descrición de como queren que sexa a imaxe usando o comando "/imaxina" na canle Midjourney Discord. Canto máis específica e descritiva sexa a mensaxe, máis a IA poderá producir bos resultados. A continuación, Midjourney creará varias versións diferentes da imaxe en función da solicitude nun minuto. Os usuarios poden optar por obter versións alternativas de calquera destas imaxes ou ampliar calquera delas para obter unha imaxe máis grande e de maior calidade. Midjourney ofrece modos rápidos e relaxados, sendo necesario o modo rápido para conseguir o máximo aumento e producir máis imaxes en menos tempo.

O modelo de intelixencia artificial de Midjourney utiliza a difusión, que implica engadir ruído a unha imaxe e despois inverter o proceso para recuperar os datos. Este proceso repítese indefinidamente, facendo que o modelo engada ruído e despois o elimine de novo, creando imaxes realistas facendo pequenas variacións na imaxe. Midjourney buscou en Internet imaxes e texto para describilos, utilizando millóns de imaxes de adestramentos publicadas.

O modelo de intelixencia artificial de Midjourney baséase nunha transmisión estable, que se adestra en 2,3 millóns de pares de imaxes e descricións de texto. Ao usar as palabras correctas no aviso, os usuarios poden crear case todo o que se ocorra. Non obstante, algunhas palabras están prohibidas e Midjourney mantén unha lista destas para evitar que persoas malintencionadas creen solicitudes. A comunidade Discord de Midjourney está dispoñible para ofrecer axuda en directo e moitos exemplos para os usuarios.

Utilizar e xerar imaxes

Para usar Midjourney AI de balde, debes ter unha conta de Discord. Se non tes un, rexístrate gratis en Discord. A continuación, visita o sitio web de Midjourney e escolla Unirse a beta. Isto levarache a unha invitación de Discord. Acepta a invitación de Discord a Midjourney e escolle Continuar en Discord.

A túa aplicación Discord abrirase automaticamente e podes seleccionar a icona Midjourney en forma de barco no menú da esquerda. Nas canles de Midjourney, localiza as salas de recén chegados e selecciona unha delas para comezar. Cando esteas listo, escribe "/imaxina" no chat de Discord para a túa sala de recén chegados.

Isto creará un campo de solicitude onde podes introducir a descrición da imaxe. Canto máis específico sexas na túa descrición, mellor será a IA para producir bos resultados. Sexa descritivo e, se estás a buscar un estilo en particular, inclínao na túa descrición. Midjourney ofrece a cada usuario 25 intentos para xogar coa IA.

Despois diso, terás que rexistrarte como membro de pleno dereito para continuar. Se prefires non gastar cartos, é unha boa idea que te tomes un tempo e penses no que queres crear en Midjourney.

Se queres, podes escribir "/help" para obter unha lista de consellos a seguir. É fundamental coñecer a lista de palabras prohibidas antes de usar a IA de Midjourney, xa que o incumprimento do código de conduta dará lugar á prohibición.

>> Ler tamén - Os 27 mellores sitios web gratuítos de intelixencia artificial (deseño, redacción, chat, etc.)

/imaxina o comando

O comando /imagine é un dos principais comandos de Midjourney que permite aos usuarios xerar imaxes xeradas por AI en función das súas demandas. Así é como funciona:

Os usuarios escriben o comando /imagine no chat de Discord e engaden a configuración que queren usar.
O algoritmo Midjourney AI analiza o aviso e xera unha imaxe baseada na entrada.
A imaxe xerada móstrase no chat de Discord e os usuarios poden proporcionar comentarios e refinar as súas mensaxes mediante a función Remix.
Os usuarios tamén poden usar opcións adicionais para axustar o estilo, a versión e outros aspectos da imaxe xerada.

O comando /imagine acepta solicitudes de imaxe e texto. Os usuarios poden engadir solicitudes como imaxes proporcionando un URL ou anexo para as imaxes que desexan xerar. As solicitudes de texto poden incluír descricións das imaxes que os usuarios queren xerar, como obxectos, fondos e estilos. Os usuarios tamén poden engadir parámetros adicionais ao comando para axustar a versión do algoritmo que queren usar, activar a función Remix, etc.

Exemplos dos tipos de imaxes que Midjourney AI pode crear

Midjourney AI pode crear unha gran variedade de imaxes en diferentes estilos, incluíndo pero non limitado a:

Ilustracións para libros infantís, como o exemplo de "A aventura dun porquiño".
Retratos realistas de persoas, animais e obxectos.
Obras de arte surrealistas e abstractas que mesturan diferentes elementos e estilos.
Paisaxes e paisaxes urbanas que poden evocar diferentes estados de ánimo e emocións.
Fotografía en branco e negro con intrincados detalles e efectos cinematográficos.
Imaxes que ilustran temas futuristas ou de ciencia ficción, como o exemplo dunha vella medio feita con pezas robóticas e levando unha máscara antigás.

É importante ter en conta que a calidade e o estilo das imaxes xeradas por Midjourney AI poden variar dependendo da calidade das indicacións, da versión do algoritmo utilizado e doutros factores. Os usuarios deben probar con diferentes indicacións e configuracións para obter os resultados desexados.

Combina imaxes en Midjourney

Para combinar dúas ou máis imaxes en Midjourney, podes seguir estes pasos:

Escolle as imaxes que queres combinar e cárgaas a Discord.
Copia as ligazóns ás imaxes e engádeas á túa solicitude /imagine como indicacións de imaxe.
Engade "-v 4" ao teu aviso se a versión 4 non está activada por defecto.
Envía o comando e agarda a que se xere a imaxe.

Por exemplo, para combinar dúas imaxes, pode usar o seguinte comando: /imagine -v 1

Tamén podes engadir información adicional, incluíndo obxectos, fondo e estilo artístico xeral, para crear unha imaxe totalmente nova co seu propio estilo. Por exemplo: /imaxina , estilo de debuxos animados, multitude alegre ao fondo, logotipo de Tesla no peito, -non disfraz -v 1

Midjourney tamén lanzou unha nova función, o comando /blend, que permite combinar ata cinco imaxes sen ter que copiar e pegar URL. Pode activar o comando /blend incluíndo a bandeira –blend no seu indicador.

É importante ter en conta que esta función só funciona coa versión 4 do algoritmo Midjourney e que a combinación de imaxes non require texto adicional, pero engadir información adoita obter mellores imaxes. Os mellores resultados adoitan conseguirse experimentando con estilos artísticos e axustando as imaxes co modo Remix.

Combina máis de dúas imaxes

Midjourney permite aos usuarios mesturar ata cinco imaxes usando o comando /blend. Non obstante, se os usuarios precisan combinar máis de cinco imaxes, poden usar o comando /imagine e pegar os URL das imaxes públicas nunha fila. Para combinar máis de dúas imaxes usando o comando /imagine, os usuarios poden engadir solicitudes ao comando. Por exemplo, para combinar tres imaxes, o comando sería /imaxina -v 1.

Os usuarios poden engadir máis solicitudes de comandos para combinar máis imaxes. É importante ter en conta que engadir información adicional ao indicador, incluídos obxectos, fondo e estilo artístico xeral, pode axudar a crear unha imaxe totalmente nova co seu propio estilo. Os mellores resultados conséguense experimentando con estilos artísticos e axustando as imaxes co modo Remix

Comando/mestura en Midjourney

O comando /blend de Midjourney permite aos usuarios mesturar ata cinco imaxes engadindo elementos de IU fáciles de usar directamente na interface de Discord. Os usuarios poden arrastrar e soltar imaxes na interface ou seleccionalas directamente desde o seu disco duro. Os usuarios tamén poden escoller as dimensións da imaxe que queren ver xerada. Se os usuarios usan sufixos personalizados, poden engadilos opcionalmente ao final do comando, como ocorre con calquera comando /imagine normal.

O equipo de Midjourney deseñou o comando /blend para examinar eficazmente os "conceptos" e o "estado de ánimo" das imaxes dos usuarios e tentar combinalos. Isto ás veces resulta en imaxes sorprendentemente atractivas e, noutros casos, os usuarios acaban con imaxes arrepiantes. Non obstante, o comando /blend non admite as solicitudes de texto.

O comando /blend ten limitacións. O máis obvio é que os usuarios só poden engadir cinco referencias de imaxes diferentes. Aínda que o comando /imagine acepta tecnicamente máis de cinco imaxes, cantas máis referencias engadan os usuarios, menos importante é cada unha. Este é un problema xeral coa dilución do problema e non un problema específico de /mestura. A outra gran limitación é que o comando de mestura Midjourney non funciona coas solicitudes de texto. Isto pode ser desafortunado para os usuarios avanzados que raramente só mesturan dúas imaxes. Non obstante, para os usuarios que buscan crear mashups, esta limitación non importa moito.

Mellorar o tempo de construción

hai formas de mellorar ou optimizar o tempo de xeración para a creación de imaxes mediante Midjourney AI. Aquí tes algúns consellos que poden axudarche:

Usa indicacións específicas e detalladas: Midjourney xera imaxes en función das indicacións do usuario. Canto máis específico e detallado sexa o aviso, mellores serán os resultados. Tamén reduce o tempo que tarda en xerar unha imaxe, xa que o algoritmo de IA ten unha idea máis precisa do que quere o usuario.
Experimenta con diferentes axustes de calidade: o parámetro –quality axusta a calidade da imaxe e o tempo que tarda en xerala. Os axustes de calidade máis baixa producen imaxes máis rápido, mentres que os axustes de calidade superior poden levar máis tempo, pero dan mellores resultados. É importante experimentar con diferentes opcións para atopar o equilibrio adecuado entre calidade e velocidade.
Usar o modo Relax: os subscritores do plan Standard e Pro poden usar o modo Relax, que non custa nada para o tempo de GPU do usuario, pero coloca os traballos nunha cola en función da frecuencia con que se usa o dispositivo. Os tempos de espera para o modo Relax son dinámicos, pero normalmente oscilan entre 0 e 10 minutos por tarefa. Usar o modo Relax pode ser unha boa forma de optimizar o tempo de construción, especialmente para os usuarios que xeran un gran número de imaxes cada mes.
Compra máis horas rápidas: o modo rápido é o nivel de procesamento de maior prioridade e utiliza o tempo mensual da GPU da subscrición do usuario. Os usuarios poden comprar máis horas rápidas na súa páxina Midjourney.com/accounts, o que axuda a garantir que as súas imaxes se xeren de forma rápida e eficiente.
Use Fast Relax: Fast Relax é unha nova función en Midjourney que permite aos usuarios xerar imaxes máis rápido sacrificando certa calidade. O modo Fast Relax xera imaxes cunha calidade de arredor do 60%, o que pode ser un bo compromiso para os usuarios que queiran xerar imaxes rapidamente pero non queren sacrificar demasiada calidade.

En resumo, hai varias formas de mellorar ou optimizar o tempo de creación para crear imaxes de IA de Midjourney, incluíndo o uso de indicacións específicas, experimentar con diferentes opcións de calidade, usar o modo Relax ou mercar máis horas rápidas e usar o modo Fast Relax.

Que precisión son as imaxes xeradas polo modelo de intelixencia artificial de Midjourney?

A precisión das imaxes xeradas polo modelo de IA de Midjourney pode variar dependendo da solicitude e da calidade dos datos de adestramento. Os usuarios poden mellorar a precisión das imaxes xeradas sendo específicos e detallados nas súas consultas. Canto máis específico e descritivo sexa o aviso, mellor será a IA para producir bos resultados. O modelo de IA de Midjourney adestrouse en millóns de imaxes e descricións de texto recuperadas de Internet, o que tamén pode afectar á precisión das imaxes xeradas.

Cómpre sinalar que as imaxes xeradas por IA de Midjourney foron obxecto de controversia sobre a infracción dos dereitos de autor e a orixinalidade artística. Algúns artistas acusaron a Midjourney de desvalorizar o traballo creativo orixinal, mentres que outros o ven como unha ferramenta para a creación de prototipos rápidos de arte conceptual para mostrar aos clientes antes de que comecen a traballar en si mesmos.

Como aborda Midjourney as preocupacións sobre a infracción dos dereitos de autor e a orixinalidade das imaxes xeradas pola intelixencia artificial?

Midjourney: infracción de dereitos de autor e orixinalidade das imaxes xeradas pola IA

Midjourney tomou medidas para resolver as preocupacións sobre a infracción dos dereitos de autor e a orixinalidade das imaxes xeradas pola intelixencia artificial. Midjourney comproba coidadosamente cada indicación e cada imaxe para asegurarse de que non hai problemas de dereitos de autor, utilizando só contido con licenza ou de dominio público e facendo investigacións adicionais ou solicitando a autorización do propietario lexítimo en caso de incerteza.

Midjourney tamén fomenta a responsabilidade dos seus usuarios instándoos a respectar as leis de dereitos de autor e a utilizar só imaxes e indicacións que teñan dereito a usar. Se un usuario cuestiona a fonte dunha publicación ou imaxe, a plataforma toma medidas inmediatas para investigar e eliminar calquera contido infractor, de acordo coa Digital Millennium Copyright Act (DMCA) de 1998.

A DMCA ofrece disposicións de protección para os provedores de servizos en liña, como Midjourney, que actúan de boa fe para eliminar o contido infractor cando o notifique un titular dos dereitos de autor. Midjourney tamén ten unha política de eliminación DMCA que permite aos artistas solicitar que o seu traballo sexa eliminado do set se cren que a infracción dos dereitos de autor é obvia. [2][4].

O enfoque de Midjourney para evitar infraccións é coherente cos casos da Corte Suprema como Feist Publications, Inc. v. Rural Telephone Service Co., Inc. (1991), onde o Tribunal considerou que a orixinalidade, e non a novidade, é o requisito esencial para a protección dos dereitos de autor, e Oracle America, Inc. v. Google LLC (2018), onde o Tribunal considerou que copiar unha obra orixinal, aínda que sexa con fins diferentes, aínda se pode considerar unha infracción do copyright.

As imaxes xeradas pola intelixencia artificial de Midjourney foron obxecto de controversia pola infracción dos dereitos de autor e a orixinalidade artística. Algúns artistas acusaron a Midjourney de desvalorizar o traballo creativo orixinal, mentres que outros o ven como unha ferramenta para a creación de prototipos rápidos de arte conceptual para mostrar aos clientes antes de que comecen a traballar en si mesmos. As Condicións de servizo de Midjourney inclúen unha política de retirada da DMCA, que permite aos artistas solicitar que o seu traballo sexa eliminado do set se cren que hai unha infracción dos dereitos de autor.

Como se asegura Midjourney de que todo o contido con licenza ou de dominio público usado para crear imaxes xeradas por IA se atribúa correctamente?

Non está claro como Midjourney garante que todo o contido con licenza ou de dominio público usado para crear as imaxes xeradas pola IA se atribúa correctamente. Non obstante, Midjourney comproba coidadosamente cada publicación e imaxe para asegurarse de que non hai problemas de dereitos de autor, utilizando só contido con licenza ou de dominio público e realizando investigacións adicionais ou solicitando a autorización do propietario lexítimo en caso de incerteza.

Midjourney tamén ten unha política de eliminación da DMCA, que permite aos artistas solicitar que o seu traballo sexa eliminado da serie se cren que hai unha infracción clara dos dereitos de autor.

As regras que os usuarios deben respectar en Midjourney

Midjourney estableceu un conxunto de regras que os usuarios deben seguir para garantir unha comunidade acolledora e inclusiva para todos. Estas regras son as seguintes: [0][1][2] :

Sexa amable e respecta aos demais e ao persoal. Non crees imaxes nin utilices indicacións de texto que sexan inherentemente irrespetuosas, agresivas ou abusivas. Non se tolerará a violencia nin o acoso de ningún tipo.
Sen contido para adultos nin escenas sanguentas. Evita contido visualmente ofensivo ou perturbador. Algunhas entradas de texto bloquearanse automaticamente.
Non reproducir publicamente as creacións doutras persoas sen o seu permiso.
Presta atención a compartir. Podes compartir as túas creacións fóra da comunidade Midjourney, pero considera como os demais poden ver o teu contido.
Calquera infracción destas normas pode dar lugar á exclusión do servizo.
Estas regras aplícanse a todo o contido, incluídas as imaxes feitas en servidores privados, en modo privado e en mensaxes directas co Midjourney Bot.

Midjourney tamén ten unha lista de palabras prohibidas que non están permitidas nas mensaxes. A lista de palabras prohibidas inclúe palabras relacionadas directa ou indirectamente coa violencia, o acoso, o gore, o contido para adultos, as drogas ou o discurso de odio. Ademais, non permite indicacións que inclúan ou estean relacionadas coa agresión e a violencia.

Se unha palabra está na lista de palabras prohibidas ou se está estreita ou remotamente relacionada cunha palabra prohibida, Midjourney non permitirá o aviso. Os usuarios de Midjourney deben substituír as palabras prohibidas por palabras similares pero permitidas, evitar o uso de palabras que estean estreita ou remotamente relacionadas con palabras prohibidas ou considerar usar un sinónimo ou outra redacción.

Palabras prohibidas a media xornada

Midjourney implementou un filtro que filtra e prohibe automaticamente palabras exactas ou similares na lista de palabras prohibidas. A lista de palabras prohibidas inclúe palabras que están directa ou indirectamente relacionadas coa violencia, o acoso, o gore, o contido para adultos, as drogas ou a incitación ao odio. Ademais, non permite indicacións que inclúan ou se relacionen con agresións e abusos.

A lista de palabras prohibidas non é necesariamente exhaustiva e pode haber moitos outros termos que aínda non estean na lista. Midjourney actualiza constantemente a lista de palabras prohibidas. Esta lista está en constante revisión e non é pública. Non obstante, hai unha lista dirixida pola comunidade á que os usuarios poden acceder e contribuír se o desexan. [0][1].

Se unha palabra está na lista de palabras prohibidas ou se está estreita ou remotamente relacionada cunha palabra prohibida, Midjourney non permitirá o aviso. Os usuarios de media xornada deberían substituír as palabras prohibidas por palabras similares pero permitidas, evitar usar unha palabra que estea aínda vagamente relacionada cunha palabra prohibida ou considerar usar un sinónimo ou unha redacción alternativa. Os usuarios de Midjourney sempre deben comprobar a canle #rules antes de enviar a súa mensaxe xa que o equipo está a actualizar constantemente a lista de palabras prohibidas. [2].

Midjourney ten un código de conduta que os usuarios deben seguir. O Código de Conduta non só consiste en seguir o contido do PG-13, senón tamén en ser amable e respectar aos demais e ao persoal. O incumprimento das normas pode supoñer a suspensión ou desterro do servizo. Midjourney é unha comunidade aberta de Discord, e seguir o código de conduta é esencial. Aínda que os usuarios utilicen o servizo en modo '/privado', deben respectar o código de conduta.

En conclusión, Midjourney aplica unha estrita política de moderación de contido e prohíbe calquera forma de violencia ou acoso, calquera contido para adultos ou gore, así como calquera contido visualmente ofensivo ou perturbador. Midjourney implementou un filtro que filtra e prohibe automaticamente as palabras exactas ou similares na lista de palabras prohibidas, que inclúe palabras directa ou indirectamente relacionadas coa violencia, o acoso, o gore, o contido para adultos, as drogas ou a incitación ao odio. Os usuarios de Midjourney deben cumprir o código de conduta e consultar a canle #regras antes de enviar a súa mensaxe, xa que o equipo está a actualizar constantemente a lista de palabras prohibidas.

Lista actualizada de palabras prohibidas

Midjourney axusta periodicamente a lista de palabras prohibidas e a lista está en constante revisión. A lista de palabras prohibidas non é pública, pero hai unha lista dirixida pola comunidade á que os usuarios poden acceder e contribuír. Midjourney esfórzase por ofrecer unha experiencia PG-13 en todo o seu Servizo, polo que están prohibidas as palabras e contidos relacionados coa violencia, o gore, o acoso, as drogas, o contido para adultos e os temas xeralmente ofensivos. A lista de palabras prohibidas divídese en varias categorías que cobren o espectro dos temas mencionados anteriormente. É importante ter en conta que a lista de palabras prohibidas en Midjourney non é necesariamente exhaustiva e que pode haber moitos outros termos que aínda non estean na lista.

Prohibición e suspensión da media xornada

Midjourney ten un estrito código de conduta que os usuarios deben seguir. O incumprimento das normas pode supoñer a suspensión ou desterro do servizo. Non obstante, non está claro se os usuarios poden apelar unha prohibición ou suspensión de Midjourney. As fontes non mencionan explícitamente un proceso de apelación nin como contactar co equipo de Midjourney sobre unha prohibición ou suspensión. É fundamental respectar o código de conduta para evitar ser prohibido ou suspendido do servizo. Se os usuarios teñen algunha dúbida ou pregunta sobre o servizo, poden contactar co equipo de Midjourney a través do seu servidor Discord [1][2].

Pode Midjourney xerar imaxes en tamaños ou resolucións específicos?

Midjourney ten tamaños de imaxe e resolucións predeterminados específicos que os usuarios poden xerar. O tamaño de imaxe predeterminado para Midjourney é de 512 x 512 píxeles, que se pode aumentar a 1024 x 1024 píxeles ou 1664 x 1664 píxeles mediante o comando /imagine en Discord. Tamén hai unha opción beta chamada "Beta Upscale Redo", que pode aumentar o tamaño das imaxes ata 2028x2028 píxeles, pero pode desenfocar algúns detalles.

Os usuarios só poden escalar a resolución máxima despois de facer polo menos a escala básica dunha imaxe [1]. O tamaño máximo de ficheiro que pode xerar Midjourney é de 3 megapíxeles, o que significa que os usuarios poden crear imaxes con calquera relación de aspecto, pero o tamaño final da imaxe non pode superar os 3 de píxeles. A resolución de Midjourney é suficiente para impresións fotográficas básicas, pero se os usuarios queren imprimir algo máis grande, poden ter que usar un conversor AI externo para obter bos resultados.

Como se compara Midjourney con outros xeradores de imaxes de IA como DALL-E e Stable Diffusion?

Segundo as fontes, Midjourney é un xerador de imaxes de intelixencia artificial que produce imaxes artísticas e oníricas a partir de indicacións de texto. Compárase con outros xeradores como DALL-E e Stable Diffusion. Segundo informes, Midjourney ofrece unha gama máis limitada de estilos que os outros dous, pero as súas imaxes aínda son máis escuras e artísticas. Midjourney non parece coincidir con DALL-E e Stable Diffusion cando se trata de fotorrealismo [1][2].

Stable Diffusion compárase con Midjourney e DALL-E, e dise que está nalgún lugar intermedio en termos de facilidade de uso e calidade de saída. Stable Diffusion ofrece máis opcións que DALL-E, como unha escala para determinar o ben que o xerador segue as palabras guía e opcións sobre o formato e o tamaño de saída. Non obstante, o fluxo de traballo de Stable Diffusion non coincide co de DALL-E, que agrupa imaxes e ofrece cartafoles de colección. Dise que Stable Diffusion e DALL-E teñen as mesmas deficiencias no que se refire ao fotorrealismo, e ambos non se achegan á aplicación web Discord de Midjourney. [0].

Segundo unha proba comparativa de Fabian Stelzer, Midjourney é sempre máis escuro que DALL-E e Stable Diffusion. Mentres DALL-E e Stable Diffusion xeran imaxes máis realistas, as ofertas de Midjourney teñen unha calidade artística e onírica. Midjourney compárase cun sintetizador analóxico Moog, con artefactos agradables, mentres que DALL-E compárase cun sintetizador de estación de traballo dixital cunha gama máis ampla.

Stable Diffusion compárase cun sintetizador modular complexo que pode producir case calquera son, pero é máis difícil de activar. En termos de resolución de imaxe, Midjourney pode xerar imaxes cunha resolución de 1792x1024, mentres que DALL-E é un pouco máis limitado a 1024x1024. Non obstante, Stelzer sinala que a resposta a cal é o mellor xerador é totalmente subxectiva e redúcese á preferencia persoal.

Sábese que DALL-E produce imaxes máis fotorrealistas, incluso imaxes que non se distinguen das fotos. Dise que ten unha mellor comprensión ou conciencia que outros xeradores de IA. Non obstante, Midjourney non está deseñado para producir imaxes fotorrealistas, senón para producir imaxes oníricas e artísticas. Polo tanto, a elección entre os dous xeradores depende en última instancia das necesidades e preferencias do usuario.

Como afecta a gama limitada de estilos de Midjourney á súa usabilidade en comparación co DALL-E e a transmisión estable?

Segundo fontes, a gama limitada de estilos de Midjourney pode afectar a súa usabilidade en comparación con DALL-E e Stable Diffusion. As imaxes de Midjourney considéranse máis agradables estéticamente, pero a súa gama de estilos é máis limitada que a de DALL-E e Stable Diffusion. O estilo de Midjourney descríbese como onírico e artístico, mentres que DALL-E é coñecido por producir imaxes máis fotorrealistas que non se distinguen das fotos.

Stable Diffusion sitúase nalgún lugar intermedio en termos de facilidade de uso e calidade dos resultados. Stable Diffusion ofrece máis opcións que DALL-E, como unha escala para determinar o ben que o xerador segue as palabras suxeridas, así como opcións relativas ao formato e tamaño dos resultados. Midjourney compárase cun sintetizador analóxico Moog, con artefactos agradables, mentres que DALL-E compárase cun sintetizador de estación de traballo dixital cun rango máis amplo. Stable Diffusion compárase cun complexo sintetizador modular que pode producir case calquera son, pero é máis difícil de activar. [1][2].

DALL-E dise que é máis flexible que Midjourney, capaz de ofrecer unha variedade máis ampla de estilos visuais. DALL-E tamén é mellor para crear fotografías realistas e "normales" que quedarían moi ben nunha revista ou nun sitio web corporativo. DALL-E tamén ofrece ferramentas poderosas que Midjourney non ten, como a superposición de pintura, o recorte e a carga de varias imaxes, que son esenciais para usos máis inventivos da arte da IA.

O modelo de DALL-E ten menos opinións, o que o fai máis receptivo ás suxestións de estilo, especialmente se ese estilo é menos fermoso inmediatamente. Polo tanto, DALL-E é máis probable que proporcione unha reacción precisa a unha solicitude específica, como o pixel art. DALL-E tamén ofrece unha aplicación web real, que permite aos usuarios traballar directamente con DALL-E, o que pode resultar menos confuso que instalar Discord.

En comparación con Midjourney, Stable Diffusion suponse que é completamente gratuíto, polo que é máis accesible para aqueles que non poden pagar un xerador de imaxes de intelixencia artificial. Non obstante, Stable Diffusion só está dispoñible como un bot de Discord e os usuarios deben solicitar acceso a el. Stable Diffusion tamén se considera máis difícil de lanzar que Midjourney, que é máis fácil de usar grazas á súa elección de relación de aspecto e galería pública. Midjourney tamén ofrece AutoArchive, que fai unha copia de seguranza de todas as imaxes, e unha cuadrícula de 2x2 de miniaturas gardadas, o que facilita a xestión do traballo. A aplicación Discord de Midjourney tamén funciona mellor no móbil que o sitio web de DALL-E, polo que é máis fácil xerar imaxes en calquera lugar. O estilo único de Midjourney faino ideal para xerar rapidamente un gran número de imaxes agradables, sen necesidade de refinar a mensaxe.

En conclusión, cada xerador de imaxes de IA ten as súas propias vantaxes e desvantaxes, e cada persoa pode ter diferentes preferencias e necesidades. A gama limitada de estilos de Midjourney pode afectar á súa usabilidade en comparación con DALL-E e Stable Diffusion, pero o seu estilo único faino ideal para xerar imaxes artísticas oníricas. DALL-E é máis flexible e hábil para crear imaxes fotorrealistas, mentres que Stable Diffusion é completamente gratuíto e ofrece máis opcións que DALL-E. En definitiva, a elección entre xeradores depende das necesidades e preferencias do usuario.

Existen diferenzas significativas na calidade dos resultados obtidos polos tres xeradores de imaxes de IA?

As fontes non mencionan diferenzas significativas na calidade de saída entre os tres xeradores de imaxes AI (Midjourney, DALL-E e Stable Diffusion). Non obstante, as fontes mencionan que cada xerador ten os seus propios puntos fortes e débiles, e cada un pode ser máis axeitado para diferentes tipos de imaxes ou estilos. Por exemplo, dise que Midjourney produce imaxes oníricas e artísticas, mentres que DALL-E produce imaxes máis fotorrealistas que non se distinguen das fotos. Stable Diffusion sitúase entre os dous en termos de facilidade de uso e calidade dos resultados. En definitiva, a elección entre xeradores depende das necesidades e preferencias do usuario.

Consellos para escoller o mellor xerador para un proxecto ou aplicación específico

Segundo as fontes, a elección do mellor xerador de imaxes AI para un proxecto ou aplicación específico depende das necesidades e preferencias do usuario. O usuario debe ter en conta factores como o tipo de imaxes que quere crear, o nivel de detalle e realismo que precisa, a facilidade de uso do xerador, a dispoñibilidade de funcións como pintar, o recorte e a carga de varias imaxes. , así como o custo do xerador.

Se o usuario quere crear imaxes oníricas e artísticas, Midjourney é a mellor opción. Se o usuario quere crear imaxes fotorrealistas, DALL-E é unha mellor opción. Stable Diffusion sitúase entre os dous en termos de facilidade de uso e calidade dos resultados. Stable Diffusion ofrece máis opcións que DALL-E, como unha escala para determinar o ben que o xerador segue as palabras guía, así como opcións relativas ao formato e tamaño dos resultados. Non obstante, o fluxo de traballo de Stable Diffusion non é comparable ao de DALL-E, que agrupa imaxes e ofrece cartafoles de colección.

O usuario tamén debe considerar se o xerador é gratuíto ou de pago e se está dispoñible como aplicación web ou bot de Discord. Stable Diffusion é completamente gratuíto e dispoñible como bot Discord, mentres que Midjourney e DALL-E son de pago e están dispoñibles como aplicacións web ou bots Discord.

En definitiva, a elección entre xeradores depende das necesidades e preferencias do usuario. O usuario debe investigar e comparar as características e a calidade de saída de cada xerador antes de escoller o que mellor se adapte ás súas necesidades.

Alternativas a medio curso.

Como se mencionou anteriormente, Midjourney é un popular xerador de imaxes de intelixencia artificial que crea imaxes a partir de descricións de texto. Non obstante, só ofrece 25 minutos de tempo de renderizado gratuíto, o que supón unhas 30 imaxes. Se estás a buscar unha alternativa gratuíta a Midjourney, hai varias opcións que podes probar.

Aquí tes algunhas alternativas gratuítas a Midjourney:

crayón : Esta é unha solución gratuíta e de código aberto que ofrece unha boa alternativa a Midjourney.
LOSA : Este é outro xerador de imaxes semellante a Midjourney e dispoñible de balde. Está feito por OpenAI.
Jasper: este é un xerador de imaxes gratuíto e de código aberto que se pode usar como alternativa a Midjourney.
Marabilla : Este é un xerador de imaxes gratuíto e de código aberto que se pode usar como alternativa a Midjourney.
Invocar a IA : Este é un xerador de imaxes moi deseñado cunha interface intuitiva que se pode usar como alternativa a Midjourney.
Disco Diffusion: este é un sistema de conversión de texto a imaxe baseado na nube que é fácil de usar e que se pode usar como alternativa a Midjourney.

Se estás buscando algo máis específico ou personalizable, Stable Streaming (SD) pode ser unha boa opción. [3]. Non obstante, SD leva máis esforzos para obter bos resultados e non é tan fácil de usar como Midjourney. Ademais, existen outros sistemas gratuítos de conversión de texto a imaxe, como Wombo's Dream, Hotpot's AI Art Maker, SnowPixel, CogView, StarryAI, ArtBreeder e ArtFlow.

En conclusión, se estás a buscar unha alternativa gratuíta a Midjourney, hai varias opcións dispoñibles, como Craiyon, DALL-E, Jasper, Wonder, Invoke AI, Disco Diffusion e Stable Diffusion. Estes sistemas ofrecen diferentes graos de personalización e facilidade de uso, polo que deberías probar varios e ver cal funciona mellor para ti.

Este artigo foi escrito en colaboración co equipo IA profunda et Orgs.

[Total: 0 Media: 0]

Midjourney: todo o que necesitas saber sobre o artista AI

A media xornada: que é? Uso, limitacións e alternativas

O proceso utilizado por Midjourney para xerar imaxes a partir de solicitudes de texto