Midjourney: Какво е това? Употреба, ограничения и алтернативи

Midjourney е генератор на AI изображения, който създава изображения от текстови описания. Това е изследователска лаборатория, управлявана от Дейвид Холц, съосновател на Leap Motion. Midjourney предлага по-мечтателен артистичен стил за вашите изисквания и има по-готически вид в сравнение с други AI генератори. В момента инструментът е в отворена бета версия и може да бъде достъпен само чрез бот на Discord в техния официален Discord.

За да генерират изображения, потребителите използват командата /imagine и въвеждат подкана, а ботът връща набор от четири изображения. След това потребителите могат да избират кои изображения искат да мащабират. Midjourney също работи върху уеб интерфейс.

Основателят Дейвид Холц гледа на артистите като на клиенти на Midjourney, а не като на конкуренти. Художниците използват Midjourney за бързо създаване на прототипи на концептуално изкуство, което представят на своите клиенти, преди да започнат да работят сами. Тъй като всички състави на Midjourney може да включват защитени с авторски права произведения на художници, някои художници обвиняват Midjourney в обезценяване на оригиналната творческа работа.

Условията за ползване на Midjourney включват Политика за премахване на DMCA, която позволява на артистите да поискат техните произведения да бъдат премахнати от комплекта, ако смятат, че нарушението на авторските права е очевидно. Рекламната индустрия също възприе AI инструменти като Midjourney, DALL-E и Stable Diffusion, наред с други, които позволяват на рекламодателите да създават оригинално съдържание и бързо да измислят идеи.

Midjourney е използван от различни хора и компании за създаване на изображения и произведения на изкуството, включително The Economist и Corriere della Sera. Midjourney обаче беше подложен на критики от някои артисти, които смятат, че отнема работни места на артисти и нарушава техните авторски права. Midjourney също беше обект на дело, заведено от екип от артисти за нарушаване на авторски права.

За да започнат да използват Midjourney, потребителите трябва да влязат в Discord и да отидат на уебсайта на Midjourney, за да се присъединят към бета версията. След като бъдат приети, потребителите ще получат покана за Discord Midjourney и могат да започнат да генерират изображения, като напишат /imagine, последвано от желаната подкана.

Midjourney не е разкрил много информация за произхода и обучението си, но се спекулира, че той използва система, подобна на Dall-E 2 и Stable Diffusion, изтривайки снимки и текст от интернет, за да ги опише, като използва милиони публикувани изображения за обучение .

Съдържание

Процесът, използван от Midjourney за генериране на изображения от текстови подкани

Midjourney използва AI модел текст към изображение, за да генерира изображения от текстови подкани. Ботът Midjourney разбива думите и фразите в подкана на по-малки части, наречени токени, които могат да бъдат сравнени с неговите данни за обучение и след това използвани за генериране на изображение. Една добре проектирана подкана може да помогне за създаването на уникални и вълнуващи изображения [0].

За да генерират изображение с Midjourney, потребителите трябва да въведат описание на това как искат да изглежда изображението, като използват командата “/imagine” в канала на Midjourney Discord. Колкото по-конкретно и описателно е съобщението, толкова повече AI ще може да произведе добри резултати. След това Midjourney ще създаде няколко различни версии на изображението въз основа на подканата в рамките на една минута. Потребителите могат да изберат да получат алтернативни версии на всяко от тези изображения или да увеличат някое от тях, за да получат по-голямо изображение с по-високо качество. Midjourney предлага бързи и спокойни режими, като бързият режим е необходим за постигане на максимално увеличение и създаване на повече изображения за по-малко време.

AI моделът на Midjourney използва дифузия, която включва добавяне на шум към изображение и след това обръщане на процеса за извличане на данните. Този процес се повтаря безкрайно, което кара модела да добавя шум и след това да го премахва отново, като в крайна сметка създава реалистични изображения чрез малки вариации в изображението. Midjourney претърси интернет за изображения и текст, за да ги опише, използвайки милиони публикувани изображения на тренировки.

AI моделът на Midjourney се основава на стабилен стрийминг, който се обучава на 2,3 милиарда двойки изображения и текстови описания. Използвайки правилните думи в подканата, потребителите могат да създадат почти всичко, което им хрумне. Някои думи обаче са забранени и Midjourney поддържа списък с тези думи, за да попречи на злонамерени хора да създават подкани. Общността на Discord на Midjourney е на разположение, за да предостави помощ на живо и много примери за потребителите.

Използване и генериране на изображения

За да използвате Midjourney AI безплатно, трябва да имате акаунт в Discord. Ако нямате такъв, регистрирайте се безплатно в Discord. След това посетете уебсайта на Midjourney и изберете Join Beta. Това ще ви отведе до покана за Discord. Приемете поканата на Discord за Midjourney и изберете да продължите в Discord.

Вашето приложение Discord ще се отвори автоматично и можете да изберете иконата Midjourney във формата на кораб от лявото меню. В каналите на Midjourney намерете стаите за новодошли и изберете една от тях, за да започнете. Когато сте готови, напишете „/imagine“ в чата на Discord за вашата стая за новодошли.

Това ще създаде поле за подкана, където можете да въведете описанието на изображението. Колкото по-конкретни сте в описанието си, толкова по-добър AI ще може да произведе добри резултати. Бъдете описателни и ако търсите определен стил, включете го в описанието си. Midjourney предлага на всеки потребител 25 опита да играе с AI.

След това ще трябва да се регистрирате като пълноправен член, за да продължите. Ако предпочитате да не харчите пари, добра идея е да отделите малко време и да помислите какво искате да създадете в Midjourney.

Ако искате, можете да въведете "/help", за да получите списък със съвети, които да следвате. Важно е да знаете списъка със забранени думи, преди да използвате AI Midjourney, тъй като неспазването на кодекса за поведение ще доведе до забрана.

>> Прочетете също - 27 най-добри безплатни уебсайта с изкуствен интелект (дизайн, писане на текстове, чат и т.н.)

/представете си командата

Командата /imagine е една от основните команди в Midjourney, която позволява на потребителите да генерират генерирани от AI изображения въз основа на техните изисквания. Ето как работи:

Потребителите въвеждат командата /imagine в чата на Discord и добавят настройките, които искат да използват.
Алгоритъмът Midjourney AI анализира подканата и генерира изображение въз основа на входа.
Генерираното изображение се показва в чата на Discord и потребителите могат да предоставят обратна връзка и да прецизират съобщенията си с помощта на функцията Remix.
Потребителите могат също да използват допълнителни настройки, за да коригират стила, версията и други аспекти на генерираното изображение.

Командата /imagine приема както изображения, така и текстови подкани. Потребителите могат да добавят подкани като изображения, като предоставят URL или прикачен файл за изображенията, които желаят да генерират. Текстовите подкани могат да включват описания на изображенията, които потребителите искат да генерират, като обекти, фонове и стилове. Потребителите могат също да добавят допълнителни параметри към командата, за да коригират версията на алгоритъма, който искат да използват, да активират функцията Remix и т.н.

Примери за видовете изображения, които Midjourney AI може да създаде

Midjourney AI може да създава широка гама от изображения в различни стилове, включително, но не само:

Илюстрации за детски книги, като например "Приключението на прасенце".
Реалистични портрети на хора, животни и предмети.
Сюрреалистични и абстрактни произведения на изкуството, които смесват различни елементи и стилове.
Пейзажи и градски пейзажи, които могат да предизвикат различни настроения и емоции.
Черно-бяла фотография със сложни детайли и кинематографични ефекти.
Изображения, които илюстрират футуристични или научно-фантастични теми, като примера на старица, направена наполовина от роботизирани части и носеща противогаз.

Важно е да се отбележи, че качеството и стилът на изображенията, генерирани от Midjourney AI, може да варира в зависимост от качеството на подканите, версията на използвания алгоритъм и други фактори. Потребителите трябва да експериментират с различни подкани и настройки, за да получат желаните резултати.

Комбинирайте изображения в Midjourney

За да комбинирате две или повече изображения в Midjourney, можете да следвате следните стъпки:

Изберете изображенията, които искате да комбинирате, и ги качете в Discord.
Копирайте връзките към изображенията и ги добавете към подканата /представете си като подкани за изображения.
Добавете "-v 4" към вашата подкана, ако версия 4 не е активирана по подразбиране.
Изпратете командата и изчакайте изображението да бъде генерирано.

Например, за да комбинирате две изображения, можете да използвате следната команда: /imagine –v 1

Можете също да добавите допълнителна информация, включително обекти, фон и общ художествен стил, за да създадете изцяло ново изображение със собствен стил. Например: /imagine , анимационен стил, весела тълпа на заден план, лого на Tesla на гърдите, -без костюм -v 1

Midjourney също стартира нова функция, командата /blend, която позволява до пет изображения да бъдат обединени, без да се налага да копирате и поставяте URL адреси. Можете да активирате командата /blend, като включите флага –blend във вашата подкана.

Важно е да се отбележи, че тази функция работи само с версия 4 на алгоритъма Midjourney и комбинирането на изображения не изисква допълнителен текст, но добавянето на информация обикновено води до по-добри снимки. Най-добри резултати обикновено се постигат чрез експериментиране с Art Styles и коригиране на изображения с Remix Mode.

Комбинирайте повече от две изображения

Midjourney позволява на потребителите да смесват до пет изображения с помощта на командата /blend. Въпреки това, ако потребителите трябва да комбинират повече от пет изображения, те могат да използват командата /imagine и да поставят публичните URL адреси на изображения в ред. За да комбинирате повече от две изображения с помощта на командата /imagine, потребителите могат да добавят подкани към командата. Например, за да комбинирате три изображения, командата ще бъде /imagine –v 1.

Потребителите могат да добавят повече командни подкани, за да комбинират повече изображения. Важно е да се отбележи, че добавянето на допълнителна информация към подканата, включително обекти, фон и общ художествен стил, може да помогне за създаването на изцяло ново изображение със собствен стил. Най-добри резултати се постигат чрез експериментиране с Art Styles и коригиране на изображения с Remix Mode

Командване / смесване в Midjourney

Командата /blend на Midjourney позволява на потребителите да смесват до пет изображения чрез добавяне на лесни за използване UI елементи директно в интерфейса на Discord. Потребителите могат да плъзгат и пускат изображения в интерфейса или да ги избират директно от своя твърд диск. Потребителите могат също така да избират размерите на изображението, което искат да видят генерирано. Ако потребителите използват персонализирани суфикси, те могат по желание да ги добавят в края на командата, както при всяка нормална команда /imagine.

Екипът на Midjourney създаде командата /blend, за да изследва ефективно „концепциите“ и „настроенията“ на изображенията на потребителите и да се опита да ги смеси. Това понякога води до изненадващо привлекателни изображения, а в други случаи потребителите завършват с ужасяващи изображения. Командата /blend обаче не поддържа текстови подкани.

Командата /blend има ограничения. Най-очевидното е, че потребителите могат да добавят само пет различни препратки към изображения. Въпреки че командата /imagine технически приема повече от пет изображения, колкото повече препратки добавят потребителите, толкова по-малко важно е всяко от тях. Това е общ проблем с проблемното разреждане, а не конкретен /blend проблем. Другото основно ограничение е, че командата Midjourney blend не работи с текстови подкани. Това може да е жалко за напреднали потребители, които рядко просто смесват две изображения. Въпреки това, за потребители, които искат да създават mashups, това ограничение няма голямо значение.

Подобрете времето за изграждане

има начини за подобряване или оптимизиране на времето за генериране на изображение от Midjourney AI. Ето няколко съвета, които могат да ви помогнат:

Използвайте конкретни и подробни подкани: Midjourney генерира изображения въз основа на потребителски подкани. Колкото по-конкретна и подробна е подканата, толкова по-добри са резултатите. Освен това намалява времето, необходимо за генериране на изображение, тъй като AI алгоритъмът има по-точна представа за това, което потребителят иска.
Експериментирайте с различни настройки за качество: Параметърът –quality настройва качеството на изображението и времето, необходимо за генерирането му. Настройките с по-ниско качество създават изображения по-бързо, докато настройките с по-високо качество може да отнемат повече време, но дават по-добри резултати. Важно е да експериментирате с различни настройки, за да намерите правилния баланс между качество и скорост.
Използвайте Relax Mode: Абонатите на стандартен и професионален план могат да използват Relax Mode, който не струва нищо за GPU времето на потребителя, но поставя задачи в опашка въз основа на това колко често се използва устройството. Времената на изчакване за режим Relax са динамични, но обикновено са между 0 и 10 минути на задача. Използването на режим Relax може да бъде добър начин за оптимизиране на времето за изграждане, особено за потребители, които генерират голям брой изображения всеки месец.
Купете още Бързи часове: Бързият режим е най-високо приоритетно ниво на обработка и използва месечното GPU време от абонамента на потребителя. Потребителите могат да закупят повече бързи часове на своята страница Midjourney.com/accounts, което помага да се гарантира, че техните изображения се генерират бързо и ефективно.
Използвайте Fast Relax: Fast Relax е нова функция в Midjourney, която позволява на потребителите да генерират изображения по-бързо, като жертват известно качество. Режимът Fast Relax генерира изображения с качество от около 60%, което може да бъде добър компромис за потребители, които искат да генерират изображения бързо, но не искат да жертват твърде много качество.

В обобщение, има няколко начина за подобряване или оптимизиране на времето за изграждане за създаване на Midjourney AI изображения, включително използване на конкретни подкани, експериментиране с различни настройки за качество, използване на режим Relax или закупуване на повече бързи часове и използване на режим Fast Relax.

Колко точни са изображенията, генерирани от AI модела на Midjourney?

Точността на изображенията, генерирани от AI модела на Midjourney, може да варира в зависимост от подканата и качеството на данните за обучение. Потребителите могат да подобрят точността на генерираните изображения, като бъдат конкретни и подробни в своите заявки. Колкото по-конкретна и описателна е подканата, толкова по-добре AI ще може да произведе добри резултати. AI моделът на Midjourney е обучен върху милиони изображения и текстови описания, извлечени от интернет, което също може да повлияе на точността на генерираните изображения.

AI моделът на Midjourney използва дифузия, която включва добавяне на шум към изображение и след това обръщане на процеса за извличане на данните. Този процес се повтаря безкрайно, карайки модела да добавя шум и след това да го премахва отново, като в крайна сметка създава реалистични изображения чрез малки вариации в изображението.

Трябва да се отбележи, че генерираните от AI изображения на Midjourney са били обект на противоречия по отношение на нарушаване на авторски права и артистична оригиналност. Някои художници обвиняват Midjourney в обезценяване на оригиналната творческа работа, докато други го виждат като инструмент за бързо прототипиране на концептуално изкуство, което да показват на клиентите, преди да започнат да работят върху себе си.

Как Midjourney отговаря на опасенията относно нарушаването на авторските права и оригиналността на изображенията, генерирани от AI?

Midjourney: Нарушаване на авторски права и оригиналност на изображения, генерирани от AI

Midjourney предприе стъпки за справяне с опасенията относно нарушаването на авторските права и оригиналността на генерираните от AI изображения. Midjourney внимателно проверява всяка подкана и всяко изображение, за да се увери, че няма проблеми с авторските права, като използва само лицензирано или обществено достояние съдържание и прави допълнителни проучвания или като иска разрешение от законния собственик в случай на несигурност.

Midjourney също насърчава отговорността на своите потребители, като ги призовава да спазват законите за авторското право и да използват само изображения и подкани, които имат право да използват. Ако потребител постави под съмнение източника на публикация или изображение, платформата предприема незабавни действия за разследване и премахване на всяко нарушаващо съдържание, в съответствие със Закона за авторското право в цифровото хилядолетие (DMCA) от 1998 г.

DMCA предоставя защитни разпоредби за доставчици на онлайн услуги, като Midjourney, които действат добросъвестно, за да премахнат съдържание в нарушение, когато бъдат уведомени от притежателя на авторските права. Midjourney също има Политика за премахване на DMCA, която позволява на артистите да поискат работата им да бъде премахната от снимачната площадка, ако смятат, че нарушаването на авторските права е очевидно. [2][4].

Подходът на Midjourney за избягване на нарушение е в съответствие с делата на Върховния съд като Feist Publications, Inc. v. Rural Telephone Service Co., Inc. (1991 г.), където Съдът приема, че оригиналността, а не новостта е основното изискване за защита на авторските права, и Oracle America, Inc. v. Google LLC (2018 г.), където Съдът постановява, че копирането на оригинално произведение, дори с различна цел, все още може да се счита за нарушение на авторски права.

Изображенията, генерирани от AI на Midjourney, са били обект на противоречия по отношение на нарушаване на авторски права и художествена оригиналност. Някои художници обвиняват Midjourney в обезценяване на оригиналната творческа работа, докато други го виждат като инструмент за бързо прототипиране на концептуално изкуство, което да показват на клиентите, преди да започнат да работят върху себе си. Условията за ползване на Midjourney включват Политика за премахване на DMCA, която позволява на артистите да поискат работата им да бъде премахната от комплекта, ако смятат, че има нарушение на авторските права.

Как Midjourney гарантира, че цялото лицензирано или обществено достояние съдържание, използвано за създаване на генерирани от AI изображения, е правилно приписано?

Не е ясно как Midjourney гарантира, че цялото лицензирано или обществено достояние съдържание, използвано за създаване на изображения, генерирани от AI, е правилно приписано. Въпреки това Midjourney внимателно проверява всяка публикация и изображение, за да се увери, че няма проблеми с авторските права, като използва само лицензирано съдържание или съдържание, което е обществено достояние, и провежда допълнителни проучвания или като иска разрешение от законния собственик в случай на несигурност.

Midjourney също насърчава отговорността на своите потребители, като ги призовава да спазват законите за авторското право и да използват само изображения и подкани, които имат право да използват. Ако потребител поставя под съмнение източника на публикация или изображение, платформата предприема бързи действия за разследване и премахване на всяко нарушаващо съдържание, в съответствие със Закона за авторското право в цифровото хилядолетие (DMCA) от 1998 г.

Midjourney също има DMCA Takedown Policy, която позволява на артистите да поискат работата им да бъде премахната от поредицата, ако смятат, че има явно нарушение на авторските права.

Правилата, които потребителите трябва да спазват на Midjourney

Midjourney е установил набор от правила, които потребителите трябва да следват, за да осигурят гостоприемна и приобщаваща общност за всички. Тези правила са както следва: [0][1][2] :

Бъдете мили и уважавайте другите и персонала. Не създавайте изображения и не използвайте текстови подкани, които по своята същност са неуважителни, агресивни или по друг начин обидни. Насилие или тормоз от всякакъв вид няма да бъдат толерирани.
Без съдържание за възрастни или кървави сцени. Моля, избягвайте визуално обидно или смущаващо съдържание. Някои текстови записи се блокират автоматично.
Не възпроизвеждайте публично творения на други хора без тяхно разрешение.
Обърнете внимание на споделянето. Можете да споделяте вашите творения извън общността на Midjourney, но помислете как другите могат да видят вашето съдържание.
Всяко нарушение на тези правила може да доведе до изключване от услугата.
Тези правила се прилагат за цялото съдържание, включително изображения, направени в частни сървъри, в частен режим и в директни съобщения с Midjourney Bot.

Midjourney също има списък със забранени думи, които не са разрешени в съобщенията. Списъкът със забранени думи включва думи, пряко или непряко свързани с насилие, тормоз, кръв, съдържание за възрастни, наркотици или реч на омразата. Освен това не позволява подкани, които включват или са свързани с агресия и насилие.

Забранени думи в Midjourney

Midjourney е внедрил филтър, който автоматично филтрира и забранява точните или подобни думи в списъка със забранени думи. Списъкът със забранени думи включва думи, които са пряко или косвено свързани с насилие, тормоз, кръв, съдържание за възрастни, наркотици или подбуждане към омраза. Освен това не позволява подкани, които включват или се отнасят до агресия и злоупотреба.

Списъкът със забранени думи не е непременно изчерпателен и може да има много други термини, които все още не са в списъка. Midjourney непрекъснато актуализира списъка със забранени думи. Този списък се преразглежда постоянно и не е публичен. Има обаче списък, управляван от общността, до който потребителите могат да имат достъп и да допринасят, ако желаят. [0][1].

Ако дума е в списъка със забранени думи или ако е тясно или отдалечено свързана със забранена дума, Midjourney няма да позволи подканата. Потребителите на Midjourney трябва да заменят забранените думи с подобни, но позволени думи, да избягват използването на дума, която е дори слабо свързана със забранена дума, или да обмислят използването на синоним или алтернативна формулировка. Потребителите на Midjourney винаги трябва да проверяват канала #rules, преди да изпратят своето съобщение, тъй като екипът непрекъснато актуализира списъка със забранени думи [2].

Midjourney има кодекс на поведение, който потребителите трябва да следват. Кодексът за поведение не се отнася само до следване на съдържанието на PG-13, но и до любезност и уважение към другите и персонала. Нарушаването на правилата може да доведе до спиране или изгонване от услугата. Midjourney е отворена общност на Discord и спазването на кодекса на поведение е от съществено значение. Дори ако потребителите използват услугата в режим „/private“, те трябва да спазват кодекса за поведение.

В заключение, Midjourney прилага стриктна политика за модериране на съдържанието и забранява всякаква форма на насилие или тормоз, всяко съдържание за възрастни или кръв, както и всяко визуално обидно или смущаващо съдържание. Midjourney е внедрил филтър, който автоматично филтрира и забранява точни или подобни думи в списъка със забранени думи, който включва думи, пряко или косвено свързани с насилие, тормоз, кръв, съдържание за възрастни, наркотици или подбуждане към омраза. Потребителите на Midjourney трябва да спазват кодекса на поведение и да проверят канала #rules, преди да изпратят своето съобщение, тъй като екипът непрекъснато актуализира списъка със забранени думи.

Актуализиран списък със забранени думи

Midjourney периодично коригира списъка със забранени думи и списъкът е под постоянен преглед. Списъкът със забранени думи не е публичен, но има списък, управляван от общността, до който потребителите могат да имат достъп и да допринасят. Midjourney се стреми да осигури PG-13 изживяване в цялата си услуга, поради което думите и съдържанието, свързани с насилие, кръв, тормоз, наркотици, съдържание за възрастни и теми, които обикновено са обидни, са забранени. Списъкът със забранени думи е разделен на няколко категории, покриващи спектъра от теми, споменати по-горе. Важно е да се отбележи, че списъкът със забранени думи в Midjourney не е непременно изчерпателен и че може да има много други термини, които все още не са в списъка.

Забрана и спиране на Midjourney

Midjourney има строг кодекс на поведение, който потребителите трябва да следват. Нарушаването на правилата може да доведе до спиране или изгонване от услугата. Въпреки това не е ясно дали потребителите могат да обжалват забрана или спиране от Midjourney. Източниците не споменават изрично процес на обжалване или как да се свържете с екипа на Midjourney относно забрана или спиране. От съществено значение е да спазвате кодекса на поведение, за да избегнете забрана или отстраняване от услугата. Ако потребителите имат притеснения или въпроси относно услугата, те могат да се свържат с екипа на Midjourney чрез техния Discord сървър [1][2].

Може ли Midjourney да генерира изображения в определени размери или резолюции?

Midjourney има специфични размери и разделителни способности на изображението по подразбиране, които потребителите могат да генерират. Размерът на изображението по подразбиране за Midjourney е 512x512 пиксела, който може да бъде увеличен до 1024x1024 пиксела или 1664x1664 пиксела с помощта на командата /imagine в Discord. Има и бета опция, наречена „Beta Upscale Redo“, която може да увеличи размера на изображенията до 2028x2028 пиксела, но може да замъгли някои детайли.

Потребителите могат да мащабират до максимална разделителна способност само след извършване на поне основно мащабиране на изображение [1]. Максималният размер на файла, който Midjourney може да генерира, е 3 мегапиксела, което означава, че потребителите могат да създават изображения с произволно съотношение, но крайният размер на изображението не може да надвишава 3 000 000 пиксела. Разделителната способност на Midjourney е достатъчна за основни разпечатки на снимки, но ако потребителите искат да отпечатат нещо по-голямо, може да се наложи да използват външен AI конвертор, за да получат добри резултати.

Как Midjourney се сравнява с други AI генератори на изображения като DALL-E и Stable Diffusion?

Според източниците, Midjourney е генератор на изображения с изкуствен интелект, който създава артистични и мечтателни изображения от текстови подкани. Сравнява се с други генератори като DALL-E и Stable Diffusion. Съобщава се, че Midjourney предлага по-ограничена гама от стилове от другите два, но изображенията му все още са по-мрачни и по-изкусни. Midjourney изглежда не съответства на DALL-E и Stable Diffusion, когато става въпрос за фотореализъм [1][2].

Stable Diffusion се сравнява с Midjourney и DALL-E и се казва, че е някъде по средата по отношение на лекота на използване и качество на продукцията. Stable Diffusion предлага повече опции от DALL-E, като например скала за определяне на това колко добре генераторът проследява водещите думи и опции относно изходния формат и размер. Работният процес на Stable Diffusion обаче не съвпада с този на DALL-E, който групира изображения и предлага папки за събиране. Твърди се, че Stable Diffusion и DALL-E имат едни и същи недостатъци, когато става въпрос за фотореализъм, като и двете не успяват да се доближат до уеб приложението Discord на Midjourney [0].

Според сравнителен тест на Fabian Stelzer, Midjourney винаги е по-тъмен от DALL-E и Stable Diffusion. Докато DALL-E и Stable Diffusion генерират по-реалистични изображения, предложенията на Midjourney имат артистично, мечтано качество. Midjourney се сравнява с аналогов синтезатор на Moog с приятни артефакти, докато DALL-E се сравнява със синтезатор на цифрова работна станция с по-широк обхват.

Stable Diffusion се сравнява със сложен модулен синтезатор, който може да произвежда почти всеки звук, но е по-труден за задействане. По отношение на разделителната способност на изображението, Midjourney може да генерира изображения с разделителна способност 1792x1024, докато DALL-E е малко по-ограничен при 1024x1024. Стелцер обаче отбелязва, че отговорът кой е най-добрият генератор е изцяло субективен и се свежда до личните предпочитания.

Известно е, че DALL-E създава по-фотореалистични изображения, дори изображения, които са неразличими от снимките. Твърди се, че има по-добро разбиране или осведоменост от другите генератори на AI. Midjourney обаче не е предназначен да създава фотореалистични изображения, а по-скоро да създава мечтани и артистични изображения. Следователно изборът между двата генератора в крайна сметка зависи от нуждите и предпочитанията на потребителя.

Как ограничената гама от стилове на Midjourney влияе върху неговата използваемост в сравнение с DALL-E и стабилния стрийминг?

Според източници ограничената гама от стилове на Midjourney може да повлияе на неговата използваемост в сравнение с DALL-E и Stable Diffusion. Изображенията на Midjourney се считат за по-естетически приятни, но диапазонът от стилове е по-ограничен от този на DALL-E и Stable Diffusion. Стилът на Midjourney се описва като мечтателен и артистичен, докато DALL-E е известен с това, че създава по-фотореалистични изображения, които са неразличими от снимките.

Stable Diffusion попада някъде по средата по отношение на лекота на използване и качество на резултатите. Stable Diffusion предлага повече опции от DALL-E, като например скала за определяне колко добре генераторът следва предложените думи, както и опции относно формата и размера на резултатите. Midjourney се сравнява с аналогов синтезатор на Moog с приятни артефакти, докато DALL-E се сравнява с цифров синтезатор на работна станция с по-широк диапазон. Stable Diffusion се сравнява със сложен модулен синтезатор, който може да произвежда почти всеки звук, но е по-труден за задействане [1][2].

Твърди се, че DALL-E е по-гъвкав от Midjourney, способен да предложи по-голямо разнообразие от визуални стилове. DALL-E също е по-добър в създаването на реалистични, "нормални" снимки, които биха изглеждали страхотно в списание или на корпоративен уебсайт. DALL-E също така предлага мощни инструменти, с които Midjourney не разполага, като наслагване на боя, изрязване и различни качвания на изображения, които са от съществено значение за по-изобретателни употреби на AI изкуство.

Моделът на DALL-E има по-малко мнения, което го прави по-възприемчив към предложения за стил, особено ако този стил не е толкова непосредствено красив. Следователно DALL-E е по-вероятно да предостави точна реакция на конкретна заявка, като например пикселно изкуство. DALL-E също предлага истинско уеб приложение, което позволява на потребителите да работят директно с DALL-E, което може да бъде по-малко объркващо от инсталирането на Discord.

В сравнение с Midjourney, Stable Diffusion трябва да бъде напълно безплатен, което го прави по-достъпен за тези, които не могат да си позволят AI генератор на изображения. Въпреки това, Stable Diffusion е наличен само като бот на Discord и потребителите трябва да кандидатстват за достъп до него. Stable Diffusion също се счита за по-труден за стартиране от Midjourney, който е по-лесен за използване благодарение на избора на пропорции и публична галерия. Midjourney също предлага AutoArchive, който архивира всички изображения, и 2x2 мрежа от запазени миниатюри, което улеснява управлението на работата. Приложението Discord на Midjourney също работи по-добре на мобилни устройства от уебсайта на DALL-E, което улеснява генерирането на изображения в движение. Уникалният стил на Midjourney го прави идеален за бързо генериране на голям брой приятни изображения, без да е необходимо да прецизирате посланието.

В заключение, всеки AI генератор на изображения има своите предимства и недостатъци и всеки човек може да има различни предпочитания и нужди. Ограничената гама от стилове на Midjourney може да повлияе на неговата използваемост в сравнение с DALL-E и Stable Diffusion, но уникалният му стил го прави идеален за генериране на мечтателни, артистични изображения. DALL-E е по-гъвкав и умел в създаването на фотореалистични изображения, докато Stable Diffusion е напълно безплатен и предлага повече опции от DALL-E. В крайна сметка изборът между генераторите зависи от нуждите и предпочитанията на потребителя.

Има ли значителни разлики в качеството на резултатите, получени от трите AI генератора на изображения?

Източниците не споменават значителни разлики в качеството на изхода между трите AI генератора на изображения (Midjourney, DALL-E и Stable Diffusion). Въпреки това източниците споменават, че всеки генератор има своите силни и слаби страни и всеки може да е по-подходящ за различни типове изображения или стилове. Например се казва, че Midjourney създава мечтателни и артистични изображения, докато DALL-E е известно, че създава по-фотореалистични изображения, които са неразличими от снимките. Stable Diffusion е между двете по отношение на лекота на използване и качество на резултатите. В крайна сметка изборът между генераторите зависи от нуждите и предпочитанията на потребителя.

Съвети за избор на най-добрия генератор за конкретен проект или приложение

Според източниците изборът на най-добрия генератор на AI изображения за конкретен проект или приложение зависи от нуждите и предпочитанията на потребителя. Потребителят трябва да вземе предвид фактори като вида на изображенията, които иска да създаде, нивото на детайлност и реализъм, от което се нуждае, лекотата на използване на генератора, наличието на функции като рисуване, изрязване и качване на различни изображения , както и цената на генератора.

Ако потребителят иска да създава мечтани и артистични изображения, Midjourney е най-добрият вариант. Ако потребителят иска да създава фотореалистични изображения, DALL-E е по-добра опция. Stable Diffusion е между двете по отношение на лекота на използване и качество на резултатите. Stable Diffusion предлага повече опции от DALL-E, като например скала за определяне колко добре генераторът следва насоките, както и опции относно формата и размера на резултатите. Работният процес на Stable Diffusion обаче не е сравним с този на DALL-E, който групира изображения и предлага папки за събиране.

Потребителят също трябва да прецени дали генераторът е безплатен или платен и дали е достъпен като уеб приложение или бот на Discord. Stable Diffusion е напълно безплатен и се предлага като бот на Discord, докато Midjourney и DALL-E са платени и се предлагат като уеб приложения или ботове на Discord.

В крайна сметка изборът между генераторите зависи от нуждите и предпочитанията на потребителя. Потребителят трябва да проучи и сравни характеристиките и качеството на изхода на всеки генератор, преди да избере този, който най-добре отговаря на техните нужди.

Алтернативи в средата на курса.

Както споменахме по-рано, Midjourney е популярен AI генератор на изображения, който създава изображения от текстови описания. Той обаче предлага само 25 минути безплатно време за рендиране, което е около 30 изображения. Ако търсите безплатна алтернатива на Midjourney, има няколко опции, които можете да опитате.

Ето някои безплатни алтернативи на Midjourney:

Пастел : Това е безплатно решение с отворен код, което предлага добра алтернатива на Midjourney.
DALL-E : Това е друг генератор на изображения, подобен на Midjourney и достъпен безплатно. Създаден е от OpenAI.
Jasper: Това е безплатен генератор на изображения с отворен код, който може да се използва като алтернатива на Midjourney.
Чудя се : Това е безплатен генератор на изображения с отворен код, който може да се използва като алтернатива на Midjourney.
Извикайте AI : Това е красиво проектиран генератор на изображения с интуитивен интерфейс, който може да се използва като алтернатива на Midjourney.
Disco Diffusion: Това е базирана на облак система за конвертиране на текст в изображение, която е лесна за използване и може да се използва като алтернатива на Midjourney.

Ако търсите нещо по-специфично или персонализирано, Stable Streaming (SD) може да е добър вариант. [3]. SD обаче изисква повече усилия за постигане на добри резултати и не е толкова лесен за използване като Midjourney. Освен това има няколко други безплатни системи за преобразуване на текст в изображение, като Wombo's Dream, Hotpot's AI Art Maker, SnowPixel, CogView, StarryAI, ArtBreeder и ArtFlow.

В заключение, ако търсите безплатна алтернатива на Midjourney, има няколко налични опции, като Craiyon, DALL-E, Jasper, Wonder, Invoke AI, Disco Diffusion и Stable Diffusion. Тези системи предлагат различни степени на персонализиране и лекота на използване, така че трябва да опитате няколко и да видите коя работи най-добре за вас.

Тази статия е написана в сътрудничество с екипа Дълбок AI et Орг.

[Обща сума: 0 Означава: 0]

Midjourney: Всичко, което трябва да знаете за AI художника

Midjourney: Какво е това? Употреба, ограничения и алтернативи

Процесът, използван от Midjourney за генериране на изображения от текстови подкани