in ,

Дунд аялал: AI зураачийн талаар мэдэх шаардлагатай бүх зүйл

Аяллын дунд: Энэ юу вэ? Хэрэглээ, хязгаарлалт ба хувилбарууд

Дунд аялал: AI зураачийн талаар мэдэх шаардлагатай бүх зүйл
Дунд аялал: AI зураачийн талаар мэдэх шаардлагатай бүх зүйл

Midjourney бол AI дүрс үүсгэгч бөгөөд текстийн тайлбараас зураг үүсгэдэг. Энэ бол Leap Motion-ийг үүсгэн байгуулагч Дэвид Холзийн удирддаг судалгааны лаборатори юм. Midjourney нь таны эрэлт хэрэгцээнд нийцүүлэн илүү мөрөөдөмтгий уран сайхны хэв маягийг санал болгодог бөгөөд бусад хиймэл оюун ухаан үүсгэгчтэй харьцуулахад илүү готик дүр төрхтэй. Энэхүү хэрэгсэл нь одоогоор нээлттэй бета хувилбарт байгаа бөгөөд зөвхөн албан ёсны Discord дээрх Discord ботоор дамжуулан хандах боломжтой.

Зураг үүсгэхийн тулд хэрэглэгчид /imagine командыг ашиглаж, сануулга оруулах ба робот дөрвөн зургийн багцыг буцаана. Хэрэглэгчид аль зургийг масштаблахыг хүсч байгаагаа сонгох боломжтой. Midjourney мөн вэб интерфэйс дээр ажиллаж байна.

Үүсгэн байгуулагч Дэвид Холз уран бүтээлчдийг Midjourney-ийн өрсөлдөгч биш харин үйлчлүүлэгчид гэж үздэг. Уран бүтээлчид Midjourney-ийг бие даан ажиллаж эхлэхээсээ өмнө үйлчлүүлэгчиддээ толилуулж буй концепцийн урлагийг хурдан загварчлахад ашигладаг. Midjourney-ийн бүх жагсаалтад уран бүтээлчдийн зохиогчийн эрхээр хамгаалагдсан бүтээлүүд багтаж болох тул зарим уран бүтээлчид Midjourney-ийг анхны бүтээлч бүтээлийн үнэ цэнийг бууруулсан гэж буруутгаж байна.

Midjourney-ийн Үйлчилгээний Нөхцөлд DMCA Татан буулгах бодлогыг багтаасан ба энэ нь уран бүтээлчид зохиогчийн эрхийг зөрчсөн гэж үзвэл бүтээлээ багцаас хасах хүсэлт гаргах боломжийг олгодог. Зар сурталчилгааны салбар нь Midjourney, DALL-E, Stable Diffusion зэрэг хиймэл оюун ухааны хэрэгслүүдийг ашигласан бөгөөд сурталчлагчдад анхны контент бүтээх, санаагаа хурдан гаргах боломжийг олгодог.

Midjourney-ийг янз бүрийн хүмүүс, компаниуд The ​​Economist, Corriere della Sera зэрэг зураг, урлагийн бүтээл хийхэд ашигладаг. Гэсэн хэдий ч Midjourney нь уран бүтээлчдийн ажлын байрыг булааж, зохиогчийн эрхийг нь зөрчиж байна гэж үздэг зарим уран бүтээлчдийн шүүмжлэлд өртөж байна. Midjourney нь мөн уран бүтээлчдийн баг зохиогчийн эрхийг зөрчсөн хэргээр шүүхэд нэхэмжлэл гаргасан.

Midjourney-г ашиглаж эхлэхийн тулд хэрэглэгчид Discord руу нэвтэрч, Midjourney вэб сайт руу орж бета хувилбарт нэгдэх хэрэгтэй. Зөвшөөрөгдсөний дараа хэрэглэгчид Discord Midjourney-д урилга хүлээн авах бөгөөд /imagine/ гэж бичээд дараа нь хүссэн сануулгыг оруулан зураг үүсгэж эхлэх боломжтой.

Midjourney өөрийн туршлага, сургалтын талаар тийм ч их мэдээлэл өгөөгүй байгаа ч тэрээр Dall-E 2 болон Stable Diffusion-тэй төстэй системийг ашиглаж, тэдгээрийг тайлбарлахын тулд интернетээс зураг, текстийг хусаж, олон сая хэвлэгдсэн зургийг сургалтанд ашигладаг гэж таамаглаж байна. .

Агуулгын хүснэгт

Midjourney-ийн текст сануулгаас зураг үүсгэхэд ашигладаг процесс

Midjourney нь текстээс зураг үүсгэх хиймэл оюун ухааны загварыг ашигладаг. Midjourney бот нь сануулга дахь үг, хэллэгийг токен гэж нэрлэдэг жижиг хэсгүүдэд хувааж, сургалтын өгөгдөлтэй нь харьцуулж, дараа нь зураг үүсгэхэд ашигладаг. Сайн зохион бүтээсэн сануулга нь өвөрмөц, сэтгэл хөдөлгөм зургийг бүтээхэд тусална [0].

Midjourney ашиглан зураг үүсгэхийн тулд хэрэглэгчид Midjourney Discord сувгийн "/imagine" командыг ашиглан зураг ямар байхыг хүсч байгаагаа тайлбарлах ёстой. Мэдээлэл нь илүү тодорхой, дүрсэлсэн байх тусам хиймэл оюун ухаан сайн үр дүнд хүрэх болно. Midjourney дараа нь минутын дотор сануулгыг үндэслэн зургийн хэд хэдэн өөр хувилбарыг үүсгэх болно. Хэрэглэгчид эдгээр зургийн аль нэгийг нь өөр хувилбараар авах эсвэл аль нэгийг нь томруулж илүү том, өндөр чанартай зураг авах боломжтой. Midjourney нь хурдан бөгөөд тайван горимуудыг санал болгодог бөгөөд хурдан горим нь хамгийн их томруулж, богино хугацаанд илүү олон зураг гаргахад шаардлагатай байдаг.

Midjourney-ийн AI загвар нь тархалтыг ашигладаг бөгөөд энэ нь зураг дээр чимээ шуугиан нэмж, дараа нь өгөгдлийг сэргээх процессыг буцаах явдал юм. Энэ үйл явц эцэс төгсгөлгүй давтагдаж, загварт чимээ шуугиан нэмж, дараа нь дахин арилгахад хүргэдэг бөгөөд эцэст нь зураг дээр жижиг өөрчлөлтүүд хийж бодит зургуудыг бий болгодог. Midjourney олон сая хэвлэгдсэн дасгалын зургийг ашиглан тэдгээрийг тайлбарлах зураг, текстийг интернетээс хайж олжээ.

Midjourney-ийн AI загвар нь 2,3 тэрбум хос зураг, текстийн тайлбар дээр бэлтгэгдсэн тогтвортой урсгал дээр суурилдаг. Сануулахад зөв үгсийг ашигласнаар хэрэглэгчид санаанд орсон бараг бүх зүйлийг бүтээх боломжтой. Гэсэн хэдий ч зарим үгсийг хориглодог бөгөөд Midjourney нь хорлонтой хүмүүсийг сануулга үүсгэхээс сэргийлэхийн тулд эдгээр үгсийн жагсаалтыг хөтөлдөг. Midjourney's Discord нийгэмлэг нь хэрэглэгчдэд шууд тусламж, олон жишээ үзүүлэх боломжтой.

Зураг ашиглах, үүсгэх

Midjourney AI-г үнэгүй ашиглахын тулд та Discord данстай байх ёстой. Хэрэв танд байхгүй бол Discord дээр үнэгүй бүртгүүлээрэй. Дараа нь Midjourney вэб сайтад зочилж, Beta-д нэгдэхийг сонгоно уу. Энэ нь таныг Discord урилгад хүргэх болно. Midjourney-д хийх Discord-ын урилгыг хүлээн авч, Discord дээр үргэлжлүүлэхийг сонгоно уу. 

Таны Discord програм автоматаар нээгдэх бөгөөд та зүүн талын цэснээс хөлөг онгоц хэлбэртэй Midjourney дүрсийг сонгох боломжтой. Midjourney сувгууд дээр шинээр ирсэн өрөөнүүдийг олоод аль нэгийг нь сонгоод эхлүүлнэ үү. Та бэлэн болмогц шинээр ирсэн хүмүүсийн өрөөнд зориулсан Discord чат дээр "/imagine" гэж бичээрэй. 

Энэ нь зургийн тайлбарыг оруулах боломжтой талбар үүсгэх болно. Та өөрийн тайлбарт илүү тодорхой байх тусам хиймэл оюун ухаан сайн үр дүнд хүрэх болно. Дүрслэх чадвартай байх ба хэрэв та тодорхой хэв маягийг хайж байгаа бол үүнийг тайлбартаа оруулаарай. Midjourney нь хэрэглэгч бүрт хиймэл оюун ухаантай тоглох 25 оролдлогыг санал болгодог. 

Үүний дараа та үргэлжлүүлэхийн тулд бүрэн эрхт гишүүнээр бүртгүүлэх шаардлагатай. Хэрэв та мөнгө үрэхгүй байхыг хүсч байвал Midjourney дээр юу бүтээхийг хүсч байгаагаа хэсэг хугацаанд бодож үзэх нь зүйтэй юм. 

Хэрэв та хүсвэл "/help" гэж бичээд дагаж мөрдөх зөвлөмжийн жагсаалтыг гаргаж болно. Midjourney AI-г ашиглахаасаа өмнө хориотой үгсийн жагсаалтыг мэдэх нь чухал бөгөөд ёс зүйн дүрмийг дагаж мөрдөөгүй тохиолдолд хориг тавих болно.

>> Мөн уншина уу - Хиймэл оюун ухааны шилдэг 27 үнэгүй вэб сайт (дизайн, хуулбар бичих, чат гэх мэт)

/командыг төсөөлөөд үз дээ

/imagine команд нь Midjourney дахь үндсэн командуудын нэг бөгөөд хэрэглэгчид өөрсдийн хэрэгцээнд тулгуурлан хиймэл оюун ухаанаар үүсгэсэн зургийг гаргах боломжийг олгодог. Энэ нь дараах байдалтай байна.

  1. Хэрэглэгчид Discord чат дээр /imagine командыг бичээд ашиглахыг хүссэн тохиргоогоо нэмнэ.
  2. Midjourney AI алгоритм нь мэдээлэлд дүн шинжилгээ хийж, оруулсан мэдээлэлд үндэслэн дүрсийг үүсгэдэг.
  3. Үүсгэсэн зургийг Discord чат дээр харуулах бөгөөд хэрэглэгчид Remix функцийг ашиглан санал хүсэлтээ өгч, мессежээ сайжруулах боломжтой.
  4. Мөн хэрэглэгчид үүсгэсэн зургийн хэв маяг, хувилбар болон бусад талыг тохируулахын тулд нэмэлт тохиргоог ашиглаж болно.

/imagine команд нь зураг болон текстийн сануулгыг хоёуланг нь хүлээн авдаг. Хэрэглэгчид үүсгэхийг хүссэн зургийнхаа URL эсвэл хавсралтыг өгснөөр сануулгыг зураг болгон нэмж болно. Текст сануулга нь объект, дэвсгэр, хэв маяг гэх мэт хэрэглэгчдийн үүсгэхийг хүссэн зургийн тайлбарыг агуулж болно. Хэрэглэгчид ашиглахыг хүсч буй алгоритмынхаа хувилбарыг тохируулах, Remix функцийг идэвхжүүлэх гэх мэт нэмэлт параметрүүдийг тушаалд нэмж болно.

Midjourney AI үүсгэж болох зургийн төрлүүдийн жишээ

Midjourney AI нь янз бүрийн хэв маягаар өргөн хүрээний зургийг бүтээх боломжтой бөгөөд үүнд:

  • "Гахайн адал явдал"-ын жишээ гэх мэт хүүхдийн номны зураглал.
  • Хүмүүс, амьтан, эд зүйлсийн бодит хөрөг зураг.
  • Янз бүрийн элемент, хэв маягийг хослуулсан сюрреал болон хийсвэр урлагийн бүтээлүүд.
  • Янз бүрийн сэтгэл хөдлөл, сэтгэл хөдлөлийг өдөөж болох ландшафт, хотын дүр төрх.
  • Нарийн нарийн ширийн зүйлс, киноны эффект бүхий хар цагаан гэрэл зураг.
  • Хагас роботын эд ангиар хийсэн, хийн баг зүүсэн хөгшин эмэгтэйн жишээ гэх мэт футурист эсвэл шинжлэх ухааны уран зөгнөлт сэдвүүдийг харуулсан зургууд.

Midjourney AI-ийн бүтээсэн зургийн чанар, хэв маяг нь сануулгийн чанар, ашигласан алгоритмын хувилбар болон бусад хүчин зүйлээс хамаарч өөр өөр байж болохыг анхаарах нь чухал юм. Хэрэглэгчид хүссэн үр дүнд хүрэхийн тулд өөр өөр сануулга, тохиргоог туршиж үзэх хэрэгтэй.

Midjourney дахь зургуудыг нэгтгэх

Midjourney-д хоёр ба түүнээс дээш зургийг нэгтгэхийн тулд та дараах алхмуудыг дагана уу.

  1. Та нэгтгэхийг хүссэн зургаа сонгоод Discord-д байршуулна уу.
  2. Зурган дээрх линкүүдийг хуулж өөрийн /imagine prompt-д зургийн сануулга болгон нэмнэ үү.
  3. Хэрэв 4-р хувилбарыг өгөгдмөлөөр идэвхжүүлээгүй бол "-v 4"-г өөрийн сануулгад нэмнэ үү.
  4. Тушаалыг өгөөд зураг үүсэхийг хүлээнэ үү.

Жишээлбэл, хоёр зургийг нэгтгэхийн тулд та дараах тушаалыг ашиглаж болно: /imagine -v 1

Та мөн өөрийн гэсэн хэв маяг бүхий цоо шинэ дүр төрхийг бий болгохын тулд объект, дэвсгэр, ерөнхий урлагийн хэв маяг зэрэг нэмэлт мэдээллийг нэмж болно. Жишээ нь: / төсөөл , хүүхэлдэйн киноны хэв маяг, ард нь хөгжилтэй хүмүүс, цээжин дээрх Тесла лого, -хувцасгүй -v 1

Midjourney мөн шинэ функц болох /blend командыг эхлүүлсэн бөгөөд энэ нь URL-г хуулж буулгахгүйгээр тав хүртэлх зургийг нэгтгэх боломжийг олгодог. Та өөрийн хүлээх мөрөнд –blend тугийг оруулснаар /blend командыг идэвхжүүлж болно.

Энэ функц нь зөвхөн Midjourney алгоритмын 4-р хувилбар дээр ажилладаг гэдгийг анхаарах нь чухал бөгөөд зургуудыг нэгтгэх нь нэмэлт текст шаарддаггүй, гэхдээ мэдээлэл нэмснээр ихэвчлэн илүү сайн зураг гарч ирдэг. Хамгийн сайн үр дүнд ихэвчлэн Урлагийн хэв маягийг туршиж, Remix Mode ашиглан зургийг өөрчлөх замаар гардаг.

Хоёроос илүү зургийг нэгтгэнэ үү

Midjourney нь хэрэглэгчдэд /blend командыг ашиглан тав хүртэлх зургийг холих боломжийг олгодог. Гэсэн хэдий ч, хэрэв хэрэглэгчид таваас дээш зургийг нэгтгэх шаардлагатай бол /imagine командыг ашиглаж, нийтийн зургийн URL-уудыг эгнээнд буулгаж болно. /imagine командыг ашиглан хоёроос дээш зургийг нэгтгэхийн тулд хэрэглэгчид команд руу сануулга нэмж болно. Жишээлбэл, гурван зургийг нэгтгэхийн тулд /imagine гэсэн команд байх болно -v 1.

Хэрэглэгчид илүү олон зургийг нэгтгэхийн тулд илүү олон тушаалын мөрийг нэмж болно. Объект, дэвсгэр зураг, урлагийн ерөнхий хэв маяг зэрэг нэмэлт мэдээлэл оруулах нь өөрийн гэсэн хэв маяг бүхий цоо шинэ дүр төрхийг бий болгоход тусална гэдгийг анхаарах нь чухал юм. Урлагийн хэв маягийг туршиж, Remix Mode ашиглан зургийг өөрчлөх замаар хамгийн сайн үр дүнд хүрдэг

Замын дундуур команд /холимог

Midjourney-ийн /blend команд нь хэрэглэгчдэд хэрэглэхэд хялбар UI элементүүдийг Discord интерфэйс рүү шууд нэмж тав хүртэлх зургийг холих боломжийг олгодог. Хэрэглэгчид дүрсийг интерфэйс рүү чирж буулгах эсвэл хатуу дискнээсээ шууд сонгох боломжтой. Мөн хэрэглэгчид үүсгэхийг хүссэн зургийнхаа хэмжээг сонгох боломжтой. Хэрэв хэрэглэгчид захиалгат дагавар ашигладаг бол ердийн /imagine командын адилаар тэдгээрийг командын төгсгөлд нэмж болно.

Midjourney багийнхан хэрэглэгчдийн зургийн "үзэл баримтлал" болон "сэтгэл санааг" ​​үр дүнтэй судалж, тэдгээрийг холихыг оролдох зорилгоор /blend командыг зохион бүтээсэн. Энэ нь заримдаа гайхалтай дур булаам зургуудыг бий болгодог бөгөөд бусад тохиолдолд хэрэглэгчид аймшигтай дүр төрхтэй байдаг. Гэсэн хэдий ч /blend команд нь текст мессежийг дэмждэггүй.

/blend команд нь хязгаарлалттай. Хамгийн ойлгомжтой нь хэрэглэгчид зөвхөн таван өөр зургийн лавлагаа нэмэх боломжтой юм. Хэдийгээр /imagine команд нь техникийн хувьд таваас дээш зургийг хүлээн авдаг ч хэрэглэгчид хэдий чинээ олон лавлагаа нэмэх тусам тус бүр нь чухал биш юм. Энэ нь шингэрүүлэлтийн асуудалтай холбоотой ерөнхий асуудал бөгөөд тусгайлсан асуудал биш юм. Өөр нэг гол хязгаарлалт бол Midjourney холих команд нь текст сануулгатай ажиллахгүй байх явдал юм. Хоёр зургийг зүгээр л холих нь ховор байдаг дэвшилтэт хэрэглэгчдийн хувьд энэ нь харамсалтай байж болох юм. Гэсэн хэдий ч, mashups үүсгэхийг хүсч буй хэрэглэгчдийн хувьд энэ хязгаарлалт нь тийм ч чухал биш юм.

Барилгын цагийг сайжруулах

Midjourney AI-аар зураг үүсгэх хугацааг сайжруулах эсвэл оновчтой болгох арга замууд байдаг. Энд танд туслах хэдэн зөвлөмж байна:

  • Тодорхой, нарийвчилсан сануулгыг ашиглана уу: Дундаж аялал нь хэрэглэгчийн сануулгад үндэслэн зураг үүсгэдэг. Шуурхай нь илүү тодорхой, нарийвчилсан байх тусам үр дүн нь илүү сайн байх болно. AI алгоритм нь хэрэглэгчийн хүссэн зүйлийн талаар илүү нарийвчлалтай ойлголттой байдаг тул энэ нь зураг үүсгэх хугацааг багасгадаг.
  • Чанарын янз бүрийн тохиргоог туршиж үзээрэй: -quality параметр нь зургийн чанар болон түүнийг бүтээхэд шаардагдах хугацааг тохируулдаг. Бага чанарын тохиргоо нь зургийг илүү хурдан гаргадаг бол өндөр чанарын тохиргоо нь илүү урт хугацаа шаардагдах боловч илүү сайн үр дүнд хүргэдэг. Чанар болон хурдны хоорондох зөв тэнцвэрийг олохын тулд янз бүрийн тохиргоог туршиж үзэх нь чухал юм.
  • Тайвшруулах горимыг ашиглах: Стандарт болон мэргэжлийн төлөвлөгөөний захиалагчид Тайвшруулах горимыг ашиглах боломжтой бөгөөд энэ нь хэрэглэгчийн GPU-д зарцуулагдах зардалгүй боловч төхөөрөмжийг хэр олон удаа ашиглаж байгаагаас хамааран ажлыг дараалалд оруулдаг. Тайвшруулах горимыг хүлээх хугацаа нь динамик боловч нэг даалгаварт ихэвчлэн 0-10 минутын хооронд байдаг. Тайвшруулах горимыг ашиглах нь ялангуяа сар бүр олон тооны зураг үүсгэдэг хэрэглэгчдэд зориулж бүтээх хугацааг оновчтой болгох сайн арга юм.
  • Илүү хурдан цаг худалдаж аваарай: Хурдан горим нь боловсруулалтын хамгийн чухал түвшин бөгөөд хэрэглэгчийн захиалгаас сар бүр GPU цагийг ашигладаг. Хэрэглэгчид өөрсдийн Midjourney.com/accounts хуудаснаас илүү хурдан цагийг худалдан авах боломжтой бөгөөд энэ нь тэдний зургийг хурдан бөгөөд үр дүнтэй бүтээхэд тусалдаг.
  • Хурдан тайвшрахыг ашиглах: Хурдан тайвшрах нь Midjourney-ийн шинэ функц бөгөөд хэрэглэгчдэд зарим чанарыг алдагдуулах замаар илүү хурдан зураг үүсгэх боломжийг олгодог. Fast Relax горим нь 60% орчим чанартай зураг үүсгэдэг бөгөөд энэ нь зургийг хурдан гаргахыг хүсдэг боловч хэт их чанарыг золиослохыг хүсдэггүй хэрэглэгчдэд сайн тохирдог.

Дүгнэж хэлэхэд, Midjourney AI дүрсийг бүтээхэд зориулж бүтээх хугацааг сайжруулах, оновчтой болгох хэд хэдэн арга байдаг бөгөөд үүнд тодорхой сануулгууд ашиглах, өөр өөр чанарын тохиргоог туршиж үзэх, Тайвшруулах горимыг ашиглах эсвэл илүү хурдан цаг худалдаж авах, Хурдан тайвшрах горимыг ашиглах боломжтой.

Midjourney-ийн AI загвараар бүтээсэн зургууд хэр нарийвчлалтай вэ?

Midjourney-ийн AI загвараар бүтээгдсэн зургийн нарийвчлал нь сургалтын өгөгдлийн шуурхай байдал, чанараас хамаарч өөр өөр байж болно. Хэрэглэгчид асуулгадаа тодорхой, нарийвчилсан байдлаар үүсгэсэн зургийн нарийвчлалыг сайжруулах боломжтой. Илүү тодорхой, тодорхой тайлбарлах тусам хиймэл оюун ухаан сайн үр дүнд хүрэх боломжтой болно. Midjourney-ийн хиймэл оюун ухааны загварыг интернетээс олж авсан сая сая зураг, текстийн тайлбар дээр сургасан бөгөөд энэ нь үүсгэсэн зургийн нарийвчлалд нөлөөлж болзошгүй юм.

Midjourney-ийн AI загвар нь тархалтыг ашигладаг бөгөөд энэ нь зураг дээр чимээ шуугиан нэмж, дараа нь өгөгдлийг сэргээх процессыг буцаах явдал юм. Энэ үйл явц эцэс төгсгөлгүй давтагдаж, загварт чимээ шуугиан нэмж, дараа нь дахин арилгахад хүргэдэг бөгөөд эцэст нь зураг дээр жижиг өөрчлөлтүүд хийж бодит зургуудыг бий болгодог.

Midjourney-ийн AI загвар нь 2,3 тэрбум хос зураг, текстийн тайлбар дээр бэлтгэгдсэн тогтвортой урсгал дээр суурилдаг. Сануулахад зөв үгсийг ашигласнаар хэрэглэгчид санаанд орсон бараг бүх зүйлийг бүтээх боломжтой. Гэсэн хэдий ч зарим үгсийг хориглодог бөгөөд Midjourney нь хорлонтой хүмүүсийг сануулга үүсгэхээс сэргийлэхийн тулд эдгээр үгсийн жагсаалтыг хөтөлдөг. Midjourney's Discord нийгэмлэг нь хэрэглэгчдэд шууд тусламж, олон жишээ үзүүлэх боломжтой.

Midjourney-ийн хиймэл оюун ухаанаар бүтээгдсэн зургууд нь зохиогчийн эрхийн зөрчил, уран сайхны өвөрмөц байдлын талаар маргаан дагуулж байсныг тэмдэглэх нь зүйтэй. Зарим уран бүтээлчид Midjourney-ийг анхны бүтээлч бүтээлийн үнэ цэнийг бууруулж байна гэж буруутгаж байгаа бол зарим нь үүнийг уран бүтээлээ өөр дээрээ ажиллаж эхлэхээс өмнө үйлчлүүлэгчдэд үзүүлэх концепцийн урлагийг хурдан загварчлах хэрэгсэл гэж үздэг.

Midjourney нь зохиогчийн эрхийн зөрчил болон хиймэл оюунаар үүсгэсэн зургийн анхны байдлын талаарх санаа зовнилыг хэрхэн шийдвэрлэдэг вэ?

Аяллын дундах хугацаа: Зохиогчийн эрхийн зөрчил, хиймэл оюун ухаанаар үүсгэсэн зургийн өвөрмөц байдал

Midjourney нь зохиогчийн эрхийн зөрчил болон хиймэл оюун ухаанаар үүсгэсэн зургуудын анхны байдлын талаарх санаа зовнилыг арилгах арга хэмжээ авсан. Midjourney нь зөвхөн лицензтэй эсвэл олон нийтийн домэйн контентыг ашиглах, нэмэлт судалгаа хийх эсвэл тодорхойгүй тохиолдолд хууль ёсны эзэмшигчээс зөвшөөрөл авах замаар зохиогчийн эрхийн асуудал байхгүй эсэхийг шалгахын тулд мэдээлэл, зураг бүрийг сайтар шалгадаг.

Midjourney нь зохиогчийн эрхийн хуулиудыг хүндэтгэж, зөвхөн ашиглах эрхтэй зураг, сануулгыг ашиглахыг уриалж, хэрэглэгчдэдээ хариуцлага хүлээхийг уриалдаг. Хэрэв хэрэглэгч мессеж эсвэл зургийн эх сурвалжийг асуувал платформ нь 1998 оны Дижитал Мянганы Зохиогчийн эрхийн тухай хуулийн (DMCA) дагуу аливаа зөрчилтэй агуулгыг судалж, устгахын тулд шуурхай арга хэмжээ авдаг.

DMCA нь Midjourney зэрэг онлайн үйлчилгээ үзүүлэгчдэд зориулсан хамгаалалтын заалтуудыг бий болгодог бөгөөд зохиогчийн эрх эзэмшигчийн мэдэгдсэнээр зөрчилтэй агуулгыг устгахын тулд үнэнч шударгаар ажилладаг. Midjourney нь мөн DMCA Татан буулгах бодлоготой бөгөөд хэрэв зохиогчийн эрхийн зөрчил илэрхий гэж үзвэл уран бүтээлчид бүтээлээ багцаас хасах хүсэлт гаргах боломжтой. [2][4].

Midjourney-ийн зөрчлөөс зайлсхийх арга барил нь Дээд шүүхийн Feist Publications, Inc. v. Rural Telephone Service Co., Inc. (1991), Шүүх зохиогчийн эрхийг хамгаалахад шинэлэг зүйл биш, өвөрмөц байдал нь чухал гэж үзсэн бөгөөд Oracle America, Inc. v. Google ХХК (2018), Шүүх эх бүтээлийг өөр зорилгоор хуулбарлах нь зохиогчийн эрхийг зөрчсөн гэж үзэж болно.

Midjourney-ийн хиймэл оюун ухаанаар бүтээгдсэн зургууд нь зохиогчийн эрхийг зөрчсөн, уран сайхны өвөрмөц байдлын талаар маргаан дагуулсан. Зарим уран бүтээлчид Midjourney-ийг анхны бүтээлч бүтээлийн үнэ цэнийг бууруулж байна гэж буруутгаж байгаа бол зарим нь үүнийг уран бүтээлээ өөр дээрээ ажиллаж эхлэхээс өмнө үйлчлүүлэгчдэд үзүүлэх концепцийн урлагийг хурдан загварчлах хэрэгсэл гэж үздэг. Midjourney-ийн Үйлчилгээний Нөхцөлд DMCA Татан буулгах бодлогыг багтаасан ба энэ нь уран бүтээлчид зохиогчийн эрхийг зөрчсөн гэж үзвэл бүтээлээ багцаас хасах хүсэлт гаргах боломжийг олгодог.

Midjourney нь хиймэл оюун ухаанаар бүтээгдсэн зургийг бүтээхэд ашигласан бүх лицензтэй эсвэл нийтийн домэйн контентыг зөв холбосон эсэхийг хэрхэн баталгаажуулдаг вэ?

Midjourney нь хиймэл оюун ухаанаар үүсгэсэн зургийг бүтээхэд ашигласан бүх лицензтэй эсвэл олон нийтийн домэйн контентыг хэрхэн зөв тайлбарлаж байгаа нь тодорхойгүй байна. Гэсэн хэдий ч Midjourney нь зөвхөн лицензтэй эсвэл нийтийн домэйн контент ашиглах, нэмэлт судалгаа хийх, эсвэл тодорхойгүй тохиолдолд хууль ёсны эзэмшигчээс зөвшөөрөл авах замаар зохиогчийн эрхийн асуудал байхгүй эсэхийг шалгахын тулд нийтлэл, зураг бүрийг сайтар шалгадаг. 

Midjourney нь зохиогчийн эрхийн хуулиудыг хүндэтгэж, зөвхөн ашиглах эрхтэй зураг, сануулгыг ашиглахыг уриалж, хэрэглэгчдэдээ хариуцлага хүлээхийг уриалдаг. Хэрэв хэрэглэгч мессеж эсвэл зургийн эх сурвалжийг асуувал платформ нь 1998 оны Дижитал Мянганы Зохиогчийн эрхийн тухай хуулийн (DMCA) дагуу аливаа зөрчилтэй агуулгыг судалж, устгахын тулд шуурхай арга хэмжээ авдаг. 

Midjourney нь мөн DMCA Татан буулгах бодлоготой бөгөөд энэ нь уран бүтээлчдэд зохиогчийн эрхийг илт зөрчсөн гэж үзвэл бүтээлээ цувралаас хасах хүсэлт гаргах боломжийг олгодог.

Midjourney-ийн хиймэл оюун ухаанаар бүтээгдсэн зургууд нь зохиогчийн эрхийн зөрчил, уран сайхны өвөрмөц байдлын талаар маргаан дагуулж байсныг тэмдэглэх нь зүйтэй. Зарим уран бүтээлчид Midjourney-ийг анхны бүтээлч бүтээлийн үнэ цэнийг бууруулж байна гэж буруутгаж байгаа бол зарим нь үүнийг уран бүтээлээ өөр дээрээ ажиллаж эхлэхээс өмнө үйлчлүүлэгчдэд үзүүлэх концепцийн урлагийг хурдан загварчлах хэрэгсэл гэж үздэг.

Midjourney дээр хэрэглэгчдийн дагаж мөрдөх ёстой дүрмүүд

Midjourney нь хүн бүрийг найрсаг, хүртээмжтэй байлгахын тулд хэрэглэгчдэд дагаж мөрдөх дүрэм журмыг тогтоосон. Эдгээр дүрмүүд нь дараах байдалтай байна. [0][1][2] :

  • Эелдэг байж, бусад болон ажилчдыг хүндэл. Угаасаа үл хүндэтгэсэн, түрэмгий, эсвэл өөр байдлаар доромжилсон зураг үүсгэх эсвэл текст сануулгыг бүү ашиглаарай. Аливаа төрлийн хүчирхийлэл, дарамтыг тэвчихгүй.
  • Насанд хүрэгчдийн контент эсвэл цуст үзэгдэл байхгүй. Харааны хувьд доромжилсон, түгшүүр төрүүлсэн контентоос зайлсхий. Зарим текст оруулгыг автоматаар хаадаг.
  • Бусдын бүтээлийг зөвшөөрөлгүйгээр олны өмнө олшруулж болохгүй.
  • Хуваалцахдаа анхаараарай. Та Midjourney нийгэмлэгээс гадуур бүтээлүүдээ хуваалцаж болно, гэхдээ бусад хүмүүс таны агуулгыг хэрхэн үзэх талаар бодож үзээрэй.
  • Эдгээр дүрмийг зөрчсөн аливаа үйлчилгээг үйлчилгээнээс хасахад хүргэж болзошгүй.
  • Эдгээр дүрмүүд нь хувийн серверт, хувийн горимд болон Midjourney Bot-тай шууд мессежээр хийсэн зураг зэрэг бүх контентод хамаарна.

Midjourney мөн зурваст оруулахыг хориглосон үгсийн жагсаалттай. Хориглосон үгсийн жагсаалтад хүчирхийлэл, дарамт, доромжлол, насанд хүрэгчдэд зориулсан контент, хар тамхи, үзэн ядалттай шууд болон шууд бус холбоотой үгс багтсан болно. Цаашилбал, энэ нь түрэмгийлэл, хүчирхийллийг агуулсан эсвэл түүнтэй холбоотой сануулгыг зөвшөөрдөггүй.

Хэрэв ямар нэг үг хориотой үгийн жагсаалтад байгаа эсвэл хориглосон үгтэй ойр эсвэл алсаас холбоотой байвал Midjourney сануулга өгөхийг зөвшөөрөхгүй. Аялал дундын хэрэглэгчид хориотой үгийг ижил төстэй боловч зөвшөөрөгдсөн үгээр солих, хориотой үгтэй ойр эсвэл алсаас холбоотой үгсийг ашиглахаас зайлсхийх, эсвэл ижил утгатай үг эсвэл өөр үг хэллэг ашиглах талаар бодох хэрэгтэй.

Аяллын дундуур хориотой үгс

Midjourney нь хориотой үгсийн жагсаалтад яг ижил эсвэл ижил төстэй үгсийг автоматаар шүүж, хориглодог шүүлтүүрийг нэвтрүүлсэн. Хориглосон үгсийн жагсаалтад хүчирхийлэл, дарамт шахалт, цус харвах, насанд хүрэгчдэд зориулсан контент, хар тамхи, үзэн ядалтыг өдөөн хатгахтай шууд болон шууд бус холбоотой үгс багтсан болно. Нэмж дурдахад, энэ нь түрэмгийлэл, хүчирхийллийг агуулсан эсвэл түүнтэй холбоотой сануулгыг зөвшөөрдөггүй.

Хориглосон үгсийн жагсаалт нь бүрэн гүйцэд байх албагүй бөгөөд жагсаалтад хараахан ороогүй өөр олон нэр томъёо байж болно. Midjourney хориотой үгсийн жагсаалтыг байнга шинэчилж байдаг. Энэ жагсаалтыг байнга хянаж байдаг бөгөөд нийтэд нээлттэй биш юм. Гэсэн хэдий ч, хэрэглэгчдэд хандаж, хэрэв хүсвэл хувь нэмрээ оруулах боломжтой олон нийтийн жагсаалт байдаг. [нэг] [1].

Хэрэв ямар нэг үг хориотой үгийн жагсаалтад байгаа эсвэл хориглосон үгтэй ойр эсвэл алсаас холбоотой байвал Midjourney сануулга өгөхийг зөвшөөрөхгүй. Аялал дундын хэрэглэгчид хориглосон үгсийг ижил төстэй боловч зөвшөөрөгдсөн үгсээр солих, хориотой үгтэй сул холбоотой үг ашиглахаас зайлсхийх, эсвэл ижил утгатай үг эсвэл өөр үг ашиглахыг бодох хэрэгтэй. Баг нь хориотой үгсийн жагсаалтыг байнга шинэчилж байдаг тул аялалын дундуур хэрэглэгчид мессеж илгээхээсээ өмнө үргэлж # дүрмийн сувгийг шалгах хэрэгтэй. [2].

Midjourney нь хэрэглэгчид дагаж мөрдөх ёс зүйн дүрэмтэй. Ёс зүйн дүрэм нь зөвхөн PG-13 агуулгыг дагаж мөрдөхөөс гадна эелдэг байх, бусад болон ажилчдыг хүндэтгэх тухай юм. Дүрмийг зөрчсөн тохиолдолд үйлчилгээгээ түдгэлзүүлэх эсвэл хөөж болно. Midjourney бол нээлттэй Discord нийгэмлэг бөгөөд ёс зүйн дүрмийг дагаж мөрдөх нь чухал юм. Хэрэглэгчид уг үйлчилгээг '/хувийн' горимд ашигладаг байсан ч ёс зүйн дүрмийг хүндэтгэх ёстой.

Дүгнэж хэлэхэд, Midjourney контентыг зохицуулах хатуу бодлого баримталж, хүчирхийлэл, дарамтын аливаа хэлбэр, насанд хүрэгчдэд зориулсан эсвэл харгис хэрцгий контент, түүнчлэн харааны доромжилсон эсвэл сэтгэл түгшээсэн контентыг хориглодог. Midjourney нь хүчирхийлэл, дарамт шахалт, цус харвах, насанд хүрэгчдэд зориулсан контент, хар тамхи, үзэн ядалтыг өдөөн хатгахтай шууд болон шууд бусаар холбоотой үгсийг багтаасан хориотой үгсийн жагсаалтад байгаа яг ижил эсвэл ижил төстэй үгсийг автоматаар шүүж, хориглодог шүүлтүүрийг нэвтрүүлсэн. Баг нь хориотой үгсийн жагсаалтыг байнга шинэчилж байдаг тул аяллын дундах хэрэглэгчид мессеж илгээхээсээ өмнө ёс зүйн дүрмийг дагаж мөрдөж, # дүрмийн сувгийг шалгана уу.

Хориотой үгсийн жагсаалтыг шинэчилсэн

Midjourney нь хориглосон үгсийн жагсаалтыг үе үе тохируулдаг бөгөөд жагсаалтыг байнга хянаж байдаг. Хориглосон үгсийн жагсаалт нь нийтэд нээлттэй биш боловч хэрэглэгчид хандаж, хувь нэмрээ оруулах боломжтой олон нийтийн жагсаалт байдаг. Midjourney нь бүх үйлчилгээндээ PG-13 туршлагыг бий болгохыг эрмэлздэг тул хүчирхийлэл, хүчирхийлэл, дарамт, хар тамхи, насанд хүрэгчдэд зориулсан контент болон ерөнхийдөө доромжилсон сэдэвтэй холбоотой үг, контентыг хориглодог. Хориглосон үгсийн жагсаалтыг дээр дурдсан сэдвүүдийн хүрээг хамарсан хэд хэдэн ангилалд хуваадаг. Midjourney дээрх хориотой үгсийн жагсаалт нь бүрэн гүйцэд байх албагүй бөгөөд жагсаалтад хараахан ороогүй өөр олон нэр томъёо байж болохыг анхаарах нь чухал юм.

Дунд аялалыг хориглох, түдгэлзүүлэх

Midjourney нь хэрэглэгчид дагаж мөрдөх ёстой ёс зүйн хатуу дүрэмтэй. Дүрмийг зөрчсөн тохиолдолд үйлчилгээгээ түдгэлзүүлэх эсвэл хөөж болно. Гэсэн хэдий ч хэрэглэгчид Midjourney-ийн хориг эсвэл түдгэлзүүлэлтийг давж заалдаж болох эсэх нь тодорхойгүй байна. Эх сурвалжууд давж заалдах үйл явц эсвэл хориглох, түдгэлзүүлэх талаар Midjourney багтай хэрхэн холбогдох талаар тодорхой дурдаагүй байна. Үйлчилгээг хориглох, түдгэлзүүлэхээс зайлсхийхийн тулд ёс зүйн дүрмийг хүндэтгэх нь чухал юм. Хэрэглэгчид үйлчилгээний талаар ямар нэгэн санаа зовоосон асуудал, асуулт байвал Discord серверээр дамжуулан Midjourney багтай холбогдож болно. [1][2].

Midjourney тодорхой хэмжээ, нягтралтай зураг үүсгэж чадах уу?

Midjourney нь хэрэглэгчдийн үүсгэж болох тодорхой зургийн хэмжээ, нягтралтай. Midjourney-ийн өгөгдмөл зургийн хэмжээ нь 512x512 пиксел бөгөөд үүнийг Discord дээрх /imagine командыг ашиглан 1024x1024 пиксел эсвэл 1664x1664 пиксел болгон нэмэгдүүлэх боломжтой. Мөн "Beta Upscale Redo" нэртэй бета хувилбар байдаг бөгөөд энэ нь зургийн хэмжээг 2028x2028 пиксел хүртэл нэмэгдүүлэх боломжтой боловч зарим нарийн ширийн зүйлийг бүдгэрүүлж болзошгүй юм.

Хэрэглэгчид зургийн наад зах нь үндсэн масштабыг хийсний дараа л хамгийн дээд нарийвчлалтай болгож болно [1]. Midjourney-ийн үүсгэж болох дээд файлын хэмжээ нь 3 мегапиксел бөгөөд энэ нь хэрэглэгчид ямар ч харьцаатай зураг үүсгэх боломжтой гэсэн үг боловч эцсийн зургийн хэмжээ 3 пикселээс хэтрэхгүй. Midjourney-ийн нягтрал нь үндсэн зураг хэвлэхэд хангалттай, гэхдээ хэрэглэгчид илүү том зүйл хэвлэхийг хүсвэл сайн үр дүнд хүрэхийн тулд гадны AI хөрвүүлэгч ашиглах шаардлагатай байж магадгүй юм.

Midjourney нь DALL-E, Stable Diffusion гэх мэт бусад хиймэл оюун ухаантай дүрс үүсгэгчтэй харьцуулахад ямар байдаг вэ?

Эх сурвалжийн мэдээлснээр Midjourney бол текстийн сануулгаас уран сайхны болон мөрөөдлийн дүрсийг гаргадаг хиймэл оюун ухаантай дүрс үүсгэгч юм. Үүнийг DALL-E, Stable Diffusion зэрэг бусад генераторуудтай харьцуулдаг. Midjourney нь бусад хоёрыг бодвол илүү хязгаарлагдмал хэв маягийг санал болгодог боловч түүний зургууд илүү бараан, илүү уран сайхны хэвээр байна. Midjourney нь фотореализмын хувьд DALL-E болон Stable Diffusion-тэй таарахгүй бололтой. [1][2].

Stable Diffusion нь Midjourney болон DALL-E-тэй харьцуулагддаг бөгөөд ашиглахад хялбар, гаралтын чанарын хувьд хаа нэгтээ байдаг гэж үздэг. Тогтвортой тархалт нь DALL-E-ээс илүү олон сонголтыг санал болгодог, тухайлбал генератор удирдамжийг хэр сайн дагаж байгааг тодорхойлох масштаб, гаралтын хэлбэр, хэмжээтэй холбоотой сонголтууд. Гэсэн хэдий ч Stable Diffusion-ийн ажлын урсгал нь зургийг бүлэглэж, цуглуулгын хавтас санал болгодог DALL-E-тэй таарахгүй байна. Stable Diffusion болон DALL-E нь фотореализмын хувьд ижил дутагдалтай гэж үздэг бөгөөд хоёулаа Midjourney's Discord вэб програмтай ойртож чадахгүй байна. [0].

Fabian Stelzer-ийн харьцуулсан туршилтын дагуу Midjourney нь DALL-E болон Stable Diffusion-ээс үргэлж бараан өнгөтэй байдаг. DALL-E болон Stable Diffusion нь илүү бодит дүр төрхийг бий болгодог бол Midjourney-ийн саналууд нь уран сайхны, мөрөөдлийн чанартай байдаг. Midjourney нь тааламжтай олдворуудтай Moog аналог синтезатортой харьцуулагддаг бол DALL-E нь илүү өргөн хүрээний дижитал ажлын станцын синтезтэй харьцуулагддаг.

Тогтвортой тархалтыг бараг ямар ч дуу чимээ гаргах чадвартай нарийн төвөгтэй модульчлагдсан синтезатортой харьцуулдаг боловч өдөөхөд илүү хэцүү байдаг. Зургийн нягтралын хувьд Midjourney нь 1792x1024 нягтаршилтай зураг үүсгэж чаддаг бол DALL-E нь 1024x1024-ээр арай илүү хязгаарлагдмал байдаг. Гэсэн хэдий ч хамгийн сайн генераторын хариулт нь бүхэлдээ субъектив бөгөөд хувийн сонголтоос хамаардаг гэж Стелзер тэмдэглэв.

DALL-E нь гэрэл зургаас ялгагдахааргүй зургуудыг хүртэл илүү фотореалист зураг гаргадаг гэдгээрээ алдартай. Энэ нь бусад хиймэл оюун ухаан үүсгэгчээс илүү сайн ойлголттой эсвэл ухамсартай гэж ярьдаг. Гэсэн хэдий ч Midjourney нь фото бодит зураг бүтээхэд зориулагдаагүй, харин зүүд шиг, уран сайхны дүр төрхийг бий болгох зорилготой юм. Тиймээс хоёр генераторын хоорондох сонголт нь эцсийн эцэст хэрэглэгчийн хэрэгцээ, сонголтоос хамаарна.

Midjourney-ийн хязгаарлагдмал хүрээтэй загвар нь DALL-E болон тогтвортой дамжуулалттай харьцуулахад ашиглахад хэрхэн нөлөөлдөг вэ?

Эх сурвалжийн мэдээлснээр Midjourney-ийн хязгаарлагдмал хүрээний хэв маяг нь DALL-E болон Stable Diffusion-тай харьцуулахад ашиглахад нь нөлөөлж магадгүй юм. Midjourney-ийн зургууд нь илүү гоо зүйн хувьд тааламжтай гэж тооцогддог боловч түүний загварын хүрээ нь DALL-E болон Stable Diffusion-ээс илүү хязгаарлагдмал байдаг. Midjourney-ийн хэв маягийг мөрөөдөмтгий, уран сайхны гэж тодорхойлдог бол DALL-E нь гэрэл зургаас ялгагдахааргүй илүү фото бодит зураг бүтээдгээрээ алдартай. 

Тогтвортой тархалт нь ашиглахад хялбар, үр дүнгийн чанарын хувьд хаа нэгтээ ордог. Stable Diffusion нь DALL-E-ээс илүү олон сонголтыг санал болгож байна, тухайлбал генератор санал болгож буй үгсийг хэр сайн дагаж байгааг тодорхойлох масштаб, мөн үр дүнгийн формат, хэмжээтэй холбоотой сонголтууд. Midjourney нь тааламжтай олдвор бүхий аналог Moog синтезатортой харьцуулагддаг бол DALL-E нь илүү өргөн хүрээтэй дижитал ажлын станцын синтезатортой харьцуулагддаг. Тогтвортой тархалтыг бараг ямар ч дуу чимээ гаргах чадвартай нарийн төвөгтэй модульчлагдсан синтезатортой харьцуулдаг боловч өдөөхөд илүү хэцүү байдаг. [1][2].

DALL-E нь Midjourney-ээс илүү уян хатан бөгөөд илүү олон төрлийн дүрсний хэв маягийг санал болгож чаддаг. DALL-E нь сэтгүүл эсвэл компанийн вэбсайт дээр гайхалтай харагдах бодит, "хэвийн" гэрэл зургуудыг бүтээхдээ илүү сайн байдаг. DALL-E нь хиймэл оюун ухааны урлагийг илүү шинэлэг байдлаар ашиглахад зайлшгүй шаардлагатай будаг давхарлах, тайрах, янз бүрийн зураг байршуулах зэрэг Midjourney-д байхгүй хүчирхэг хэрэгслүүдийг санал болгодог.

DALL-E-ийн загвар нь цөөн тооны санал бодолтой байдаг бөгөөд энэ нь загварын зөвлөмжийг илүү хүлээн авдаг, ялангуяа тэр загвар нь шууд үзэсгэлэнтэй биш бол. Тиймээс DALL-E нь пикселийн урлаг гэх мэт тодорхой хүсэлтэд үнэн зөв хариу үйлдэл үзүүлэх магадлал өндөр байдаг. DALL-E нь жинхэнэ вэб программыг санал болгодог бөгөөд энэ нь хэрэглэгчдэд DALL-E-тэй шууд ажиллах боломжийг олгодог бөгөөд энэ нь Discord-ийг суулгахаас хамаагүй төөрөгдүүлдэг.

Midjourney-тэй харьцуулахад Stable Diffusion нь бүрэн үнэ төлбөргүй байх ёстой бөгөөд энэ нь AI дүрс үүсгэгчийг худалдаж авах боломжгүй хүмүүст илүү хүртээмжтэй болгодог. Гэсэн хэдий ч Stable Diffusion нь зөвхөн Discord робот хэлбэрээр ашиглах боломжтой бөгөөд хэрэглэгчид хандахын тулд өргөдөл гаргах ёстой. Stable Diffusion нь Midjourney-ийг бодвол эхлүүлэхэд хэцүү гэж үздэг бөгөөд энэ нь талуудын харьцаа болон нийтийн галерейн сонголтын ачаар ашиглахад хялбар юм. Midjourney нь мөн бүх зургийг нөөцлөх AutoArchive, хадгалсан өнгөц зургийн 2x2 сүлжээг санал болгодог бөгөөд ингэснээр ажлыг удирдахад хялбар болгодог. Midjourney's Discord програм нь DALL-E-ийн вэб сайтаас илүү гар утсан дээр илүү сайн ажилладаг тул зам дээр зураг үүсгэхэд хялбар болгодог. Midjourney-ийн өвөрмөц хэв маяг нь мессежийг сайжруулах шаардлагагүй, олон тооны тааламжтай зургийг хурдан гаргахад тохиромжтой.

Дүгнэж хэлэхэд AI дүрс үүсгэгч бүр өөрийн гэсэн давуу болон сул талуудтай бөгөөд хүн бүр өөр өөр сонголт, хэрэгцээтэй байж болно. Midjourney-ийн хязгаарлагдмал хүрээтэй загвар нь DALL-E болон Stable Diffusion-тай харьцуулахад ашиглахад нь нөлөөлж болох ч өвөрмөц хэв маяг нь түүнийг мөрөөдөмтгий, уран сайхны дүрслэл үүсгэхэд тохиромжтой болгодог. DALL-E нь илүү уян хатан, фото бодит зураг бүтээх чадвартай бол Stable Diffusion нь бүрэн үнэ төлбөргүй бөгөөд DALL-E-ээс илүү олон сонголтыг санал болгодог. Эцсийн эцэст генераторуудын хоорондох сонголт нь хэрэглэгчийн хэрэгцээ, сонголтоос хамаарна.

Гурван AI дүрс үүсгэгчийн олж авсан үр дүнгийн чанарт мэдэгдэхүйц ялгаа бий юу?

Гурван AI дүрс үүсгэгчийн (Midjourney, DALL-E болон Тогтвортой тархалт) хооронд гаралтын чанарын мэдэгдэхүйц ялгааг эх сурвалжуудад дурдаагүй болно. Гэсэн хэдий ч, эх сурвалжууд генератор бүр өөрийн гэсэн давуу болон сул талуудтай байдаг бөгөөд тус бүр нь өөр өөр төрлийн зураг, хэв маягт илүү тохиромжтой байдаг. Жишээ нь, Midjourney нь зүүд мэт, уран сайхны дүр төрхийг бүтээдэг гэж ярьдаг бол DALL-E нь гэрэл зургаас ялгагдахааргүй илүү фото бодит зургуудыг бүтээдэг. Тогтвортой тархалт нь ашиглахад хялбар, үр дүнгийн чанарын хувьд энэ хоёрын хооронд ордог. Эцсийн эцэст генераторуудын хоорондох сонголт нь хэрэглэгчийн хэрэгцээ, сонголтоос хамаарна.

Тодорхой төсөл эсвэл хэрэглээний хувьд хамгийн сайн генераторыг сонгох зөвлөмжүүд

Эх сурвалжийн мэдээлснээр тодорхой төсөл эсвэл програмын хувьд хамгийн сайн AI дүрс үүсгэгчийг сонгох нь хэрэглэгчийн хэрэгцээ, сонголтоос хамаарна. Хэрэглэгч өөрийн бүтээхийг хүсч буй зургийн төрөл, түүнд шаардлагатай нарийвчлал, бодит байдлын түвшин, генераторыг ашиглахад хялбар байдал, будах, янз бүрийн зургийг тайрах, байршуулах зэрэг функцүүдийн бэлэн байдал зэрэг хүчин зүйлсийг харгалзан үзэх ёстой. , түүнчлэн генераторын өртөг.

Хэрэв хэрэглэгч мөрөөдөмтгий, уран сайхны зураг бүтээхийг хүсвэл Midjourney бол хамгийн сайн сонголт юм. Хэрэв хэрэглэгч фото бодит зураг бүтээхийг хүсвэл DALL-E нь илүү тохиромжтой. Тогтвортой тархалт нь ашиглахад хялбар, үр дүнгийн чанарын хувьд энэ хоёрын хооронд ордог. Тогтвортой тархалт нь DALL-E-ээс илүү олон сонголтыг санал болгодог бөгөөд жишээлбэл генератор удирдамжийг хэр сайн дагаж байгааг тодорхойлох масштаб, мөн үр дүнгийн формат, хэмжээтэй холбоотой сонголтуудыг санал болгодог. Гэсэн хэдий ч Stable Diffusion-ийн ажлын урсгалыг DALL-E-тэй харьцуулах боломжгүй бөгөөд зургуудыг бүлэглэн цуглуулах хавтаснуудыг санал болгодог.

Хэрэглэгч мөн генератор үнэгүй эсвэл төлбөртэй эсэх, вэб програм эсвэл Discord бот хэлбэрээр ашиглах боломжтой эсэхийг анхаарч үзэх хэрэгтэй. Stable Diffusion нь бүрэн үнэ төлбөргүй бөгөөд Discord бот хэлбэрээр ашиглах боломжтой бол Midjourney болон DALL-E нь төлбөртэй бөгөөд вэб програм эсвэл Discord робот хэлбэрээр ашиглах боломжтой.

Эцсийн эцэст генераторуудын хоорондох сонголт нь хэрэглэгчийн хэрэгцээ, сонголтоос хамаарна. Хэрэглэгч өөрийн хэрэгцээнд хамгийн сайн тохирохыг сонгохын өмнө генератор бүрийн онцлог, гаралтын чанарыг судалж, харьцуулах хэрэгтэй.

Дунд шатны хувилбарууд.

Өмнө дурьдсанчлан Midjourney бол текстийн тайлбараас зураг үүсгэдэг алдартай AI дүрс үүсгэгч юм. Гэсэн хэдий ч энэ нь ердөө 25 минут үнэгүй үзүүлэх хугацааг санал болгодог бөгөөд энэ нь 30 орчим зураг юм. Хэрэв та Midjourney-ийн үнэгүй хувилбарыг хайж байгаа бол хэд хэдэн сонголтыг туршиж үзэх боломжтой.

Midjourney-ийн зарим үнэгүй хувилбарууд энд байна:

  • Крайон : Энэ бол Midjourney-ийн сайн хувилбарыг санал болгодог үнэгүй, нээлттэй эхийн шийдэл юм.
  • SLAB : Энэ бол Midjourney-тэй төстэй өөр дүрс үүсгэгч бөгөөд үнэ төлбөргүй авах боломжтой. Үүнийг OpenAI хийсэн.
  • Жаспер: Энэ бол Midjourney-ийн өөр хувилбар болгон ашиглаж болох үнэгүй, нээлттэй эхийн дүрс үүсгэгч юм.
  • Wonder : Энэ бол Midjourney-ийн өөр хувилбар болгон ашиглаж болох үнэгүй, нээлттэй эхийн зураг үүсгэгч юм.
  • AI-г дуудах : Энэ бол Midjourney-ийн өөр хувилбар болгон ашиглах боломжтой, ойлгомжтой интерфэйстэй, гоёмсог дизайнтай дүрс үүсгэгч юм.
  • Disco Diffusion: Энэ нь ашиглахад хялбар, Midjourney-ийн өөр хувилбар болгон ашиглаж болох үүлэн дээр суурилсан текстийг зураг руу хөрвүүлэх систем юм.

Хэрэв та илүү тодорхой эсвэл өөрчлөх боломжтой зүйл хайж байгаа бол Stable Streaming (SD) нь сайн сонголт байж магадгүй юм. [3]. Гэсэн хэдий ч SD нь сайн үр дүнд хүрэхийн тулд илүү их хүчин чармайлт шаарддаг бөгөөд Midjourney шиг ашиглахад хялбар биш юм. Нэмж дурдахад Wombo's Dream, Hotpot's AI Art Maker, SnowPixel, CogView, StarryAI, ArtBreeder, ArtFlow зэрэг өөр хэд хэдэн үнэгүй текстийг дүрс болгон хувиргах системүүд байдаг.

Эцэст нь хэлэхэд, хэрэв та Midjourney-ээс үнэгүй хувилбар хайж байгаа бол Craiyon, DALL-E, Jasper, Wonder, Invoke AI, Disco Diffusion, Stable Diffusion зэрэг хэд хэдэн сонголтууд байдаг. Эдгээр системүүд нь өөр өөр түвшний тохируулга, ашиглахад хялбар байдаг тул та хэд хэдэн оролдлого хийж, аль нь танд илүү тохирохыг харах хэрэгтэй.

Энэ нийтлэлийг багтай хамтран бичсэн Гүн хиймэл оюун ухаан et Байгууллагууд.

[Нийт: 0 гэсэн утгатай: 0]

Бичигдсэн Дитер Б.

Шинэ технологид дуртай сэтгүүлч. Дитер бол Review сэтгүүлийн редактор юм. Өмнө нь тэрээр Forbes сэтгүүлд зохиолч байсан.

Laisser НҮБ-ын commentaire

Таны имэйл хаяг нийтлэгдэхгүй. Шаардлагатай талбарууд гэж тэмдэглэгдсэн байна *

Чи юу гэж бодож байна?

386 оноо
Upvote Downvote