in ,

মিডজার্নি: এআই শিল্পী সম্পর্কে আপনার যা কিছু জানা দরকার

মিডজার্নি: এটা কি? ব্যবহার, সীমাবদ্ধতা এবং বিকল্প

মিডজার্নি: এআই শিল্পী সম্পর্কে আপনার যা কিছু জানা দরকার
মিডজার্নি: এআই শিল্পী সম্পর্কে আপনার যা কিছু জানা দরকার

মিডজার্নি হল একটি এআই ইমেজ জেনারেটর যা পাঠ্য বিবরণ থেকে ছবি তৈরি করে। এটি লিপ মোশনের সহ-প্রতিষ্ঠাতা ডেভিড হোলজ দ্বারা পরিচালিত একটি গবেষণা ল্যাব। মিডজার্নি আপনার চাহিদাগুলির জন্য আরও স্বপ্নের মতো শিল্প শৈলী অফার করে এবং অন্যান্য এআই জেনারেটরের তুলনায় এটি আরও বেশি গথিক লুক রয়েছে। টুলটি বর্তমানে ওপেন বিটাতে রয়েছে এবং শুধুমাত্র তাদের অফিসিয়াল ডিসকর্ডে একটি ডিসকর্ড বটের মাধ্যমে অ্যাক্সেস করা যেতে পারে।

ছবি তৈরি করতে, ব্যবহারকারীরা /imagine কমান্ডটি ব্যবহার করে এবং একটি প্রম্পট প্রবেশ করান এবং বটটি চারটি চিত্রের একটি সেট প্রদান করে। ব্যবহারকারীরা তারপরে তারা কোন চিত্রগুলি স্কেল করতে চান তা চয়ন করতে পারেন। মিডজার্নি একটি ওয়েব ইন্টারফেসেও কাজ করছে।

প্রতিষ্ঠাতা ডেভিড হোলজ শিল্পীদের মিডজার্নির গ্রাহক হিসাবে দেখেন, প্রতিযোগী নয়। শিল্পীরা ধারণা শিল্পের দ্রুত প্রোটোটাইপিংয়ের জন্য মিডজার্নি ব্যবহার করে যা তারা তাদের নিজস্ব কাজ শুরু করার আগে তাদের ক্লায়েন্টদের কাছে উপস্থাপন করে। যেহেতু মিডজার্নির সমস্ত লাইনআপে শিল্পীদের দ্বারা কপিরাইট করা কাজ অন্তর্ভুক্ত থাকতে পারে, তাই কিছু শিল্পী মিডজার্নিকে মূল সৃজনশীল কাজের অবমূল্যায়ন করার জন্য অভিযুক্ত করেছেন।

মিডজার্নির পরিষেবার শর্তাবলীতে একটি DMCA টেকডাউন নীতি অন্তর্ভুক্ত রয়েছে, যা শিল্পীদের অনুরোধ করতে দেয় যে তাদের কাজগুলি সেট থেকে সরিয়ে ফেলা হবে, যদি তারা বিশ্বাস করে যে কপিরাইট লঙ্ঘন স্পষ্ট। বিজ্ঞাপন শিল্প অন্যান্যদের মধ্যে মিডজার্নি, ডাল-ই এবং স্টেবল ডিফিউশনের মতো এআই সরঞ্জামগুলিকেও গ্রহণ করেছে, যা বিজ্ঞাপনদাতাদের আসল সামগ্রী তৈরি করতে এবং দ্রুত ধারণা নিয়ে আসতে দেয়।

The Economist এবং Corriere della Sera সহ বিভিন্ন ব্যক্তি ও কোম্পানি ছবি এবং শিল্পকর্ম তৈরি করতে মিডজার্নি ব্যবহার করেছে। যাইহোক, মিডজার্নি এমন কিছু শিল্পীর সমালোচনার মুখে পড়েছে যারা মনে করেন যে এটি শিল্পীদের কাছ থেকে কাজ কেড়ে নিচ্ছে এবং তাদের কপিরাইট লঙ্ঘন করছে। মিডজার্নি কপিরাইট লঙ্ঘনের জন্য শিল্পীদের একটি দল দ্বারা দায়ের করা মামলার বিষয়ও ছিল।

মিডজার্নি ব্যবহার শুরু করতে, ব্যবহারকারীদের ডিসকর্ডে লগ ইন করতে হবে এবং বিটাতে যোগ দিতে মিডজার্নি ওয়েবসাইটে যেতে হবে। একবার গৃহীত হলে, ব্যবহারকারীরা Discord Midjourney-এ একটি আমন্ত্রণ পাবেন এবং পছন্দসই প্রম্পট অনুসরণ করে/imagine লিখে ছবি তৈরি করা শুরু করতে পারবেন।

মিডজার্নি তার পটভূমি এবং প্রশিক্ষণ সম্পর্কে খুব বেশি তথ্য প্রকাশ করেননি, তবে অনুমান করা হয় যে তিনি প্রশিক্ষণের জন্য লক্ষ লক্ষ প্রকাশিত চিত্র ব্যবহার করে ড্যাল-ই 2 এবং স্ট্যাবল ডিফিউশনের মতো একটি সিস্টেম ব্যবহার করেন, ইন্টারনেট থেকে ছবি এবং পাঠ্য স্ক্র্যাপ করেন। .

বিষয়বস্তু টেবিল

টেক্সট প্রম্পট থেকে ছবি তৈরি করতে Midjourney দ্বারা ব্যবহৃত প্রক্রিয়া

টেক্সট প্রম্পট থেকে ছবি তৈরি করতে মিডজার্নি একটি টেক্সট-টু-ইমেজ এআই মডেল ব্যবহার করে। মিডজার্নি বট প্রম্পটে শব্দ এবং বাক্যাংশগুলিকে ছোট ছোট টুকরোগুলিতে বিভক্ত করে, যাকে টোকেন বলা হয়, যা এর প্রশিক্ষণ ডেটার সাথে তুলনা করা যেতে পারে এবং তারপরে একটি চিত্র তৈরি করতে ব্যবহার করা যেতে পারে। একটি ভালভাবে ডিজাইন করা প্রম্পট অনন্য এবং উত্তেজনাপূর্ণ ছবি তৈরি করতে সাহায্য করতে পারে [0].

মিডজার্নি দিয়ে একটি ইমেজ তৈরি করতে, ব্যবহারকারীদের অবশ্যই মিডজার্নি ডিসকর্ড চ্যানেলে "/ কল্পনা" কমান্ড ব্যবহার করে চিত্রটি কেমন দেখতে চান তার একটি বিবরণ টাইপ করতে হবে। বার্তাটি যত বেশি নির্দিষ্ট এবং বর্ণনামূলক হবে, AI তত বেশি ভাল ফলাফল দিতে সক্ষম হবে। মিডজার্নি তারপর এক মিনিটের মধ্যে প্রম্পটের উপর ভিত্তি করে ছবির বিভিন্ন সংস্করণ তৈরি করবে। ব্যবহারকারীরা এই ছবিগুলির যেকোনও বিকল্প সংস্করণ পেতে বেছে নিতে পারেন, বা একটি বড়, উচ্চ মানের ছবি পেতে তাদের যেকোনো একটি বড় করতে পারেন৷ মিডজার্নি দ্রুত এবং স্বস্তিদায়ক মোডগুলি অফার করে, দ্রুত মোডের সাথে সর্বাধিক বিবর্ধন অর্জন এবং কম সময়ে আরও চিত্র তৈরি করতে প্রয়োজনীয়।

মিডজার্নির এআই মডেলটি ডিফিউশন ব্যবহার করে, যার মধ্যে একটি ছবিতে শব্দ যোগ করা এবং তারপর ডেটা পুনরুদ্ধার করার প্রক্রিয়াটিকে বিপরীত করা জড়িত। এই প্রক্রিয়াটি অবিরামভাবে পুনরাবৃত্তি হয়, যার ফলে মডেলটি গোলমাল যোগ করে এবং তারপরে এটিকে আবার সরিয়ে দেয়, অবশেষে চিত্রটিতে ছোট বৈচিত্র তৈরি করে বাস্তবসম্মত চিত্র তৈরি করে। মিডজার্নি লাখ লাখ প্রকাশিত ওয়ার্কআউট ইমেজ ব্যবহার করে ছবি এবং টেক্সট বর্ণনা করার জন্য ইন্টারনেট ঘেঁটেছে।

মিডজার্নির এআই মডেলটি স্থিতিশীল স্ট্রিমিংয়ের উপর ভিত্তি করে তৈরি করা হয়েছে, যা ২.৩ বিলিয়ন জোড়া ছবি এবং পাঠ্য বিবরণের উপর প্রশিক্ষিত। প্রম্পটে সঠিক শব্দ ব্যবহার করে, ব্যবহারকারীরা মনে আসে এমন প্রায় সব কিছু তৈরি করতে পারে। যাইহোক, কিছু শব্দ নিষিদ্ধ, এবং মিডজার্নি দূষিত ব্যক্তিদের প্রম্পট তৈরি করা থেকে বিরত রাখতে এই শব্দগুলির একটি তালিকা বজায় রাখে। Midjourney's Discord সম্প্রদায় ব্যবহারকারীদের জন্য লাইভ সহায়তা এবং প্রচুর উদাহরণ প্রদানের জন্য উপলব্ধ।

ব্যবহার এবং ইমেজ তৈরি

মিডজার্নি এআই বিনামূল্যে ব্যবহার করতে, আপনার অবশ্যই একটি ডিসকর্ড অ্যাকাউন্ট থাকতে হবে। আপনার যদি এটি না থাকে তবে Discord-এ বিনামূল্যে সাইন আপ করুন। এরপর, মিডজার্নি ওয়েবসাইটে যান এবং বিটাতে যোগ দিন বেছে নিন। এটি আপনাকে একটি ডিসকর্ড আমন্ত্রণে নিয়ে যাবে। মিডজার্নিতে ডিসকর্ডের আমন্ত্রণটি গ্রহণ করুন এবং ডিসকর্ডে চালিয়ে যেতে বেছে নিন। 

আপনার ডিসকর্ড অ্যাপটি স্বয়ংক্রিয়ভাবে খুলবে এবং আপনি বাম মেনু থেকে জাহাজের আকারের মিডজার্নি আইকনটি নির্বাচন করতে পারেন। মিডজার্নি চ্যানেলগুলিতে, নবাগত রুমগুলি সনাক্ত করুন এবং শুরু করতে তাদের মধ্যে একটি নির্বাচন করুন৷ আপনি প্রস্তুত হলে, আপনার নতুনদের রুমের জন্য Discord চ্যাটে "/imagine" টাইপ করুন। 

এটি একটি প্রম্পট ক্ষেত্র তৈরি করবে যেখানে আপনি চিত্রের বিবরণ লিখতে পারেন। আপনার বর্ণনায় আপনি যত বেশি নির্দিষ্ট হবেন, AI তত ভালো ফলাফল দিতে সক্ষম হবে। বর্ণনামূলক হন, এবং আপনি যদি একটি নির্দিষ্ট শৈলী খুঁজছেন, আপনার বিবরণে এটি অন্তর্ভুক্ত করুন। মিডজার্নি প্রতিটি ব্যবহারকারীকে 25টি AI এর সাথে খেলার চেষ্টা করে। 

এর পরে, চালিয়ে যাওয়ার জন্য আপনাকে পূর্ণ সদস্য হিসাবে নিবন্ধন করতে হবে। আপনি যদি অর্থ ব্যয় না করতে চান তবে কিছু সময় নেওয়া এবং মিডজার্নিতে আপনি কী তৈরি করতে চান সে সম্পর্কে চিন্তা করা ভাল। 

আপনি চাইলে, অনুসরণ করার জন্য টিপসের তালিকা পেতে "/help" টাইপ করতে পারেন। মিডজার্নি এআই ব্যবহার করার আগে নিষিদ্ধ শব্দের তালিকা জেনে নেওয়া অপরিহার্য, কারণ আচরণবিধি মেনে চলতে ব্যর্থ হলে নিষেধাজ্ঞার কারণ হবে।

>> আরও পড়ুন- 27 সেরা ফ্রি কৃত্রিম বুদ্ধিমত্তা ওয়েবসাইট (ডিজাইন, কপিরাইটিং, চ্যাট, ইত্যাদি)

/কমান্ডটি কল্পনা করুন

/imagine কমান্ডটি মিডজার্নির অন্যতম প্রধান কমান্ড যা ব্যবহারকারীদের তাদের চাহিদার উপর ভিত্তি করে এআই-জেনারেট করা ছবি তৈরি করতে দেয়। এখানে কিভাবে এটা কাজ করে:

  1. ব্যবহারকারীরা Discord চ্যাটে /imagin কমান্ডটি টাইপ করে এবং তারা যে সেটিংস ব্যবহার করতে চায় তা যোগ করে।
  2. মিডজার্নি এআই অ্যালগরিদম প্রম্পট বিশ্লেষণ করে এবং ইনপুটের উপর ভিত্তি করে একটি চিত্র তৈরি করে।
  3. জেনারেট করা চিত্রটি ডিসকর্ড চ্যাটে প্রদর্শিত হয় এবং ব্যবহারকারীরা রিমিক্স বৈশিষ্ট্য ব্যবহার করে প্রতিক্রিয়া প্রদান এবং তাদের বার্তাগুলিকে পরিমার্জিত করতে পারে।
  4. ব্যবহারকারীরা তৈরি করা ছবির শৈলী, সংস্করণ এবং অন্যান্য দিকগুলি সামঞ্জস্য করতে অতিরিক্ত সেটিংসও ব্যবহার করতে পারেন।

/imagine কমান্ড ইমেজ এবং টেক্সট প্রম্পট উভয়ই গ্রহণ করে। ব্যবহারকারীরা তাদের তৈরি করতে চান এমন চিত্রগুলির জন্য একটি URL বা সংযুক্তি প্রদান করে চিত্র হিসাবে প্রম্পট যোগ করতে পারেন। পাঠ্য প্রম্পটে ব্যবহারকারীরা যে চিত্রগুলি তৈরি করতে চান তার বর্ণনা অন্তর্ভুক্ত করতে পারে, যেমন অবজেক্ট, ব্যাকগ্রাউন্ড এবং শৈলী। ব্যবহারকারীরা যে অ্যালগরিদম ব্যবহার করতে চান তার সংস্করণ সামঞ্জস্য করতে, রিমিক্স বৈশিষ্ট্য সক্রিয় করতে, ইত্যাদির জন্য কমান্ডে অতিরিক্ত পরামিতি যোগ করতে পারেন।

মিডজার্নি এআই যে ধরনের ছবি তৈরি করতে পারে তার উদাহরণ

মিডজার্নি এআই বিভিন্ন শৈলীতে বিস্তৃত চিত্র তৈরি করতে পারে, যার মধ্যে রয়েছে কিন্তু সীমাবদ্ধ নয়:

  • শিশুদের বইয়ের জন্য উদাহরণ, যেমন "একটি পিগলেটস অ্যাডভেঞ্চার" এর উদাহরণ।
  • মানুষ, প্রাণী এবং বস্তুর বাস্তবসম্মত প্রতিকৃতি।
  • শিল্পের পরাবাস্তব এবং বিমূর্ত কাজ যা বিভিন্ন উপাদান এবং শৈলী মিশ্রিত করে।
  • ল্যান্ডস্কেপ এবং সিটিস্কেপ যা বিভিন্ন মেজাজ এবং আবেগ জাগিয়ে তুলতে পারে।
  • জটিল বিশদ এবং সিনেমাটিক প্রভাব সহ কালো এবং সাদা ফটোগ্রাফি।
  • যে ছবিগুলি ভবিষ্যৎ বা বিজ্ঞান-গল্পের থিমগুলিকে চিত্রিত করে, যেমন একটি বৃদ্ধ মহিলার অর্ধেক রোবটিক অংশ দিয়ে তৈরি এবং একটি গ্যাস মাস্ক পরা উদাহরণ৷

এটি লক্ষ করা গুরুত্বপূর্ণ যে মিডজার্নি এআই দ্বারা উত্পন্ন চিত্রগুলির গুণমান এবং শৈলী প্রম্পটের গুণমান, ব্যবহৃত অ্যালগরিদমের সংস্করণ এবং অন্যান্য বিষয়গুলির উপর নির্ভর করে পরিবর্তিত হতে পারে। পছন্দসই ফলাফল পেতে ব্যবহারকারীদের বিভিন্ন প্রম্পট এবং সেটিংস দিয়ে পরীক্ষা করা উচিত।

মিডজার্নিতে ছবি একত্রিত করুন

মিডজার্নিতে দুই বা ততোধিক ছবি একত্রিত করতে, আপনি এই পদক্ষেপগুলি অনুসরণ করতে পারেন:

  1. আপনি যে ছবিগুলি একত্রিত করতে চান তা চয়ন করুন এবং সেগুলি ডিসকর্ডে আপলোড করুন৷
  2. ছবিগুলির লিঙ্কগুলি অনুলিপি করুন এবং সেগুলিকে ইমেজ প্রম্পট হিসাবে আপনার /imagine প্রম্পটে যুক্ত করুন।
  3. সংস্করণ 4 ডিফল্টরূপে সক্ষম না হলে আপনার প্রম্পটে "-v 4" যোগ করুন।
  4. কমান্ড জমা দিন এবং ইমেজ তৈরি হওয়ার জন্য অপেক্ষা করুন।

উদাহরণস্বরূপ, দুটি চিত্রকে একত্রিত করতে, আপনি নিম্নলিখিত কমান্ডটি ব্যবহার করতে পারেন: /imagin -v 1

আপনি নিজস্ব শৈলীর সাথে সম্পূর্ণ নতুন ছবি তৈরি করতে বস্তু, পটভূমি এবং সাধারণ শিল্প শৈলী সহ অতিরিক্ত তথ্য যোগ করতে পারেন। উদাহরণস্বরূপ: / কল্পনা করুন , কার্টুন শৈলী, ব্যাকগ্রাউন্ডে প্রফুল্ল ভিড়, বুকে টেসলা লোগো, -নন কস্টিউম -v 1

মিডজার্নি একটি নতুন বৈশিষ্ট্যও চালু করেছে, /ব্লেন্ড কমান্ড, যা ইউআরএল কপি এবং পেস্ট না করেই পাঁচটি পর্যন্ত ছবি একত্রিত করার অনুমতি দেয়। আপনি আপনার প্রম্পটে –blend পতাকা অন্তর্ভুক্ত করে /blend কমান্ড সক্রিয় করতে পারেন।

এটি লক্ষ করা গুরুত্বপূর্ণ যে এই ফাংশনটি শুধুমাত্র মিডজার্নি অ্যালগরিদমের সংস্করণ 4 এর সাথে কাজ করে এবং চিত্রগুলিকে একত্রিত করার জন্য অতিরিক্ত পাঠ্যের প্রয়োজন হয় না, তবে তথ্য যোগ করার ফলে সাধারণত আরও ভাল ছবি পাওয়া যায়। আর্ট স্টাইল নিয়ে পরীক্ষা-নিরীক্ষা করে এবং রিমিক্স মোডের মাধ্যমে ছবি টুইক করে সেরা ফলাফল পাওয়া যায়।

দুটির বেশি ছবি একত্রিত করুন

মিডজার্নি ব্যবহারকারীদের /ব্লেন্ড কমান্ড ব্যবহার করে পাঁচটি ছবি পর্যন্ত মিশ্রিত করতে দেয়। যাইহোক, ব্যবহারকারীদের যদি পাঁচটির বেশি ছবি একত্রিত করতে হয়, তাহলে তারা /imagine কমান্ডটি ব্যবহার করতে পারে এবং একটি সারিতে পাবলিক ইমেজ ইউআরএল পেস্ট করতে পারে। /imagine কমান্ড ব্যবহার করে দুটির বেশি ছবি একত্রিত করতে, ব্যবহারকারীরা কমান্ডে প্রম্পট যোগ করতে পারেন। উদাহরণস্বরূপ, তিনটি চিত্রকে একত্রিত করার জন্য, কমান্ডটি হবে /imagine -v 1।

ব্যবহারকারীরা আরো ইমেজ একত্রিত করতে আরো কমান্ড প্রম্পট যোগ করতে পারেন. এটি লক্ষ্য করা গুরুত্বপূর্ণ যে প্রম্পটে অতিরিক্ত তথ্য যোগ করা, বস্তু, পটভূমি এবং সাধারণ শিল্প শৈলী সহ, এটির নিজস্ব শৈলীর সাথে একটি সম্পূর্ণ নতুন চিত্র তৈরি করতে সহায়তা করতে পারে। আর্ট স্টাইল নিয়ে পরীক্ষা-নিরীক্ষা করে এবং রিমিক্স মোডের মাধ্যমে ছবি টুইক করে সেরা ফলাফল পাওয়া যায়

মিডজার্নিতে কমান্ড/মিশ্রন

Midjourney's /blend কমান্ড ব্যবহারকারীদের ডিসকর্ড ইন্টারফেসে সরাসরি ব্যবহার করা সহজ UI উপাদান যোগ করে পাঁচটি ছবি পর্যন্ত মিশ্রিত করতে দেয়। ব্যবহারকারীরা ছবিগুলিকে ইন্টারফেসে টেনে আনতে এবং ফেলে দিতে পারে বা তাদের হার্ড ড্রাইভ থেকে সরাসরি নির্বাচন করতে পারে৷ ব্যবহারকারীরা যে ইমেজ তৈরি করতে চান তার মাত্রাও বেছে নিতে পারেন। ব্যবহারকারীরা কাস্টম প্রত্যয় ব্যবহার করলে, তারা ঐচ্ছিকভাবে সেগুলিকে কমান্ডের শেষে যোগ করতে পারে, যে কোনো সাধারণ /imagine কমান্ডের মতো।

মিডজার্নি দলটি ব্যবহারকারীদের ছবির "ধারণা" এবং "মেজাজ" কার্যকরভাবে পরীক্ষা করার জন্য /ব্লেন্ড কমান্ডটি ডিজাইন করেছে এবং তাদের মিশ্রিত করার চেষ্টা করেছে। এর ফলে কখনও কখনও আশ্চর্যজনকভাবে লোভনীয় ছবি দেখা যায় এবং অন্যান্য ক্ষেত্রে ব্যবহারকারীরা ভয়ঙ্কর ছবি দিয়ে শেষ করে। যাইহোক, /blend কমান্ড টেক্সট প্রম্পট সমর্থন করে না।

/ব্লেন্ড কমান্ডের সীমাবদ্ধতা রয়েছে। সবচেয়ে স্পষ্ট যে ব্যবহারকারীরা শুধুমাত্র পাঁচটি ভিন্ন ইমেজ রেফারেন্স যোগ করতে পারেন। যদিও /imagine কমান্ড প্রযুক্তিগতভাবে পাঁচটির বেশি ছবি গ্রহণ করে, ব্যবহারকারীরা যত বেশি রেফারেন্স যোগ করে, প্রতিটির গুরুত্ব তত কম। এটি একটি সাধারণ সমস্যা যার সাথে সমস্যা তরলীকরণ এবং একটি নির্দিষ্ট সমস্যা নয়। অন্য প্রধান সীমাবদ্ধতা হল মিডজার্নি মিশ্রিত কমান্ডটি পাঠ্য প্রম্পটের সাথে কাজ করে না। এটি উন্নত ব্যবহারকারীদের জন্য দুর্ভাগ্যজনক হতে পারে যারা খুব কমই শুধুমাত্র দুটি ছবি মিশ্রিত করে। যাইহোক, ম্যাশআপ তৈরি করতে চাওয়া ব্যবহারকারীদের জন্য, এই সীমাবদ্ধতা খুব একটা ব্যাপার নয়।

বিল্ড সময় উন্নত করুন

Midjourney AI দ্বারা ছবি তৈরির জন্য প্রজন্মের সময়কে উন্নত বা অপ্টিমাইজ করার উপায় রয়েছে৷ এখানে কিছু টিপস রয়েছে যা আপনাকে সাহায্য করতে পারে:

  • নির্দিষ্ট এবং বিস্তারিত প্রম্পট ব্যবহার করুন: মিডজার্নি ব্যবহারকারীর প্রম্পটের উপর ভিত্তি করে ছবি তৈরি করে। আরো নির্দিষ্ট এবং বিস্তারিত প্রম্পট, ভাল ফলাফল. এটি একটি চিত্র তৈরি করতে যে সময় নেয় তাও কমিয়ে দেয়, কারণ AI অ্যালগরিদম ব্যবহারকারী কী চায় তার আরও সঠিক ধারণা রয়েছে।
  • বিভিন্ন গুণমান সেটিংসের সাথে পরীক্ষা করুন: -গুণমান প্যারামিটার চিত্রের গুণমান এবং এটি তৈরি করতে যে সময় লাগে তা সামঞ্জস্য করে। নিম্ন মানের সেটিংস দ্রুত ইমেজ তৈরি করে, যখন উচ্চ মানের সেটিংস বেশি সময় নিতে পারে কিন্তু ভাল ফলাফল দেয়। গুণমান এবং গতির মধ্যে সঠিক ভারসাম্য খুঁজে পেতে বিভিন্ন সেটিংস নিয়ে পরীক্ষা করা গুরুত্বপূর্ণ।
  • রিল্যাক্স মোড ব্যবহার করুন: স্ট্যান্ডার্ড এবং প্রো প্ল্যান গ্রাহকরা রিল্যাক্স মোড ব্যবহার করতে পারেন, এতে ব্যবহারকারীর জিপিইউ সময় খরচ হয় না, তবে ডিভাইসটি কতবার ব্যবহার করা হয় তার উপর ভিত্তি করে কাজগুলিকে একটি সারিতে রাখে। রিল্যাক্স মোডের জন্য অপেক্ষার সময়গুলি গতিশীল, তবে সাধারণত প্রতি টাস্ক 0 থেকে 10 মিনিটের মধ্যে হয়। বিল্ড টাইম অপ্টিমাইজ করার জন্য রিল্যাক্স মোড ব্যবহার করা একটি ভাল উপায় হতে পারে, বিশেষ করে যারা প্রতি মাসে প্রচুর সংখ্যক ছবি তৈরি করেন তাদের জন্য।
  • আরও কিনুন দ্রুত ঘন্টা: দ্রুত মোড হল সর্বোচ্চ অগ্রাধিকার প্রক্রিয়াকরণ স্তর এবং ব্যবহারকারীর সদস্যতা থেকে মাসিক GPU সময় ব্যবহার করে৷ ব্যবহারকারীরা তাদের Midjourney.com/accounts পৃষ্ঠায় আরও দ্রুত ঘন্টা ক্রয় করতে পারে, যা তাদের ছবিগুলি দ্রুত এবং দক্ষতার সাথে তৈরি করা নিশ্চিত করতে সহায়তা করে।
  • ফাস্ট রিল্যাক্স ব্যবহার করুন: ফাস্ট রিলাক্স হল মিডজার্নির একটি নতুন বৈশিষ্ট্য যা ব্যবহারকারীদের কিছু গুণমানকে ত্যাগ করে দ্রুত ছবি তৈরি করতে দেয়। ফাস্ট রিল্যাক্স মোড প্রায় 60% গুণমানের সাথে ছবি তৈরি করে, যা ব্যবহারকারীদের জন্য একটি ভাল আপস হতে পারে যারা দ্রুত ছবি তৈরি করতে চান কিন্তু খুব বেশি গুণমান ত্যাগ করতে চান না।

সংক্ষেপে, মিডজার্নি এআই ইমেজ তৈরির জন্য বিল্ড টাইম উন্নত বা অপ্টিমাইজ করার বিভিন্ন উপায় রয়েছে, যার মধ্যে রয়েছে নির্দিষ্ট প্রম্পট ব্যবহার করা, বিভিন্ন গুণমানের সেটিংস নিয়ে পরীক্ষা করা, রিল্যাক্স মোড ব্যবহার করা, বা আরও দ্রুত ঘন্টা কেনা এবং ফাস্ট রিলাক্স মোড ব্যবহার করা।

মিডজার্নির এআই মডেল দ্বারা তৈরি করা ছবিগুলি কতটা সঠিক?

মিডজার্নির এআই মডেল দ্বারা উত্পন্ন চিত্রগুলির যথার্থতা প্রম্পট এবং প্রশিক্ষণ ডেটার মানের উপর নির্ভর করে পরিবর্তিত হতে পারে। ব্যবহারকারীরা তাদের প্রশ্নের মধ্যে সুনির্দিষ্ট এবং বিশদভাবে উত্পন্ন চিত্রগুলির নির্ভুলতা উন্নত করতে পারে। প্রম্পট যত বেশি সুনির্দিষ্ট এবং বর্ণনামূলক হবে, AI তত ভালো ফলাফল দিতে সক্ষম হবে। Midjourney's AI মডেলকে ইন্টারনেট থেকে প্রাপ্ত লক্ষ লক্ষ ছবি এবং টেক্সট বর্ণনার উপর প্রশিক্ষিত করা হয়েছিল, যা জেনারেট করা ছবির নির্ভুলতাকেও প্রভাবিত করতে পারে।

মিডজার্নির এআই মডেলটি ডিফিউশন ব্যবহার করে, যার মধ্যে একটি ছবিতে শব্দ যোগ করা এবং তারপর ডেটা পুনরুদ্ধার করার প্রক্রিয়াটিকে বিপরীত করা জড়িত। এই প্রক্রিয়াটি অবিরামভাবে পুনরাবৃত্তি হয়, যার ফলে মডেলটি গোলমাল যোগ করে এবং তারপরে এটিকে আবার সরিয়ে দেয়, অবশেষে চিত্রটিতে ছোট বৈচিত্র তৈরি করে বাস্তবসম্মত চিত্র তৈরি করে।

মিডজার্নির এআই মডেলটি স্থিতিশীল স্ট্রিমিংয়ের উপর ভিত্তি করে তৈরি করা হয়েছে, যা ২.৩ বিলিয়ন জোড়া ছবি এবং পাঠ্য বিবরণের উপর প্রশিক্ষিত। প্রম্পটে সঠিক শব্দ ব্যবহার করে, ব্যবহারকারীরা মনে আসে এমন প্রায় সব কিছু তৈরি করতে পারে। যাইহোক, কিছু শব্দ নিষিদ্ধ, এবং মিডজার্নি দূষিত ব্যক্তিদের প্রম্পট তৈরি করা থেকে বিরত রাখতে এই শব্দগুলির একটি তালিকা বজায় রাখে। Midjourney's Discord সম্প্রদায় ব্যবহারকারীদের জন্য লাইভ সহায়তা এবং প্রচুর উদাহরণ প্রদানের জন্য উপলব্ধ।

এটি উল্লেখ করা উচিত যে মিডজার্নির এআই-উত্পন্ন চিত্রগুলি কপিরাইট লঙ্ঘন এবং শৈল্পিক মৌলিকতা সম্পর্কিত বিতর্কের বিষয়। কিছু শিল্পী মিডজার্নিকে মূল সৃজনশীল কাজের অবমূল্যায়ন করার জন্য অভিযুক্ত করেছেন, অন্যরা এটিকে দ্রুত প্রোটোটাইপিং ধারণা শিল্পের একটি হাতিয়ার হিসাবে দেখেন যাতে তারা নিজেরাই কাজ শুরু করার আগে ক্লায়েন্টদের দেখাতে পারে।

মিডজার্নি কপিরাইট লঙ্ঘন এবং এআই-উত্পন্ন চিত্রগুলির মৌলিকতা সম্পর্কে উদ্বেগকে কীভাবে সমাধান করে?

মিডজার্নি: কপিরাইট লঙ্ঘন এবং এআই-জেনারেট করা ছবির মৌলিকতা

মিডজার্নি কপিরাইট লঙ্ঘন এবং এআই-উত্পন্ন চিত্রগুলির মৌলিকতা সম্পর্কে উদ্বেগগুলি মোকাবেলার জন্য পদক্ষেপ নিয়েছে৷ মিডজার্নি সতর্কতার সাথে প্রতিটি প্রম্পট এবং প্রতিটি চিত্র পরীক্ষা করে নিশ্চিত করে যে কোনও কপিরাইট সমস্যা নেই, শুধুমাত্র লাইসেন্সপ্রাপ্ত বা সর্বজনীন ডোমেন সামগ্রী ব্যবহার করে এবং অতিরিক্ত গবেষণা করে বা অনিশ্চয়তার ক্ষেত্রে সঠিক মালিকের অনুমোদন জিজ্ঞাসা করে।

মিডজার্নি তার ব্যবহারকারীদের কপিরাইট আইনকে সম্মান করার এবং শুধুমাত্র ছবি এবং প্রম্পট ব্যবহার করার আহ্বান জানিয়ে তাদের দায়িত্বকে উৎসাহিত করে যা তাদের ব্যবহারের অধিকার রয়েছে। যদি কোনো ব্যবহারকারী কোনো বার্তা বা ছবির উৎস নিয়ে প্রশ্ন করেন, প্ল্যাটফর্মটি 1998 সালের ডিজিটাল মিলেনিয়াম কপিরাইট অ্যাক্ট (DMCA) অনুযায়ী কোনো লঙ্ঘনকারী বিষয়বস্তু তদন্ত ও অপসারণের জন্য দ্রুত পদক্ষেপ নেয়।

DMCA অনলাইন পরিষেবা প্রদানকারীদের জন্য সুরক্ষামূলক বিধান প্রদান করে, যেমন মিডজার্নি, যারা কপিরাইট ধারক দ্বারা অবহিত করা হলে লঙ্ঘনকারী বিষয়বস্তু সরানোর জন্য সরল বিশ্বাসে কাজ করে। মিডজার্নির একটি DMCA টেকডাউন নীতিও রয়েছে যা শিল্পীদের অনুরোধ করতে দেয় যে তাদের কাজ সেট থেকে সরানো হবে যদি তারা বিশ্বাস করে যে কপিরাইট লঙ্ঘন স্পষ্ট। [2][4].

লঙ্ঘন এড়াতে মিডজার্নির পদ্ধতি সুপ্রিম কোর্টের মামলার সাথে সামঞ্জস্যপূর্ণ যেমন ফিস্ট পাবলিকেশন্স, ইনকর্পোরেটেড। Rural Telephone Service Co., Inc. (1991), যেখানে আদালত বলেছিল যে মৌলিকতা, অভিনবত্ব নয়, কপিরাইট সুরক্ষার জন্য অপরিহার্য প্রয়োজন, এবং Oracle America, Inc. v. Google LLC (2018), যেখানে আদালত বলেছিল যে একটি আসল কাজ অনুলিপি করা, এমনকি একটি ভিন্ন উদ্দেশ্যে, এখনও কপিরাইট লঙ্ঘন হিসাবে বিবেচিত হতে পারে।

কপিরাইট লঙ্ঘন এবং শৈল্পিক মৌলিকতার জন্য মিডজার্নির এআই-জেনারেটেড চিত্র বিতর্কের বিষয়। কিছু শিল্পী মিডজার্নিকে মূল সৃজনশীল কাজের অবমূল্যায়ন করার জন্য অভিযুক্ত করেছেন, অন্যরা এটিকে দ্রুত প্রোটোটাইপিং ধারণা শিল্পের একটি হাতিয়ার হিসাবে দেখেন যাতে তারা নিজেরাই কাজ শুরু করার আগে ক্লায়েন্টদের দেখাতে পারে। মিডজার্নির পরিষেবার শর্তাবলীর মধ্যে একটি DMCA টেকডাউন নীতি অন্তর্ভুক্ত রয়েছে, যা শিল্পীদের অনুরোধ করতে দেয় যে তাদের কাজ সেট থেকে সরানো হবে যদি তারা বিশ্বাস করে যে কপিরাইট লঙ্ঘন হয়েছে।

মিডজার্নি কীভাবে নিশ্চিত করে যে AI-জেনারেটেড ছবি তৈরি করতে ব্যবহৃত সমস্ত লাইসেন্সপ্রাপ্ত বা সর্বজনীন ডোমেন সামগ্রী সঠিকভাবে দায়ী করা হয়েছে?

মিডজার্নি কীভাবে নিশ্চিত করে যে AI-উত্পন্ন চিত্রগুলি তৈরি করতে ব্যবহৃত সমস্ত লাইসেন্সপ্রাপ্ত বা সর্বজনীন ডোমেন সামগ্রী সঠিকভাবে দায়ী করা হয়েছে তা স্পষ্ট নয়। যাইহোক, Midjourney সাবধানতার সাথে প্রতিটি পোস্ট এবং ছবি পরীক্ষা করে নিশ্চিত করে যে কোন কপিরাইট সমস্যা নেই, শুধুমাত্র লাইসেন্সপ্রাপ্ত বা পাবলিক ডোমেইন সামগ্রী ব্যবহার করে এবং অতিরিক্ত গবেষণা পরিচালনা করে। অথবা অনিশ্চয়তার ক্ষেত্রে সঠিক মালিকের অনুমোদন জিজ্ঞাসা করে। 

মিডজার্নি তার ব্যবহারকারীদের কপিরাইট আইনকে সম্মান করার এবং শুধুমাত্র ছবি এবং প্রম্পট ব্যবহার করার আহ্বান জানিয়ে তাদের দায়িত্বকে উৎসাহিত করে যা তাদের ব্যবহারের অধিকার রয়েছে। যদি কোনো ব্যবহারকারী কোনো বার্তা বা ছবির উৎস নিয়ে প্রশ্ন করেন, প্ল্যাটফর্মটি 1998 সালের ডিজিটাল মিলেনিয়াম কপিরাইট অ্যাক্ট (DMCA) অনুযায়ী কোনো লঙ্ঘনকারী বিষয়বস্তু তদন্ত ও অপসারণের জন্য দ্রুত পদক্ষেপ নেয়। 

Midjourney-এর একটি DMCA টেকডাউন নীতিও রয়েছে, যা শিল্পীদের অনুরোধ করতে দেয় যে তাদের কাজ সিরিজ থেকে সরানো হবে যদি তারা বিশ্বাস করে যে স্পষ্ট কপিরাইট লঙ্ঘন হয়েছে।

এটি উল্লেখ করা উচিত যে মিডজার্নির এআই-উত্পন্ন চিত্রগুলি কপিরাইট লঙ্ঘন এবং শৈল্পিক মৌলিকতা সম্পর্কিত বিতর্কের বিষয়। কিছু শিল্পী মিডজার্নিকে মূল সৃজনশীল কাজের অবমূল্যায়ন করার জন্য অভিযুক্ত করেছেন, অন্যরা এটিকে দ্রুত প্রোটোটাইপিং ধারণা শিল্পের একটি হাতিয়ার হিসাবে দেখেন যাতে তারা নিজেরাই কাজ শুরু করার আগে ক্লায়েন্টদের দেখাতে পারে।

মিডজার্নিতে ব্যবহারকারীদের অবশ্যই যে নিয়মগুলি মেনে চলতে হবে

মিডজার্নি নিয়মের একটি সেট স্থাপন করেছে যা ব্যবহারকারীদের অবশ্যই অনুসরণ করতে হবে যাতে সবার জন্য একটি স্বাগত এবং অন্তর্ভুক্তিমূলক সম্প্রদায় নিশ্চিত করা যায়। এই নিয়মগুলি নিম্নরূপ: [0][1][2] :

  • সদয় হন এবং অন্যদের এবং কর্মীদের সম্মান করুন। অন্তর্নিহিতভাবে অসম্মানজনক, আক্রমনাত্মক, বা অন্যথায় অপমানজনক চিত্র তৈরি করবেন না বা পাঠ্য প্রম্পট ব্যবহার করবেন না। কোনো প্রকার সহিংসতা বা হয়রানি বরদাস্ত করা হবে না।
  • কোনো প্রাপ্তবয়স্ক বিষয়বস্তু বা রক্তাক্ত দৃশ্য নেই। দৃশ্যত আপত্তিকর বা বিরক্তিকর বিষয়বস্তু এড়িয়ে চলুন. কিছু টেক্সট এন্ট্রি স্বয়ংক্রিয়ভাবে ব্লক করা হয়.
  • তাদের অনুমতি ছাড়া অন্য মানুষের সৃষ্টি প্রকাশ্যে পুনরুত্পাদন করবেন না।
  • শেয়ার করার দিকে মনোযোগ দিন। আপনি মিডজার্নি সম্প্রদায়ের বাইরে আপনার সৃষ্টিগুলি ভাগ করতে পারেন, তবে অন্যরা কীভাবে আপনার সামগ্রী দেখতে পারে তা বিবেচনা করুন।
  • এই নিয়মগুলির কোনো লঙ্ঘনের ফলে পরিষেবা থেকে বাদ দেওয়া হতে পারে।
  • এই নিয়মগুলি ব্যক্তিগত সার্ভারে, ব্যক্তিগত মোডে এবং মিডজার্নি বটের সাথে সরাসরি বার্তাগুলিতে তৈরি করা ছবি সহ সমস্ত সামগ্রীতে প্রযোজ্য।

মিডজার্নিতে নিষিদ্ধ শব্দগুলির একটি তালিকাও রয়েছে যা বার্তাগুলিতে অনুমোদিত নয়৷ নিষিদ্ধ শব্দের তালিকায় প্রত্যক্ষ বা পরোক্ষভাবে সহিংসতা, হয়রানি, গোর, প্রাপ্তবয়স্কদের বিষয়বস্তু, মাদক বা ঘৃণামূলক বক্তব্যের সাথে সম্পর্কিত শব্দ রয়েছে। অধিকন্তু, এটি আগ্রাসন এবং সহিংসতা অন্তর্ভুক্ত বা এর সাথে সম্পর্কিত প্রম্পটগুলির অনুমতি দেয় না।

যদি একটি শব্দ নিষিদ্ধ শব্দ তালিকায় থাকে বা এটি একটি নিষিদ্ধ শব্দের সাথে ঘনিষ্ঠভাবে বা দূরবর্তীভাবে সম্পর্কিত হয় তবে মিডজার্নি প্রম্পটটিকে অনুমতি দেবে না। মিডজার্নি ব্যবহারকারীদের নিষিদ্ধ শব্দগুলিকে অনুরূপ কিন্তু অনুমোদিত শব্দগুলির সাথে প্রতিস্থাপন করা উচিত, নিষিদ্ধ শব্দগুলির সাথে ঘনিষ্ঠভাবে বা দূরবর্তীভাবে সম্পর্কিত শব্দগুলি ব্যবহার করা এড়ানো উচিত, বা একটি সমার্থক বা অন্য শব্দ ব্যবহার করার কথা বিবেচনা করা উচিত।

মিডজার্নিতে নিষিদ্ধ শব্দ

মিডজার্নি একটি ফিল্টার প্রয়োগ করেছে যা স্বয়ংক্রিয়ভাবে ফিল্টার করে এবং নিষিদ্ধ শব্দ তালিকায় সঠিক বা অনুরূপ শব্দ নিষিদ্ধ করে। নিষিদ্ধ শব্দের তালিকায় এমন শব্দ রয়েছে যা প্রত্যক্ষ বা পরোক্ষভাবে সহিংসতা, হয়রানি, গোর, প্রাপ্তবয়স্ক সামগ্রী, মাদক, বা ঘৃণার প্ররোচনার সাথে সম্পর্কিত। উপরন্তু, এটি আগ্রাসন এবং অপব্যবহারের অন্তর্ভুক্ত বা সম্পর্কিত প্রম্পটগুলির অনুমতি দেয় না।

নিষিদ্ধ শব্দের তালিকা অগত্যা সম্পূর্ণ নয়, এবং আরও অনেক পদ থাকতে পারে যা এখনও তালিকায় নেই। মিডজার্নি প্রতিনিয়ত নিষিদ্ধ শব্দের তালিকা আপডেট করছে। এই তালিকাটি ক্রমাগত পর্যালোচনার অধীনে রয়েছে এবং সর্বজনীন নয়। যাইহোক, একটি সম্প্রদায়-চালিত তালিকা রয়েছে যা ব্যবহারকারীরা চাইলে অ্যাক্সেস করতে এবং অবদান রাখতে পারে। [০]1].

যদি একটি শব্দ নিষিদ্ধ শব্দ তালিকায় থাকে বা এটি একটি নিষিদ্ধ শব্দের সাথে ঘনিষ্ঠভাবে বা দূরবর্তীভাবে সম্পর্কিত হয় তবে মিডজার্নি প্রম্পটটিকে অনুমতি দেবে না। মিডজার্নি ব্যবহারকারীদের নিষিদ্ধ শব্দগুলিকে অনুরূপ কিন্তু অনুমোদিত শব্দ দিয়ে প্রতিস্থাপন করা উচিত, এমন শব্দ ব্যবহার করা এড়িয়ে চলা উচিত যা এমনকি একটি নিষিদ্ধ শব্দের সাথে ঢিলেঢালাভাবে সম্পর্কিত, অথবা একটি প্রতিশব্দ বা বিকল্প শব্দ ব্যবহার করার কথা বিবেচনা করুন। মিডজার্নি ব্যবহারকারীদের সর্বদা তাদের বার্তা জমা দেওয়ার আগে #রুলস চ্যানেল চেক করা উচিত কারণ দল ক্রমাগত নিষিদ্ধ শব্দগুলির তালিকা আপডেট করছে [2].

মিডজার্নির একটি আচরণবিধি রয়েছে যা ব্যবহারকারীদের অবশ্যই অনুসরণ করতে হবে। আচরণবিধি শুধুমাত্র PG-13 বিষয়বস্তু অনুসরণ করার বিষয়ে নয়, বরং অন্যদের এবং কর্মীদের প্রতি সদয় হওয়া এবং সম্মান করার বিষয়েও। নিয়ম লঙ্ঘনের ফলে পরিষেবা থেকে স্থগিত বা বহিষ্কার হতে পারে। মিডজার্নি একটি উন্মুক্ত ডিসকর্ড সম্প্রদায়, এবং আচরণবিধি অনুসরণ করা অপরিহার্য। এমনকি ব্যবহারকারীরা '/প্রাইভেট' মোডে পরিষেবা ব্যবহার করলেও, তাদের অবশ্যই আচরণবিধিকে সম্মান করতে হবে।

উপসংহারে, মিডজার্নি একটি কঠোর বিষয়বস্তু সংযম নীতি পরিচালনা করে এবং যে কোনো ধরনের সহিংসতা বা হয়রানি, কোনো প্রাপ্তবয়স্ক বা গোর বিষয়বস্তু, সেইসাথে কোনো দৃশ্যত আপত্তিকর বা বিরক্তিকর বিষয়বস্তু নিষিদ্ধ করে। মিডজার্নি একটি ফিল্টার প্রয়োগ করেছে যা স্বয়ংক্রিয়ভাবে নিষিদ্ধ শব্দ তালিকায় সঠিক বা অনুরূপ শব্দগুলিকে ফিল্টার করে এবং নিষিদ্ধ করে, যার মধ্যে প্রত্যক্ষ বা পরোক্ষভাবে সহিংসতা, হয়রানি, গোর, প্রাপ্তবয়স্ক বিষয়বস্তু, মাদক বা ঘৃণার উদ্দীপনা সম্পর্কিত শব্দ রয়েছে। মিডজার্নি ব্যবহারকারীদের আচরণবিধি মেনে চলা উচিত এবং তাদের বার্তা জমা দেওয়ার আগে #রুলস চ্যানেল চেক করা উচিত, কারণ দলটি ক্রমাগত নিষিদ্ধ শব্দের তালিকা আপডেট করছে।

হালনাগাদ নিষিদ্ধ শব্দ তালিকা

মিডজার্নি পর্যায়ক্রমে নিষিদ্ধ শব্দগুলির তালিকা সামঞ্জস্য করে এবং তালিকাটি ক্রমাগত পর্যালোচনার অধীনে থাকে। নিষিদ্ধ শব্দ তালিকাটি সর্বজনীন নয়, তবে একটি সম্প্রদায়-চালিত তালিকা রয়েছে যা ব্যবহারকারীরা অ্যাক্সেস করতে এবং অবদান রাখতে পারে। মিডজার্নি তার সমগ্র পরিষেবা জুড়ে একটি PG-13 অভিজ্ঞতা প্রদান করার চেষ্টা করে, যে কারণে হিংস্রতা, রক্ত, হয়রানি, মাদক, প্রাপ্তবয়স্কদের বিষয়বস্তু এবং সাধারণত আপত্তিকর বিষয় সম্পর্কিত শব্দ এবং বিষয়বস্তু নিষিদ্ধ। নিষিদ্ধ শব্দগুলির তালিকাটি উপরে উল্লিখিত বিষয়গুলির বর্ণালীকে কভার করে কয়েকটি বিভাগে বিভক্ত। এটি লক্ষ্য করা গুরুত্বপূর্ণ যে মিডজার্নিতে নিষিদ্ধ শব্দগুলির তালিকা অগত্যা সম্পূর্ণ নয়, এবং আরও অনেক পদ থাকতে পারে যা এখনও তালিকায় নেই।

নিষেধাজ্ঞা এবং মিডজার্নি স্থগিত

মিডজার্নির একটি কঠোর আচরণবিধি রয়েছে যা ব্যবহারকারীদের অবশ্যই অনুসরণ করতে হবে। নিয়ম লঙ্ঘনের ফলে পরিষেবা থেকে স্থগিত বা বহিষ্কার হতে পারে। তবে, ব্যবহারকারীরা মিডজার্নি থেকে নিষেধাজ্ঞা বা স্থগিতাদেশের আবেদন করতে পারবেন কিনা তা স্পষ্ট নয়। উত্সগুলি স্পষ্টভাবে একটি আপিল প্রক্রিয়া বা নিষেধাজ্ঞা বা স্থগিতাদেশ সম্পর্কে মিডজার্নি দলের সাথে কীভাবে যোগাযোগ করতে হবে তা উল্লেখ করে না। পরিষেবা থেকে নিষিদ্ধ বা বরখাস্ত হওয়া এড়াতে আচরণবিধিকে সম্মান করা অপরিহার্য। যদি ব্যবহারকারীদের পরিষেবা সম্পর্কে কোনও উদ্বেগ বা প্রশ্ন থাকে, তবে তারা তাদের ডিসকর্ড সার্ভারের মাধ্যমে মিডজার্নি দলের সাথে যোগাযোগ করতে পারে [1][2].

মিডজার্নি কি নির্দিষ্ট আকার বা রেজোলিউশনে ছবি তৈরি করতে পারে?

মিডজার্নির নির্দিষ্ট ডিফল্ট চিত্রের আকার এবং রেজোলিউশন রয়েছে যা ব্যবহারকারীরা তৈরি করতে পারে। মিডজার্নির জন্য ডিফল্ট চিত্রের আকার হল 512x512 পিক্সেল, যা Discord-এ /imagine কমান্ড ব্যবহার করে 1024x1024 পিক্সেল বা 1664x1664 পিক্সেলে বাড়ানো যেতে পারে। "বিটা আপস্কেল রিডো" নামে একটি বিটা বিকল্পও রয়েছে, যা 2028x2028 পিক্সেল পর্যন্ত চিত্রের আকার বাড়াতে পারে, তবে কিছু বিবরণ অস্পষ্ট করতে পারে।

ব্যবহারকারীরা একটি চিত্রের অন্তত মৌলিক স্কেলিং করার পরে শুধুমাত্র সর্বাধিক রেজোলিউশনে স্কেল করতে পারেন [1]. মিডজার্নি সর্বোচ্চ যে ফাইলের আকার তৈরি করতে পারে তা হল 3 মেগাপিক্সেল, যার মানে ব্যবহারকারীরা যেকোন আকৃতির অনুপাতের সাথে ছবি তৈরি করতে পারে, কিন্তু চূড়ান্ত চিত্রের আকার 3 পিক্সেলের বেশি হতে পারে না। মিডজার্নির রেজোলিউশন মৌলিক ফটো প্রিন্টের জন্য যথেষ্ট, কিন্তু ব্যবহারকারীরা যদি আরও বড় কিছু প্রিন্ট করতে চান, তাহলে ভালো ফলাফল পেতে তাদের একটি বাহ্যিক AI কনভার্টার ব্যবহার করতে হতে পারে।

মিডজার্নি কীভাবে অন্যান্য এআই ইমেজ জেনারেটরের সাথে তুলনা করে যেমন DALL-E এবং স্টেবল ডিফিউশন?

সূত্র অনুসারে, মিডজার্নি হল একটি এআই ইমেজ জেনারেটর যা পাঠ্য প্রম্পট থেকে শৈল্পিক এবং স্বপ্নের মতো ছবি তৈরি করে। এটি অন্যান্য জেনারেটরের সাথে তুলনা করা হয় যেমন DALL-E এবং স্টেবল ডিফিউশন। মিডজার্নি অন্য দুটির তুলনায় আরও সীমিত পরিসরের শৈলী অফার করে, তবে এর চিত্রগুলি এখনও গাঢ় এবং আরও শৈল্পিক। ফটোরিয়ালিজমের ক্ষেত্রে মিডজার্নি DALL-E এবং স্টেবল ডিফিউশনের সাথে মেলে না বলে মনে হয় [1][2].

স্টেবল ডিফিউশনকে মিডজার্নি এবং ড্যাল-ই-এর সাথে তুলনা করা হয় এবং বলা হয় ব্যবহারের সহজতা এবং আউটপুটের মানের ক্ষেত্রে এর মধ্যে কোথাও। স্ট্যাবল ডিফিউশন DALL-E-এর চেয়ে আরও বেশি বিকল্প অফার করে, যেমন জেনারেটর কতটা ভালোভাবে গাইডওয়ার্ড ট্র্যাক করে এবং আউটপুট ফর্ম্যাট এবং আকার সংক্রান্ত বিকল্পগুলি নির্ধারণ করার জন্য একটি স্কেল। যাইহোক, স্টেবল ডিফিউশনের ওয়ার্কফ্লো DALL-E এর সাথে মেলে না, যা ছবিগুলিকে গোষ্ঠীভুক্ত করে এবং সংগ্রহ ফোল্ডারগুলি অফার করে। স্টেবল ডিফিউশন এবং ড্যাল-ই-এর ক্ষেত্রে একই ত্রুটি রয়েছে বলে বলা হয় যখন ফটোরিয়ালিজম আসে, উভয়ই মিডজার্নির ডিসকর্ড ওয়েব অ্যাপের কাছাকাছি আসতে ব্যর্থ হয় [0].

ফ্যাবিয়ান স্টেলজারের একটি তুলনামূলক পরীক্ষা অনুসারে, মিডজার্নি সবসময় DALL-E এবং স্টেবল ডিফিউশনের চেয়ে গাঢ় হয়। যদিও DALL-E এবং স্টেবল ডিফিউশন আরও বাস্তবসম্মত চিত্র তৈরি করে, মিডজার্নির অফারগুলির একটি শৈল্পিক, স্বপ্নের মতো গুণ রয়েছে। মিডজার্নিকে একটি মুগ অ্যানালগ সিন্থেসাইজারের সাথে তুলনা করা হয়েছে, যেখানে আনন্দদায়ক শিল্পকর্ম রয়েছে, যেখানে DALL-E-কে একটি বিস্তৃত পরিসরের একটি ডিজিটাল ওয়ার্কস্টেশন সিন্থের সাথে তুলনা করা হয়েছে।

স্থিতিশীল বিস্তারকে একটি জটিল মডুলার সিন্থেসাইজারের সাথে তুলনা করা হয় যা প্রায় যেকোনো শব্দ উৎপন্ন করতে পারে, কিন্তু ট্রিগার করা কঠিন। ইমেজ রেজোলিউশনের ক্ষেত্রে, মিডজার্নি 1792x1024 রেজোলিউশনে ছবি তৈরি করতে পারে, যখন DALL-E 1024x1024 এ একটু বেশি সীমিত। যাইহোক, স্টেলজার নোট করেছেন যে উত্তরটি সর্বোত্তম জেনারেটর সম্পূর্ণরূপে বিষয়ভিত্তিক এবং ব্যক্তিগত পছন্দের উপর নির্ভর করে।

DALL-E আরও বেশি ফটোরিয়েলিস্টিক ছবি তৈরি করতে পরিচিত, এমনকি এমন ছবিও যা ফটো থেকে আলাদা করা যায় না। এটি অন্যান্য AI জেনারেটরের তুলনায় ভাল বোঝার বা সচেতনতা রয়েছে বলে জানা যায়। যাইহোক, মিডজার্নি ফটোরিয়ালিস্টিক ইমেজ তৈরি করার জন্য ডিজাইন করা হয়নি, বরং স্বপ্নের মতো এবং শৈল্পিক ছবি তৈরি করার জন্য। অতএব, দুটি জেনারেটরের মধ্যে পছন্দ শেষ পর্যন্ত ব্যবহারকারীর চাহিদা এবং পছন্দের উপর নির্ভর করে।

DALL-E এবং স্থিতিশীল স্ট্রিমিংয়ের তুলনায় মিডজার্নির সীমিত পরিসরের শৈলী কীভাবে এর ব্যবহারযোগ্যতাকে প্রভাবিত করে?

সূত্রের মতে, মিডজার্নির শৈলীর সীমিত পরিসর DALL-E এবং স্থিতিশীল বিস্তারের তুলনায় এর ব্যবহারযোগ্যতাকে প্রভাবিত করতে পারে। মিডজার্নির ছবিগুলিকে আরও নান্দনিকভাবে আনন্দদায়ক বলে মনে করা হয়, তবে এর শৈলীর পরিসর DALL-E এবং স্টেবল ডিফিউশনের তুলনায় আরও সীমিত। মিডজার্নির শৈলীকে স্বপ্নের মতো এবং শৈল্পিক হিসাবে বর্ণনা করা হয়েছে, যখন DALL-E আরও ফটোরিয়ালিস্টিক ছবি তৈরির জন্য পরিচিত যা ফটো থেকে আলাদা নয়। 

স্থিতিশীল ডিফিউশন ব্যবহারের সহজতা এবং ফলাফলের মানের ক্ষেত্রে এর মধ্যে কোথাও পড়ে। স্থিতিশীল ডিফিউশন DALL-E-এর চেয়ে আরও বেশি বিকল্প অফার করে, যেমন জেনারেটর প্রস্তাবিত শব্দগুলি কতটা ভালভাবে অনুসরণ করে তা নির্ধারণ করার জন্য একটি স্কেল, সেইসাথে ফলাফলের বিন্যাস এবং আকার সম্পর্কিত বিকল্পগুলি। মিডজার্নিকে একটি এনালগ মুগ সিন্থেসাইজারের সাথে তুলনা করা হয়, যেখানে আনন্দদায়ক শিল্পকর্ম রয়েছে, যেখানে DALL-E-কে একটি বিস্তৃত পরিসরের একটি ডিজিটাল ওয়ার্কস্টেশন সিন্থেসাইজারের সাথে তুলনা করা হয়। স্থিতিশীল ডিফিউশনকে একটি জটিল মডুলার সিন্থেসাইজারের সাথে তুলনা করা হয় যা প্রায় যেকোনো শব্দ উৎপন্ন করতে পারে, কিন্তু ট্রিগার করা কঠিন [1][2].

DALL-E-কে মিডজার্নির চেয়ে বেশি নমনীয় বলা হয়, যা বিভিন্ন ধরনের ভিজ্যুয়াল শৈলী অফার করতে সক্ষম। DALL-E বাস্তবসম্মত, "স্বাভাবিক" ফটোগ্রাফ তৈরি করতেও ভাল যা ম্যাগাজিনে বা কর্পোরেট ওয়েবসাইটে দুর্দান্ত দেখাবে৷ DALL-E এছাড়াও শক্তিশালী টুল অফার করে যা মিডজার্নির নেই, যেমন পেইন্ট ওভারলে, ক্রপিং, এবং বিভিন্ন ইমেজ আপলোড করা, যা এআই শিল্পের আরও উদ্ভাবনী ব্যবহারের জন্য অপরিহার্য।

DALL-E-এর মডেলে কম মতামত রয়েছে, যা এটিকে শৈলীর পরামর্শের প্রতি আরও গ্রহণযোগ্য করে তোলে, বিশেষ করে যদি সেই শৈলীটি অবিলম্বে কম সুন্দর হয়। অতএব, DALL-E একটি নির্দিষ্ট অনুরোধে একটি সঠিক প্রতিক্রিয়া প্রদান করার সম্ভাবনা বেশি, যেমন পিক্সেল আর্ট। DALL-E একটি বাস্তব ওয়েব অ্যাপ্লিকেশনও অফার করে, যা ব্যবহারকারীদের সরাসরি DALL-E এর সাথে কাজ করতে দেয়, যা ডিসকর্ড ইনস্টল করার চেয়ে কম বিভ্রান্তিকর হতে পারে।

মিডজার্নির তুলনায়, স্থিতিশীল ডিফিউশন সম্পূর্ণ বিনামূল্যে বলে মনে করা হয়, যারা AI ইমেজ জেনারেটর বহন করতে পারে না তাদের জন্য এটি আরও অ্যাক্সেসযোগ্য করে তোলে। যাইহোক, স্ট্যাবল ডিফিউশন শুধুমাত্র একটি ডিসকর্ড বট হিসাবে উপলব্ধ, এবং ব্যবহারকারীদের এটি অ্যাক্সেস করার জন্য আবেদন করতে হবে। স্থিতিশীল ডিফিউশনকে মিডজার্নির তুলনায় লঞ্চ করা কঠিন বলে মনে করা হয়, যা তার পছন্দ অনুপাত এবং পাবলিক গ্যালারির জন্য ধন্যবাদ ব্যবহার করা সহজ। মিডজার্নি অটোআর্কাইভও অফার করে, যা সমস্ত ছবি ব্যাক আপ করে, এবং সংরক্ষিত থাম্বনেইলের 2x2 গ্রিড, কাজ পরিচালনা করা সহজ করে। Midjourney's Discord অ্যাপটি মোবাইলে DALL-E-এর ওয়েবসাইটের চেয়েও ভালো কাজ করে, যা যেতে যেতে ছবি তৈরি করা সহজ করে তোলে। মিডজার্নির অনন্য শৈলী বার্তাটিকে পরিমার্জিত করার প্রয়োজন ছাড়াই দ্রুত প্রচুর পরিমাণে আনন্দদায়ক চিত্র তৈরি করার জন্য এটিকে আদর্শ করে তোলে।

উপসংহারে, প্রতিটি এআই ইমেজ জেনারেটরের নিজস্ব সুবিধা এবং অসুবিধা রয়েছে এবং প্রতিটি ব্যক্তির আলাদা পছন্দ এবং চাহিদা থাকতে পারে। DALL-E এবং স্টেবল ডিফিউশনের তুলনায় মিডজার্নির সীমিত পরিসরের শৈলী এর ব্যবহারযোগ্যতাকে প্রভাবিত করতে পারে, তবে এর অনন্য শৈলী এটিকে স্বপ্নের মতো, শৈল্পিক চিত্র তৈরির জন্য আদর্শ করে তোলে। DALL-E ফটোরিয়ালিস্টিক ইমেজ তৈরিতে আরও নমনীয় এবং পারদর্শী, যখন স্থিতিশীল ডিফিউশন সম্পূর্ণ বিনামূল্যে এবং DALL-E থেকে আরও বেশি বিকল্প অফার করে। শেষ পর্যন্ত, জেনারেটরের মধ্যে পছন্দ ব্যবহারকারীর চাহিদা এবং পছন্দের উপর নির্ভর করে।

তিনটি এআই ইমেজ জেনারেটর দ্বারা প্রাপ্ত ফলাফলের মানের মধ্যে উল্লেখযোগ্য পার্থক্য আছে কি?

তিনটি এআই ইমেজ জেনারেটরের (মিডজার্নি, ড্যাল-ই এবং স্টেবল ডিফিউশন) মধ্যে আউটপুট মানের কোনো উল্লেখযোগ্য পার্থক্যের কথা সূত্রগুলো উল্লেখ করে না। যাইহোক, উত্সগুলি উল্লেখ করেছে যে প্রতিটি জেনারেটরের নিজস্ব শক্তি এবং দুর্বলতা রয়েছে এবং প্রতিটি বিভিন্ন ধরণের চিত্র বা শৈলীর জন্য আরও উপযুক্ত হতে পারে। উদাহরণস্বরূপ, মিডজার্নিকে বলা হয় স্বপ্নের মতো এবং শৈল্পিক চিত্র তৈরি করে, যখন DALL-E আরও বেশি ফটোরিয়ালিস্টিক ছবি তৈরি করতে পরিচিত যা ফটো থেকে আলাদা করা যায় না। স্থিতিশীল ডিফিউশন ব্যবহারের সহজতা এবং ফলাফলের মানের ক্ষেত্রে উভয়ের মধ্যে পড়ে। শেষ পর্যন্ত, জেনারেটরের মধ্যে পছন্দ ব্যবহারকারীর চাহিদা এবং পছন্দের উপর নির্ভর করে।

একটি নির্দিষ্ট প্রকল্প বা অ্যাপ্লিকেশনের জন্য সেরা জেনারেটর নির্বাচন করার জন্য টিপস

সূত্রের মতে, একটি নির্দিষ্ট প্রকল্প বা অ্যাপ্লিকেশনের জন্য সেরা এআই ইমেজ জেনারেটর নির্বাচন করা ব্যবহারকারীর চাহিদা এবং পছন্দের উপর নির্ভর করে। ব্যবহারকারীকে অবশ্যই বিষয়গুলি বিবেচনা করতে হবে যেমন তিনি যে ধরণের চিত্র তৈরি করতে চান, তার প্রয়োজনীয় বিশদ এবং বাস্তবতার স্তর, জেনারেটরের ব্যবহারের সহজতা, পেইন্টিংয়ের মতো ফাংশনগুলির প্রাপ্যতা, বিভিন্ন চিত্র ক্রপ করা এবং আপলোড করা, যেমন পাশাপাশি জেনারেটরের খরচ।

ব্যবহারকারী যদি স্বপ্নের মতো এবং শৈল্পিক চিত্র তৈরি করতে চান তবে মিডজার্নি হল সেরা বিকল্প। ব্যবহারকারী যদি ফটোরিয়ালিস্টিক ইমেজ তৈরি করতে চান, DALL-E একটি ভাল বিকল্প। স্থিতিশীল ডিফিউশন ব্যবহারের সহজতা এবং ফলাফলের মানের ক্ষেত্রে উভয়ের মধ্যে পড়ে। স্ট্যাবল ডিফিউশন DALL-E-এর চেয়ে আরও বেশি বিকল্প অফার করে, যেমন জেনারেটর কতটা ভালোভাবে নির্দেশিকা অনুসরণ করে তা নির্ধারণ করার জন্য একটি স্কেল, সেইসাথে ফলাফলের বিন্যাস এবং আকার সম্পর্কিত বিকল্পগুলি। যাইহোক, স্ট্যাবল ডিফিউশনের ওয়ার্কফ্লো DALL-E-এর সাথে তুলনীয় নয়, যা ইমেজগুলিকে গোষ্ঠীভুক্ত করে এবং সংগ্রহ ফোল্ডারগুলি অফার করে।

ব্যবহারকারীর বিবেচনা করা উচিত যে জেনারেটর বিনামূল্যে বা অর্থপ্রদান করা হয় কিনা এবং এটি একটি ওয়েব অ্যাপ বা ডিসকর্ড বট হিসাবে উপলব্ধ কিনা। স্টেবল ডিফিউশন সম্পূর্ণ বিনামূল্যে এবং ডিসকর্ড বট হিসাবে উপলব্ধ, যখন মিডজার্নি এবং DALL-E অর্থপ্রদান করা হয় এবং ওয়েব অ্যাপ বা ডিসকর্ড বট হিসাবে উপলব্ধ।

শেষ পর্যন্ত, জেনারেটরের মধ্যে পছন্দ ব্যবহারকারীর চাহিদা এবং পছন্দের উপর নির্ভর করে। ব্যবহারকারীর উচিত তাদের প্রয়োজনের জন্য সবচেয়ে উপযুক্ত একটি বেছে নেওয়ার আগে প্রতিটি জেনারেটরের বৈশিষ্ট্য এবং আউটপুট গুণমানের গবেষণা এবং তুলনা করা।

মধ্য-কোর্সের বিকল্প।

আগেই উল্লেখ করা হয়েছে, মিডজার্নি হল একটি জনপ্রিয় এআই ইমেজ জেনারেটর যা পাঠ্য বর্ণনা থেকে ছবি তৈরি করে। যাইহোক, এটি শুধুমাত্র 25 মিনিটের ফ্রি রেন্ডার টাইম অফার করে, যা প্রায় 30টি ছবি। আপনি যদি মিডজার্নির একটি বিনামূল্যের বিকল্প খুঁজছেন, তবে আপনি চেষ্টা করতে পারেন এমন বেশ কয়েকটি বিকল্প রয়েছে।

এখানে মিডজার্নির কিছু বিনামূল্যের বিকল্প রয়েছে:

  • ক্রাইয়ন : এটি একটি বিনামূল্যের এবং ওপেন সোর্স সমাধান যা মিডজার্নির একটি ভাল বিকল্প অফার করে৷
  • ডাল-ই : এটি Midjourney-এর অনুরূপ আরেকটি ইমেজ জেনারেটর এবং বিনামূল্যে পাওয়া যায়। এটি OpenAI দ্বারা তৈরি।
  • Jasper: এটি একটি বিনামূল্যের এবং ওপেন সোর্স ইমেজ জেনারেটর যা মিডজার্নির বিকল্প হিসেবে ব্যবহার করা যেতে পারে।
  • আশ্চর্য : এটি একটি বিনামূল্যের এবং ওপেন সোর্স ইমেজ জেনারেটর যা মিডজার্নির বিকল্প হিসেবে ব্যবহার করা যেতে পারে।
  • এআইকে আহ্বান করুন : এটি একটি স্বজ্ঞাত ইন্টারফেস সহ একটি সুন্দর ডিজাইন করা ইমেজ জেনারেটর যা মিডজার্নির বিকল্প হিসাবে ব্যবহার করা যেতে পারে।
  • ডিস্কো ডিফিউশন: এটি একটি ক্লাউড-ভিত্তিক টেক্সট টু ইমেজ কনভার্সন সিস্টেম যা ব্যবহার করা সহজ এবং মিডজার্নির বিকল্প হিসেবে ব্যবহার করা যেতে পারে।

আপনি যদি আরও নির্দিষ্ট বা কাস্টমাইজযোগ্য কিছু খুঁজছেন, স্থিতিশীল স্ট্রিমিং (SD) একটি ভাল বিকল্প হতে পারে। [3]. যাইহোক, SD ভাল ফলাফল পেতে আরও বেশি পরিশ্রম করে এবং মিডজার্নির মতো ব্যবহার করা সহজ নয়। উপরন্তু, আরও বেশ কিছু বিনামূল্যের টেক্সট-টু-ইমেজ কনভার্সন সিস্টেম রয়েছে, যেমন Wombo's Dream, Hotpot's AI Art Maker, SnowPixel, CogView, StarryAI, ArtBreeder এবং ArtFlow।

উপসংহারে, আপনি যদি মিডজার্নির একটি বিনামূল্যের বিকল্প খুঁজছেন, সেখানে বেশ কয়েকটি বিকল্প উপলব্ধ রয়েছে, যেমন Craiyon, DALL-E, Jasper, Wonder, Invoke AI, Disco Diffusion এবং Stable Diffusion. এই সিস্টেমগুলি কাস্টমাইজেশনের বিভিন্ন ডিগ্রী এবং ব্যবহারের সহজতা অফার করে, তাই আপনার বেশ কয়েকটি চেষ্টা করা উচিত এবং দেখুন কোনটি আপনার জন্য সবচেয়ে ভাল কাজ করে।

এই নিবন্ধটি দলের সাথে সহযোগিতায় লেখা হয়েছে ডিপএআই et সংগঠন.

[মোট: 0 মানে: 0]

লিখেছেন ডায়েটার বি.

নতুন প্রযুক্তি সম্পর্কে উত্সাহী সাংবাদিক। Dieter রিভিউ এর সম্পাদক. এর আগে, তিনি ফোর্বসের একজন লেখক ছিলেন।

Laisser উন commentaire

আপনার ইমেইল ঠিকানা প্রচার করা হবে না. প্রয়োজনীয় ক্ষেত্রগুলি চিহ্নিত হয় *

আপনি কি মনে করেন?

386 পয়েন্ট
ভোট দিন ভোট