গুগল জেমিনির এআই ইমেজ মডেলে ‘বানানাস’ আপগ্রেড: ফটো এডিটিংয়ে নতুন বিপ্লব

গুগল জেমিনির এআই ইমেজ মডেলে ‘বানানাস’ আপগ্রেড! ফটো এডিটিংয়ে নতুন নিয়ন্ত্রণ ও উন্নত গুণমান। এআই ইমেজ প্রযুক্তিতে বিপ্লব ঘটাচ্ছে গুগল।

আনিস আফিফি
লিখেছেন:
আনিস আফিফি
লিখেছেন:আনিস আফিফি
সম্পাদক
আমি আনিস আফিফি — একজন উদ্যোক্তা এবং ওয়েব ডেভেলপার, যার একটি বড় স্বপ্ন হলো মানবজাতির জন্য পৃথিবীকে আরও ভালো একটি জায়গায় পরিণত করা। আমি ব্র্যান্ড তৈরি...
- সম্পাদক
ছবির সৌজন্যে: গুগল

গুগল তার জেমিনি চ্যাটবটে একটি নতুন এআই ইমেজ মডেল যুক্ত করছে, যা ব্যবহারকারীদের ফটো এডিটিংয়ে আরও নিখুঁত নিয়ন্ত্রণ দেবে। এই আপগ্রেডের মাধ্যমে গুগল ওপেনএআই-এর জনপ্রিয় ইমেজ টুলের সঙ্গে প্রতিযোগিতায় এগিয়ে যেতে চায় এবং চ্যাটজিপিটি থেকে ব্যবহারকারীদের আকর্ষণ করতে চায়।

নতুন আপডেটটি, যার নাম জেমিনি ২.৫ ফ্ল্যাশ ইমেজ, মঙ্গলবার থেকে জেমিনি অ্যাপের সব ব্যবহারকারী এবং ডেভেলপারদের জন্য উন্মুক্ত হয়েছে। এটি গুগল এআই স্টুডিও, ভার্টেক্স এআই প্ল্যাটফর্ম এবং জেমিনি এপিআই-এর মাধ্যমেও পাওয়া যাবে।

এই নতুন এআই ইমেজ মডেলটি ব্যবহারকারীদের সাধারণ ভাষার নির্দেশনার ভিত্তিতে ইমেজে আরও নির্ভুল সম্পাদনা করতে সক্ষম। এটি মানুষের মুখ, প্রাণী বা অন্যান্য বিবরণের ধারাবাহিকতা বজায় রাখে, যা অন্যান্য প্রতিযোগী টুলের ক্ষেত্রে প্রায়ই সমস্যা হয়। উদাহরণস্বরূপ, চ্যাটজিপিটি বা এক্সএআই-এর গ্রককে কারও শার্টের রঙ পরিবর্তন করতে বললে ফলাফল হতে পারে বিকৃত মুখ বা পটভূমির পরিবর্তন। কিন্তু গুগলের নতুন মডেল এই সমস্যাগুলো এড়িয়ে আরও স্বাভাবিক সম্পাদনা নিশ্চিত করে।

সাম্প্রতিক সপ্তাহগুলোতে সামাজিক মাধ্যমে এই মডেলটি বেশ আলোচনার জন্ম দিয়েছে। ক্রাউডসোর্সড মূল্যায়ন প্ল্যাটফর্ম এলএমএরিনায় এটি ‘ন্যানো-বানানা’ ছদ্মনামে পরীক্ষিত হয়েছিল এবং ব্যবহারকারীদের কাছ থেকে প্রশংসা কুড়িয়েছে। গুগল নিশ্চিত করেছে যে এটি তাদের ফ্ল্যাগশিপ জেমিনি ২.৫ ফ্ল্যাশ এআই মডেলের অংশ। এলএমএরিনা এবং অন্যান্য বেঞ্চমার্কে এই মডেলটি শীর্ষস্থানীয় বলে দাবি করেছে গুগল।

গুগল ডিপমাইন্ডের ভিজ্যুয়াল জেনারেশন মডেলের প্রোডাক্ট লিড নিকোল ব্রিচটোভা টেকক্রাঞ্চকে দেওয়া এক সাক্ষাৎকারে বলেন, “আমরা ভিজ্যুয়াল গুণমান এবং মডেলের নির্দেশনা অনুসরণের ক্ষমতাকে এগিয়ে নিয়ে যাচ্ছি। এই আপডেটটি সম্পাদনাকে আরও স্বাভাবিক করে এবং ফলাফলগুলো ব্যবহারকারীদের প্রয়োজন অনুযায়ী ব্যবহারযোগ্য।”

Gemini Image Image Editing Benchmark
গুগল দাবি করেছে যে তাদের নতুন এআই ইমেজ মডেলটি বেশ কয়েকটি মানদণ্ডে অত্যাধুনিক। ক্রেডিট: গুগল

এআই ইমেজ মডেল এখন বড় প্রযুক্তি কোম্পানিগুলোর জন্য একটি গুরুত্বপূর্ণ প্রতিযোগিতার ক্ষেত্র হয়ে উঠেছে। গত মার্চে ওপেনএআই-এর জিপিটি-৪ও ইমেজ জেনারেটর চালু হওয়ার পর স্টুডিও ঘিবলি মিমের উন্মাদনায় চ্যাটজিপিটির ব্যবহারকারী সংখ্যা হু হু করে বেড়ে যায়। ওপেনএআই-এর সিইও স্যাম অল্টম্যানের মতে, এই উন্মাদনা কোম্পানির জিপিইউ-গুলোকে “গলিয়ে” দিয়েছিল।

গুগল এবং ওপেনএআই-এর সঙ্গে তাল মিলিয়ে চলতে মেটা গত সপ্তাহে স্টার্টআপ মিডজার্নির কাছ থেকে এআই ইমেজ মডেল লাইসেন্স করার ঘোষণা দিয়েছে। এদিকে, জার্মান ইউনিকর্ন ব্ল্যাক ফরেস্ট ল্যাবস তাদের ফ্লাক্স এআই ইমেজ মডেল দিয়ে বেঞ্চমার্কে আধিপত্য বিস্তার করছে।

গুগলের জেমিনি এআই ইমেজ এডিটর হয়তো ওপেনএআই-এর সঙ্গে ব্যবহারকারী সংখ্যার ব্যবধান কমাতে সাহায্য করবে। বর্তমানে চ্যাটজিপিটির সাপ্তাহিক ব্যবহারকারী ৭০০ মিলিয়নের বেশি, যেখানে গুগলের সিইও সুন্দর পিচাই গত জুলাইয়ে জানিয়েছিলেন যে জেমিনির মাসিক ব্যবহারকারী ৪৫০ মিলিয়ন, অর্থাৎ সাপ্তাহিক ব্যবহারকারী আরও কম।

ব্রিচটোভা বলেন, এই ইমেজ মডেলটি বিশেষভাবে গ্রাহকদের চাহিদার কথা মাথায় রেখে তৈরি করা হয়েছে, যেমন বাড়ি বা বাগানের প্রকল্প ভিজ্যুয়ালাইজ করা। এটি আরও উন্নত “বিশ্ব জ্ঞান” ধারণ করে এবং একটি প্রম্পটে একাধিক রেফারেন্স একত্রিত করতে পারে। উদাহরণস্বরূপ, একটি সোফার ছবি, লিভিং রুমের ছবি এবং রঙের প্যালেট একত্রিত করে একটি সুসংগত রেন্ডার তৈরি করতে পারে।

তবে, গুগলের নতুন এআই ইমেজ জেনারেটর ব্যবহারকারীদের জন্য সহজ হলেও, কোম্পানি কিছু নিরাপত্তা সীমাবদ্ধতা আরোপ করেছে। অতীতে গুগলের এআই ইমেজ জেনারেটর ঐতিহাসিকভাবে ভুল ছবি তৈরি করায় সমালোচনার মুখে পড়েছিল, এমনকি এক পর্যায়ে এটি বন্ধও করে দেওয়া হয়েছিল। এখন গুগল বলছে, তারা সৃজনশীল নিয়ন্ত্রণ এবং নিরাপত্তার মধ্যে ভারসাম্য বজায় রেখেছে।

“আমরা ব্যবহারকারীদের সৃজনশীল নিয়ন্ত্রণ দিতে চাই, যাতে তারা তাদের পছন্দমতো ফলাফল পায়। কিন্তু এর মানে এই নয় যে সবকিছুই অনুমোদিত,” বলেন ব্রিচটোভা। গুগলের জেনারেটিভ এআই টার্মস অফ সার্ভিসে “অননুমোদিত অন্তরঙ্গ চিত্র” তৈরি নিষিদ্ধ করা হয়েছে। তবে, এক্সএআই-এর গ্রকের ক্ষেত্রে এমন কঠোর সীমাবদ্ধতা নেই, যেখানে ব্যবহারকারীরা টেলর সুইফটের মতো সেলিব্রিটিদের স্পষ্ট এআই-জেনারেটেড ছবি তৈরি করতে পেরেছে।

ডিপফেক ইমেজের ক্রমবর্ধমান সমস্যা মোকাবেলায় গুগল এআই-জেনারেটেড ছবিতে ভিজ্যুয়াল ওয়াটারমার্ক এবং মেটাডেটায় শনাক্তকারী যুক্ত করছে। তবে, সামাজিক মাধ্যমে দ্রুত স্ক্রল করার সময় ব্যবহারকারীরা এই শনাক্তকারীগুলো লক্ষ্য নাও করতে পারে।

গুগলের এই নতুন পদক্ষেপ বাংলাদেশের প্রযুক্তি উৎসাহীদের জন্যও উত্তেজনার বিষয়। বাড়ির ডিজাইন থেকে শুরু করে সৃজনশীল প্রকল্প—জেমিনির এই আপগ্রেড ব্যবহারকারীদের কল্পনাকে বাস্তবে রূপ দেওয়ার নতুন সুযোগ তৈরি করবে। তবে, এই প্রযুক্তির দায়িত্বশীল ব্যবহার নিশ্চিত করা এখন বড় চ্যালেঞ্জ।

Avatar Of আনিস আফিফি
লিখেছেন:আনিস আফিফি
সম্পাদক
ফলো:
আমি আনিস আফিফি — একজন উদ্যোক্তা এবং ওয়েব ডেভেলপার, যার একটি বড় স্বপ্ন হলো মানবজাতির জন্য পৃথিবীকে আরও ভালো একটি জায়গায় পরিণত করা। আমি ব্র্যান্ড তৈরি করি, ডিজিটাল সমস্যাগুলোর সমাধান করি। এবং এমন একটি ভবিষ্যত তৈরি করতে চাই যা মানুষকে ক্ষমতায়িত করে।
মন্তব্য নেই

মন্তব্য করুন

আপনার ই-মেইল এ্যাড্রেস প্রকাশিত হবে না। * চিহ্নিত বিষয়গুলো আবশ্যক।

০%