গুগল ডিপমাইন্ড তাদের নতুন এআই “ওয়ার্ল্ড” মডেলের একটি আপডেটেড সংস্করণ প্রকাশ করছে, যার নাম জিনি ৩। এই মডেলটি রিয়েল টাইমে ত্রিমাত্রিক (থ্রিডি) পরিবেশ তৈরি করতে পারে, যেখানে ব্যবহারকারী এবং এআই এজেন্টরা সরাসরি ইন্টারেক্ট করতে পারে। গুগল জানিয়েছে, এই নতুন মডেলে ব্যবহারকারীরা আগের তুলনায় অনেক বেশি সময় ধরে এই জগতের সঙ্গে ইন্টারেক্ট করতে পারবেন। শুধু তাই নয়, এই মডেলটি এমনকি মনে রাখতে পারে যে আপনি যখন কোনো কিছু থেকে দৃষ্টি সরিয়ে নেন, তখন সেটি ঠিক কোথায় ছিল।
“ওয়ার্ল্ড মডেল” হলো এমন একটি এআই সিস্টেম, যা শিক্ষা, বিনোদন বা রোবট এবং এআই এজেন্টদের প্রশিক্ষণের জন্য বিভিন্ন পরিবেশের সিমুলেশন তৈরি করতে পারে। এই মডেলে একটি প্রম্পট দিলে, এটি এমন একটি স্থান তৈরি করে, যেখানে আপনি ভিডিও গেমের মতো ঘুরে বেড়াতে পারেন। তবে, এই জগতগুলো হাতে তৈরি থ্রিডি অ্যাসেটের পরিবর্তে এআই দিয়ে তৈরি হয়। গুগল এই প্রযুক্তির উপর ব্যাপক গুরুত্ব দিচ্ছে। গত ডিসেম্বরে তারা জিনি ২ প্রকাশ করেছিল, যা একটি ছবির ভিত্তিতে ইন্টারেক্টিভ জগত তৈরি করতে পারত। এছাড়া, গুগল এখন ওপেনএআই-এর সোরা ভিডিও জেনারেশন টুলের সাবেক সহ-নেতার নেতৃত্বে একটি ওয়ার্ল্ড মডেল টিম গঠন করছে।
তবে, এই ধরনের মডেলের বর্তমানে কিছু সীমাবদ্ধতা রয়েছে। উদাহরণস্বরূপ, জিনি ২-এর তৈরি জগতগুলোতে মাত্র এক মিনিট পর্যন্ত খেলা যেত। সম্প্রতি আমি পিক্সারের সহ-প্রতিষ্ঠাতার সমর্থিত একটি কোম্পানির “ইন্টারেক্টিভ ভিডিও” চেষ্টা করেছিলাম, যা গুগল স্ট্রিট ভিউ-এর একটি ঝাপসা সংস্করণের মতো মনে হয়েছিল। সেখানে জিনিসগুলো অপ্রত্যাশিতভাবে রূপান্তরিত হতো এবং পরিবর্তন হতো।
জিনি ৩ এই ক্ষেত্রে একটি উল্লেখযোগ্য অগ্রগতি হতে পারে। গুগলের ব্লগ পোস্ট অনুযায়ী, ব্যবহারকারীরা একটি প্রম্পট দিয়ে এমন জগত তৈরি করতে পারবেন, যেখানে কয়েক মিনিট ধরে ইন্টারেক্ট করা যাবে, যা জিনি ২-এর ১০-২০ সেকেন্ডের তুলনায় অনেক বেশি। গুগল জানিয়েছে, জিনি ৩ প্রায় এক মিনিট পর্যন্ত ভিজ্যুয়াল মেমরি ধরে রাখতে পারে। এর মানে, আপনি যদি কোনো জগতের কোনো বস্তু থেকে দৃষ্টি সরিয়ে আবার ফিরে তাকান, তবে দেয়ালে আঁকা রং বা চকবোর্ডে লেখা লেখাগুলো ঠিক একই জায়গায় থাকবে। এই জগতগুলো ৭২০পি রেজোলিউশনে চলবে এবং প্রতি সেকেন্ডে ২৪ ফ্রেমে রান করবে।
ডিপমাইন্ড জিনি ৩-এ “প্রম্পটেবল ওয়ার্ল্ড ইভেন্ট” নামে একটি ফিচার যোগ করছে। এর মাধ্যমে ব্যবহারকারীরা প্রম্পট ব্যবহার করে জগতের আবহাওয়া পরিবর্তন করতে বা নতুন চরিত্র যোগ করতে পারবেন।
তবে, এই মডেলটি সম্ভবত সাধারণ ব্যবহারকারীদের জন্য উন্মুক্ত হবে না। গুগল জানিয়েছে, এটি “সীমিত গবেষণা প্রিভিউ” হিসেবে মুক্তি পাবে, যা শুধুমাত্র “একটি ছোট গ্রুপের শিক্ষাবিদ এবং স্রষ্টা” ব্যবহার করতে পারবেন। এর মাধ্যমে ডেভেলপাররা এর ঝুঁকিগুলো ভালোভাবে বুঝতে এবং তা কমানোর উপায় খুঁজে বের করতে চান। এছাড়া, ব্যবহারকারীদের ইন্টারেকশনের উপায় সীমিত এবং পাঠযোগ্য টেক্সট শুধুমাত্র তখনই তৈরি হয় যখন এটি ইনপুট বিবরণে দেওয়া থাকে। গুগল বলছে, তারা ভবিষ্যতে “অতিরিক্ত পরীক্ষকদের” জন্য জিনি ৩ উন্মুক্ত করার বিষয়টি “অনুসন্ধান” করছে।