ওপেনএআই মঙ্গলবার ঘোষণা করেছে যে তারা দুটি নতুন ওপেন-ওয়েট এআই রিজনিং মডেল চালু করেছে, যার নাম জিপিটি-ওএসএস-১২০বি এবং জিপিটি-ওএসএস-২০বি। এই মডেল দুটি হাগিং ফেস প্ল্যাটফর্ম থেকে বিনামূল্যে ডাউনলোড করা যাবে। ওপেনএআই দাবি করেছে, এই মডেলগুলো ওপেন মডেলের তুলনায় বিভিন্ন বেঞ্চমার্কে “অত্যাধুনিক” পারফরম্যান্স প্রদান করে। এটি ২০১৯ সালে জিপিটি-২ প্রকাশের পর ওপেনএআই-এর প্রথম ওপেন-ওয়েট ভাষা মডেল।
মডেল দুটি দুই ধরনের: বড় এবং আরও শক্তিশালী জিপিটি-ওএসএস-১২০বি, যা একটি এনভিডিয়া এইচ১০০ জিপিইউ-তে চলতে পারে, এবং ছোট ও হালকা জিপিটি-ওএসএস-২০বি, যা মাত্র ১৬ জিবি মেমরির সাধারণ ল্যাপটপে চলতে পারে। এই মডেলগুলো ক্লাউডে জটিল কোয়েরি পাঠাতে পারে। যদি কোনো কাজ, যেমন ছবি প্রসেসিং, এই মডেলগুলোর সামর্থ্যের বাইরে হয়, তবে ডেভেলপাররা ওপেনএআই-এর আরও উন্নত ক্লোজড মডেলের সঙ্গে সংযোগ স্থাপন করতে পারেন।
ওপেনএআই শুরুর দিকে ওপেন-সোর্স মডেল প্রকাশ করলেও, সম্প্রতি তারা প্রোপ্রাইটারি, ক্লোজড-সোর্স পদ্ধতির দিকে ঝুঁকেছে, যা তাদের এআই মডেলগুলোর এপিআইয়ের মাধ্যমে ব্যবসায়িক সাফল্য এনেছে। তবে, ওপেনএআই-এর সিইও স্যাম অল্টম্যান জানুয়ারিতে বলেছিলেন, ওপেন-সোর্সিংয়ের ক্ষেত্রে তারা “ইতিহাসের ভুল পক্ষে” ছিল। চীনের এআই ল্যাবগুলো, যেমন ডিপসিক, আলিবাবার কিউয়েন এবং মুনশট এআই, উন্নত ওপেন মডেল তৈরি করে বিশ্বব্যাপী জনপ্রিয়তা অর্জন করেছে। এছাড়া, ট্রাম্প প্রশাসনও আমেরিকান মূল্যবোধের সঙ্গে সামঞ্জস্যপূর্ণ এআই প্রচারের জন্য ওপেন-সোর্সিংয়ে উৎসাহ দিয়েছে।
অল্টম্যান বলেছেন, “আমরা ২০১৫ সালে যখন শুরু করি, তখন আমাদের লক্ষ্য ছিল এআই প্রযুক্তির মাধ্যমে সমগ্র মানবজাতির উপকার নিশ্চিত করা। এই মডেলগুলো আমেরিকায় তৈরি ওপেন এআই স্ট্যাকের ওপর ভিত্তি করে গড়ে উঠবে, যা গণতান্ত্রিক মূল্যবোধের ভিত্তিতে বিনামূল্যে সকলের জন্য উপলব্ধ।”
মডেলগুলোর পারফরম্যান্স
ওপেনএআই দাবি করেছে, তাদের ওপেন মডেলগুলো অন্যান্য ওপেন-ওয়েট মডেলের তুলনায় শীর্ষে রয়েছে। কোডফোর্সেস প্রতিযোগিতামূলক কোডিং পরীক্ষায় জিপিটি-ওএসএস-১২০বি এবং ২০বি যথাক্রমে ২৬২২ এবং ২৫১৬ স্কোর করেছে, যা ডিপসিকের আর১-কে ছাড়িয়ে গেছে, তবে ওপেনএআই-এর ও৩ এবং ও৪-মিনির তুলনায় কিছুটা পিছিয়ে। হিউম্যানিটিস লাস্ট এক্সাম (এইচএলই)-এ জিপিটি-ওএসএস-১২০বি এবং ২০বি যথাক্রমে ১৯% এবং ১৭.৩% স্কোর করেছে, যা ডিপসিক এবং কিউয়েনের শীর্ষ মডেলগুলোকে ছাড়িয়ে গেছে।
তবে, এই মডেলগুলোতে হ্যালুসিনেশনের (ভুল তথ্য প্রদান) সমস্যা বেশি। ওপেনএআই-এর পার্সনকিউএ বেঞ্চমার্কে জিপিটি-ওএসএস-১২০বি এবং ২০বি যথাক্রমে ৪৯% এবং ৫৩% প্রশ্নে হ্যালুসিনেট করেছে, যা ও১ মডেলের ১৬% এবং ও৪-মিনির ৩৬% হ্যালুসিনেশন রেটের তুলনায় অনেক বেশি। ওপেনএআই জানিয়েছে, ছোট মডেলগুলোতে বিশ্ব সম্পর্কে কম জ্ঞান থাকায় এটি প্রত্যাশিত।
মডেল প্রশিক্ষণ
ওপেনএআই জানিয়েছে, এই মডেলগুলো তাদের প্রোপ্রাইটারি মডেলের মতো একই প্রক্রিয়ায় প্রশিক্ষিত। প্রতিটি মডেল মিক্সচার-অফ-এক্সপার্টস (এমওই) কাঠামো ব্যবহার করে, যা প্রতিটি প্রশ্নের জন্য কম প্যারামিটার সক্রিয় করে, ফলে এটি আরও দক্ষতার সঙ্গে চলে। জিপিটি-ওএসএস-১২০বি-তে মোট ১১৭ বিলিয়ন প্যারামিটার রয়েছে, কিন্তু প্রতি টোকেনে মাত্র ৫.১ বিলিয়ন সক্রিয় হয়। উচ্চ-কম্পিউট রিইনফোর্সমেন্ট লার্নিং (আরএল) ব্যবহার করে এই মডেলগুলো প্রশিক্ষিত, যা এনভিডিয়া জিপিইউ-এর বড় ক্লাস্টারে সিমুলেটেড পরিবেশে সঠিক-ভুল শেখায়। এই প্রক্রিয়া মডেলগুলোকে চেইন-অফ-থট প্রক্রিয়ায় আরও সময় ও কম্পিউটিং রিসোর্স ব্যবহার করে উত্তর প্রদানে দক্ষ করে।
এই মডেলগুলো এআই এজেন্ট চালানোর জন্য উৎকৃষ্ট, যেমন ওয়েব সার্চ বা পাইথন কোড এক্সিকিউশনের মতো টুল ব্যবহার করতে পারে। তবে, এগুলো শুধুমাত্র টেক্সট-ভিত্তিক, অর্থাৎ ছবি বা অডিও প্রসেস বা তৈরি করতে পারে না।
মডেলগুলো অ্যাপাচি ২.০ লাইসেন্সের আওতায় প্রকাশিত, যা উদ্যোগীদের জন্য বিনামূল্যে বাণিজ্যিক ব্যবহারের সুযোগ দেয়। তবে, এআই২-এর মতো সম্পূর্ণ ওপেন-সোর্স মডেলের বিপরীতে, ওপেনএআই তাদের প্রশিক্ষণ ডেটা প্রকাশ করেনি, কারণ কপিরাইটেড কাজের উপর প্রশিক্ষণ সংক্রান্ত মামলা এড়াতে।
নিরাপত্তার বিষয়ে, ওপেনএআই মডেল প্রকাশে বিলম্ব করেছে যাতে সাইবার আক্রমণ বা জৈবিক/রাসায়নিক অস্ত্র তৈরির মতো ঝুঁকি পরীক্ষা করা যায়। পরীক্ষায় দেখা গেছে, এই মডেলগুলো জৈবিক ক্ষমতা কিছুটা বাড়াতে পারে, তবে “উচ্চ ঝুঁকির” থ্রেশহোল্ডে পৌঁছায় না।