ওপেনএআই-এর নতুন দুটি ওপেন-ওয়েট এআই মডেল: জিপিটি-ওএসএস-১২০বি ও ২০বি

ওপেনএআই-এর জিপিটি-ওএসএস-১২০বি ও ২০বি ওপেন-ওয়েট এআই মডেল এখন হাগিং ফেসে! উন্নত রিজনিং ও সাশ্রয়ী ডিপ্লয়মেন্টের জন্য দেখুন।

সর্বশেষ সম্পাদনা: ২০২৫-০৮-০৬ ১০:২৭

লিখেছেন:

সম্পাদক

আমি আনিস আফিফি — একজন উদ্যোক্তা এবং ওয়েব ডেভেলপার, যার একটি বড় স্বপ্ন হলো মানবজাতির জন্য পৃথিবীকে আরও ভালো একটি জায়গায় পরিণত করা। আমি ব্র্যান্ড তৈরি...

ফলো:

- সম্পাদক

ওপেনএআই মঙ্গলবার ঘোষণা করেছে যে তারা দুটি নতুন ওপেন-ওয়েট এআই রিজনিং মডেল চালু করেছে, যার নাম জিপিটি-ওএসএস-১২০বি এবং জিপিটি-ওএসএস-২০বি। এই মডেল দুটি হাগিং ফেস প্ল্যাটফর্ম থেকে বিনামূল্যে ডাউনলোড করা যাবে। ওপেনএআই দাবি করেছে, এই মডেলগুলো ওপেন মডেলের তুলনায় বিভিন্ন বেঞ্চমার্কে “অত্যাধুনিক” পারফরম্যান্স প্রদান করে। এটি ২০১৯ সালে জিপিটি-২ প্রকাশের পর ওপেনএআই-এর প্রথম ওপেন-ওয়েট ভাষা মডেল।

শিরোনাম

মডেলগুলোর পারফরম্যান্স মডেল প্রশিক্ষণ

মডেল দুটি দুই ধরনের: বড় এবং আরও শক্তিশালী জিপিটি-ওএসএস-১২০বি, যা একটি এনভিডিয়া এইচ১০০ জিপিইউ-তে চলতে পারে, এবং ছোট ও হালকা জিপিটি-ওএসএস-২০বি, যা মাত্র ১৬ জিবি মেমরির সাধারণ ল্যাপটপে চলতে পারে। এই মডেলগুলো ক্লাউডে জটিল কোয়েরি পাঠাতে পারে। যদি কোনো কাজ, যেমন ছবি প্রসেসিং, এই মডেলগুলোর সামর্থ্যের বাইরে হয়, তবে ডেভেলপাররা ওপেনএআই-এর আরও উন্নত ক্লোজড মডেলের সঙ্গে সংযোগ স্থাপন করতে পারেন।

ওপেনএআই শুরুর দিকে ওপেন-সোর্স মডেল প্রকাশ করলেও, সম্প্রতি তারা প্রোপ্রাইটারি, ক্লোজড-সোর্স পদ্ধতির দিকে ঝুঁকেছে, যা তাদের এআই মডেলগুলোর এপিআইয়ের মাধ্যমে ব্যবসায়িক সাফল্য এনেছে। তবে, ওপেনএআই-এর সিইও স্যাম অল্টম্যান জানুয়ারিতে বলেছিলেন, ওপেন-সোর্সিংয়ের ক্ষেত্রে তারা “ইতিহাসের ভুল পক্ষে” ছিল। চীনের এআই ল্যাবগুলো, যেমন ডিপসিক, আলিবাবার কিউয়েন এবং মুনশট এআই, উন্নত ওপেন মডেল তৈরি করে বিশ্বব্যাপী জনপ্রিয়তা অর্জন করেছে। এছাড়া, ট্রাম্প প্রশাসনও আমেরিকান মূল্যবোধের সঙ্গে সামঞ্জস্যপূর্ণ এআই প্রচারের জন্য ওপেন-সোর্সিংয়ে উৎসাহ দিয়েছে।

অল্টম্যান বলেছেন, “আমরা ২০১৫ সালে যখন শুরু করি, তখন আমাদের লক্ষ্য ছিল এআই প্রযুক্তির মাধ্যমে সমগ্র মানবজাতির উপকার নিশ্চিত করা। এই মডেলগুলো আমেরিকায় তৈরি ওপেন এআই স্ট্যাকের ওপর ভিত্তি করে গড়ে উঠবে, যা গণতান্ত্রিক মূল্যবোধের ভিত্তিতে বিনামূল্যে সকলের জন্য উপলব্ধ।”

Open Ai Ceo Sam Altman — ছবির সৌজন্যে: তোমোহিরো ওহসুমি / গেটি ইমেজেস

মডেলগুলোর পারফরম্যান্স

Screenshot 2025 08 05 At 12.21.54Pm — কোডফোর্সেসে ওপেনএআই-এর ওপেন মডেলের পারফরম্যান্স। ছবির সৌজন্যে: ওপেনএআই

ওপেনএআই দাবি করেছে, তাদের ওপেন মডেলগুলো অন্যান্য ওপেন-ওয়েট মডেলের তুলনায় শীর্ষে রয়েছে। কোডফোর্সেস প্রতিযোগিতামূলক কোডিং পরীক্ষায় জিপিটি-ওএসএস-১২০বি এবং ২০বি যথাক্রমে ২৬২২ এবং ২৫১৬ স্কোর করেছে, যা ডিপসিকের আর১-কে ছাড়িয়ে গেছে, তবে ওপেনএআই-এর ও৩ এবং ও৪-মিনির তুলনায় কিছুটা পিছিয়ে। হিউম্যানিটিস লাস্ট এক্সাম (এইচএলই)-এ জিপিটি-ওএসএস-১২০বি এবং ২০বি যথাক্রমে ১৯% এবং ১৭.৩% স্কোর করেছে, যা ডিপসিক এবং কিউয়েনের শীর্ষ মডেলগুলোকে ছাড়িয়ে গেছে।

Screenshot 2025 08 05 At 12.18.20Pm — Hle-তে Openai-এর ওপেন মডেলের পারফরম্যান্স। ছবির সৌজন্যে:Openai

তবে, এই মডেলগুলোতে হ্যালুসিনেশনের (ভুল তথ্য প্রদান) সমস্যা বেশি। ওপেনএআই-এর পার্সনকিউএ বেঞ্চমার্কে জিপিটি-ওএসএস-১২০বি এবং ২০বি যথাক্রমে ৪৯% এবং ৫৩% প্রশ্নে হ্যালুসিনেট করেছে, যা ও১ মডেলের ১৬% এবং ও৪-মিনির ৩৬% হ্যালুসিনেশন রেটের তুলনায় অনেক বেশি। ওপেনএআই জানিয়েছে, ছোট মডেলগুলোতে বিশ্ব সম্পর্কে কম জ্ঞান থাকায় এটি প্রত্যাশিত।

মডেল প্রশিক্ষণ

ওপেনএআই জানিয়েছে, এই মডেলগুলো তাদের প্রোপ্রাইটারি মডেলের মতো একই প্রক্রিয়ায় প্রশিক্ষিত। প্রতিটি মডেল মিক্সচার-অফ-এক্সপার্টস (এমওই) কাঠামো ব্যবহার করে, যা প্রতিটি প্রশ্নের জন্য কম প্যারামিটার সক্রিয় করে, ফলে এটি আরও দক্ষতার সঙ্গে চলে। জিপিটি-ওএসএস-১২০বি-তে মোট ১১৭ বিলিয়ন প্যারামিটার রয়েছে, কিন্তু প্রতি টোকেনে মাত্র ৫.১ বিলিয়ন সক্রিয় হয়। উচ্চ-কম্পিউট রিইনফোর্সমেন্ট লার্নিং (আরএল) ব্যবহার করে এই মডেলগুলো প্রশিক্ষিত, যা এনভিডিয়া জিপিইউ-এর বড় ক্লাস্টারে সিমুলেটেড পরিবেশে সঠিক-ভুল শেখায়। এই প্রক্রিয়া মডেলগুলোকে চেইন-অফ-থট প্রক্রিয়ায় আরও সময় ও কম্পিউটিং রিসোর্স ব্যবহার করে উত্তর প্রদানে দক্ষ করে।

এই মডেলগুলো এআই এজেন্ট চালানোর জন্য উৎকৃষ্ট, যেমন ওয়েব সার্চ বা পাইথন কোড এক্সিকিউশনের মতো টুল ব্যবহার করতে পারে। তবে, এগুলো শুধুমাত্র টেক্সট-ভিত্তিক, অর্থাৎ ছবি বা অডিও প্রসেস বা তৈরি করতে পারে না।

মডেলগুলো অ্যাপাচি ২.০ লাইসেন্সের আওতায় প্রকাশিত, যা উদ্যোগীদের জন্য বিনামূল্যে বাণিজ্যিক ব্যবহারের সুযোগ দেয়। তবে, এআই২-এর মতো সম্পূর্ণ ওপেন-সোর্স মডেলের বিপরীতে, ওপেনএআই তাদের প্রশিক্ষণ ডেটা প্রকাশ করেনি, কারণ কপিরাইটেড কাজের উপর প্রশিক্ষণ সংক্রান্ত মামলা এড়াতে।

নিরাপত্তার বিষয়ে, ওপেনএআই মডেল প্রকাশে বিলম্ব করেছে যাতে সাইবার আক্রমণ বা জৈবিক/রাসায়নিক অস্ত্র তৈরির মতো ঝুঁকি পরীক্ষা করা যায়। পরীক্ষায় দেখা গেছে, এই মডেলগুলো জৈবিক ক্ষমতা কিছুটা বাড়াতে পারে, তবে “উচ্চ ঝুঁকির” থ্রেশহোল্ডে পৌঁছায় না।

লিখেছেন:আনিস আফিফি

সম্পাদক

ফলো:

আমি আনিস আফিফি — একজন উদ্যোক্তা এবং ওয়েব ডেভেলপার, যার একটি বড় স্বপ্ন হলো মানবজাতির জন্য পৃথিবীকে আরও ভালো একটি জায়গায় পরিণত করা। আমি ব্র্যান্ড তৈরি করি, ডিজিটাল সমস্যাগুলোর সমাধান করি। এবং এমন একটি ভবিষ্যত তৈরি করতে চাই যা মানুষকে ক্ষমতায়িত করে।