ওপেনএআই-এর নতুন দুটি ওপেন-ওয়েট এআই মডেল: জিপিটি-ওএসএস-১২০বি ও ২০বি

ওপেনএআই-এর জিপিটি-ওএসএস-১২০বি ও ২০বি ওপেন-ওয়েট এআই মডেল এখন হাগিং ফেসে! উন্নত রিজনিং ও সাশ্রয়ী ডিপ্লয়মেন্টের জন্য দেখুন।

আনিস আফিফি
লিখেছেন:
আনিস আফিফি
লিখেছেন:আনিস আফিফি
সম্পাদক
আমি আনিস আফিফি — একজন উদ্যোক্তা এবং ওয়েব ডেভেলপার, যার একটি বড় স্বপ্ন হলো মানবজাতির জন্য পৃথিবীকে আরও ভালো একটি জায়গায় পরিণত করা। আমি ব্র্যান্ড তৈরি...
- সম্পাদক

ওপেনএআই মঙ্গলবার ঘোষণা করেছে যে তারা দুটি নতুন ওপেন-ওয়েট এআই রিজনিং মডেল চালু করেছে, যার নাম জিপিটি-ওএসএস-১২০বি এবং জিপিটি-ওএসএস-২০বি। এই মডেল দুটি হাগিং ফেস প্ল্যাটফর্ম থেকে বিনামূল্যে ডাউনলোড করা যাবে। ওপেনএআই দাবি করেছে, এই মডেলগুলো ওপেন মডেলের তুলনায় বিভিন্ন বেঞ্চমার্কে “অত্যাধুনিক” পারফরম্যান্স প্রদান করে। এটি ২০১৯ সালে জিপিটি-২ প্রকাশের পর ওপেনএআই-এর প্রথম ওপেন-ওয়েট ভাষা মডেল।

মডেল দুটি দুই ধরনের: বড় এবং আরও শক্তিশালী জিপিটি-ওএসএস-১২০বি, যা একটি এনভিডিয়া এইচ১০০ জিপিইউ-তে চলতে পারে, এবং ছোট ও হালকা জিপিটি-ওএসএস-২০বি, যা মাত্র ১৬ জিবি মেমরির সাধারণ ল্যাপটপে চলতে পারে। এই মডেলগুলো ক্লাউডে জটিল কোয়েরি পাঠাতে পারে। যদি কোনো কাজ, যেমন ছবি প্রসেসিং, এই মডেলগুলোর সামর্থ্যের বাইরে হয়, তবে ডেভেলপাররা ওপেনএআই-এর আরও উন্নত ক্লোজড মডেলের সঙ্গে সংযোগ স্থাপন করতে পারেন।

ওপেনএআই শুরুর দিকে ওপেন-সোর্স মডেল প্রকাশ করলেও, সম্প্রতি তারা প্রোপ্রাইটারি, ক্লোজড-সোর্স পদ্ধতির দিকে ঝুঁকেছে, যা তাদের এআই মডেলগুলোর এপিআইয়ের মাধ্যমে ব্যবসায়িক সাফল্য এনেছে। তবে, ওপেনএআই-এর সিইও স্যাম অল্টম্যান জানুয়ারিতে বলেছিলেন, ওপেন-সোর্সিংয়ের ক্ষেত্রে তারা “ইতিহাসের ভুল পক্ষে” ছিল। চীনের এআই ল্যাবগুলো, যেমন ডিপসিক, আলিবাবার কিউয়েন এবং মুনশট এআই, উন্নত ওপেন মডেল তৈরি করে বিশ্বব্যাপী জনপ্রিয়তা অর্জন করেছে। এছাড়া, ট্রাম্প প্রশাসনও আমেরিকান মূল্যবোধের সঙ্গে সামঞ্জস্যপূর্ণ এআই প্রচারের জন্য ওপেন-সোর্সিংয়ে উৎসাহ দিয়েছে।

অল্টম্যান বলেছেন, “আমরা ২০১৫ সালে যখন শুরু করি, তখন আমাদের লক্ষ্য ছিল এআই প্রযুক্তির মাধ্যমে সমগ্র মানবজাতির উপকার নিশ্চিত করা। এই মডেলগুলো আমেরিকায় তৈরি ওপেন এআই স্ট্যাকের ওপর ভিত্তি করে গড়ে উঠবে, যা গণতান্ত্রিক মূল্যবোধের ভিত্তিতে বিনামূল্যে সকলের জন্য উপলব্ধ।”

Open Ai Ceo Sam Altman
ছবির সৌজন্যে: তোমোহিরো ওহসুমি / গেটি ইমেজেস

মডেলগুলোর পারফরম্যান্স

Screenshot 2025 08 05 At 12.21.54Pm
কোডফোর্সেসে ওপেনএআই-এর ওপেন মডেলের পারফরম্যান্স। ছবির সৌজন্যে: ওপেনএআই

ওপেনএআই দাবি করেছে, তাদের ওপেন মডেলগুলো অন্যান্য ওপেন-ওয়েট মডেলের তুলনায় শীর্ষে রয়েছে। কোডফোর্সেস প্রতিযোগিতামূলক কোডিং পরীক্ষায় জিপিটি-ওএসএস-১২০বি এবং ২০বি যথাক্রমে ২৬২২ এবং ২৫১৬ স্কোর করেছে, যা ডিপসিকের আর১-কে ছাড়িয়ে গেছে, তবে ওপেনএআই-এর ও৩ এবং ও৪-মিনির তুলনায় কিছুটা পিছিয়ে। হিউম্যানিটিস লাস্ট এক্সাম (এইচএলই)-এ জিপিটি-ওএসএস-১২০বি এবং ২০বি যথাক্রমে ১৯% এবং ১৭.৩% স্কোর করেছে, যা ডিপসিক এবং কিউয়েনের শীর্ষ মডেলগুলোকে ছাড়িয়ে গেছে।

Screenshot 2025 08 05 At 12.18.20Pm
Hle-তে Openai-এর ওপেন মডেলের পারফরম্যান্স। ছবির সৌজন্যে:Openai

তবে, এই মডেলগুলোতে হ্যালুসিনেশনের (ভুল তথ্য প্রদান) সমস্যা বেশি। ওপেনএআই-এর পার্সনকিউএ বেঞ্চমার্কে জিপিটি-ওএসএস-১২০বি এবং ২০বি যথাক্রমে ৪৯% এবং ৫৩% প্রশ্নে হ্যালুসিনেট করেছে, যা ও১ মডেলের ১৬% এবং ও৪-মিনির ৩৬% হ্যালুসিনেশন রেটের তুলনায় অনেক বেশি। ওপেনএআই জানিয়েছে, ছোট মডেলগুলোতে বিশ্ব সম্পর্কে কম জ্ঞান থাকায় এটি প্রত্যাশিত।

মডেল প্রশিক্ষণ

ওপেনএআই জানিয়েছে, এই মডেলগুলো তাদের প্রোপ্রাইটারি মডেলের মতো একই প্রক্রিয়ায় প্রশিক্ষিত। প্রতিটি মডেল মিক্সচার-অফ-এক্সপার্টস (এমওই) কাঠামো ব্যবহার করে, যা প্রতিটি প্রশ্নের জন্য কম প্যারামিটার সক্রিয় করে, ফলে এটি আরও দক্ষতার সঙ্গে চলে। জিপিটি-ওএসএস-১২০বি-তে মোট ১১৭ বিলিয়ন প্যারামিটার রয়েছে, কিন্তু প্রতি টোকেনে মাত্র ৫.১ বিলিয়ন সক্রিয় হয়। উচ্চ-কম্পিউট রিইনফোর্সমেন্ট লার্নিং (আরএল) ব্যবহার করে এই মডেলগুলো প্রশিক্ষিত, যা এনভিডিয়া জিপিইউ-এর বড় ক্লাস্টারে সিমুলেটেড পরিবেশে সঠিক-ভুল শেখায়। এই প্রক্রিয়া মডেলগুলোকে চেইন-অফ-থট প্রক্রিয়ায় আরও সময় ও কম্পিউটিং রিসোর্স ব্যবহার করে উত্তর প্রদানে দক্ষ করে।

এই মডেলগুলো এআই এজেন্ট চালানোর জন্য উৎকৃষ্ট, যেমন ওয়েব সার্চ বা পাইথন কোড এক্সিকিউশনের মতো টুল ব্যবহার করতে পারে। তবে, এগুলো শুধুমাত্র টেক্সট-ভিত্তিক, অর্থাৎ ছবি বা অডিও প্রসেস বা তৈরি করতে পারে না।

মডেলগুলো অ্যাপাচি ২.০ লাইসেন্সের আওতায় প্রকাশিত, যা উদ্যোগীদের জন্য বিনামূল্যে বাণিজ্যিক ব্যবহারের সুযোগ দেয়। তবে, এআই২-এর মতো সম্পূর্ণ ওপেন-সোর্স মডেলের বিপরীতে, ওপেনএআই তাদের প্রশিক্ষণ ডেটা প্রকাশ করেনি, কারণ কপিরাইটেড কাজের উপর প্রশিক্ষণ সংক্রান্ত মামলা এড়াতে।

নিরাপত্তার বিষয়ে, ওপেনএআই মডেল প্রকাশে বিলম্ব করেছে যাতে সাইবার আক্রমণ বা জৈবিক/রাসায়নিক অস্ত্র তৈরির মতো ঝুঁকি পরীক্ষা করা যায়। পরীক্ষায় দেখা গেছে, এই মডেলগুলো জৈবিক ক্ষমতা কিছুটা বাড়াতে পারে, তবে “উচ্চ ঝুঁকির” থ্রেশহোল্ডে পৌঁছায় না।

Avatar Of আনিস আফিফি
লিখেছেন:আনিস আফিফি
সম্পাদক
ফলো:
আমি আনিস আফিফি — একজন উদ্যোক্তা এবং ওয়েব ডেভেলপার, যার একটি বড় স্বপ্ন হলো মানবজাতির জন্য পৃথিবীকে আরও ভালো একটি জায়গায় পরিণত করা। আমি ব্র্যান্ড তৈরি করি, ডিজিটাল সমস্যাগুলোর সমাধান করি। এবং এমন একটি ভবিষ্যত তৈরি করতে চাই যা মানুষকে ক্ষমতায়িত করে।
মন্তব্য নেই

মন্তব্য করুন

আপনার ই-মেইল এ্যাড্রেস প্রকাশিত হবে না। * চিহ্নিত বিষয়গুলো আবশ্যক।

০%