২০২২ সালে হান্টার লাইটম্যান ওপেনএআই-এ গবেষক হিসেবে যোগ দিয়েছিলেন। সেই সময় তিনি তার সহকর্মীদের চ্যাটজিপিটি উন্মোচন করতে দেখেন, যা ইতিহাসের দ্রুততম জনপ্রিয় পণ্যগুলোর একটি। তবে লাইটম্যান নিজে নীরবে একটি দলের সঙ্গে কাজ করছিলেন, যার নাম ম্যাথজেন। এই দল ওপেনএআই-এর মডেলগুলোকে উচ্চ বিদ্যালয়ের গণিত প্রতিযোগিতার সমস্যা সমাধানে প্রশিক্ষণ দিচ্ছিল।
আজ ম্যাথজেন দলটি ওপেনএআই-এর এআই রিজনিং মডেল তৈরির ক্ষেত্রে অগ্রণী ভূমিকা পালন করছে। এই প্রযুক্তি এমন এআই এজেন্ট তৈরির মূল ভিত্তি, যারা মানুষের মতো কম্পিউটারে বিভিন্ন কাজ সম্পাদন করতে পারে। লাইটম্যান টেকক্রাঞ্চকে বলেন, “আমরা মডেলগুলোর গাণিতিক যুক্তি ক্ষমতা উন্নত করার চেষ্টা করছিলাম, যেটা তখন খুবই দুর্বল ছিল।”
ওপেনএআই-এর মডেলগুলো এখনও নিখুঁত নয়। সাম্প্রতিক এআই সিস্টেমগুলো মাঝেমধ্যে ভুল তথ্য দেয় এবং জটিল কাজে হোঁচট খায়। তবে গাণিতিক যুক্তিতে এরা উল্লেখযোগ্য উন্নতি করেছে। সম্প্রতি ওপেনএআই-এর মডেল আন্তর্জাতিক গণিত অলিম্পিয়াডে স্বর্ণপদক জিতেছে, যা বিশ্বের উজ্জ্বল শিক্ষার্থীদের জন্য একটি প্রতিযোগিতা। ওপেনএআই বিশ্বাস করে, এই যুক্তি ক্ষমতা অন্যান্য বিষয়েও প্রয়োগ করা যাবে এবং এটি সাধারণ-উদ্দেশ্য এআই এজেন্ট তৈরির পথ প্রশস্ত করবে, যা কোম্পানির দীর্ঘদিনের স্বপ্ন।
চ্যাটজিপিটি ছিল একটি সুখকর দুর্ঘটনা—একটি গবেষণা প্রকল্প যা ভাইরাল ভোক্তা পণ্যে পরিণত হয়। কিন্তু ওপেনএআই-এর এজেন্ট তৈরির প্রচেষ্টা বছরের পর বছর ধরে পরিকল্পিত উদ্যোগের ফল। ২০২৩ সালে কোম্পানির প্রথম ডেভেলপার সম্মেলনে সিইও স্যাম অল্টম্যান বলেন, “একদিন আপনি কম্পিউটারকে বলবেন আপনার কী প্রয়োজন, আর এটি সব কাজ করে দেবে। এআই ক্ষেত্রে এগুলোকে এজেন্ট বলা হয়। এর সুবিধা অপরিসীম হবে।”
২০২৪ সালের শরতে ওপেনএআই তাদের প্রথম রিজনিং মডেল ‘ও১’ প্রকাশ করে বিশ্বকে চমকে দেয়। এই সাফল্যের পেছনে থাকা ২১ জন মূল গবেষক এখন সিলিকন ভ্যালির সবচেয়ে কাঙ্ক্ষিত প্রতিভা। মেটার প্রতিষ্ঠাতা মার্ক জাকারবার্গ এই দলের পাঁচজনকে ১০০ মিলিয়ন ডলারের বেশি প্যাকেজ দিয়ে তাদের সুপারইনটেলিজেন্স ইউনিটে নিয়োগ করেন। এদের মধ্যে শেংজিয়া ঝাও এখন মেটা সুপারইনটেলিজেন্স ল্যাবের প্রধান বিজ্ঞানী।
রিইনফোর্সমেন্ট লার্নিং-এর পুনর্জাগরণ
ওপেনএআই-এর রিজনিং মডেল ও এজেন্টদের উত্থান রিইনফোর্সমেন্ট লার্নিং (আরএল) নামক একটি মেশিন লার্নিং কৌশলের সঙ্গে জড়িত। আরএল এআই মডেলকে সিমুলেটেড পরিবেশে তাদের সিদ্ধান্তের ফলাফল সম্পর্কে ফিডব্যাক দেয়। ২০১৬ সালে গুগল ডিপমাইন্ডের আলফাগো আরএল ব্যবহার করে গো খেলায় বিশ্ব চ্যাম্পিয়নকে হারিয়ে বিশ্বব্যাপী দৃষ্টি আকর্ষণ করে।
ওপেনএআই-এর প্রথম কর্মীদের একজন আন্দ্রেজ কার্পাথি তখন থেকেই আরএল ব্যবহার করে এআই এজেন্ট তৈরির কথা ভাবছিলেন। তবে প্রয়োজনীয় মডেল ও প্রশিক্ষণ কৌশল তৈরিতে বছরের পর বছর লেগে যায়। ২০১৮ সালে ওপেনএআই জিপিটি সিরিজের প্রথম বড় ভাষা মডেল তৈরি করে, যা ইন্টারনেট ডেটা ও জিপিইউ ক্লাস্টারে প্রশিক্ষিত। জিপিটি মডেল টেক্সট প্রসেসিংয়ে দক্ষ হলেও গণিতে দুর্বল ছিল।
২০২৩ সালে ওপেনএআই “কিউ*” (পরে “স্ট্রবেরি”) নামে একটি সাফল্য অর্জন করে, যেখানে তারা বড় ভাষা মডেল, আরএল এবং টেস্ট-টাইম কম্পিউটেশন নামক একটি কৌশল একত্রিত করে। এটি মডেলকে সমস্যা সমাধানের জন্য অতিরিক্ত সময় ও কম্পিউটিং শক্তি দেয়। এই প্রক্রিয়ায় “চেইন-অব-থট” (সিওটি) নামক একটি পদ্ধতি প্রবর্তিত হয়, যা মডেলের অপরিচিত গণিত প্রশ্নে পারফরম্যান্স উন্নত করে।
গবেষক এল কিশকি বলেন, “মডেল যুক্তি করতে শুরু করেছে। এটি ভুল ধরে পিছিয়ে যায়, হতাশ হয়। এটি যেন একজন মানুষের চিন্তা পড়ার মতো।” এই কৌশলগুলো পৃথকভাবে নতুন না হলেও, ওপেনএআই এগুলোকে একত্রিত করে স্ট্রবেরি তৈরি করে, যা ও১-এর উন্নয়নের পথ প্রশস্ত করে।
রিজনিং স্কেলিং
ওপেনএআই বুঝতে পারে যে রিজনিং মডেল দুটি নতুন দিক থেকে উন্নতি করতে পারে: প্রশিক্ষণ-পরবর্তী পর্যায়ে বেশি কম্পিউটিং শক্তি ব্যবহার এবং প্রশ্নের উত্তর দেওয়ার সময় মডেলকে বেশি সময় ও প্রক্রিয়াকরণ শক্তি দেওয়া। লাইটম্যান বলেন, “ওপেনএআই শুধু বর্তমান নিয়ে ভাবে না, স্কেলিংয়ের ভবিষ্যৎ নিয়েও চিন্তা করে।”
২০২৩ সালের স্ট্রবেরি সাফল্যের পর ওপেনএআই গবেষক ড্যানিয়েল সেলসামের নেতৃত্বে একটি “এজেন্টস” দল গঠন করে। এই দল ও১ মডেলের উন্নয়নে কাজ করে, যেখানে ওপেনএআই-এর সহ-প্রতিষ্ঠাতা ইলিয়া সুটস্কেভার, প্রধান গবেষণা কর্মকর্তা মার্ক চেন এবং প্রধান বিজ্ঞানী জাকুব পাচোকি নেতৃত্ব দেন।
ওপেনএআই-এর গবেষকরা প্রায়ই প্রমাণ করতে হয় যে তাদের প্রকল্পে সম্পদ বরাদ্দের যোগ্য। ও১-এর ক্ষেত্রে সাফল্যের প্রমাণ দেখানোর পর কোম্পানি এটির উপর জোর দেয়। লাইটম্যান বলেন, “ওপেনএআই-এর গবেষণা সবসময় নিচ থেকে উপরের দিকে চলে। আমরা প্রমাণ দেখানোর পর কোম্পানি বলে, ‘এটা বোধগম্য, এগিয়ে যাও।’”
এআই কি সত্যিই “যুক্তি” করে?
এআই গবেষণার লক্ষ্য মানুষের বুদ্ধিমত্তাকে কম্পিউটারে পুনরায় তৈরি করা। ও১ প্রকাশের পর চ্যাটজিপিটি-এর ইউজার ইন্টারফেসে “চিন্তা” এবং “যুক্তি”য়ের মতো মানবিক বৈশিষ্ট্য যুক্ত হয়েছে। তবে এআই কি সত্যিই যুক্তি করে? এল কিশকি বলেন, “আমরা মডেলকে শেখাচ্ছি কীভাবে দক্ষতার সঙ্গে কম্পিউট শক্তি ব্যবহার করে উত্তর দেওয়া যায়। এইভাবে দেখলে, হ্যাঁ, এটি যুক্তি করছে।”
লাইটম্যান ফলাফলের উপর জোর দেন, প্রক্রিয়া বা মানব মস্তিষ্কের সঙ্গে তুলনার চেয়ে। তিনি বলেন, “যদি মডেল জটিল কাজ করতে পারে, তবে এটি যুক্তির প্রয়োজনীয় আনুমানিক কাজ করছে। আমরা এটাকে যুক্তি বলতে পারি, কারণ এটি যুক্তির চিহ্নের মতো দেখায়।”
অন্যান্য এআই গবেষকরাও একমত। এআই২-এর গবেষক নাথান ল্যামবার্ট একটি ব্লগে এআই রিজনিং মডেলকে বিমানের সঙ্গে তুলনা করেন। উভয়ই প্রকৃতি থেকে অনুপ্রাণিত—মানব যুক্তি এবং পাখির উড়ান—কিন্তু ভিন্ন পদ্ধতিতে কাজ করে।
পরবর্তী সীমান্ত: সাবজেক্টিভ কাজের জন্য এআই এজেন্ট
বর্তমান এআই এজেন্টরা কোডিংয়ের মতো সুনির্দিষ্ট ক্ষেত্রে ভালো কাজ করে। ওপেনএআই-এর কোডেক্স এজেন্ট সফটওয়্যার ইঞ্জিনিয়ারদের সহজ কাজে সাহায্য করে। তবে, চ্যাটজিপিটি এজেন্ট বা পারপ্লেক্সিটির কমেটের মতো সাধারণ-উদ্দেশ্য এজেন্টরা জটিল, সাবজেক্টিভ কাজে—যেমন অনলাইন কেনাকাটা বা দীর্ঘমেয়াদী পার্কিং খোঁজা—হোঁচট খায়।
লাইটম্যান বলেন, “এটি একটি ডেটা সমস্যা। আমরা এখন এমন গবেষণায় কাজ করছি যা কম যাচাইযোগ্য কাজে প্রশিক্ষণ দেওয়ার উপায় খুঁজছে।” ওপেনএআই-এর গবেষক নোয়াম ব্রাউন বলেন, নতুন জেনারেল-পারপাস আরএল কৌশল এআই মডেলকে এমন দক্ষতা শেখাতে পারে যা সহজে যাচাই করা যায় না। এই কৌশলের মাধ্যমে ওপেনএআই আইএমও মডেল তৈরি করে, যা একাধিক এজেন্ট স্পন করে এবং একাধিক ধারণা একযোগে পরীক্ষা করে।
এই অগ্রগতি ওপেনএআই-এর আসন্ন জিপিটি-৫ মডেলে প্রতিফলিত হতে পারে, যা প্রতিযোগীদের উপর আধিপত্য বিস্তারের লক্ষ্যে। ওপেনএআই এমন এআই এজেন্ট তৈরি করতে চায় যারা ব্যবহারকারীর চাহিদা স্বজ্ঞাতভাবে বুঝতে পারে, সুনির্দিষ্ট সেটিংস ছাড়াই। এল কিশকি বলেন, “আমরা এমন এআই চাই যা বোঝে কখন কোন টুল ব্যবহার করতে হবে এবং কতক্ষণ যুক্তি করতে হবে।”
ওপেনএআই একসময় এআই শিল্পে নেতৃত্ব দিলেও, এখন গুগল, অ্যানথ্রপিক, এক্সএআই এবং মেটার মতো শক্তিশালী প্রতিযোগীদের মুখোমুখি হচ্ছে। প্রশ্ন এখন শুধু ওপেনএআই তাদের এজেন্টিক ভবিষ্যৎ বাস্তবায়ন করতে পারবে কিনা, বরং তারা এটি প্রতিযোগীদের আগে করতে পারবে কিনা। বাংলাদেশের প্রযুক্তি উৎসাহীদের জন্য এটি একটি উত্তেজনাপূর্ণ সময়, কারণ এই অগ্রগতি আমাদের দৈনন্দিন জীবনে এআই-এর ব্যবহারকে নতুন মাত্রায় নিয়ে যেতে পারে।