প্রযুক্তি কোম্পানি Google চতুষ্পদ রোবট Spot-এ তার Gemini Robotics মূর্ত যুক্তি মডেল একীভূত করতে Boston Dynamics-এর সাথে একটি অংশীদারিত্ব ঘোষণা করেছে, যা বাস্তব-বিশ্ব রোবোটিক্সে কৃত্রিম বুদ্ধিমত্তার প্রয়োগে একটি এগিয়ে যাওয়ার পদক্ষেপ চিহ্নিত করে। এই সহযোগিতা রোবটটিকে তার পরিবেশ আরও ভালোভাবে ব্যাখ্যা করতে, বস্তু শনাক্ত করতে এবং শুধুমাত্র পূর্ব-প্রোগ্রাম করা রুটিনের উপর নির্ভর না করে প্রাকৃতিক ভাষার নির্দেশনার উপর ভিত্তি করে কাজ সম্পাদন করতে সক্ষম করে।
এই একীকরণ ২০২৫ সালের একটি অভ্যন্তরীণ হ্যাকাথনের সময় পরিচালিত পরীক্ষামূলক কাজের উপর নির্মিত, যেখানে ডেভেলপাররা অন্বেষণ করেছিলেন কীভাবে বৃহৎ ভাষা মডেল এবং ভিজ্যুয়াল যুক্তি সিস্টেম Spot-এর স্বায়ত্তশাসন বৃদ্ধি করতে পারে। Gemini Robotics ব্যবহার করে, রোবটটি তার ক্যামেরা থেকে ভিজ্যুয়াল ইনপুট প্রক্রিয়া করতে পারে এবং উচ্চ-স্তরের নির্দেশনা—যেমন একটি ঘরে বস্তু সাজানো—সমন্বিত শারীরিক ক্রিয়ায় অনুবাদ করতে পারে।
ঐতিহ্যবাহী রোবোটিক্স প্রোগ্রামিং থেকে ভিন্ন, যা প্রায়শই কঠোর, ধাপে-ধাপে যুক্তির উপর নির্ভর করে, সিস্টেমটি কথোপকথন প্রম্পটের উপর ভিত্তি করে আরও নমনীয় ইন্টারফেস প্রবর্তন করে। ডেভেলপাররা Spot-এর সফ্টওয়্যার ডেভেলপমেন্ট কিট ব্যবহার করে একটি মধ্যস্থতাকারী সফ্টওয়্যার স্তর তৈরি করেছে, যা Gemini মডেলগুলিকে রোবটের অ্যাপ্লিকেশন প্রোগ্রামিং ইন্টারফেসের সাথে যোগাযোগ করতে দেয়। এই কাঠামো AI-কে নেভিগেশন, বস্তু সনাক্তকরণ, ছবি ক্যাপচার, আঁকড়ে ধরা এবং স্থাপন সহ একটি নির্ধারিত ক্রিয়াকলাপের সেট থেকে নির্বাচন করতে সক্ষম করে।
ব্যবহারিক প্রদর্শনীতে, সিস্টেমটি সাধারণ নির্দেশনা ব্যাখ্যা করার এবং গতিশীল পরিবেশের সাথে খাপ খাওয়ানোর ক্ষমতা দেখিয়েছে। উদাহরণস্বরূপ, যখন আইটেম সাজানোর দায়িত্ব দেওয়া হয়েছিল, AI মডেল ভিজ্যুয়াল ডেটা বিশ্লেষণ করেছে, প্রাসঙ্গিক বস্তু চিহ্নিত করেছে এবং রোবটকে একটি ক্রিয়াকলাপের ক্রম দিয়ে পরিচালিত করেছে। রোবট থেকে প্রতিক্রিয়া—যেমন কাজ সম্পূর্ণ করা বা শারীরিক সীমাবদ্ধতা—রিয়েল টাইমে অন্তর্ভুক্ত করা হয়েছিল, যা সিস্টেমটিকে ম্যানুয়াল হস্তক্ষেপ ছাড়াই তার আচরণ সামঞ্জস্য করতে দেয়।
এই পদ্ধতি রোবটের API-এর মধ্যে পূর্বনির্ধারিত ক্ষমতায় AI-কে সীমাবদ্ধ করে কার্যকরী সীমানা বজায় রাখে, যা পূর্বাভাসযোগ্য এবং নিয়ন্ত্রিত কর্মক্ষমতা নিশ্চিত করে। এই ডিজাইন নিরাপত্তার সাথে অভিযোজনযোগ্যতার ভারসাম্য রাখে, যা শারীরিক সিস্টেমে AI স্থাপনের জন্য একটি মূল বিবেচনা।
অংশীদারিত্বটি ডেভেলপারদের জন্য সম্ভাব্য দক্ষতা বৃদ্ধিও তুলে ধরে। ব্যাপক ম্যানুয়াল কোডিংের প্রয়োজন হ্রাস করে, প্রাকৃতিক ভাষা ইন্টারফেস প্রকৌশলীদের প্রতিটি ক্রিয়া ক্রম প্রোগ্রামিংয়ের পরিবর্তে উদ্দেশ্য নির্ধারণে মনোনিবেশ করতে দেয়। এই পরিবর্তন উৎপাদন, পরিদর্শন এবং লজিস্টিকসের মতো শিল্প জুড়ে রোবোটিক্স অ্যাপ্লিকেশনের উন্নয়নকে ত্বরান্বিত করতে পারে।
যদিও বাস্তবায়ন পরীক্ষামূলক থেকে যায়, প্রদর্শনীটি শারীরিক AI-এর বিস্তৃত প্রবণতা প্রতিফলিত করে, যেখানে মেশিন উপলব্ধি এবং সিদ্ধান্ত গ্রহণ বৃদ্ধি করতে ভিত্তিগত মডেলগুলি ক্রমবর্ধমানভাবে ব্যবহৃত হচ্ছে। উভয় কোম্পানি ইঙ্গিত দিয়েছে যে আরও উন্নয়ন চলছে, যার মধ্যে রোবোটিক্স প্ল্যাটফর্মে Gemini-ভিত্তিক সিস্টেমের ক্রমাগত একীকরণ রয়েছে।
সহযোগিতাটি আরও স্বজ্ঞাত মানব-যন্ত্র মিথস্ক্রিয়ার দিকে একটি রূপান্তর নির্দেশ করে, যেখানে জটিল রোবোটিক আচরণ সরলীকৃত ইনপুটের মাধ্যমে পরিচালিত হতে পারে। AI মডেলগুলি বিকশিত হতে থাকায়, এই ধরনের একীকরণ স্বায়ত্তশাসিত সিস্টেমের কার্যকরী সুযোগ প্রসারিত করতে পারে এবং তাদের স্থাপনার প্রযুক্তিগত বাধা হ্রাস করতে পারে।
পোস্ট Google এবং Boston Dynamics উন্নত উপলব্ধি এবং কাজ সম্পাদনের জন্য Spot-এ Gemini Robotics মডেল একীভূত করেছে প্রথম প্রকাশিত হয়েছে Metaverse Post-এ।


