Mistral AI Lean 4-এর জন্য Leanstral ওপেন-সোর্স প্রুফ এজেন্ট চালু করেছে
Zach Anderson মার্চ ১৬, ২০২৬ ১৯:১৩
Mistral Lean 4 ফর্মাল ভেরিফিকেশনের জন্য 6B প্যারামিটার AI এজেন্ট Leanstral প্রকাশ করেছে, যা Apache 2.0 লাইসেন্সের অধীনে ১/১৫তম খরচে বড় মডেলগুলিকে হারিয়ে দিচ্ছে।
Mistral AI ১৬ মার্চ, ২০২৬ তারিখে Leanstral প্রকাশ করেছে—Lean 4 ফর্মাল ভেরিফিকেশনের জন্য বিশেষভাবে তৈরি প্রথম ওপেন-সোর্স AI এজেন্ট। 120B প্যারামিটার মডেলটি মাত্র 6B সক্রিয় প্যারামিটারে চলে এবং Apache 2.0 লাইসেন্সিংয়ের অধীনে প্রকাশিত হয়, যা এন্টারপ্রাইজ বাজেট ছাড়াই প্রোডাকশন-গ্রেড থিওরেম প্রুভিংকে সহজলভ্য করে তোলে।
ক্রিপ্টোর জন্য এটি কেন গুরুত্বপূর্ণ? ফর্মাল ভেরিফিকেশন—গাণিতিক প্রমাণ যে কোডটি ঠিক সেটাই করে যা এটি দাবি করে—স্মার্ট কন্ট্রাক্ট এবং ব্লকচেইন প্রোটোকল সুরক্ষিত করার জন্য গোল্ড স্ট্যান্ডার্ড হয়ে উঠেছে। DeFi কোডে বাগের কারণে বিলিয়ন ডলার ক্ষতি হয়েছে। Leanstral ভেরিফাইড সিকিউরিটি চাওয়া প্রজেক্টগুলির জন্য বাধা নাটকীয়ভাবে কমিয়ে দিতে পারে।
পারফরম্যান্স বনাম খরচের ট্রেড-অফ
Mistral FLTEval ব্যবহার করে মালিকানাধীন এবং ওপেন-সোর্স প্রতিযোগীদের বিরুদ্ধে Leanstral-এর বেঞ্চমার্ক করেছে, যা ফার্মাটের লাস্ট থিওরেম ফরমালাইজেশন প্রজেক্ট থেকে বাস্তব প্রুফ ইঞ্জিনিয়ারিং কাজ পরীক্ষা করে এমন একটি নতুন মূল্যায়ন স্যুট।
সংখ্যাগুলি উল্লেখযোগ্য। Leanstral pass@2-তে $36 কম্পিউট খরচে 26.3 পয়েন্ট স্কোর করেছে। Claude Sonnet 4.6 23.7 পয়েন্ট পরিচালনা করেছে কিন্তু $549 বিল চালিয়েছে—খারাপ পারফরম্যান্সের জন্য 15 গুণেরও বেশি খরচ। এমনকি pass@16-তে, যেখানে Leanstral $290-এ 31.9 পয়েন্ট অর্জন করে, এটি এখনও Claude Opus 4.6-এর $1,650 মূল্য ট্যাগের এক-পঞ্চমাংশেরও কম খরচ করে (যদিও Opus 39.6-এ গুণমানে এগিয়ে আছে)।
ওপেন-সোর্স বিকল্পগুলির বিরুদ্ধে, দক্ষতার ব্যবধান আরও প্রশস্ত হয়। GLM5-744B-A40B এবং Kimi-K2.5-1T-A32B 6-8 গুণ বেশি সক্রিয় প্যারামিটার থাকা সত্ত্বেও প্রায় 16-20 পয়েন্টে থমকে যায়। Qwen3.5-397B-A17B-এর 25.4 পয়েন্ট পৌঁছাতে চারটি পাস প্রয়োজন—Leanstral দুইটি দিয়ে তা হারিয়ে দেয়।
প্রযুক্তিগত আর্কিটেকচার
Leanstral প্রুফ ইঞ্জিনিয়ারিং ওয়ার্কফ্লোর জন্য অপ্টিমাইজ করা একটি স্পার্স মিক্সচার-অফ-এক্সপার্টস আর্কিটেকচার ব্যবহার করে। মডেলটি MCP (Model Context Protocol) এর মাধ্যমে Lean-এর ল্যাঙ্গুয়েজ সার্ভার প্রোটোকলের সাথে একীভূত হয়, বিশেষভাবে lean-lsp-mcp টুলিংয়ের সাথে সর্বোচ্চ পারফরম্যান্সের জন্য প্রশিক্ষিত।
Lean 4 নিজেই সেপ্টেম্বর 2023-এ স্থিতিশীল চালু হয়েছিল এবং গণিত ফরমালাইজ করার জন্য দ্রুত গ্রহণযোগ্যতা পেয়েছে। Mathlib লাইব্রেরি—গাণিতিক প্রমাণের একটি বিশাল সংগ্রহ—একই বছর সফলভাবে Lean 4-এ পোর্ট করা হয়েছিল। ফার্মাটের লাস্ট থিওরেমের ফর্মাল প্রুফের মতো প্রজেক্টগুলি গুরুতর গাণিতিক কাজের জন্য প্ল্যাটফর্মের সক্ষমতা প্রদর্শন করে।
বাস্তব-বিশ্বের অ্যাপ্লিকেশন
Mistral Lean 4.29.0-rc6-এ ব্রেকিং পরিবর্তন সম্পর্কে একটি প্রকৃত Stack Exchange ডিবাগিং প্রশ্ন পরিচালনা করে Leanstral প্রদর্শন করেছে। এজেন্টটি টাইপ এলিয়াসের সাথে একটি ডেফিনিশনাল ইকুয়ালিটি সমস্যা নির্ণয় করেছে এবং সঠিকভাবে চিহ্নিত করেছে যে def-এর জন্য abbrev অদলবদল করলে ট্যাকটিক ম্যাচিং পুনরুদ্ধার হবে।
মডেলটি ক্রস-ল্যাঙ্গুয়েজ অনুবাদও প্রদর্শন করেছে, প্রুফ সিমান্টিক্স সংরক্ষণ এবং কাস্টম নোটেশন বাস্তবায়ন করার সময় Rocq (পূর্বে Coq) ডেফিনিশনগুলিকে Lean 4-এ রূপান্তর করেছে।
অ্যাক্সেস অপশন
তিনটি ডিপ্লয়মেন্ট পথ বিদ্যমান: Mistral Vibe-এ সরাসরি একীকরণ (শুরু করতে /leanstall ব্যবহার করুন), সীমিত-সময়ের ফিডব্যাক সংগ্রহের জন্য labs-leanstral-2603-এ একটি ফ্রি API এন্ডপয়েন্ট, অথবা Apache 2.0 ওয়েটগুলির সাথে সেলফ-হোস্টেড ডিপ্লয়মেন্ট।
ব্লকচেইন প্রজেক্টগুলির জন্য, হিসাবটি সরল। ফর্মাল ভেরিফিকেশন ঐতিহ্যগতভাবে ব্যয়বহুল অডিটিং ফার্ম বা গভীর ইন-হাউস দক্ষতা প্রয়োজন। একটি ওপেন-সোর্স এজেন্ট যা প্রতি টাস্কে $36-290-এ কোড সঠিকতা প্রমাণ করতে পারে তা প্রোটোকলগুলি কীভাবে নিরাপত্তার কাছে যায় তা পুনর্গঠন করতে পারে—অনুমান করে যে প্রুফগুলি প্রোডাকশন শর্তে টিকে থাকে।
ছবির উৎস: Shutterstock- mistral ai
- leanstral
- lean 4
- ফর্মাল ভেরিফিকেশন
- ওপেন সোর্স



