MaGGIe I-HIM50K এবং M-HIM2K ডেটাসেট প্রবর্তন করে, যাতে ইনস্ট্যান্স ম্যাটিং দৃঢ়তা মূল্যায়ন করতে ১,৮০,০০০-এর বেশি সংশ্লেষিত মানব মাস্ক রয়েছে।MaGGIe I-HIM50K এবং M-HIM2K ডেটাসেট প্রবর্তন করে, যাতে ইনস্ট্যান্স ম্যাটিং দৃঢ়তা মূল্যায়ন করতে ১,৮০,০০০-এর বেশি সংশ্লেষিত মানব মাস্ক রয়েছে।

MaskRCNN এবং BG20K দিয়ে মাল্টি-ইনস্ট্যান্স হিউম্যান ম্যাটিং ডেটা সংশ্লেষণ

2025/12/20 02:30

সারসংক্ষেপ এবং ১. ভূমিকা

  1. সম্পর্কিত কাজসমূহ

  2. MaGGIe

    ৩.১. দক্ষ মাস্কড গাইডেড ইনস্ট্যান্স ম্যাটিং

    ৩.২. ফিচার-ম্যাট টেম্পোরাল সামঞ্জস্য

  3. ইনস্ট্যান্স ম্যাটিং ডেটাসেট

    ৪.১. ইমেজ ইনস্ট্যান্স ম্যাটিং এবং ৪.২. ভিডিও ইনস্ট্যান্স ম্যাটিং

  4. পরীক্ষা-নিরীক্ষা

    ৫.১. ইমেজ ডেটার উপর প্রি-ট্রেনিং

    ৫.২. ভিডিও ডেটার উপর ট্রেনিং

  5. আলোচনা এবং তথ্যসূত্র

\ সম্পূরক উপাদান

  1. আর্কিটেকচার বিস্তারিত

  2. ইমেজ ম্যাটিং

    ৮.১. ডেটাসেট তৈরি এবং প্রস্তুতি

    ৮.২. ট্রেনিং বিস্তারিত

    ৮.৩. পরিমাণগত বিস্তারিত

    ৮.৪. প্রাকৃতিক ছবিতে আরও গুণগত ফলাফল

  3. ভিডিও ম্যাটিং

    ৯.১. ডেটাসেট তৈরি

    ৯.২. ট্রেনিং বিস্তারিত

    ৯.৩. পরিমাণগত বিস্তারিত

    ৯.৪. আরও গুণগত ফলাফল

৮. ইমেজ ম্যাটিং

এই বিভাগটি ইমেজ ম্যাটিং প্রক্রিয়া সম্প্রসারিত করে, ডেটাসেট তৈরি এবং বিদ্যমান পদ্ধতিগুলির সাথে ব্যাপক তুলনার অতিরিক্ত অন্তর্দৃষ্টি প্রদান করে। আমরা I-HIM50K এবং M-HIM2K ডেটাসেট তৈরিতে গভীরভাবে প্রবেশ করি, বিস্তারিত পরিমাণগত বিশ্লেষণ প্রদান করি এবং আমাদের পদ্ধতির কার্যকারিতা তুলে ধরতে আরও গুণগত ফলাফল উপস্থাপন করি।

৮.১. ডেটাসেট তৈরি এবং প্রস্তুতি

I-HIM50K ডেটাসেট HHM50K [50] ডেটাসেট থেকে সংশ্লেষিত হয়েছিল, যা মানব ইমেজ ম্যাটের বিস্তৃত সংগ্রহের জন্য পরিচিত। আমরা একক-ব্যক্তির ছবি ফিল্টার করতে COCO ডেটাসেটে প্রশিক্ষিত একটি MaskRCNN [14] Resnet-50 FPN 3x মডেল ব্যবহার করেছি, যার ফলে ৩৫,০৫৩টি ছবির একটি উপসেট পাওয়া গেছে। InstMatt [49] পদ্ধতি অনুসরণ করে, এই ছবিগুলি BG20K [29] ডেটাসেট থেকে বিভিন্ন পটভূমির বিপরীতে কম্পোজিট করা হয়েছিল, প্রতিটি ছবিতে ২-৫টি বিষয় সহ মাল্টি-ইনস্ট্যান্স পরিস্থিতি তৈরি করে। বিষয়গুলি একটি বাস্তবসম্মত স্কেল বজায় রাখতে এবং অতিরিক্ত ওভারল্যাপ এড়াতে আকার পরিবর্তন এবং অবস্থান করা হয়েছিল, যেমন ইনস্ট্যান্স IoU ৩০% অতিক্রম করে না। এই প্রক্রিয়াটি ৪৯,৭৩৭টি ছবি তৈরি করেছে, প্রতিটি ছবিতে গড়ে ২.২৮টি ইনস্ট্যান্স রয়েছে। ট্রেনিংয়ের সময়, আলফা ম্যাট বাইনারাইজ করে এবং এলোমেলো ড্রপআউট, ডাইলেশন এবং ইরোশন অপারেশন প্রয়োগ করে গাইডেন্স মাস্ক তৈরি করা হয়েছিল। I-HIM50K থেকে নমুনা ছবি চিত্র ১০-এ প্রদর্শিত হয়েছে।

\ M-HIM2K ডেটাসেট বিভিন্ন মাস্ক গুণমানের বিপরীতে মডেল দৃঢ়তা পরীক্ষা করার জন্য ডিজাইন করা হয়েছিল। এটি বিভিন্ন MaskRCNN মডেল ব্যবহার করে তৈরি প্রতিটি ইনস্ট্যান্সে দশটি মাস্ক নিয়ে গঠিত। এই তৈরি প্রক্রিয়ার জন্য ব্যবহৃত মডেল সম্পর্কে আরও তথ্য সারণি ৮-এ দেখানো হয়েছে। মাস্কগুলি গ্রাউন্ড ট্রুথ আলফা ম্যাটের সাথে সর্বোচ্চ IoU এর ভিত্তিতে ইনস্ট্যান্সের সাথে মিলানো হয়েছিল, ন্যূনতম IoU থ্রেশহোল্ড ৭০% নিশ্চিত করে। যে মাস্কগুলি এই থ্রেশহোল্ড পূরণ করেনি সেগুলি গ্রাউন্ড ট্রুথ থেকে কৃত্রিমভাবে তৈরি করা হয়েছিল। এই প্রক্রিয়াটি ১,৩৪,২৪০টি মাস্কের একটি ব্যাপক সেট তৈরি করেছে, যার মধ্যে কম্পোজিটের জন্য ১,১৭,৬৬০টি এবং প্রাকৃতিক ছবির জন্য ১৬,৬০০টি, মাস্কড গাইডেড ইনস্ট্যান্স ম্যাটিং মূল্যায়নের জন্য একটি শক্তিশালী বেঞ্চমার্ক প্রদান করে। সম্পূর্ণ ডেটাসেট I-HIM50K এবং M-HIM2K এই কাজের গ্রহণযোগ্যতার পরে প্রকাশ করা হবে।

\ চিত্র ১০. I-HIM50K ডেটাসেটের উদাহরণ। (রঙে সেরা দেখা যায়।)

\ সারণি ৮. MHIM2K-তে বিভিন্ন মাস্ক গুণমান সহ দশটি মডেল ব্যবহার করা হয়েছে। MaskRCNN মডেলগুলি বিভিন্ন সেটিংস সহ COCO-তে প্রশিক্ষিত detectron2 থেকে নেওয়া হয়েছে।

\

:::info লেখকগণ:

(১) Chuong Huynh, ইউনিভার্সিটি অফ মেরিল্যান্ড, কলেজ পার্ক ([email protected]);

(২) Seoung Wug Oh, Adobe Research (seoh,[email protected]);

(৩) Abhinav Shrivastava, ইউনিভার্সিটি অফ মেরিল্যান্ড, কলেজ পার্ক ([email protected]);

(৪) Joon-Young Lee, Adobe Research ([email protected])।

:::


:::info এই গবেষণাপত্রটি CC by 4.0 Deed (Attribution 4.0 International) লাইসেন্সের অধীনে arxiv-এ উপলব্ধ

:::

\

মার্কেটের সুযোগ
Multichain লোগো
Multichain প্রাইস(MULTI)
$0.0386
$0.0386$0.0386
+3.70%
USD
Multichain (MULTI) লাইভ প্রাইস চার্ট
ডিসক্লেইমার: এই সাইটে পুনঃপ্রকাশিত নিবন্ধগুলো সর্বসাধারণের জন্য উন্মুক্ত প্ল্যাটফর্ম থেকে সংগ্রহ করা হয়েছে এবং শুধুমাত্র তথ্যের উদ্দেশ্যে প্রদান করা হয়েছে। এগুলো আবশ্যিকভাবে MEXC-এর মতামতকে প্রতিফলিত করে না। সমস্ত অধিকার মূল লেখকদের কাছে সংরক্ষিত রয়েছে। আপনি যদি মনে করেন কোনো কনটেন্ট তৃতীয় পক্ষের অধিকার লঙ্ঘন করেছে, তাহলে অনুগ্রহ করে অপসারণের জন্য [email protected] এ যোগাযোগ করুন। MEXC কনটেন্টের সঠিকতা, সম্পূর্ণতা বা সময়োপযোগিতা সম্পর্কে কোনো গ্যারান্টি দেয় না এবং প্রদত্ত তথ্যের ভিত্তিতে নেওয়া কোনো পদক্ষেপের জন্য দায়ী নয়। এই কনটেন্ট কোনো আর্থিক, আইনগত বা অন্যান্য পেশাদার পরামর্শ নয় এবং এটি MEXC-এর সুপারিশ বা সমর্থন হিসেবে গণ্য করা উচিত নয়।

আপনি আরও পছন্দ করতে পারেন

আইগেন ফাউন্ডেশন সক্রিয় ব্যবহারকারীদের উচ্চতর পুরস্কার প্রদানের জন্য EIGEN টোকেন প্রণোদনা সমন্বয়ের প্রস্তাব করেছে।

আইগেন ফাউন্ডেশন সক্রিয় ব্যবহারকারীদের উচ্চতর পুরস্কার প্রদানের জন্য EIGEN টোকেন প্রণোদনা সমন্বয়ের প্রস্তাব করেছে।

PANews ২০ ডিসেম্বর রিপোর্ট করেছে যে EigenLayer রিস্টেকিং প্রোটোকলের পেছনের ফাউন্ডেশন একটি নতুন প্রণোদনা প্রক্রিয়া চালু করার জন্য একটি গভর্নেন্স পরিবর্তন প্রস্তাব করেছে
শেয়ার করুন
PANews2025/12/20 08:24
পিটার ব্র্যান্ড কেন বলছেন মার্কিন ক্রিপ্টো বিল গেম-চেঞ্জার হবে না

পিটার ব্র্যান্ড কেন বলছেন মার্কিন ক্রিপ্টো বিল গেম-চেঞ্জার হবে না

পোস্টটি Why Peter Brandt Says The US Crypto Bill Won't Be A Game-Changer BitcoinEthereumNews.com-এ প্রকাশিত হয়েছে। একটি যুগান্তকারী US ক্রিপ্টো বিল কি Bitcoin-কে আকাশচুম্বী করবে
শেয়ার করুন
BitcoinEthereumNews2025/12/20 08:21
ড্রাফটকিংস প্রেডিকশন মার্কেট লঞ্চের মাধ্যমে কালশি, পলিমার্কেটের লিড টার্গেট করছে

ড্রাফটকিংস প্রেডিকশন মার্কেট লঞ্চের মাধ্যমে কালশি, পলিমার্কেটের লিড টার্গেট করছে

পোস্টটি DraftKings targets Kalshi, Polymarket's lead with predictions market launch BitcoinEthereumNews.com-এ প্রকাশিত হয়েছে। DraftKings আনুষ্ঠানিকভাবে প্রবেশ করেছে
শেয়ার করুন
BitcoinEthereumNews2025/12/20 08:43