گوگل و کنسرسیومی از مؤسسات تحقیقاتی آفریقایی مجموعه داده WAXAL را راهاندازی کردهاند، تلاشی بزرگ و جدید برای اصلاح یکی از چالشهای اساسی هوش مصنوعی در این قاره، یعنی ناتوانی آن در تفسیر و درک اکثر زبانهای آفریقایی.
این پروژه یک مجموعه داده گفتار باز و بزرگ را که شامل 21 زبان آفریقای جنوب صحرا میشود، ارائه میدهد و فناوری صوتی را به بیش از 100 میلیون نفر که از اقتصاد هوش مصنوعی محروم بودهاند، میرساند.
مجموعه داده WAXAL محصول یک همکاری سهساله است که توسط گوگل تامین مالی و توسط دانشگاههای محلی و گروههای اجتماعی رهبری شده است.
این شامل 1,250 ساعت گفتار طبیعی رونویسی شده و بیش از 20 ساعت ضبط با کیفیت استودیویی است که هدف آن ساخت صداهای مصنوعی با وفاداری بالا است. این مجموعه زبانهایی مانند هوسا، یوروبا، لوگاندا، ایگبو و آچولی را هدف قرار میدهد که بسیاری از آنها توسط دهها میلیون نفر صحبت میشوند اما عمدتاً برای سیستمهای گفتار تجاری نامرئی باقی ماندهاند.
با وجود تمام صحبتها درباره هوش مصنوعی جهانی، فناوریهای صوتی همچنان به شدت به انگلیسی و تعداد محدودی از زبانهای اروپایی و آسیایی متمایل هستند. آفریقا، خانه بیش از 2,000 زبان، در حاشیه باقی مانده است.
این شکاف صرفاً آکادمیک نیست؛ این شکاف تعیین میکند چه کسی میتواند از خدمات دیجیتال استفاده کند، چه کسی میتواند به ابزارهای آموزشی و بهداشتی دسترسی داشته باشد، و چه کسی میتواند شرکتهایی بر اساس پلتفرمهای هوش مصنوعی مدرن بسازد. گوگل این کار را گامی به سمت کاهش شکاف دادهای دیرینهای معرفی کرد که بسیاری از زبانهای آفریقایی را از دستیارهای صوتی و سایر ابزارها دور نگه داشته است.
فراتر از رفع مستقیم این عدم تعادل، این پروژه به اندازه خود دادهها اهمیت دارد.
برخلاف ابتکارات قبلی که در آنها دادههای گفتار آفریقایی استخراج و در جای دیگری متعلق به دیگران بود، WAXAL در محل توسط مؤسسات آفریقایی رهبری شد. دانشگاه ماکررِه در اوگاندا، دانشگاه غنا، و Digital Umuganda در رواندا نظارت بر جمعآوری دادهها، تعامل با جامعه و مدیریت زبانی را با پشتیبانی فنی Google Research Africa انجام دادند.
نکته مهم این است که این مؤسسات مالکیت دادهها را حفظ میکنند. این یک تغییر قابل توجه در حوزهای است که اغلب به دلیل بازتولید پویاییهای استخراجی تحت عنوان باز بودن مورد انتقاد قرار میگیرد.
به گفته آیشا والکات-برایانت، رئیس Google Research Africa: "تأثیر نهایی WAXAL توانمندسازی مردم آفریقا است. این مجموعه داده پایه حیاتی را برای دانشجویان، محققان و کارآفرینان فراهم میکند تا فناوری را بر اساس شرایط خود، به زبانهای خود بسازند و سرانجام به بیش از 100 میلیون نفر دسترسی پیدا کنند."
وی افزود: "ما مشتاقانه منتظریم که نوآوران آفریقایی از این دادهها برای ایجاد همه چیز، از ابزارهای آموزشی جدید گرفته تا خدمات صوتمحور که فرصتهای اقتصادی ملموس در سراسر قاره ایجاد میکنند، استفاده کنند."
آیشا والکات-برایانت، رئیس Google Research Africa
این چارچوب توسط دانشگاههای درگیر تکرار میشود. جویس ناکاتومبا-نابِنده، مدرس ارشد دانشگاه ماکررِه، گفت:
"برای اینکه هوش مصنوعی تأثیر واقعی در آفریقا داشته باشد، باید به زبانهای ما صحبت کند و زمینههای ما را درک کند. مجموعه داده WAXAL دادههای با کیفیت بالا را که محققان ما برای ساخت فناوریهای گفتاری که منعکسکننده جوامع منحصر به فرد ما هستند، نیاز دارند، ارائه میدهد. در اوگاندا، این در حال حاضر ظرفیت تحقیقاتی محلی ما را تقویت کرده و از پروژههای جدید به رهبری دانشجویان و اعضای هیئت علمی پشتیبانی کرده است."
در دانشگاه غنا، دانشیار ایزاک ویافِ به مقیاس مشارکت عمومی اشاره کرد:
"برای ما در دانشگاه غنا، تأثیر WAXAL فراتر از خود دادهها است. این به ما توانایی داده تا منابع زبانی خود را بسازیم و نسل جدیدی از محققان هوش مصنوعی را آموزش دهیم. بیش از 7,000 داوطلب به ما پیوستند زیرا میخواستند صدا و زبانهای آنها به آینده دیجیتال تعلق داشته باشد. امروز، آن تلاش جمعی اکوسیستم نوآوری در زمینههایی مانند سلامت، آموزش و کشاورزی را جرقه زده است. این ثابت میکند که وقتی دادهها وجود داشته باشند، امکان در همه جا گسترش مییابد."
دلیلی برای خوشبینی محتاطانه وجود دارد. مجموعه دادههای گفتار باز میتوانند موانع را برای استارتاپها و محققان محلی که منابع لازم برای جمعآوری داده در مقیاس بزرگ را ندارند، کاهش دهند. آنها همچنین میتوانند اتکا به APIهای خارجی که به ندرت زبانهای آفریقایی را به خوبی پشتیبانی میکنند، در صورت پشتیبانی، را کاهش دهند.
مجموعه داده WAXAL
با این حال، مجموعه دادهها نتایج را تضمین نمیکنند؛ ساخت سیستمهای صوتی قابل اعتماد نیازمند سرمایهگذاری پایدار، استقرار محلی، و مسیرهای تجاری است که ارزش را در داخل کشور حفظ کنند. نقش گوگل به عنوان تامینکننده مالی و برگزارکننده بررسی دقیق را دعوت میکند، به ویژه در مورد نحوه استفاده از دادههای WAXAL توسط شرکتهای جهانی در آینده.
فعلاً، انتشار مجموعه داده WAXAL گامی مشخص به سمت یک اکوسیستم هوش مصنوعی فراگیرتر از نظر زبانی است. این چالشهای هوش مصنوعی آفریقا را حل نمیکند، اما به یک چالش بنیادی رسیدگی میکند. صدا اغلب طبیعیترین رابط با فناوری است. اطمینان از اینکه هوش مصنوعی میتواند آفریقا را در تمام تنوع آن بشنود، خیلی وقت است که باید انجام میشد.
پست Google to train AI in 21 African languages, including Yoruba, Hausa and Igbo ابتدا در Technext ظاهر شد.


