مایکروسافت و انویدیا قدرتمندترین مدل زبانی یکپارچه دنیا را ایجاد کردند

18 اکتبر 2021

29 زمان مطالعه یک دقیقه

مایکروسافت و انویدیا با همکاری یکدیگر مدل زبانی جدیدی بر پایه هوش مصنوعی ساخته‌اند که ۱۰۵ لایه و ۵۳۰ میلیارد پارامتر دارد و قدرتمندترین مدل زبانی دگرگون‌ساز یکپارچه در طول تاریخ است. البته این مدل همچنان از مشکل سوگیری رنج می‌برد.

دو شرکت مایکروسافت و انویدیا دست به خلق «مدل تولید زبان طبیعی مگاترون-تورینگ» (MT-NLG) زده‌اند که برای ابرکامپیوترهایی مثل Selene طراحی شده است. این دو شرکت در بیانیه‌ای در این باره اعلام کردند: «در این مدل هر ماکت ۲۸۰ پردازشگر گرافیکی انویدیا A100 دارد که هر گره آن دارای برش تنسور ۸ سویه است. گره‌ها در مجموع با مسیرهای موازی ۳۵ سویه طراحی شده‌اند.»

مدل حاضر با ۱۵ مجموعه دیتا تعلیم داده شده که شامل ۳۳۹ میلیارد توکن بوده و نشان داده که مدل‌های بزرگ‌تر چطور می‌توانند با آموزش‌های کمتر عملکرد درستی داشته باشند. منتها نیاز به کار با زبان‌ها و نمونه‌های جهان واقعی باعث بروز مشکل قدیمی سوگیری شده است.

انویدیا و مایکروسافت می‌گویند: «مشاهدات ما از MT-NLG نشان می‌دهد که این مدل به کلیشه‌ها و سوگیری‌های موجود در اطلاعات دریافتی آلوده می‌شود. مایکروسافت و انویدیا تعهد دارند که برای حل این مشکل تلاش کنند.» مایکروسافت قبلا هم چت‌باتی به نام Tay را توسعه داده بود که با مشکل سوگیری ظرف چند ساعت تعامل با فضای اینترنت گرایشات متعصبانه و افراطی پیدا کرد.

مدل‌های زبانی اساسا به بررسی صحت قرارگیری واژه‌ها در کنار یکدیگر با توجه به زبان طبیعی انسان می‌پردازند. این مدل‌ها برای دریافت صحیح معنای عبارت‌ها باید درک مناسبی از زبان طبیعی داشته باشند. از مدل‌های زبانی در حوزه‌های مختلفی مثل ترجمه، تشخیص گفتار، OCR، تشخیص دست خط و غیره استفاده می‌شود.

مدل دگرگون‌ساز یکی از مدل‌های یادگیری ماشینی است که به ارزیابی اهمیت بخش‌های مختلف یک داده ورودی می‌پردازد. برای مثال، در این مدل لازم نیست برای پردازش یک جمله اول بخش ابتدایی و بعد بخش انتهایی آن بررسی شود.

18 اکتبر 2021

29 زمان مطالعه یک دقیقه