هوش مصنوعی هنوز در تشخیص ساعت و تقویم مشکل دارد

هوش مصنوعی هنوز در تشخیص ساعت و تقویم مشکل دارد
به گزارش دیتاسنتر من و به نقل از ساینسدیلی، این در حالی است که این مدلها میتوانند وظایف پیچیدهای مانند نوشتن مقاله یا تولید آثار هنری را انجام دهند، اما هنوز در مهارتهایی که انسانها بهسادگی از عهدهشان برمیآیند، دچار ضعفاند.
تیمی از دانشگاه ادینبرو نشان داده است که مدلهای پیشرفتهی هوش مصنوعی قادر نیستند بهدرستی موقعیت عقربههای ساعت را تفسیر کنند یا به پرسشهایی دربارهی تاریخها در تقویم پاسخ دقیق بدهند.
دانشمندان میگویند برخلاف تشخیص سادهی اشکال، درک ساعتهای آنالوگ و تقویمها نیازمند ترکیبی از مهارتهای فضایی، درک زمینه و ریاضیات پایه است؛ مواردی که همچنان برای سامانههای هوش مصنوعی چالشبرانگیزند.
گفته میشود که اگر این چالشها برطرف شوند، سامانههای هوش مصنوعی میتوانند نقش مؤثری در کاربردهای وابسته به زمان مانند دستیارهای زمانبندی، رباتهای خودکار و ابزارهای کمکی برای افراد دارای اختلال بینایی ایفا کنند.
برای بررسی این موضوع، پژوهشگران مدلهای هوش مصنوعی چندوجهی (Multimodal Large Language Models یا MLLMs) را که توانایی پردازش متن و تصویر را دارند، در مواجهه با تصاویری از ساعت یا تقویم آزمایش کردند تا ببینند آیا میتوانند به پرسشهای مرتبط با زمان پاسخ دهند یا نه.
در این آزمایش، ساعتهای مختلفی مورد استفاده قرار گرفت؛ از جمله ساعتهایی با اعداد رومی، بدون عقربه ثانیهشمار، و با صفحههای رنگی متنوع. یافتهها نشان داد که در بهترین حالت، سامانههای هوش مصنوعی موقعیت عقربهها را کمتر از یکچهارم مواقع درست تشخیص دادهاند.
گفتنی است این اشتباهها زمانی بیشتر میشد که ساعتها دارای اعداد رومی یا عقربههای تزئینی بودند. حتی حذف عقربه ثانیهشمار نیز عملکرد مدلها را بهبود نداد، که به گفتهی تیم پژوهشی، نشاندهندهی مشکلات اساسی در تشخیص عقربهها و تفسیر زاویههاست.
پژوهشگران همچنین از این مدلها خواستند به پرسشهایی در مورد تقویم پاسخ دهند، مانند تشخیص تعطیلات یا محاسبه تاریخهای گذشته و آینده. نتایج نشان داد حتی بهترین مدل نیز در یکپنجم موارد در محاسبه تاریخها اشتباه کرده است.
این یافتهها در مقالهای که مورد داوری علمی قرار گرفته، منتشر شده و قرار است در کارگاه «استدلال و برنامهریزی برای مدلهای زبانی بزرگ» در سیزدهمین کنفرانس بینالمللی بازنماییهای یادگیری (ICLR) در سنگاپور در تاریخ ۲۸ آوریل ۲۰۲۵ ارائه شود.
رهبر این پژوهش، روهیت ساکسنا از دانشکده انفورماتیک دانشگاه ادینبرو، میگوید: «اکثر مردم از سنین پایین میتوانند ساعت بخوانند و از تقویم استفاده کنند. یافتههای ما نشاندهندهی شکاف قابلتوجهی در توانایی هوش مصنوعی برای انجام مهارتهایی است که برای انسانها بسیار پایهای تلقی میشود. اگر بخواهیم این سامانهها را بهدرستی در کاربردهای واقعی و حساس به زمان مانند زمانبندی، اتوماسیون و فناوریهای کمکی ادغام کنیم، این کمبودها باید برطرف شوند.»
آریو جما، دیگر پژوهشگر این تیم نیز در پایان میافزاید: «در حالی که تحقیقات امروز در حوزهی هوش مصنوعی اغلب بر وظایف پیچیده تمرکز دارد، به طرز جالبی بسیاری از سامانهها هنوز در کارهای ساده و روزمره ناتوان هستند.
یافتههای ما نشان میدهد که وقت آن رسیده این خلأهای بنیادی را جدی بگیریم؛ وگرنه ممکن است کاربردهای عملی هوش مصنوعی همیشه در لحظه آخر گیر کنند!»
مجله خبری mydtc