سرور مجازی
فناوری

Fara-7B مایکروسافت: هوش مصنوعی لوکال که حریم خصوصی داده‌ها را تضمین می‌کند

Fara-7B مایکروسافت: هوش مصنوعی لوکال که حریم خصوصی داده‌ها را تضمین می‌کند

مایکروسافت مدل جدیدی به نام Fara-7B  معرفی کرده است که با ۷ میلیارد پارامتر، به عنوان یک عامل هوش مصنوعی کاربرکامپیوتر (Computer Use Agent) قادر است وظایف پیچیده را مستقیماً روی دستگاه کاربران اجرا کند.

به گزارش دیتاسنتر من و به نقل از VentureBeat، این مدل که اندازه کوچکتری نسبت به مدل‌های ابری بزرگ دارد، امنیت داده‌ها را افزایش داده و به دلیل اجرا شدن لوکال روی رایانه، داده‌های حساس مانند اطلاعات شرکت و حساب‌های داخلی هرگز از دستگاه خارج نمی‌شوند.

Fara-7B برای تعامل با واسط‌های کاربری از ماوس و کیبورد مانند انسان استفاده می‌کند و اطلاعات صفحه وب را به‌صورت تصویری و از طریق اسکرین‌شات‌ها می‌بیند و بر اساس آن مختصات کلیک، تایپ و اسکرول را پیش‌بینی می‌کند.

این مدل برخلاف سیستم‌های دیگر که به ساختار کد “accessibility trees” وابسته‌اند، فقط روی داده گرافیکی پیکسل‌ها تمرکز دارد که باعث می‌شود حتی در سایت‌های پیچیده یا دارای کد مخفی به خوبی کار کند. این روش باعث حفظ کامل حاکمیت داده‌ها (pixel sovereignty)  شده و برای صنایع با قوانین سختگیرانه همچون HIPAA و GLBA ایده‌آل است.

در آزمایش‌های معیاری مانند  WebVoyager، Fara-7B  با نرخ موفقیت ۷۳.۵٪ عملکردی بهتر از مدل قدرتمندتر و بزرگ‌تر GPT-4o  با ۶۵.۱٪ و همچنین مدل UI-TARS-1.5-7B با ۶۶.۴٪ ارائه داد. همچنین این مدل در انجام وظایف با میانگین ۱۶ مرحله به کارآمدی بیشتری نسبت به ۴۱ مرحله مدل UI-TARS دست یافته است که بیانگر سرعت و دقت بالاتر است.
 

Fara-7B مایکروسافت: هوش مصنوعی لوکال که حریم خصوصی داده‌ها را تضمین می‌کند
مایکروسافت اذعان دارد که مانند دیگر مدل‌های هوش مصنوعی، Fara-7B  نیز محدودیت‌هایی مانند خطا در دستورهای پیچیده و احتمالا توهم‌سازی دارد. برای کاهش ریسک‌ها، این سیستم برای شناسایی “Critical Points” توسعه یافته است؛ نقاطی که برای انجام اقداماتی که داده شخصی یا رضایت کاربر لازم دارد مانند ارسال ایمیل یا تراکنش مالی، باید ابتدا اجازه صریح کاربر گرفته شود.

این مدل با رویکردی به نام “distillation” از طریق فشرده‌سازی داده‌های تعاملی تولیدشده توسط سیستم چندعاملی Magentic-One  و WebSurfer آموزش دیده است. مدل پایه آن Qwen2.5-VL-7B  است که پنجره متنی بسیار بلندی دارد و توانایی بالایی در ارتباط دادن دستورات متنی با عناصر تصویری صفحه دارد.

مایکروسافت این مدل را در پلتفرم‌هایی مانند Hugging Face  و Microsoft Foundry  با مجوز MIT منتشر کرده است اما هشدار می‌دهد که هنوز برای استفاده در محیط‌های حیاتی و پر ریسک آماده نیست و بیشتر مناسب پروژه‌های تحقیقاتی و نمونه‌سازی می‌باشد.

در مجموع، Fara-7B  یک پیشرفت بزرگ در حوزه هوش مصنوعی لوکال است که با عملکردی قابل رقابت با GPT-4o و حفظ حریم خصوصی، نویدبخش آینده‌ای امن‌تر و بهینه‌تر در تعامل هوش مصنوعی با رایانه‌های شخصی است.

مجله خبری mydtc

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا