اصطلاحات پرکاربرد هوش مصنوعی در یک نگاه؛ مفاهیم AI به زبان ساده

اصطلاحات پرکاربرد هوش مصنوعی در یک نگاه؛ مفاهیم AI به زبان ساده
به گزارش دیتاسنتر من، این پیچیدگی زبانی، اغلب درک عمومی از فناوریهای نوین را دشوار میسازد. به همین دلیل، در این واژهنامه، مهمترین اصطلاحات رایج در مقالات تخصصی هوش مصنوعی را به زبان ساده و قابل فهم گردآوری کردهایم. این فهرست بهطور منظم بهروزرسانی خواهد شد تا مفاهیم جدید و کاربردی به آن افزوده شود.
AGI (هوش عمومی مصنوعی)
هوش عمومی مصنوعی یا AGI مفهومی نسبتاً مبهم است، اما بهطور کلی به سامانهای اطلاق میشود که در بیشتر وظایف شناختی انسانی، حداقل به اندازه یک انسان عادی یا حتی بهتر عمل میکند. به گفته سم آلتمن، (مدیرعامل OpenAI) AGI میتواند «همکاری در سطح یک انسان متوسط» باشد. اوپن ایآی در اساسنامه خود، AGI را سامانهای بسیار خودمختار میداند که در مهمترین فعالیتهای اقتصادی از انسان عملکرد بهتری دارد. گوگل دیپمایند نیز تعریفی مشابه اما متمایز ارائه میدهد: «شکلی از هوش مصنوعی که در اکثر کارهای شناختی، همسطح یا بهتر از انسان عمل میکند.» این تفاوت در تعاریف، نشاندهنده گستردگی و چالشهای درک این مفهوم حتی در میان متخصصان است.
AI Agent (عامل هوش مصنوعی)
عامل هوش مصنوعی، سامانهای است که میتواند بهصورت خودکار و بدون دخالت مستقیم انسان، وظایف پیچیدهای را انجام دهد؛ فراتر از قابلیتهای یک چتبات معمولی. این وظایف میتوانند شامل رزرو بلیت، نگهداری کد یا تحلیل دادهها باشند. هرچند زیرساختهای مورد نیاز برای این عوامل هنوز در حال توسعه هستند، اما هدف نهایی آنها، ایجاد سیستمهایی خودمختار است که از چندین مدل هوش مصنوعی برای انجام وظایف چندمرحلهای استفاده میکنند.
Chain of Thought (زنجیره تفکر)
زنجیره تفکر روشی در استدلال است که در آن، مدل هوش مصنوعی بهجای ارائه مستقیم پاسخ، مسئله را به بخشهای کوچکتر و میانی تجزیه میکند. این رویکرد باعث افزایش دقت، بهویژه در مسائل منطقی و ریاضی، میشود. این روش با الهام از فرآیند تفکر انسانی طراحی شده و بهویژه در مدلهای زبانی بزرگ (LLM) با استفاده از یادگیری تقویتی تقویت شده است.
Deep Learning (یادگیری عمیق)
یادگیری عمیق شاخهای از یادگیری ماشین است که در آن، از شبکههای عصبی چندلایه برای تحلیل و یادگیری از دادهها استفاده میشود. این مدلها بدون نیاز به تعریف ویژگیها توسط انسان، قادر به استخراج الگوهای پیچیده در دادهها هستند. گرچه دقت بالایی دارند، اما نیازمند دادههای فراوان و منابع محاسباتی قابل توجهی هستند.
Diffusion (انتشار)
فناوری انتشار، پایهی بسیاری از مدلهای مولد در تولید تصویر، متن و موسیقی است. در این فرآیند، ابتدا دادهها با افزودن نویز تخریب میشوند و سپس مدل تلاش میکند با آموختن مسیر معکوس، داده اصلی را بازسازی کند. این فرایند برخلاف انتشار فیزیکی (که برگشتناپذیر است)، در مدلهای AI قابل معکوسسازی است.
Distillation (تقطیر)
تقطیر تکنیکی برای استخراج دانش از یک مدل بزرگ (معلم) و انتقال آن به مدلی کوچکتر و سریعتر (دانشآموز) است. این روش باعث کاهش حجم و هزینه اجرای مدل، بدون افت محسوس در کیفیت خروجی میشود. بسیاری از مدلهای هوش مصنوعی تجاری از این روش برای بهینهسازی بهره میبرند.
Fine-tuning (تنظیم دقیق)
تنظیم دقیق به معنای آموزش تکمیلی مدل برای یک وظیفه یا حوزه خاص است. شرکتها معمولاً از مدلهای زبانی عمومی بهعنوان پایه استفاده کرده و با دادههای اختصاصی، عملکرد آن را برای نیازهای ویژه بهینه میکنند. این رویکرد باعث افزایش دقت و کاربردپذیری در سناریوهای خاص میشود.
GAN (شبکه مولد تخاصمی)
شبکههای مولد تخاصمی (GAN) شامل دو شبکه عصبی هستند: یک مولد که دادههایی مصنوعی تولید میکند، و یک تفکیککننده که صحت دادهها را میسنجد. این دو شبکه در یک فرآیند رقابتی به بهبود عملکرد یکدیگر کمک میکنند. GANها در تولید تصاویر، صدا و ویدیوهای واقعگرایانه کاربرد گستردهای دارند.
Hallucination (توهم)
توهم، پدیدهای است که در آن مدلهای هوش مصنوعی اطلاعات نادرست و ساختگی تولید میکنند. این مسئله، بهویژه در مدلهای مولد زبان (GenAI)، یکی از چالشهای اساسی محسوب میشود. علت اصلی این پدیده، کمبود یا نبود دادههای آموزشی کافی در برخی حوزههاست. برای کاهش نرخ توهم، توسعه مدلهای تخصصیتر و دامنهمحور توصیه میشود.
Inference (استنتاج)
استنتاج به فرآیند اجرای مدل آموزشدیده برای تولید خروجی از دادههای جدید گفته میشود. این مرحله برخلاف آموزش، نسبتاً سبکتر است، اما در مدلهای بزرگ نیازمند سختافزارهای پیشرفته مانند GPU یا شتابدهندههای خاص است.
LLM (مدل زبانی بزرگ)
مدلهای زبانی بزرگ مانند GPT (OpenAI)، Claude (Anthropic)، Gemini ، LLaMA (متا) و Le Chat (Mistral) مدلهایی هستند که از میلیاردها پارامتر عددی تشکیل شدهاند و با تحلیل الگوهای زبان، توانایی درک و تولید زبان طبیعی را دارند. این مدلها ستون فقرات دستیارهای هوش مصنوعی امروزی هستند.
Neural Network (شبکه عصبی)
شبکههای عصبی، ساختارهای الگوریتمی هستند که از مغز انسان الهام گرفته شدهاند و اساس یادگیری عمیق را تشکیل میدهند. آنها شامل لایههایی از واحدهای پردازشی (نورونها) هستند که با تنظیم وزنها، الگوها را از دادهها استخراج میکنند. توانایی آنها در یادگیری روابط پیچیده، پایهگذار پیشرفتهای اخیر در AI بوده است.
Training (آموزش)
آموزش فرآیندی است که طی آن مدل با دریافت دادههای ورودی و تطبیق وزنها، یاد میگیرد چگونه خروجی مناسب تولید کند. مدلها معمولاً با وزنهای تصادفی شروع میکنند و در طول آموزش با بازخورد مکرر بهینه میشوند. آموزش، نیازمند حجم عظیمی از داده و توان پردازشی بالا است.
Transfer Learning (یادگیری انتقالی)
در یادگیری انتقالی، از دانشی که مدل در یک وظیفه آموخته است، برای بهبود عملکرد در یک وظیفه جدید و مرتبط استفاده میشود. این تکنیک میتواند در زمان و منابع صرفهجویی کند، بهویژه زمانی که دادههای وظیفه جدید محدود باشد.
Weights (وزنها)
وزنها پارامترهای عددی در شبکههای عصبی هستند که تعیین میکنند هر ورودی تا چه اندازه در خروجی مدل نقش داشته باشد. در طول آموزش، مدل با بهروزرسانی مکرر این وزنها، بهتدریج به خروجیهای دقیقتری میرسد.
مجله خبری mydtc