DeepSeek چیست؟ نگاهی به چت‌باتی که غول‌های فناوری را به چالش کشید

29 می 2025

0 زمان تقریبی مطالعه 4 دقیقه

DeepSeek چیست؟ نگاهی به چت‌باتی که غول‌های فناوری را به چالش کشید

آزمایشگاه هوش مصنوعی چینی «دیپ‌سیک» (DeepSeek) اخیراً با قرار گرفتن اپلیکیشن چت‌بات این شرکت در صدر جدول اپ‌استور اپل و گوگل‌پلی، توجه جهانی را به خود جلب کرده است.

به گزارش دیتاسنتر من و به نقل از تک‌کرانچ، موفقیت این مدل‌ها که با بهره‌گیری از روش‌های محاسباتی پیشرفته آموزش داده شده‌اند، تحلیل‌گران وال‌استریت و فعالان حوزه فناوری را به این پرسش واداشته است که آیا ایالات متحده قادر به حفظ برتری خود در عرصه هوش مصنوعی خواهد بود و اینکه تقاضا برای تراشه‌های مرتبط با این فناوری پایدار می‌ماند یا نه.

اما دیپ‌سیک چگونه شکل گرفت و چطور توانست در مدت زمانی کوتاه به چنین شهرتی دست یابد؟

ریشه‌های دیپ‌سیک در دنیای معاملات

دیپ‌سیک از سوی شرکت مدیریت سرمایه High-Flyer، یکی از صندوق‌های پوشش ریسک کمی در چین که از هوش مصنوعی در تصمیم‌گیری‌های تجاری خود استفاده می‌کند، پشتیبانی می‌شود.

بنیان‌گذار این شرکت، «لیانگ ونفنگ»، علاقه‌مند به هوش مصنوعی، شرکت High-Flyer را در سال ۲۰۱۵ تأسیس کرد. او فعالیت در حوزه معاملات را از زمان دانشجویی خود در دانشگاه ژجیانگ آغاز کرده بود و در نهایت در سال ۲۰۱۹، High-Flyer Capital Management را با تمرکز بر توسعه الگوریتم‌های هوش مصنوعی راه‌اندازی کرد.

در سال ۲۰۲۳، شرکت High-Flyer اقدام به تأسیس آزمایشگاه دیپ‌سیک کرد؛ نهادی مستقل برای تحقیق و توسعه ابزارهای هوش مصنوعی، جدا از فعالیت‌های مالی این شرکت. با حمایت مالی High-Flyer، دیپ‌سیک به شرکتی مستقل در زمینه فناوری تبدیل شد.

از همان ابتدا، دیپ‌سیک اقدام به ساخت زیرساخت‌های اختصاصی خود برای آموزش مدل‌های هوش مصنوعی کرد. با این حال، مانند بسیاری دیگر از شرکت‌های چینی فعال در این حوزه، تحت تأثیر محدودیت‌های صادراتی ایالات متحده در زمینه سخت‌افزار قرار گرفت و ناچار شد از تراشه‌های ضعیف‌تر Nvidia H800 (نسخه‌ای محدودتر از H100 که در اختیار شرکت‌های آمریکایی است) برای آموزش مدل‌های جدید استفاده کند.

گفته می‌شود تیم فنی دیپ‌سیک عمدتاً متشکل از نیروهای جوان است و این شرکت به‌شکل ویژه‌ای به جذب پژوهشگران دکتری از دانشگاه‌های برتر چین روی آورده است. بر اساس گزارش نیویورک‌تایمز، دیپ‌سیک حتی افرادی را بدون سابقه در علوم رایانه استخدام می‌کند تا تنوع موضوعی و درک چندرشته‌ای را در توسعه فناوری خود افزایش دهد.

مدل‌های پیشرفته DeepSeek

دیپ‌سیک نخستین مجموعه مدل‌های خود شامل DeepSeek Coder، DeepSeek LLM و DeepSeek Chat را در آبان ۱۴۰۲ ( نوامبر ۲۰۲۳ ) معرفی کرد. با این حال، توجه گسترده صنعت هوش مصنوعی زمانی جلب شد که این شرکت در بهار گذشته از نسل دوم مدل‌های خود تحت عنوان DeepSeek-V2 رونمایی کرد.

مدل DeepSeek-V2 که قابلیت تحلیل ترکیبی متن و تصویر را دارد، در آزمون‌های مختلف عملکرد چشمگیری از خود نشان داد. هزینه راه‌اندازی پایین آن در مقایسه با مدل‌های هم‌رده، باعث شد رقبای بزرگی مانند ByteDance و Alibaba قیمت برخی از مدل‌های خود را کاهش داده و حتی برخی را رایگان ارائه دهند.

مدل DeepSeek-V3 که در آذرماه ۱۴۰۳ منتشر شد، به افزایش شهرت این شرکت کمک کرد. بر اساس ارزیابی‌های داخلی، این مدل عملکردی بهتر از مدل‌های متن‌باز مانند Llama محصول شرکت Meta و حتی مدل‌های تجاری مانند GPT-4o از شرکت OpenAI ارائه داده است.

مدل استدلالی R1 که در دی‌ماه عرضه شد نیز از دیگر محصولات قابل‌توجه دیپ‌سیک به شمار می‌رود. این مدل، با قابلیت تحلیل و ارزیابی پاسخ‌های خود، در حل مسائل پیچیده در حوزه‌هایی همچون فیزیک، علوم و ریاضیات دقت بالاتری دارد، هرچند پردازش آن اندکی زمان‌برتر از مدل‌های معمولی است.

با این حال، یکی از محدودیت‌های قابل توجه مدل‌های دیپ‌سیک، اعمال فیلترینگ از سوی نهادهای ناظر بر اینترنت در چین است. برای نمونه، مدل R1 در اپلیکیشن چت‌بات دیپ‌سیک از پاسخ‌گویی به پرسش‌هایی درباره میدان تیان‌آن‌من یا استقلال تایوان خودداری می‌کند.

رشد کاربران و واکنش‌ها

در اسفندماه، تعداد بازدیدهای دیپ‌سیک از مرز ۱۶.۵ میلیون عبور کرد. دیوید کار، سردبیر Similarweb، اعلام کرد که علی‌رغم کاهش ۲۵ درصدی ترافیک نسبت به بهمن، دیپ‌سیک از نظر بازدیدهای روزانه در رتبه دوم قرار دارد. البته این رقم در مقایسه با ChatGPT که در همان ماه از ۵۰۰ میلیون کاربر فعال هفتگی عبور کرد، رقم نسبتاً کوچکی محسوب می‌شود.

در اردیبهشت‌ماه، نسخه به‌روزشده مدل استدلالی R1 در پلتفرم Hugging Face منتشر شد.

مدل کسب‌وکار غیرمتعارف

دیپ‌سیک علی‌رغم تمایل بالای سرمایه‌گذاران خطرپذیر، تاکنون از آن‌ها سرمایه‌ جذب نکرده و محصولات خود را با قیمتی پایین‌تر از نرخ بازار یا حتی رایگان عرضه می‌کند. به گفته این شرکت، پیشرفت‌های فناورانه در بهره‌وری، آن را قادر ساخته تا با هزینه‌ای پایین، رقابت‌پذیر باقی بماند. با این حال، برخی کارشناسان در صحت این ادعاها تردید دارند.

اگرچه مدل‌های دیپ‌سیک به‌صورت کامل متن‌باز نیستند، اما تحت مجوزهای خاصی عرضه می‌شوند که امکان استفاده تجاری از آن‌ها را فراهم می‌کند. مدیرعامل پلتفرم Hugging Face اعلام کرده که تاکنون بیش از ۵۰۰ مدل مشتق‌شده از R1 ایجاد شده که در مجموع ۲.۵ میلیون بار دانلود شده‌اند.

واکنش جهانی و چالش‌های سیاسی

موفقیت دیپ‌سیک که از سوی برخی تحلیل‌گران «تحولی در هوش مصنوعی» و از سوی برخی دیگر «اغراق‌آمیز» توصیف شده، تأثیر محسوسی بر بازار داشته است. از جمله می‌توان به کاهش ۱۸ درصدی ارزش سهام شرکت Nvidia در دی‌ماه و واکنش سم آلتمن، مدیرعامل OpenAI، اشاره کرد.

در اسفندماه، وزارت بازرگانی ایالات متحده استفاده از دیپ‌سیک در دستگاه‌های دولتی را ممنوع اعلام کرد. همچنین، شرکت مایکروسافت اعلام کرد که مدل‌های دیپ‌سیک در پلتفرم Azure AI Foundry در دسترس قرار گرفته‌اند. با این حال، برد اسمیت، نایب‌رئیس مایکروسافت، در جلسه‌ای در سنای آمریکا تأکید کرد که کارکنان این شرکت به دلایل امنیتی و تبلیغاتی اجازه استفاده از دیپ‌سیک را ندارند.

مدیرعامل انویدیا نیز در جریان ارائه گزارش مالی، بر «نوآوری تحسین‌برانگیز» دیپ‌سیک تأکید کرد و گفت مدل‌های استدلالی مانند R1 از آنجا که به توان پردازشی بیشتری نیاز دارند، برای کسب‌وکار این شرکت مفید هستند.

در همین حال، برخی کشورها و نهادهای دولتی، از جمله کره‌ جنوبی و ایالت نیویورک، استفاده از دیپ‌سیک را ممنوع کرده‌اند.

آینده‌ای نامشخص

آینده دیپ‌سیک با ابهاماتی همراه است. هرچند توسعه مدل‌های پیشرفته‌تر امری بدیهی به نظر می‌رسد، اما نگرانی‌های سیاسی و امنیتی، به‌ویژه از سوی ایالات متحده، می‌تواند مسیر این شرکت را تحت تأثیر قرار دهد. بر اساس گزارشی از وال‌استریت ژورنال در اسفندماه، دولت ایالات متحده در حال بررسی ممنوعیت کامل استفاده از دیپ‌سیک در دستگاه‌های دولتی است.

حتما بخوانید : استفاده کلاهبرداران از هوش مصنوعی: تشخیص فیشینگ سخت‌تر شده است

مجله خبری mydtc

برچسب ها

29 می 2025

0 زمان تقریبی مطالعه 4 دقیقه