DeepSeek چیست؟ نگاهی به چتباتی که غولهای فناوری را به چالش کشید

DeepSeek چیست؟ نگاهی به چتباتی که غولهای فناوری را به چالش کشید
به گزارش دیتاسنتر من و به نقل از تککرانچ، موفقیت این مدلها که با بهرهگیری از روشهای محاسباتی پیشرفته آموزش داده شدهاند، تحلیلگران والاستریت و فعالان حوزه فناوری را به این پرسش واداشته است که آیا ایالات متحده قادر به حفظ برتری خود در عرصه هوش مصنوعی خواهد بود و اینکه تقاضا برای تراشههای مرتبط با این فناوری پایدار میماند یا نه.
اما دیپسیک چگونه شکل گرفت و چطور توانست در مدت زمانی کوتاه به چنین شهرتی دست یابد؟
ریشههای دیپسیک در دنیای معاملات
دیپسیک از سوی شرکت مدیریت سرمایه High-Flyer، یکی از صندوقهای پوشش ریسک کمی در چین که از هوش مصنوعی در تصمیمگیریهای تجاری خود استفاده میکند، پشتیبانی میشود.
بنیانگذار این شرکت، «لیانگ ونفنگ»، علاقهمند به هوش مصنوعی، شرکت High-Flyer را در سال ۲۰۱۵ تأسیس کرد. او فعالیت در حوزه معاملات را از زمان دانشجویی خود در دانشگاه ژجیانگ آغاز کرده بود و در نهایت در سال ۲۰۱۹، High-Flyer Capital Management را با تمرکز بر توسعه الگوریتمهای هوش مصنوعی راهاندازی کرد.
در سال ۲۰۲۳، شرکت High-Flyer اقدام به تأسیس آزمایشگاه دیپسیک کرد؛ نهادی مستقل برای تحقیق و توسعه ابزارهای هوش مصنوعی، جدا از فعالیتهای مالی این شرکت. با حمایت مالی High-Flyer، دیپسیک به شرکتی مستقل در زمینه فناوری تبدیل شد.
از همان ابتدا، دیپسیک اقدام به ساخت زیرساختهای اختصاصی خود برای آموزش مدلهای هوش مصنوعی کرد. با این حال، مانند بسیاری دیگر از شرکتهای چینی فعال در این حوزه، تحت تأثیر محدودیتهای صادراتی ایالات متحده در زمینه سختافزار قرار گرفت و ناچار شد از تراشههای ضعیفتر Nvidia H800 (نسخهای محدودتر از H100 که در اختیار شرکتهای آمریکایی است) برای آموزش مدلهای جدید استفاده کند.
گفته میشود تیم فنی دیپسیک عمدتاً متشکل از نیروهای جوان است و این شرکت بهشکل ویژهای به جذب پژوهشگران دکتری از دانشگاههای برتر چین روی آورده است. بر اساس گزارش نیویورکتایمز، دیپسیک حتی افرادی را بدون سابقه در علوم رایانه استخدام میکند تا تنوع موضوعی و درک چندرشتهای را در توسعه فناوری خود افزایش دهد.
مدلهای پیشرفته DeepSeek
دیپسیک نخستین مجموعه مدلهای خود شامل DeepSeek Coder، DeepSeek LLM و DeepSeek Chat را در آبان ۱۴۰۲ ( نوامبر ۲۰۲۳ ) معرفی کرد. با این حال، توجه گسترده صنعت هوش مصنوعی زمانی جلب شد که این شرکت در بهار گذشته از نسل دوم مدلهای خود تحت عنوان DeepSeek-V2 رونمایی کرد.
مدل DeepSeek-V2 که قابلیت تحلیل ترکیبی متن و تصویر را دارد، در آزمونهای مختلف عملکرد چشمگیری از خود نشان داد. هزینه راهاندازی پایین آن در مقایسه با مدلهای همرده، باعث شد رقبای بزرگی مانند ByteDance و Alibaba قیمت برخی از مدلهای خود را کاهش داده و حتی برخی را رایگان ارائه دهند.
مدل DeepSeek-V3 که در آذرماه ۱۴۰۳ منتشر شد، به افزایش شهرت این شرکت کمک کرد. بر اساس ارزیابیهای داخلی، این مدل عملکردی بهتر از مدلهای متنباز مانند Llama محصول شرکت Meta و حتی مدلهای تجاری مانند GPT-4o از شرکت OpenAI ارائه داده است.
مدل استدلالی R1 که در دیماه عرضه شد نیز از دیگر محصولات قابلتوجه دیپسیک به شمار میرود. این مدل، با قابلیت تحلیل و ارزیابی پاسخهای خود، در حل مسائل پیچیده در حوزههایی همچون فیزیک، علوم و ریاضیات دقت بالاتری دارد، هرچند پردازش آن اندکی زمانبرتر از مدلهای معمولی است.
با این حال، یکی از محدودیتهای قابل توجه مدلهای دیپسیک، اعمال فیلترینگ از سوی نهادهای ناظر بر اینترنت در چین است. برای نمونه، مدل R1 در اپلیکیشن چتبات دیپسیک از پاسخگویی به پرسشهایی درباره میدان تیانآنمن یا استقلال تایوان خودداری میکند.
رشد کاربران و واکنشها
در اسفندماه، تعداد بازدیدهای دیپسیک از مرز ۱۶.۵ میلیون عبور کرد. دیوید کار، سردبیر Similarweb، اعلام کرد که علیرغم کاهش ۲۵ درصدی ترافیک نسبت به بهمن، دیپسیک از نظر بازدیدهای روزانه در رتبه دوم قرار دارد. البته این رقم در مقایسه با ChatGPT که در همان ماه از ۵۰۰ میلیون کاربر فعال هفتگی عبور کرد، رقم نسبتاً کوچکی محسوب میشود.
در اردیبهشتماه، نسخه بهروزشده مدل استدلالی R1 در پلتفرم Hugging Face منتشر شد.
مدل کسبوکار غیرمتعارف
دیپسیک علیرغم تمایل بالای سرمایهگذاران خطرپذیر، تاکنون از آنها سرمایه جذب نکرده و محصولات خود را با قیمتی پایینتر از نرخ بازار یا حتی رایگان عرضه میکند. به گفته این شرکت، پیشرفتهای فناورانه در بهرهوری، آن را قادر ساخته تا با هزینهای پایین، رقابتپذیر باقی بماند. با این حال، برخی کارشناسان در صحت این ادعاها تردید دارند.
اگرچه مدلهای دیپسیک بهصورت کامل متنباز نیستند، اما تحت مجوزهای خاصی عرضه میشوند که امکان استفاده تجاری از آنها را فراهم میکند. مدیرعامل پلتفرم Hugging Face اعلام کرده که تاکنون بیش از ۵۰۰ مدل مشتقشده از R1 ایجاد شده که در مجموع ۲.۵ میلیون بار دانلود شدهاند.
واکنش جهانی و چالشهای سیاسی
موفقیت دیپسیک که از سوی برخی تحلیلگران «تحولی در هوش مصنوعی» و از سوی برخی دیگر «اغراقآمیز» توصیف شده، تأثیر محسوسی بر بازار داشته است. از جمله میتوان به کاهش ۱۸ درصدی ارزش سهام شرکت Nvidia در دیماه و واکنش سم آلتمن، مدیرعامل OpenAI، اشاره کرد.
در اسفندماه، وزارت بازرگانی ایالات متحده استفاده از دیپسیک در دستگاههای دولتی را ممنوع اعلام کرد. همچنین، شرکت مایکروسافت اعلام کرد که مدلهای دیپسیک در پلتفرم Azure AI Foundry در دسترس قرار گرفتهاند. با این حال، برد اسمیت، نایبرئیس مایکروسافت، در جلسهای در سنای آمریکا تأکید کرد که کارکنان این شرکت به دلایل امنیتی و تبلیغاتی اجازه استفاده از دیپسیک را ندارند.
مدیرعامل انویدیا نیز در جریان ارائه گزارش مالی، بر «نوآوری تحسینبرانگیز» دیپسیک تأکید کرد و گفت مدلهای استدلالی مانند R1 از آنجا که به توان پردازشی بیشتری نیاز دارند، برای کسبوکار این شرکت مفید هستند.
در همین حال، برخی کشورها و نهادهای دولتی، از جمله کره جنوبی و ایالت نیویورک، استفاده از دیپسیک را ممنوع کردهاند.
آیندهای نامشخص
آینده دیپسیک با ابهاماتی همراه است. هرچند توسعه مدلهای پیشرفتهتر امری بدیهی به نظر میرسد، اما نگرانیهای سیاسی و امنیتی، بهویژه از سوی ایالات متحده، میتواند مسیر این شرکت را تحت تأثیر قرار دهد. بر اساس گزارشی از والاستریت ژورنال در اسفندماه، دولت ایالات متحده در حال بررسی ممنوعیت کامل استفاده از دیپسیک در دستگاههای دولتی است.
مجله خبری mydtc