چگونه DeepSeek با کمترین هزینه سیستم هوش مصنوعی پیشرفته خود را توسعه داد؟

چگونه DeepSeek با کمترین هزینه سیستم هوش مصنوعی پیشرفته خود را توسعه داد؟
دیپسیک یک استارتاپ چینی، با بهرهگیری از تکنیکهای نوآورانه و صرف هزینهای به میزان تنها ۶ میلیون دلار، موفق شد مدل هوش مصنوعی قدرتمند خود به نام DeepSeek R1 را توسعه دهد. این مبلغ تقریباً یک دهم هزینهای است که Meta برای ساخت فناوریهای مشابه خود صرف کرده است.
مدل DeepSeek R1 نه تنها در زمان راهاندازی توجه جهانی را جلب کرد، بلکه موجب نوسانات قابل توجهی در بازار سهام ایالات متحده شد و چالشهای موجود در توسعه فناوریهای هوش مصنوعی را بهطور کامل بازتعریف کرد. این استارتاپ چینی با استفاده بهینه از منابع خود، همچنان در مسیر رشد و پیشرفت در فضای فناوری حرکت میکند.
یکی از دلایل اصلی موفقیت دیپسیک، طراحی DeepSeek-V3 است که شامل ۶۷۱ میلیارد داده میشود و با عملکردی مؤثرتر از رقبای خود، تحولی در این حوزه ایجاد کرده است.
چرا هزینهها کاهش یافت؟
عملکرد چشمگیر DeepSeek به استفاده از تنها ۲۰۰۰ تراشه گره خورده مربوط میشود، در حالی که رقبای دیگر همان کار را با ۱۶۰۰۰ تراشه انجام میدهند. این به معنای صرف حدود ۶ میلیون دلار برای قدرت محاسباتی است؛ هزینهای که فقط یک دهم مبلغ مشابه متا (Meta) برای فناوریهای مشابه خود بوده است.
این کارایی حتی با وجود محدودیتهای شدید صادراتی ایالات متحده به دست آمده است، چرا که دیپ سیک مجبور بود از پردازندههای گرافیکی H800 NVIDIA استفاده کند.
اما مهمترین نوآوری DeepSeek در معماری Mixture of Expert (MoE) نهفته است. این معماری که در ۲۶ ژانویه ۲۰۲۴ معرفی شد، شامل ۶۷۱ میلیارد داده است. اما تفاوت این مدل با دیگر مدلها در این است که همه دادهها به یکباره پردازش نمیشوند؛ بلکه فقط بخشهای ضروری فعال میشوند، که این امر موجب کاهش قابل توجه ضایعات محاسباتی میشود.
این رویکرد با تکنیک DeepSeekMLA ترکیب شده است که حافظه را بهینه میکند و تنها اطلاعات ضروری را اولویتبندی میکند.
تأثیر در بازار
اعلام این جزئیات DeepSeek در مورد سیستم هوش مصنوعی خود در ژانویه ۲۰۲۵ واکنش شدیدی در بازارهای مالی به همراه داشت. به طور مثال، قیمت سهام NVIDIA به دنبال این پیشرفت و نگرانیها از رقابت فزاینده با تراشهسازانی مانند AMD، Intel و سایر شرکتهای چینی کاهش یافت.
استراتژی قیمتگذاری دیپسیک نیز رقابتی باقی مانده است. این شرکت اعلام کرده که قیمت هر میلیون توکن تنها 0.27 دلار است که به اعتقاد آنها بهترین ارزش برای پول در بازار محسوب میشود.
مجله خبری mydtc