نسخه جدید دیپ‌سیک با ۹۷٪ هزینه کمتر در راه است

نسخه جدید هوش مصنوعی دیپ‌سیک در راه است

گزارش‌های اخیر نشان می‌دهد که مدل زبانی بزرگ بعدی دیپ‌سیک با نام DeepSeek-R2 بین ۲۴ مرداد تا ۸ شهریور ۱۴۰۴ عرضه خواهد شد. این مدل پیشرفته، با ۱٫۲ تریلیون پارامتر تقریباً دو برابر نسخه پیشین، DeepSeek-R1، خواهد بود و انتظار می‌رود جهشی قابل‌توجه در عملکرد و معماری هوش مصنوعی ایجاد کند.

جهش بزرگ در معماری و قدرت پردازشی

DeepSeek-R2 از سیستم Mixture of Experts بهره می‌برد و با استفاده از تراشه‌های Ascend 910B هواوی آموزش دیده است. این تراشه با عملکرد ۵۱۲ پتافلاپسی و بهره‌وری ۸۲ درصد، تقریباً ۹۱٪ توان تراشه‌ی A100 انویدیا را ارائه می‌کند.

کاهش چشمگیر هزینه آموزش

به دلیل استفاده از سخت‌افزار داخلی و تکنیک‌های بهینه‌سازی، هزینه آموزش DeepSeek-R2 تقریباً ۹۷٪ کمتر از GPT-4 تخمین زده شده است. این موضوع می‌تواند تاثیر قابل‌توجهی بر مدل‌های هوش مصنوعی فعلی OpenAI و Anthropic داشته باشد.

تاثیر بر بازار و شرکت‌ها

انتشار اخبار پیرامون DeepSeek-R2 باعث رشد ۲۰٪ سهام شرکت Cambricon شده و ارزش بازار این شرکت به حدود ۴۹٫۷ میلیارد دلار رسیده است. Cambricon در حوزه توسعه پردازنده‌های هوش مصنوعی فعالیت می‌کند و مدل جدید دیپ‌سیک می‌تواند موقعیت این شرکت را در بازار جهانی تقویت کند.

DeepSeek-R2 نویدبخش هوش مصنوعی سریع‌تر، پیشرفته‌تر و اقتصادی‌تر است. این مدل می‌تواند استاندارد جدیدی برای پردازش زبان طبیعی ایجاد کرده و رقابت بین غول‌های هوش مصنوعی را شدت ببخشد.