نسخه جدید دیپسیک با ۹۷٪ هزینه کمتر در راه است
نسخه جدید هوش مصنوعی دیپسیک در راه است
گزارشهای اخیر نشان میدهد که مدل زبانی بزرگ بعدی دیپسیک با نام DeepSeek-R2 بین ۲۴ مرداد تا ۸ شهریور ۱۴۰۴ عرضه خواهد شد. این مدل پیشرفته، با ۱٫۲ تریلیون پارامتر تقریباً دو برابر نسخه پیشین، DeepSeek-R1، خواهد بود و انتظار میرود جهشی قابلتوجه در عملکرد و معماری هوش مصنوعی ایجاد کند.
جهش بزرگ در معماری و قدرت پردازشی
DeepSeek-R2 از سیستم Mixture of Experts بهره میبرد و با استفاده از تراشههای Ascend 910B هواوی آموزش دیده است. این تراشه با عملکرد ۵۱۲ پتافلاپسی و بهرهوری ۸۲ درصد، تقریباً ۹۱٪ توان تراشهی A100 انویدیا را ارائه میکند.
کاهش چشمگیر هزینه آموزش
به دلیل استفاده از سختافزار داخلی و تکنیکهای بهینهسازی، هزینه آموزش DeepSeek-R2 تقریباً ۹۷٪ کمتر از GPT-4 تخمین زده شده است. این موضوع میتواند تاثیر قابلتوجهی بر مدلهای هوش مصنوعی فعلی OpenAI و Anthropic داشته باشد.
تاثیر بر بازار و شرکتها
انتشار اخبار پیرامون DeepSeek-R2 باعث رشد ۲۰٪ سهام شرکت Cambricon شده و ارزش بازار این شرکت به حدود ۴۹٫۷ میلیارد دلار رسیده است. Cambricon در حوزه توسعه پردازندههای هوش مصنوعی فعالیت میکند و مدل جدید دیپسیک میتواند موقعیت این شرکت را در بازار جهانی تقویت کند.
DeepSeek-R2 نویدبخش هوش مصنوعی سریعتر، پیشرفتهتر و اقتصادیتر است. این مدل میتواند استاندارد جدیدی برای پردازش زبان طبیعی ایجاد کرده و رقابت بین غولهای هوش مصنوعی را شدت ببخشد.