نسخه جدید هوش مصنوعی دیپسیک در راه است
گزارشهای اخیر نشان میدهد که مدل زبانی بزرگ بعدی دیپسیک با نام DeepSeek-R2 بین ۲۴ مرداد تا ۸ شهریور ۱۴۰۴ عرضه خواهد شد. این مدل پیشرفته، با ۱٫۲ تریلیون پارامتر تقریباً دو برابر نسخه پیشین، DeepSeek-R1، خواهد بود و انتظار میرود جهشی قابلتوجه در عملکرد و معماری هوش مصنوعی ایجاد کند.
جهش بزرگ در معماری و قدرت پردازشی
DeepSeek-R2 از سیستم Mixture of Experts بهره میبرد و با استفاده از تراشههای Ascend 910B هواوی آموزش دیده است. این تراشه با عملکرد ۵۱۲ پتافلاپسی و بهرهوری ۸۲ درصد، تقریباً ۹۱٪ توان تراشهی A100 انویدیا را ارائه میکند.
کاهش چشمگیر هزینه آموزش
به دلیل استفاده از سختافزار داخلی و تکنیکهای بهینهسازی، هزینه آموزش DeepSeek-R2 تقریباً ۹۷٪ کمتر از GPT-4 تخمین زده شده است. این موضوع میتواند تاثیر قابلتوجهی بر مدلهای هوش مصنوعی فعلی OpenAI و Anthropic داشته باشد.
تاثیر بر بازار و شرکتها
انتشار اخبار پیرامون DeepSeek-R2 باعث رشد ۲۰٪ سهام شرکت Cambricon شده و ارزش بازار این شرکت به حدود ۴۹٫۷ میلیارد دلار رسیده است. Cambricon در حوزه توسعه پردازندههای هوش مصنوعی فعالیت میکند و مدل جدید دیپسیک میتواند موقعیت این شرکت را در بازار جهانی تقویت کند.
DeepSeek-R2 نویدبخش هوش مصنوعی سریعتر، پیشرفتهتر و اقتصادیتر است. این مدل میتواند استاندارد جدیدی برای پردازش زبان طبیعی ایجاد کرده و رقابت بین غولهای هوش مصنوعی را شدت ببخشد.