هوش مصنوعی مایکروسافت بدون GPU اجرا می‌شود!

BitNet مایکروسافت: مدل هوش مصنوعی که نیازی به GPU ندارد

مایکروسافت از مدل هوش مصنوعی سبک و کارآمدی با نام BitNet b1.58 2B4T رونمایی کرده که برخلاف بیشتر مدل‌های پیشرفته بازار، بدون نیاز به GPU و تنها با CPU اجرا می‌شود. این مدل به‌صورت متن‌باز و تحت مجوز MIT در دسترس قرار گرفته است.

اولین مدل یک‌بیتی با ۲ میلیارد پارامتر

BitNet جدیدترین دستاورد مایکروسافت در زمینه مدل‌های یک‌بیتی است. این مدل‌ها برای اجرا روی سخت‌افزارهای سبک طراحی شده‌اند و برخلاف مدل‌های مرسوم که از اعداد دقیق یا کوانتیزه‌شده استفاده می‌کنند، وزن‌هایشان را فقط به سه مقدار ۱-، ۰ و ۱ محدود می‌کنند. نتیجه این طراحی، سرعت بالا و مصرف منابع پایین است.

BitNet b1.58 2B4T نخستین مدل یک‌بیتی با ۲ میلیارد پارامتر به‌شمار می‌رود و روی مجموعه عظیمی شامل ۴ تریلیون توکن معادل حدود ۳۳ میلیون کتاب آموزش دیده است.

اجرای روان روی CPU، حتی M2 اپل

این مدل می‌تواند روی CPUهایی مانند پردازنده‌های M2 اپل نیز به‌راحتی اجرا شود. مایکروسافت حتی اعلام کرده BitNet با استفاده از چهارچوب اختصاصی bitnet.cpp تا دو برابر سریع‌تر از مدل‌های مشابه عمل می‌کند؛ هرچند این چهارچوب فقط با سخت‌افزارهای خاصی سازگار است و از GPU پشتیبانی نمی‌کند.

عملکرد رقابتی در تست‌های هوش مصنوعی

براساس آزمایش‌ها، BitNet b1.58 2B4T در آزمون‌های رایج هوش مصنوعی مانند:

  • GSM8K (مسائل ریاضی پایه مدرسه)
  • PIQA (تست‌های استدلال فیزیکی و عمومی)

عملکردی رقابتی و حتی بهتر از برخی مدل‌های قدرتمند مانند LLaMA 3.2 1B، Qwen 2.5 1.5B و Gemma 31B داشته است.

آینده‌ای با هوش مصنوعی سبک‌تر و سریع‌تر؟

BitNet یک گام مهم در مسیر ساخت مدل‌های هوش مصنوعی مقرون‌به‌صرفه و سبک برای کاربردهای گسترده‌تر است. به لطف طراحی یک‌بیتی، چنین مدل‌هایی می‌توانند حتی بدون سخت‌افزارهای گران‌قیمت، عملکرد قابل‌قبولی داشته باشند.

امتیاز شما

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا