هوش مصنوعی مایکروسافت بدون GPU اجرا میشود!

BitNet مایکروسافت: مدل هوش مصنوعی که نیازی به GPU ندارد
مایکروسافت از مدل هوش مصنوعی سبک و کارآمدی با نام BitNet b1.58 2B4T رونمایی کرده که برخلاف بیشتر مدلهای پیشرفته بازار، بدون نیاز به GPU و تنها با CPU اجرا میشود. این مدل بهصورت متنباز و تحت مجوز MIT در دسترس قرار گرفته است.
اولین مدل یکبیتی با ۲ میلیارد پارامتر
BitNet جدیدترین دستاورد مایکروسافت در زمینه مدلهای یکبیتی است. این مدلها برای اجرا روی سختافزارهای سبک طراحی شدهاند و برخلاف مدلهای مرسوم که از اعداد دقیق یا کوانتیزهشده استفاده میکنند، وزنهایشان را فقط به سه مقدار ۱-، ۰ و ۱ محدود میکنند. نتیجه این طراحی، سرعت بالا و مصرف منابع پایین است.
BitNet b1.58 2B4T نخستین مدل یکبیتی با ۲ میلیارد پارامتر بهشمار میرود و روی مجموعه عظیمی شامل ۴ تریلیون توکن معادل حدود ۳۳ میلیون کتاب آموزش دیده است.
اجرای روان روی CPU، حتی M2 اپل
این مدل میتواند روی CPUهایی مانند پردازندههای M2 اپل نیز بهراحتی اجرا شود. مایکروسافت حتی اعلام کرده BitNet با استفاده از چهارچوب اختصاصی bitnet.cpp تا دو برابر سریعتر از مدلهای مشابه عمل میکند؛ هرچند این چهارچوب فقط با سختافزارهای خاصی سازگار است و از GPU پشتیبانی نمیکند.
عملکرد رقابتی در تستهای هوش مصنوعی
براساس آزمایشها، BitNet b1.58 2B4T در آزمونهای رایج هوش مصنوعی مانند:
- GSM8K (مسائل ریاضی پایه مدرسه)
- PIQA (تستهای استدلال فیزیکی و عمومی)
عملکردی رقابتی و حتی بهتر از برخی مدلهای قدرتمند مانند LLaMA 3.2 1B، Qwen 2.5 1.5B و Gemma 31B داشته است.
آیندهای با هوش مصنوعی سبکتر و سریعتر؟
BitNet یک گام مهم در مسیر ساخت مدلهای هوش مصنوعی مقرونبهصرفه و سبک برای کاربردهای گستردهتر است. به لطف طراحی یکبیتی، چنین مدلهایی میتوانند حتی بدون سختافزارهای گرانقیمت، عملکرد قابلقبولی داشته باشند.