رونمایی OpenAI از قدرتمندترین مدل تصویری خود

به گزارش “آرسینه“، شرکت OpenAI در جدیدترین بیانیه رسمی خود، از مدل جدید o3 به‌عنوان قوی‌ترین مدل استدلالی تاریخ این شرکت رونمایی کرد. این مدل توانایی استثنایی در ترکیب تصویر با فرایند تفکر دارد و می‌تواند مفاهیم بصری را به‌صورت یکپارچه تحلیل کند. در کنار آن، مدل جمع‌وجورتر اما سریع‌تر o4-mini نیز معرفی شده که با وجود اندازه کوچک، عملکرد چشمگیری از خود نشان می‌دهد.

هر دو مدل جدید به قابلیت استدلال تصویری مجهز شده‌اند. این یعنی حالا می‌توانند تصاویر را نه‌تنها ببینند، بلکه آن‌ها را به‌صورت منطقی تحلیل کرده و وارد زنجیره تفکر خود کنند. این توانایی در شرایطی مثل تحلیل نوشته‌های روی تخته سفید یا طراحی‌ها می‌تواند بسیار مؤثر باشد.

OpenAI توضیح داده که مدل‌های o3 و o4-mini قادرند تصویر را بزرگ‌نمایی، چرخش و بازسازی دیداری کنند؛ و همه این‌ها را در جریان فرآیند تحلیل و استدلال انجام دهند. این نشان می‌دهد که مدل‌های جدید، تنها به خواندن متن محدود نیستند، بلکه از درک عمیق‌تری نسبت به داده‌های بصری نیز برخوردارند.

این مدل‌ها اکنون به تمامی ابزارهای موجود در ChatGPT دسترسی دارند؛ از جمله مرورگر وب و تولید تصویر. دسترسی به این امکانات از امروز برای کاربران نسخه‌های Plus، Pro و Team فعال شده و به‌زودی در نسخه o3-pro نیز ارائه خواهد شد.

OpenAI همچنین اعلام کرده که به‌مرور زمان مدل‌های قدیمی‌تر مثل o1، o3-mini و o3-mini-high از دسترس خارج خواهند شد. در همین راستا، مدل GPT-4.1 نیز به‌عنوان جانشین GPT-4o معرفی شده که پرچم‌دار جدید سری GPT محسوب می‌شود.

با معرفی مدل‌های o3 و o4-mini، اکنون کاربران می‌توانند منتظر تجربه‌ای متفاوت از هوش مصنوعی باشند؛ تجربه‌ای که متن و تصویر را در کنار هم و با توان استدلالی بالا پردازش می‌کند.