هوش مصنوعی جدید علی‌بابا معرفی شد؛ توهم کمتر و کدنویسی پیشرفته‌تر

جمعه 1 خرداد 1405 - 10:50
مطالعه 2 دقیقه
علی بابا
هوش مصنوعی Qwen3.7 Max علی‌بابا با قابلیت‌های پیشرفته‌تر در حوزه‌ی استدلال و کدنویسی رونمایی شد.
تبلیغات

شرکت علی‌بابا مدل هوش مصنوعی Qwen3.7 Max را معرفی کرد؛ مدلی که در شاخص هوش مصنوعی Artificial Analysis امتیاز ۵۶٫۶ را ثبت کرد و نسبت‌به نسخه‌ی قبلی Qwen3.6 Max Preview حدود ۴٫۸ امتیاز پیشرفت داشته است.

هوش مصنوعی جدید علی‌بابا هنوز پشت‌سر مدل‌های پیشرفته‌ی اوپن‌ای‌آی، انتروپیک و گوگل قرار می‌گیرد؛ اما Qwen3.7 Max نزدیک‌ترین تلاش این شرکت برای رقابت با مدل‌های پیشرو در بازار محسوب می‌شود.

علی‌بابا از زمان انتشار Qwen2.5 Max در اوایل ۲۰۲۵، مدل‌های مکس و پلاس را به‌صورت بسته منتشر می‌کند و فقط مدل‌های دیگر خانواده‌ی Qwen متن‌باز باقی مانده‌اند. درحال‌حاضر، قوی‌ترین مدل متن‌باز این خانواده Qwen3.6 27B با امتیاز ۴۵٫۸ و نسخه‌ی MoE آن یعنی Qwen3.5 397B A17B با امتیاز ۴۵٫۰ شناخته می‌شوند.

پیشرفت اصلی در استدلال و برنامه‌نویسی

طبق بنچمارک‌ها، بیشترین پیشرفت Qwen3.7 Max در بخش‌های استدلال علمی، توانایی انجام وظایف ایجنت‌محور و کدنویسی دیده می‌شود. عملکرد مدل در چندین بنچمارک مهم رشد محسوسی داشته و مثلاً امتیاز HLE از ۲۸٫۹ به ۳۸٫۱ درصد رسیده است.

بخشی از افزایش امتیاز کلی مدل به کاهش «توهم» مربوط می‌شود. نرخ توهم Qwen3.7 Max از ۴۴٫۲ به ۲۲٫۹ درصد کاهش پیدا کرده؛ اما دقت پاسخ‌ها هم افت کرده و از ۳۷٫۷ به ۳۰٫۱ درصد رسیده است. در واقع مدل در بسیاری از مواقع ترجیح می‌دهد به سؤال پاسخ ندهد تا اطلاعات اشتباه ارائه کند.

حافظه‌ی متنی یک میلیون توکنی

مدل جدید علی‌بابا از حافظه‌ی کانتکست یک میلیون توکنی بهره می‌برد؛ عددی که نسبت‌به محدودیت ۲۵۶ هزار توکنی نسل قبل جهش بزرگی به‌حساب می‌آید. البته Qwen3.7 Max فعلاً فقط از ورودی و خروجی متنی پشتیبانی می‌کند و قابلیت چندرسانه‌ای ندارد.

علی‌بابا هنوز قیمت API مدل را اعلام نکرده؛ اما نسخه‌ی قبلی یعنی Qwen3.6 Max Preview برای هر یک میلیون توکن ورودی و خروجی به‌ترتیب ۱٫۳۰ و ۷٫۸۰ دلار قیمت داشت.

نظرات