هوش مصنوعی جدید علیبابا معرفی شد؛ توهم کمتر و کدنویسی پیشرفتهتر
شرکت علیبابا مدل هوش مصنوعی Qwen3.7 Max را معرفی کرد؛ مدلی که در شاخص هوش مصنوعی Artificial Analysis امتیاز ۵۶٫۶ را ثبت کرد و نسبتبه نسخهی قبلی Qwen3.6 Max Preview حدود ۴٫۸ امتیاز پیشرفت داشته است.
هوش مصنوعی جدید علیبابا هنوز پشتسر مدلهای پیشرفتهی اوپنایآی، انتروپیک و گوگل قرار میگیرد؛ اما Qwen3.7 Max نزدیکترین تلاش این شرکت برای رقابت با مدلهای پیشرو در بازار محسوب میشود.
علیبابا از زمان انتشار Qwen2.5 Max در اوایل ۲۰۲۵، مدلهای مکس و پلاس را بهصورت بسته منتشر میکند و فقط مدلهای دیگر خانوادهی Qwen متنباز باقی ماندهاند. درحالحاضر، قویترین مدل متنباز این خانواده Qwen3.6 27B با امتیاز ۴۵٫۸ و نسخهی MoE آن یعنی Qwen3.5 397B A17B با امتیاز ۴۵٫۰ شناخته میشوند.
پیشرفت اصلی در استدلال و برنامهنویسی
طبق بنچمارکها، بیشترین پیشرفت Qwen3.7 Max در بخشهای استدلال علمی، توانایی انجام وظایف ایجنتمحور و کدنویسی دیده میشود. عملکرد مدل در چندین بنچمارک مهم رشد محسوسی داشته و مثلاً امتیاز HLE از ۲۸٫۹ به ۳۸٫۱ درصد رسیده است.
بخشی از افزایش امتیاز کلی مدل به کاهش «توهم» مربوط میشود. نرخ توهم Qwen3.7 Max از ۴۴٫۲ به ۲۲٫۹ درصد کاهش پیدا کرده؛ اما دقت پاسخها هم افت کرده و از ۳۷٫۷ به ۳۰٫۱ درصد رسیده است. در واقع مدل در بسیاری از مواقع ترجیح میدهد به سؤال پاسخ ندهد تا اطلاعات اشتباه ارائه کند.
حافظهی متنی یک میلیون توکنی
مدل جدید علیبابا از حافظهی کانتکست یک میلیون توکنی بهره میبرد؛ عددی که نسبتبه محدودیت ۲۵۶ هزار توکنی نسل قبل جهش بزرگی بهحساب میآید. البته Qwen3.7 Max فعلاً فقط از ورودی و خروجی متنی پشتیبانی میکند و قابلیت چندرسانهای ندارد.
علیبابا هنوز قیمت API مدل را اعلام نکرده؛ اما نسخهی قبلی یعنی Qwen3.6 Max Preview برای هر یک میلیون توکن ورودی و خروجی بهترتیب ۱٫۳۰ و ۷٫۸۰ دلار قیمت داشت.