تجهیز x86 به موتورهای ضرب ماتریسی؛ سلاح مشترک اینتل و AMD برای مهار هوش مصنوعی
سال گذشته اینتل و AMD در اقدامی کمسابقه، برای تقویت اکوسیستم مشترکشان، «گروه مشاورهی اکوسیستم x86» را پایهگذاری کردند. آنها میخواستند با استانداردسازی ویژگیهای x86، این معماری را در برابر نیازهای آینده، مقیاسپذیر کنند. در همان زمان، ویژگیهای کلیدی FRED، AVX10، ChkTag و ACE نیز معرفی شدند؛ اما حالا با انتشار اسناد فنی افزونههای محاسبات هوش مصنوعی (ACE)، مشخص شده است که تراشهسازهای آمریکایی چه خوابی برای آیندهی پردازندهها دیدهاند.
هسته و قلب تپندهی شبکههای عصبی و مدلهای زبانی بزرگ، عملیاتی ریاضی ضرب ماتریسی است. تا پیش از این، افزونههای فعلی پردازندهها، نظیر AVX10 میتوانستند چنین محاسباتی را انجام دهند؛ اما توانایی آنها در مقیاسپذیری و چگالی پردازشی بسیار محدود بود؛ بهزبان سادهتر، CPU-ها درمقایسهبا GPU-ها در زمینهی ضرب ماتریسی، حرفی برای گفتن نداشتند. حال افزونهی ACE با اضافهکردن مستقیم موتورهای ضرب ماتریسی به درون معماری پردازنده، سرعت و بهرهوری انرژی را بهشدت افزایش میدهد.
پردازندههای سنتی در برابر حجم عظیم محاسبات هوش مصنوعی در حال تسلیمشدن بودند؛ افزونهی ACE، در واقع تلاش اینتل و AMD برای زنده نگهداشتن پادشاهی x86 در دنیای فرداست.
طبق اسناد منتشر شده، افزونهی ACE با یکپارچگی عمیق با دستورات AVX، قابلیتهای جدیدی را به پردازندهها تزریق میکند. از جملهی این قابلیتها میتوان به «رجیسترهای کاشیبندی» و دستورات جابهجایی سریع دادهها اشاره کرد. این ترکیب اجازه میدهد که قدرت پردازشی متراکم ACE در کنار انعطافپذیری دستورات AVX قرار بگیرد.
علاوهبر شتابدهندههای ماتریسی، یکی از مهمترین بخشهای بهروزرسانی ACE، پشتیبانی بومی از فرمتهای داده با دقت پایین است. در دنیای یادگیری ماشین، نیازی به اعشار بسیار دقیق نیست؛ بلکه سرعت پردازش حرف اول را میزند.
در هوش مصنوعی، دقت کمتر مساوی است با سرعت بیشتر. پشتیبانی پردازندههای آینده از فرمتهای ۴بیتی و ۸بیتی، یک انقلاب خاموش در کاهش مصرف انرژی و افزایش توان پردازشی خواهد بود.
براساس مشخصات اعلام شده، افزونهی ACE قرار است از طیف وسیعی از فرمتها پشتیبانی کند؛ از اعداد صحیح سنتی INT8 و INT32 گرفته تا فرمتهای اعشاری پیشرفتهای که بهطور اختصاصی برای هوش مصنوعی طراحی شدهاند، نظیر:
- FP16 و BF16 (استانداردهای فعلی یادگیری ماشین)
- FP8 و MX FP8 (فرمتهای ۸بیتی مایکرو-اسکیلینگ)
- MX FP6 و MX FP4 (فرمتهای فوقفشرده ۶ و ۴بیتی)
افزونهی ACE تنها یک قطعه از پازل بزرگتری است که مسیر آیندهی پردازندههای x86 را شکل میدهد. در کنار آن، فناوری دیگری به نام افزونههای عملکرد پیشرفته (APX) نیز بهزودی از راه میرسد که نقش حیاتی در توسعهی تراشههای نسل بعد ایفا خواهد کرد. انتظار میرود چنین تغییرات بنیادینی، در سبد محصولات نسلهای آیندهی اینتل و AMD روانهی بازار شوند تا نشان دهند دنیای CPU هنوز تسلیمشدن در برابر هوش مصنوعی را نمیپذیرد.