تجهیز x86 به موتورهای ضرب ماتریسی؛ سلاح مشترک اینتل و AMD برای مهار هوش مصنوعی

جمعه 29 خرداد 1405 - 17:43
مطالعه 2 دقیقه
همکاری اینتل و AMD در کارگروه x86
اینتل و AMD از مشخصات افزونه‌ی ACE رونمایی کردند تا معماری x86 را با موتورهای ماتریسی در نبرد هوش مصنوعی مجهزتر از همیشه به میدان بفرستند.
تبلیغات

سال گذشته اینتل و AMD در اقدامی کم‌سابقه، برای تقویت اکوسیستم مشترکشان، «گروه مشاوره‌ی اکوسیستم x86» را پایه‌گذاری کردند. آن‌ها می‌خواستند با استانداردسازی ویژگی‌های x86، این معماری را در برابر نیازهای آینده، مقیاس‌پذیر کنند. در همان زمان، ویژگی‌های کلیدی FRED، AVX10، ChkTag و ACE نیز معرفی شدند؛ اما حالا با انتشار اسناد فنی افزونه‌های محاسبات هوش مصنوعی (ACE)، مشخص شده است که تراشه‌سازهای آمریکایی چه خوابی برای آینده‌ی پردازنده‌ها دیده‌اند.

هسته و قلب تپنده‌ی شبکه‌های عصبی و مدل‌های زبانی بزرگ، عملیاتی ریاضی ضرب ماتریسی است. تا پیش از این، افزونه‌های فعلی پردازنده‌ها، نظیر AVX10 می‌توانستند چنین محاسباتی را انجام دهند؛ اما توانایی آن‌ها در مقیاس‌پذیری و چگالی پردازشی بسیار محدود بود؛ به‌زبان ساده‌تر، CPU-ها درمقایسه‌با GPU-ها در زمینه‌ی ضرب ماتریسی، حرفی برای گفتن نداشتند. حال افزونه‌ی ACE با اضافه‌کردن مستقیم موتورهای ضرب ماتریسی به درون معماری پردازنده، سرعت و بهره‌وری انرژی را به‌شدت افزایش می‌دهد.

پردازنده‌های سنتی در برابر حجم عظیم محاسبات هوش مصنوعی در حال تسلیم‌شدن بودند؛ افزونه‌ی ACE، در واقع تلاش اینتل و AMD برای زنده نگه‌داشتن پادشاهی x86 در دنیای فرداست.

طبق اسناد منتشر شده، افزونه‌ی ACE با یکپارچگی عمیق با دستورات AVX، قابلیت‌های جدیدی را به پردازنده‌ها تزریق می‌کند. از جمله‌ی این قابلیت‌ها می‌توان به «رجیسترهای کاشی‌بندی» و دستورات جابه‌جایی سریع داده‌ها اشاره کرد. این ترکیب اجازه می‌دهد که قدرت پردازشی متراکم ACE در کنار انعطاف‌پذیری دستورات AVX قرار بگیرد.

علاوه‌بر شتاب‌دهنده‌های ماتریسی، یکی از مهم‌ترین بخش‌های به‌روزرسانی ACE، پشتیبانی بومی از فرمت‌های داده با دقت پایین است. در دنیای یادگیری ماشین، نیازی به اعشار بسیار دقیق نیست؛ بلکه سرعت پردازش حرف اول را می‌زند.

در هوش مصنوعی، دقت کمتر مساوی است با سرعت بیشتر. پشتیبانی پردازنده‌های آینده از فرمت‌های ۴بیتی و ۸بیتی، یک انقلاب خاموش در کاهش مصرف انرژی و افزایش توان پردازشی خواهد بود.

براساس مشخصات اعلام شده، افزونه‌ی ACE قرار است از طیف وسیعی از فرمت‌ها پشتیبانی کند؛ از اعداد صحیح سنتی INT8 و INT32 گرفته تا فرمت‌های اعشاری پیشرفته‌ای که به‌طور اختصاصی برای هوش مصنوعی طراحی شده‌اند، نظیر:

  • FP16 و BF16 (استانداردهای فعلی یادگیری ماشین)
  • FP8 و MX FP8 (فرمت‌های ۸بیتی مایکرو-اسکیلینگ)
  • MX FP6 و MX FP4 (فرمت‌های فوق‌فشرده ۶ و ۴بیتی)

افزونه‌ی ACE تنها یک قطعه از پازل بزرگتری است که مسیر آینده‌ی پردازنده‌های x86 را شکل می‌دهد. در کنار آن، فناوری دیگری به نام افزونه‌های عملکرد پیشرفته (APX) نیز به‌زودی از راه می‌رسد که نقش حیاتی در توسعه‌ی تراشه‌های نسل بعد ایفا خواهد کرد. انتظار می‌رود چنین تغییرات بنیادینی، در سبد محصولات نسل‌های آینده‌ی اینتل و AMD روانه‌ی بازار شوند تا نشان دهند دنیای CPU هنوز تسلیم‌شدن در برابر هوش مصنوعی را نمی‌پذیرد.

نظرات