چین چگونه توازن هوش مصنوعی را در جهان تغییر داد؟
چهارشنبه 10 تیر 1405 - 14:30مطالعه 11 دقیقهتا همین چند سال پیش، رقابت بر سر توسعهی هوش مصنوعی بیشتر به مسابقهای یکطرفه شبیه بود تا نبردی پایاپای. تا ماه می ۲۰۲۳، ارزیابیهای فنی نشان میداد که برترین مدلهای توسعهیافته در ایالات متحده با فاصلهای معنادار دست بالا را نسبت به رقبای چینی خود دارند. در آن زمان، سیلیکونولی با اتکا به بودجههای کلان شرکتهایی نظیر مایکروسافت، گوگل و متا و همچنین دسترسی به پیشرفتهترین تجهیزات پردازشی، جایگاه خود را دستنیافتنی میدید.
خلاصه صوتی
خلاصهی صوتی، ساختهشده با هوش مصنوعی
رویکرد ایالات متحده بر پایهی مدلی تجاری استوار بود که میتوان آن را کمیابی هوش نامید؛ مدلی متکیبر سیستمهای بسته، بودجههای کلان تحقیقوتوسعه و زیرساختهای پردازشی بهشدت انحصاری؛ اما تاریخ فناوری نشان داده است که انحصارها همواره شکنندهاند.
اواسط سال ۲۰۲۶، واقعیت میدانی دستخوش تغییراتی باورنکردنی شد و شکاف عمیق گذشته تنها به ۲٫۷ درصد رسید؛ عددی که در دنیای توسعهی الگوریتمها یعنی چیزی در حد تأخیر سه تا ششماهه نسبت به پیشرفتهترین مدلهای غربی.
تغییر توازن قدرت، نهتنها خطای آماری نیست، بلکه از پیادهسازی استراتژی «فراوانی هوش» چین حاصل شده است. توسعهدهندگان چینی با عرضهی سیستمهای بسیار کارآمد، ارزانقیمت و با وزن باز (Open-weight)، تلاش میکنند قواعد بازی را به نفع خود تغییر دهند.
ولی مهندسان چینی چگونه توانستند تحریمهای فلجکنندهی سختافزاری را خنثی کنند و با کسری از هزینههای رقبای غربی، به بالاترین سطوح دانش الگوریتمی دست یابند؟
زلزله دیپسیک؛ روزی که غرب سایه رقیب را احساس کرد
برای اینکه جزئیات صحنهی جنجالی هوش مصنوعی امروز را بهتر بفهمیم، باید بستر تاریخی و تصمیمات کلان سیاسی را مرور کنیم. واشنگتن با این پیشفرض که توان محاسباتی زیربنای اصلی هوش مصنوعی است، تلاش کرد با اعمال محدودیتهای صادراتی بیسابقه بر تجهیزات تولید تراشه و نیمهرساناهای پیشرفته، ماشین توسعهی فناوری چین را متوقف کند.
استدلال طراحان تحریم این بود که بدون دسترسی به پردازندههای ردهبالای انویدیا، چین نمیتواند آموزش مدلهای زبانی عظیم را پیش ببرد؛ اما شواهد نشان میدهد که همین محدودیت بهجای توقف روند توسعه، بهعنوان کاتالیزوری قدرتمند عمل کرد و چین را بهسمت بهینهسازی الگوریتمها و استفاده از استراتژیهای جایگزین سوق داد.
تحریمهای سختافزاری واشنگتن نتیجهای کاملاً معکوس به همراه داشت
بزنگاه تاریخی تقابل چین و آمریکا، اوایل سال ۲۰۲۵ رخ داد و با عنوان لحظهی دیپسیک در محافل فناوری شهرت یافت. در زمان انتشار مدل DeepSeek-R1 گفته میشد که یک تیم چینی با منابع ردهپایینتر پردازشی و بودجهای در حدود ۶ میلیون دلار، توانسته است سیستمی با قابلیت استدلال همتراز با مدلهای پرهزینهای مانند OpenAI o1 توسعه دهد.
زلزلهی دیپسیک زنگ خطر را در راهروهای سیلیکونولی به صدا درآورد و نشان داد که رقیب شرقی بهجای تلاش برای عبور مستقیم از سد تحریمها، راهی برای دورزدن نیاز به منابع عظیم سختافزاری پیدا کرده است.
تقطیر خصمانه؛ استخراج دانش بهجای کشف دوباره آن
در دنیای یادگیری ماشین، توسعهی یک مدل پیشرفته و عظیم هوش مصنوعی به میلیاردها دلار هزینه، زمان و قویترین سیستمهای محاسباتی نیاز دارد تا بتواند با تحلیل حجم عظیمی از دادههای خام، الگوهای پیچیده و مسیرهای استدلال را کشف کند. این مدل بزرگ اولیه و همهفنحریف در نقش مدل معلم ظاهر میشود.
در حالت عادی، مهندسان برای اینکه بتوانند مغز متفکر و سنگین مدل بزرگ اولیه را درون وسایل کوچکی مثل گوشیهای هوشمند جا بدهند، از تکنیکی بهنام تقطیر دانش استفاده میکنند. در این فرایند، دانش و قابلیتهای سیستم بزرگ به مدلی کوچکتر و سادهتر که نقش دانشجو را دارد، منتقل میشود.
در واقع خروجیهای سیستم معلم را بهعنوان دادهی آموزشی به سیستم دانشجو میدهند تا مدل کوچکتر بتواند بدون نیاز به طیکردن مسیر پرهزینهی کشف اولیه، الگوهای مشابهی را با توان پردازشی بسیار کمتری بازتولید کند.
ولی وقتی تکنیک تقطیر در بستری رقابتی، بینالمللی و بدون مجوز بهکار گرفته شود؛ ماجرا ابعاد دیگری به خود میگیرد؛ پدیدهای که در گزارشهای نهادهای غربی تقطیر خصمانه (Adversarial Distillation) خوانده میشود.
توسعهدهندگان چینی مغز مدلهای بزرگ را با تکنیک تقطیر فشردهسازی میکنند
در سناریوی تقطیر خصمانه، توسعهدهندگان سیستمی را فشردهسازی میکنند که متعلق به خودشان نیست. آنها اصولاً از طریق دسترسی غیرمجاز به سیستمهای کشور هدف، قابلیتهای هوش مصنوعی را در مقیاسی وسیع استخراج میکنند.
بهبیان ساده، ازآنجاکه چین بهدلیل تحریمها نمیتواند توان پردازشی لازم را به کشف مسیرهای استدلال پایه اختصاص دهد؛ روزانه میلیونها سؤال و مسئلهی فوقالعاده پیچیده را بهسمت مدلهای پیشرو غربی مثل محصولات OpenAI، گوگل یا آنتروپیک سرازیر میکند؛ سپس پاسخهای دقیق، نحوهی استدلال و ساختار فکری مدلها را ثبت کرده و بهعنوان دادههای آموزشی ناب به مدلهای بومی خود تزریق میکند.
روش تقطیر به چینیها فرصت میدهد تحریمهای سختافزاری را بیاثر کنند و بدون صرف هزینههای کمرشکن تحقیقوتوسعه، از نوآوریهای انجامشده در خاک آمریکا بهرهبرداری کند.
نفوذ دهها هزار حساب کاربری به API مدلهای غربی
ابعاد استخراج اطلاعات مدلهای غربی بهحدی گسترده است که دیگر نمیتوان آن را به تلاشهای پراکندهی چند محقق تقلیل داد.
سازندگان مدلهای پیشتاز آمریکایی در جریان پایش شبکههای خود متوجه شدهاند که آزمایشگاههای چینی با ایجاد دهها هزار حساب کاربری جعلی، در حال استفاده از رابطهای برنامهنویسی آنها بهعنوان یک منبع تغذیهی بیپایان برای مدلهای داخلی خود هستند.
سازوکار عملیات چینیها شباهت زیادی به کمپینهای سایبری دارد که با استفاده از خدمات پراکسی تجاری و پنهانسازی هویت کاربران اجرا میشود. مستندات آنتروپیک در گزارش فوریهی ۲۰۲۶ نشان میداد که سه استارتاپ برتر چینی شامل دیپسیک، مونشات و مینیمکس، حدود ۲۴هزار حساب جعلی در پلتفرم آنها ایجاد کردهاند.
هزاران حساب جعلی در حال تخلیه اطلاعاتی مدلهای پیشرو آمریکایی هستند
حسابهای جعلی بهصورت هماهنگ بیشاز ۱۶میلیون پرسوجوی مهندسیشده را به سیستم کلاد ارسال کردند تا پاسخها و مسیرهای دقیق استدلالی آن را جمعآوری و بایگانی کنند.
چند ماه بعد، ابعاد وسیعتری از استراتژی چینیها را یکی از بزرگترین غولهای فناوری آسیا تکرار کرد. طبق گزارشها شرکت علیبابا در فرآیند توسعهی مدل Qwen، از آوریل تا ژوئن ۲۰۲۶ شبکهای متشکل از ۲۵هزار حساب کاربری ایجاد کرده و بالغبر ۲۸٫۸ میلیون تعامل با سیستم کلاد انجام داده است تا قابلیتهای برنامهنویسی و عاملیت پیشرفتهی آن را به طور کامل استخراج کند.
همزمان پژوهشگران امنیتی مایکروسافت و گوگل نیز با شناسایی الگوهای رفتاری مشابه، دریافتند که کارمندان شرکتهای چینی با بهرهگیری از روترهای ناشناس، محدودیتهای جغرافیایی و هویتی، API مدلهای OpenAI و جمنای را دور زدهاند و حجم گستردهای از دادههای باارزش را خارج کردهاند.
برآیند چنین وضعیتی، دستیابی به دستاوردهای لبهی فناوری با صرف کمترین هزینه است؛ انگار سرمایهگذاریهای سنگین آزمایشگاههای آمریکایی برای توسعهی هوش مصنوعی، ناخواسته به یارانهای پنهان برای رقیب تبدیل شدهاند و اکوسیستم فناوری چین را با سرعتی بیسابقه جلو میبرند.
بهینهسازی الگوریتمها؛ ابداع GRPO برای غلبه بر فقر محاسباتی
اگر پیشرفتهای اخیر چین را به کپیبرداریهای ساده نسبت دهیم، خطای تحلیلی بزرگی مرتکب میشویم و تمرکز افراطی رسانههای غربی بر ابعاد سایبری این ماجرا نیز تصویر ناقصی از واقعیت ارائه میدهد. ارزیابیهای فنی نشان میدهد که موفقیت آزمایشگاههای شنژن و پکن، حاصل ترکیب هوشمندانهی دادههای استخراجشده با نوآوریهای عمیق الگوریتمی است.
تیمهای مهندسی چین برای غلبه بر فقر شدید منابع پردازشی، چارهای جز بازاندیشی در مبانی معماری شبکههای عصبی نداشتند. آنها باید نرمافزاری میساختند که بتواند روی سختافزار ضعیفتر، عملکردی در سطح جهانی ارائه دهد.
یکی از مهمترین ابداعات چینیها با خلق الگوریتم بهینهسازی سیاست نسبی گروهی (GRPO) معرفی شد. در روشهای مرسوم یادگیری تقویتی که در آمریکا استفاده میشود، سیستم به یک مدل ارزیاب مجزا و هماندازه با مدل اصلی نیاز دارد تا کیفیت و صحت پاسخها را بررسی کند، رویکردی مبتنیبر مصرف حافظه و پردازندههای قوی گرافیکی.
حذف مدل ارزیاب موازی، سرعت و کارایی سیستم را به شدت افزایش داد
مهندسان چینی با حذف کامل مدل ارزیاب موازی، سرعت و کارایی سیستم را بهسطح بالاتری بردند. الگوریتم جدید با نمونهبرداری گروهی از خروجیها و استفاده از سیستم پاداشدهی مبتنیبر قواعد سختگیرانهی ریاضی، توانست قابلیتهای استدلالی پیچیده را با مصرف کسر کوچکی از توان محاسباتی درون مدل نهادینه کند.
از طرف دیگر متخصصان دیپسیک برای مدیریت بهینهی حافظه در زمان استنتاج، ساختار سنتی پردازش را نیز بهطور کامل بازطراحی کردهاند. آنها با بهرهگیری از تکنیک توجه پنهان چندسَری (Multi-head Latent Attention)، دادهها را در یک فضای مشترک فشردهسازی کرده و میزان اشغال حافظهی گرافیکی را بهشکلی چشمگیر کاهش دادهاند.
برای درک ملموستر طراحی دیپسیک، میتوانید کارخانهی غولپیکری را تصور کنید که هزاران کارگر متخصص در بخشهای مختلف آن مشغول به کارند. در ساختارهای سنتی هوش مصنوعی، برای انجام یک وظیفهی کوچک و پاسخ به یک پرسش ساده، برق و تجهیزات کل کارخانه درگیر میشد.
اما مهندسان با توسعهی ایدهی تخصیص خُبرگان، به سیستم آموختند که از میان صدها میلیارد متغیر، برای پردازش هر کلمه تنها درصد بسیار کوچکی از کارگران مرتبط را فعال کند. این طراحی هوشمندانه، ضعفهای سختافزاری را جبران کرد و هزینههای استنتاج را به پایینترین حد ممکن رساند.
تورممنفی استنتاج؛ گذار به تراشههای بومی و سقوط آزاد هزینههای پردازش
بیتردید هدف اصلی تحریمهای وضعشده در سالهای اخیر، قطع دسترسی پکن به پیشرفتهترین تراشههای محاسباتی جهان بود؛ اما این فشارها در عمل، موتور توسعهی سختافزار رقیب شرقی را با سرعتی غیرمنتظره روشن کرد.
زیرساخت فناوری چین بهسرعت از اتکا به محصولات خارجی فاصله گرفت و بهسمت استفاده از پردازندههای بومی، نظیر پردازندههای Ascend 910C هواوی و چارچوب نرمافزاری مرتبط با آن حرکت کرد؛ البته این گذار تکنولوژیک با چالشهای عظیمی همراه بود. پردازندههای بومی بهدلیل تحریم تجهیزات، برپایهی فناوریهای قدیمیتر ۷نانومتری و بدون دسترسی به دستگاههای فوقپیشرفتهی EUV تولید میشوند.
بااینحال، طراحان سعی کردند کاستیهای فیزیکی تراشهها را با طراحی شبکهای در سطح ابرگرهها جبران کنند. مقایسههای فنی نشان میدهد که پردازندهی بومی چین به حدود ۶۰درصد توان استنتاج پردازندهی پرچمدار انویدیا دست مییابد؛ اما با مصرف انرژی بسیار کمترِ ۳۱۰وات در برابر ۷۰۰وات برق مصرفی تراشهی آمریکایی.
کاهش چشمگیر هزینههای API، دسترسی جهانی به هوش مصنوعی را دگرگون کرد
هواوی در نظر دارد تولید پردازندههایش را در سال ۲۰۲۶ به ۱٫۶ میلیون واحد افزایش دهد و با معرفی معماریهای شبکهای نوین، پهنای باند ارتباطی نوری عظیمی را جایگزین ساختارهای سنتی کند.
آثار ترکیب تقطیر دادهها، الگوریتمهای بهینه و سختافزارهای بومی را میتوان به واضحترین شکل ممکن در اقتصاد و قیمتگذاری خدمات هوش مصنوعی مشاهده کرد.
ایالات متحده در سال ۲۰۲۵، توانست ۲۸۵٫۹ میلیارد دلار سرمایهی خصوصی جذب کند و چین تنها به ۱۲٫۴ میلیارد دلار دستیافت؛ اما شرکتهای چینی با مدل تجاری مبتنیبر فراوانی و کاهش هزینههای سربار، قیمت نهایی خدمات را برای کاربران در سراسر جهان پایین آوردند؛ پدیدهای که در محافل اقتصادی از آن باعنوان تورممنفی استنتاج یاد میشود.
جدول زیر، ابعاد شکاف عمیق اقتصادی و زیرساختی را بهروشنی نشان میدهد:
شاخص مقایسهای | ایالات متحده (مدلهای رده اول) | چین (مدلهای بومی) |
|---|---|---|
سرمایهی خصوصی جذبشده در سال ۲۰۲۵ | ۲۸۵٫۹ میلیارد دلار | ۱۲٫۴ میلیارد دلار |
هزینهی API ورودی (به ازای یک میلیون توکن) | ۵٫۰۰ دلار | ۰٫۱۴ دلار |
هزینهی API خروجی (به ازای یک میلیون توکن) | ۱۵٫۰۰ دلار | ۰٫۲۸ دلار |
هزینهی کشف هر آسیبپذیری سایبری | بیش از ۱٫۰۰ دلار | ۰٫۱۷ دلار |
تفاوت فاحش اقتصادی، فراتر از رقابتهای تجاری، دسترسی جهانی به فناوری را نیز متحول ساخت. وقتی هزینهی کشف آسیبپذیری سایبری با مدلهای توسعهیافته در آسیا به کسری از هزینههای سیستمهای غربی کاهش مییابد، توسعهدهندگان مستقل در کشورهای درحالتوسعه به قابلیتهایی دست مییابند که پیشتر تنها در انحصار ابرشرکتهای چندملیتی با بودجههای بیپایان بود.
پدافند الگوریتمی؛ حصارکشی واشنگتن و بازنویسی ردپای ضدتقطیر
با آشکارشدن نقش استخراج سیستماتیک اطلاعات در فرسایش مزیتهای راهبردی غرب و اثبات خطرات امنیتی ناشی از کاربرد این سیستمهای ارزانقیمت در تسریع حملات سایبری، نهادهای امنیتی آمریکا و شرکتهای بزرگ فناوری مجموعهای از اقدامات بیسابقهی تهاجمی و تدافعی را برای محافظت از داراییهای فکری خود کلید زدند.
دوران دسترسی آزاد و بدون نظارت به پایان رسید و دولت آمریکا با کنارگذاشتن سیاستهای پیشین، استقرار مدلهای فوق پیشرفته نظیر نسخههای جدید جیپیتی و کلاد میتوس را بهشدت محدود ساخت.
در رویکرد انقباضی آمریکا، غولهای نرمافزاری ملزم شدند پیشرفتهترین محصولات خود را منحصراً تحت یک سیستم یکپارچه مجوزدهی دولتی و صرفاً در اختیار سازمانهای تأییدشده قرار دهند تا دسترسی مستقیم و آسان رقبای خارجی به منابع پردازشی بهطور کامل مسدود شود؛ اما نبرد اصلی در لایههای پنهان کدها و روی سرورها جریان دارد.
آمریکا استقرار مدلهای فوقپیشرفته را به سیستم مجوزدهی دولتی محدود کرده است
پژوهشگران تکنیکهای بدیع و چندلایهای را برای حراست از قلمرو الگوریتمی خود پیادهسازی کردهاند. یکی از راهکارها، محصورکردن پاسخها با دستورالعملهای سیستمی پنهان است؛ اگر سیستم رقیب، خروجیها را جذب کند، ویژگیهای رفتاری خاصی بهارث میبرد و توسط الگوریتمهای داور بهعنوان سیستم سارق شناسایی میشود. دومین رویکرد براساس تکنیک بازنویسی ردپای ضدتقطیر اجرا میشود؛ مسیر استدلال سیستم مرجع پیشاز آنکه روی نمایشگر کاربر بیاید، بازنویسی میشود.
این تغییرات ظریف، کیفیت پاسخ نهایی و درستی معنا را برای مخاطب انسانی حفظ میکند؛ اما ارزش فنی دادهها برای آموزش یک مدل رقیب را بهشدت تخریب میسازد و فرآیند تقطیر را عملاً به تلاش بیثمر تبدیل خواهد کرد. در سمت مقابل، مدافعان دسترسی باز و تحلیلگران مستقر در آسیا، اقدامات محدودکنندهی غرب را مصداق بارز ریاکاری ژئوپلیتیک میدانند.
کدگذاری پنهان پاسخها، تلاش مدلهای رقیب برای تقطیر را بیاثر میکند
مدافعان دسترسی باز، استدلال میکنند که شرکتهای بزرگ آمریکایی در سالهای ابتدایی توسعه، اکوسیستم عظیمشان را با استخراج بیرویه و جمعآوری حجم وسیعی از دادههای دارای حق کپیرایت از پلتفرمهای عمومی و بدون کسب اجازه بنا کردهاند. حالا که رقیبی جدید با روش مشابه و بودجهای اندک مدلهای کارآمدی ارائه کرده است، با ابزارهای حقوقی و امنیتی غیرشفاف در پی حفظ انحصار خود هستند.
مدیران پروژههای متنباز چینی تأکید میکنند که در فاز پیشآموزش و ساخت پایههای اصلی سیستمهای خود، صرفاً از دادههای خزش وب طبیعی بهره بردهاند.
آیا مدلهای ارزان شرقی امنیت زیرساختها را تهدید میکنند؟
رقابت امروزی بر سر زیرساختهای محاسباتی بیشاز آنکه روندی خطی داشته باشد، به هزارتویی شباهت دارد که در آن، مرز میان نوآوری بومی، مهندسی معکوس و تقابلهای ژئواستراتژیک قابلتشخیص نیست.
حصارهای قانونی و معماریهای پیچیدهی دفاعی شاید بتوانند سرعت استخراج دادهها را در کوتاهمدت کنترل کنند؛ اما توقف کامل جریان اطلاعات در یک شبکهی جهانی پیوسته، امری دورازذهن بهنظر میرسد.
در سطح کاربران شخصی و شرکتی، مدل نوظهور GLM-5.2 شرکت Zhipu AI و مدلهای پیشین دیپسیک؛ شکاف فناورانهی چین با شرکتهای پیشتاز آمریکایی مانند اوپنایآی و آنتروپیک را کاهش دادهاند و به پذیرش گستردهی مدلهای چینی در بازارهای جهانی و کشورهای درحالتوسعه سرعت بخشیدهاند.
بااینحال جذابیت اقتصادی و عملکردی هوش مصنوعی چین، مستقیماً زیر سایهی سنگین تهدیدهای فزاینده در حوزهی امنیت سایبری قرار میگیرد. گزارشهای معتبر نشان میدهند که مدلهای هوش مصنوعی برخاسته از چین پتانسیل بالایی در ایجاد آسیبپذیریهای پنهان ساختاری دارند.
بههمین دلیل دولت آمریکا علاوهبر رگولاتوری چندوجهی، به سرمایهگذاریهای مستقیم روی آورده و بهمنظور حفظ برتری خود در جنگ سایبری با چین، بودجههای چندده میلیارددلاری به توسعهی مدلهای هوش مصنوعی دفاعی و حاکمیتی اختصاص داده است.
لااقل تا اینجای کار، موفقیت مدلهای چینی به ما میگویند بزرگترین سرورها یا قویترین پردازندههای خام مزیت انکارناپذیری برای شرکتها هستند؛ ولی اکوسیستمی در این رقابت پیروز میشود که بتواند قدرت تحلیل هوش مصنوعی را با کمترین هزینه و بیشترین آزادی، در اختیار هر توسعهدهندهای در هر گوشهی دنیا بگذارد.