محققان یک حفره امنیتی به نام GPUHammer را کشف کردهاند که با دستکاری حافظه کارتهای گرافیک انویدیا، روند آموزش مدلهای هوش مصنوعی را بدون تغییر در کد یا دادهها، به طور پنهانی تخریب میکند. این حمله میتواند دقت یک مدل هوش مصنوعی را از ۸۰ درصد به کمتر از یک درصد کاهش دهد.
بر اساس گزارش Tom’s Hardware، گروهی از محققان دانشگاه تورنتو از یک حمله سختافزاری جدید به نام GPUHammer پردهبرداری کردهاند که میتواند به طور پنهانی و بدون دسترسی به کد یا دادههای ورودی، مدلهای هوش مصنوعی در حال اجرا روی کارتهای گرافیک انویدیا را تخریب کند. این حمله که نسخهای از آسیبپذیری شناختهشده «Rowhammer» برای پردازندههای گرافیکی است، دقت یک مدل هوش مصنوعی را از ۸۰٪ به کمتر از ۱٪ کاهش میدهد و زنگ خطری جدی برای امنیت زیرساختهای محاسباتی مدرن محسوب میشود.
این حمله روی کارت گرافیک حرفهای NVIDIA RTX A6000 با حافظه GDDR6 آزمایش شده است، اما طیف گستردهای از کارتهای گرافیک مبتنی بر معماریهای Ampere، Ada، Hopper و Turing، بهویژه مدلهای مورد استفاده در سرورها و ورکاستیشنها، در برابر آن آسیبپذیر هستند.
GPUHammer چیست و چگونه کار میکند؟
حفره امنیتی GPUHammer، نسخهای از آسیبپذیری Rowhammer است که پیش از این برای اخلال در روند پردازندههای مرکزی و حافظههای رم استفاده میشد. دراین نوع حملات، دسترسی مکرر و سریع به یک ردیف از سلولهای حافظه، باعث ایجاد تداخل الکتریکی در ردیفهای مجاور شده و منجر به تغییر ناخواسته تک بیتها (Bit Flip) در آنها میشود. این بیت تغییریافته میتواند بخشی از یک عدد، یک دستور یا وزنهای یک شبکه عصبی باشد و به تولید خروجی استباه در سیستم پردازشی را منجر شود.
حال محققان با اجرای موفق حمله GPUHammer ثابت کردند که این آسیبپذیری در حافظههای GDDR6 کارت گرافیک نیز وجود دارد. بخش نگرانکننده ماجرا این است که مهاجم برای اجرای این حمله نیازی به دسترسی به دادههای شما ندارد. کافی است در یک محیط ابری یا سرور اشتراکی، برنامه خودشان را روی همان پردازنده گرافیکی که شما نیز به صورت اشتراکی از آن استفاده میکنید، اجرا کند تا بتواند در عملکرد مدل هوش مصنوعی شما اختلال ایجاد نماید.
این حمله به طور خاص برای محیطهای چندکاربره مانند سرورهای ابری، خوشههای آموزش هوش مصنوعی و زیرساختهای دسکتاپ مجازی (VDI) یک تهدید جدی است.
توصیه انویدیا برای جلوگیری از حمله GPUHammer
انویدیا در واکنش به کشف این آسیبپذیری، راهکاری ساده را توصیه کرده است: فعالسازی قابلیت تصحیح خطا یا ECC. این ویژگی با افزودن بیتهای اضافی به حافظه، قادر به شناسایی و تصحیح خودکار خطاهایی مانند تغییر ناخواسته بیتها است. البته فعالسازی ECC بدون هزینه نیست و میتواند حدود ۱۰٪ کاهش عملکرد در پردازشهای یادگیری ماشین و کاهش ۶ تا ۶.۵ درصدی ظرفیت قابل استفاده حافظه VRAM را به همراه داشته باشد.
برای فعالسازی قابلیت تصحیح خطا میتوانید در ابزار خط فرمان انویدیا عبارت زیر را تایپ کنید:
nvidia-smi -e 1
همچنین فعال بودن ECC با دستور زیر قابل بررسی است:
nvidia-smi -q | grep ECC
خوشبختانه، پردازندههای گرافیکی جدیدتر مانند سری RTX 50 و H100 دارای قابلیت ECC داخلی روی خود تراشه هستند که این مشکل را به طور خودکار مدیریت میکنند. هرچند GPUHammer کاربران معمولی و گیمرها را مستقیماً تهدید نمیکند، اما این حمله یک هشدار جدی برای کل صنعت فناوری است. با افزایش وابستگی نرمافزارها و سرویسها به هوش مصنوعی، استفاده از قابلیتهای تصحیح خطای سختافزاری در حال تبدیل شدن به بخشی ضروری از هر سیستم کامپیوتری است.
نظرات کاربران