فیلترینگ هوشمند، رؤیای امنیتی ناتمام

مانی امیرخانی - ایده فیلترینگ هوشمند در جمهوری اسلامی قرار است به جای مسدود کردن کامل یک سایت، محتویات صفحات سایت را پردازش کند؛ اما آیا این ایده عملی است؟

مانی امیرخانی

۲۸ اسفند ۱۳۹۳

۶ دقیقه

سانسور فراگیر اینترنت که در سال‌های اخیر و با اوج‌گیری اعتراضات سیاسی به یکی از متغیرهای اثرگذار ادبیات سیاسی کشور تبدیل شده، در حال گذر به یک مرحله جدید است.

دولت از شروع مرحله نخست طرحی به نام فیلترینگ هوشمند سخن می‌گوید. در این طرح به جای مسدود کردن کامل یک سایت، محتویات صفحات سایت پردازش شده و در صورت سازگار نبودن با الگوهای مورد پذیرش حکومت، از نمایش آن جلوگیری می‌شود.این اقدام به دلیل ناکارآمدی روش‌های پیشین فیلترینگ، ورود تلفن‌های هوشمند و امکانات ارتباطی جدید که اینترنت را در هر جا و برای همه‌کس قابل دسترس ساخته است مورد توجه دستگاه سانسور اینترنت قرار گرفته است.

شاخص زمان در فیلترینگ هوشمند

فیلترینگ هوشمند با مبنای تحلیل محتوای سایت‌ها از سال‌ها پیش در مراکز علمی و شرکت‌های تجاری مورد توجه قرار گرفته بود، اما به‌کارگیری روش تحلیل محتوا نیازمند برخورداری از بستر عملیاتی پرهزینه و تجهیزات سخت‌افزاری قابل توجه است.

برای فیلترینگ محتوایی، زمان شاخص مهمی است. تحلیل محتوا و تصمیم‌گیری برای نمایش یا عدم نمایش محتویات صفحات اینترنتی بایستی همزمان با درخواست کاربر برای دسترسی به این محتوا و مطابق با محتوای همان بخش درخواست شده و در همان زمان انجام شود.

فیلترینگ هوشمند

اجرای سانسور محتوایی در متون با کمترین چالش‌ها مواجه است و پیش از این نیز شرکت‌ها غربی و هم‌پیمانان چینی امکانات اجرای آن را در اختیار جمهوری اسلامی ایران قرار داده بودند.

همچنین دانش فنی اجرای پروژه‌های سانسور متن در ایران پیش از این نیز وجود داشته است.

اما بخش پر چالش فیلترینگ هوشمند تحلیل محتوایی تصاویر، فیلم، و صدا است که بخش غالب اینترنت بوده و دقیقاً همین قسمت مورد توجه حکومت نیز هست.

فرآیند فیلترینگ هوشمند عبارت است از بهره‌گیری از نتایج یک (یا چند) اقدام اساسی زیر:

۱- ایجاد فهرست سیاه دامنه (نام‌های) اینترنتی؛

۲- کنترل دسترسی‌ها در سطح دروازه‌های ورودی اینترنت کشور؛

۳- کنترل دسترسی‌ها در سطح مناطق جغرافیایی؛

۴- کنترل دسترسی‌ها متناسب با نوع وسیله ارتباطی (رایانه، تلفن هوشمند،...)؛

۵- کنترل دسترسی‌ها در سطح شرکت‌ها و مراکز عرضه‌کننده خدمات اینترنتی؛

۶- تحلیل محتوای عمومی صفحات مورد درخواست کاربر و

۷- تحلیل اجزای صفحات.

فیلترکردن تصاویر

آنچه به‌طور عمده مد نظر حکومت است، تصاویر برهنه زنان است. در تحلیل و رتبه‌بندی تصاویر تأکید بر شناسایی سطوح رنگی قابل تفکیک است. در این روش ترکیبات رنگی تصویر تحلیل شده و سطوح به‌هم‌پیوسته مشخص می‌شود، سپس با استفاده از الگوهای آماری احتمال وجود بدن برهنه در تصویر تخمین زده می‌شود.

پیاده‌سازی الگوریتم‌های پردازش تصویر و تحلیل آماری با روش‌های هوش مصنوعی انجام‌شده و به سخت‌افزار مناسب و سرعت بالا در اجرای عملیات نیاز دارد.

به این ترتیب کاربر پس از درخواست دسترسی به یک صفحه، علاوه بر انتظار برای دریافت پاسخ از سرور اصلی آن صفحه، و انتظار برای دریافت محتوا (بر اساس سرعت دسترسی به شبکه)، باید در انتظار تحلیل همه تصاویر صفحه درخواستی توسط سامانه فیلترینگ جمهوری اسلامی نیز بماند. این ارتباط را به شدت کند می‌کند.

گرچه آزمایش عملی بر روی نمونه‌های تجاری نرم‌افزارهای رتبه‌بندی تصاویر نشان می‌دهد که این روش قابل اجرا و به میزان قابل قبولی قادر به تفکیک تصاویر است، اما در این میان چند مانع بزرگ وجود دارد:

الف) زمان اختصاص‌یافته به پردازش هر تصویر همچنان اعدادی بیش از ثانیه را نشان می‌دهد.

ب) صفحات اینترنتی بیش از پیش وابسته به تصاویر است و تحلیل همه تصاویر یک صفحه (در مقایسه با توقعات عمومی از اینترنت) بسیار زمان‌بر است.

ج) افزایش شمار کاربران همزمان شبکه، به نحو چشمگیری بر ابعاد حجم پردازشی که بایستی در بخش فیلترینگ انجام شود می‌افزاید.

د) الگوی مورد نظر جمهوری اسلامی برای رتبه‌بندی تصاویر با الگوی عمومی که این نرم‌افزارها شناسایی می‌کنند تفاوت‌های بسیاری دارد.

فیلترینگ هوشمند اینترنت و معضل کاهش سرعت

شواهد حاکی است که طرح جاری فیلترینگ هوشمند اینترنت در ایران به سه روش عمل می‌کند:

۱- تشخیص قابل قبول بودن یا نبودن مطالب؛

۲- وارد کردن مشخصات موارد مردودی در فهرست سیاه؛

۳- مقایسه درخواستهای کاربران با فهرست موجود (در صورتیکه موردی پیش از این تحلیل شده باشد، نتیجه بلافاصله اعمال می‌گردد؛ در غیر اینصورت محتوای مورد نظر وارد فرآیند تحلیل شده و پس از تحلیل به فهرست موارد شناسایی اضافه و نتیجه به کاربر برگردانده می‌شود).

گرچه این نوع پیاده‌سازی از بار عملیات شناسایی می‌کاهد اما کاربر همچنان منتظر مقایسه درخواستش با فهرست سیاه می‌ماند. این فهرست هر لحظه در حال تغییر و گسترش است و معمولاً نگهداری و به‌هنگام‌سازی این نوع فهرست‌ها خود چالش بزرگ دیگری را می‌آفریند. تا آنجا که پس از مدتی کوتاه، زمان صرف‌شده برای جست‌وجوی یک مورد تحلیل‌شده، بیش از زمان لازم برای تحلیل کامل همان مورد می‌شود.

الگوی تشخیص در فیلترینگ هوشمند

اگر سیستم سانسور در ایران بتواند بر چالش کاهش فراوان سرعت پاسخ‌دهی فائق آید، موضوع الگوی تشخیص همچنان یک مشکل بزرگ است.

همواره مشکلاتی در تشخیص سطوح رنگی وجود دارد. به این معنا که آیا هر سطحی که دارای یک طیف رنگی مشابه پوست بدن انسان است الزاماً نمایانگر بدن لخت است؟ اگر تصویر شامل نمای کامل هیکل یک شیر در میان جنگل باشد چطور؟

نگاه گذرا به یک نمونه تحلیل تصویر که به صورت آنلاین انجام‌شده نشان می‌دهد دو تصویری را که یقیناً از دید جمهوری اسلامی به عنوان تصویر خلاف اخلاق رده‌بندی می‌شود با اطمینان بالای ۹۰% فاقد برهنگی تشخیص داده است.

تشخیص تصاویر با کیفیت پایین و یا عکس‌برداری شده در شب با اشکالاتی همراه است. از طرف دیگر بسیاری از تصاویری که شامل بخش‌های عریان بدن نیست، در الگوی مورد استفاده سیستم سانسور در ایران، به‌منزله تصاویر تحریک‌کننده رده‌بندی شده است. نرم‌افزارهای فعلی مورد استفاده سیستم فیلترکردن اینترنت در ایران (دست کم با فناوری شناخته شده فعلی) قادر به تفکیک این نوع تصاویر نیستند.

تشخیص صدا نیز چالش‌های خاص خود را دارد. حتی با فرض غلبه بر مشکلات سرعت و زیرساخت‌های مورد نیاز، وجود گویش‌ها مختلف در زبان فارسی چالش‌های بزرگی را می‌آفریند. همین فیلترینگ هوشمند فیلم‌ها را هم به یک مأموریت غیر ممکن یا دست‌کم رؤیایی بدل می‌سازد. (در این زمینه لازم است نگاهی کوتاه به گزارش چالش‌هایی که شرکت مایکروسافت برای تهیه نرم‌افزار ترجمه همزمان مکالمات اسکایپ داشته است بیندازید).

نمونه دیگری از تصویری که از زیر نرم افزارهای جست‌وجو برهنگی که مورد استفاده جمهوری اسلامی است، «در می‌رود».

فیلترینگ هوشمند فعلا ممکن نیست

پرسش بزرگ این است که:

۱- آیا در حال حاضر فناوری لازم برای فائق آمدن بر همه این چالش‌ها در اختیار بخش دولتی و خصوصی ایران قرار دارد؟

۲- آیا دولت توان تأمین هزینه‌ها و مدیریت پیاده‌سازی این روندها را دارد؟

۳- اجرای این طرح با چه هزینه‌ای عملی است و در نهایت در مقایسه با هزینه چه چیزی به دست می‌آید؟

نگاه گذرا به یک نمونه تحلیل تصویر که به صورت آنلاین انجام‌شده نشان می‌دهد دو تصویری را که یقیناً از دید جمهوری اسلامی به عنوان تصویر خلاف اخلاق رده‌بندی می‌شود با اطمینان بالای ۹۰% فاقد برهنگی تشخیص داده است. حتی اگر تغییر پارامترهای کلیدی الگوریتم‌های محاسبه این عدد را تغییر دهد اما فاصله نتایج تا سطح مورد نظر ماشین سانسور جمهوری اسلامی همچنان بسیار زیاد است.

دستیابی به فیلترینگ هوشمند در شرایط حاضر عملی نیست و این رؤیای امنیتی با ضرب‌الاجل‌های دادستان کل جمهوری اسلامی عملی نمی‌شود.

پس از اعلام اجرای فیلترینگ هوشمند صفحات سایت‌ها در ایران کندتر باز شده و بخش‌های پشتیبانی شرکت‌های خدمات اینترنتی در هفته‌های اخیر با انبوه تماس کاربران مواجه هستند. اینک کاربران به جای دیدن اخطارهایی که در سال‌های گذشته نشان از مسدود بودن سایت‌ها داشت با صفحات خالی مواجه می‌شوند. شاید هوشمندی طرح فیلترینگ اخیر در همین تغییر باشد.

[۱] Nudity detection API پیاده شده توسط sightengine.com

در همین زمینه:

شبکه اینترنت و معضل عبور از فیلترینگ

چرا فیلترینگ نرم‌افزارهای پیام‌رسان متوقف شد؟

اختلاف دستگاه قضائی با وزارت ارشاد بر سر فیلترینگ

نرم‌افزار عبور از فیلترینگ رادیو زمانه

آرشیو مطالب مرتبط با امنیت اینترنت، امن‌گذر، را از اینجا بخوانید.

دانش و فناوری

توضیح بیشتر در مورد اینکه چطور از ما حمایت کنید

نظرها

محمود
۲۸ اسفند ۱۳۹۳، ۸:۳۱
سلام لطفا نرم افزاري براي دسترسي سايت براي آي فون معرفي كنيد ممنون
مهدی
۶ فروردین ۱۳۹۴، ۱۹:۲۱
مقاله مفید و دقیقی بود، تا به حال چنین مطلبی درباره فیلترینگ ندیدم. خوب پنبه ادعاهای حکومت را زدید