فیلترینگ هوشمند، رؤیای امنیتی ناتمام
مانی امیرخانی - ایده فیلترینگ هوشمند در جمهوری اسلامی قرار است به جای مسدود کردن کامل یک سایت، محتویات صفحات سایت را پردازش کند؛ اما آیا این ایده عملی است؟
سانسور فراگیر اینترنت که در سالهای اخیر و با اوجگیری اعتراضات سیاسی به یکی از متغیرهای اثرگذار ادبیات سیاسی کشور تبدیل شده، در حال گذر به یک مرحله جدید است.
دولت از شروع مرحله نخست طرحی به نام فیلترینگ هوشمند سخن میگوید. در این طرح به جای مسدود کردن کامل یک سایت، محتویات صفحات سایت پردازش شده و در صورت سازگار نبودن با الگوهای مورد پذیرش حکومت، از نمایش آن جلوگیری میشود.این اقدام به دلیل ناکارآمدی روشهای پیشین فیلترینگ، ورود تلفنهای هوشمند و امکانات ارتباطی جدید که اینترنت را در هر جا و برای همهکس قابل دسترس ساخته است مورد توجه دستگاه سانسور اینترنت قرار گرفته است.
شاخص زمان در فیلترینگ هوشمند
فیلترینگ هوشمند با مبنای تحلیل محتوای سایتها از سالها پیش در مراکز علمی و شرکتهای تجاری مورد توجه قرار گرفته بود، اما بهکارگیری روش تحلیل محتوا نیازمند برخورداری از بستر عملیاتی پرهزینه و تجهیزات سختافزاری قابل توجه است.
برای فیلترینگ محتوایی، زمان شاخص مهمی است. تحلیل محتوا و تصمیمگیری برای نمایش یا عدم نمایش محتویات صفحات اینترنتی بایستی همزمان با درخواست کاربر برای دسترسی به این محتوا و مطابق با محتوای همان بخش درخواست شده و در همان زمان انجام شود.
فیلترینگ هوشمند
اجرای سانسور محتوایی در متون با کمترین چالشها مواجه است و پیش از این نیز شرکتها غربی و همپیمانان چینی امکانات اجرای آن را در اختیار جمهوری اسلامی ایران قرار داده بودند.
همچنین دانش فنی اجرای پروژههای سانسور متن در ایران پیش از این نیز وجود داشته است.
اما بخش پر چالش فیلترینگ هوشمند تحلیل محتوایی تصاویر، فیلم، و صدا است که بخش غالب اینترنت بوده و دقیقاً همین قسمت مورد توجه حکومت نیز هست.
فرآیند فیلترینگ هوشمند عبارت است از بهرهگیری از نتایج یک (یا چند) اقدام اساسی زیر:
۱- ایجاد فهرست سیاه دامنه (نامهای) اینترنتی؛
۲- کنترل دسترسیها در سطح دروازههای ورودی اینترنت کشور؛
۳- کنترل دسترسیها در سطح مناطق جغرافیایی؛
۴- کنترل دسترسیها متناسب با نوع وسیله ارتباطی (رایانه، تلفن هوشمند،...)؛
۵- کنترل دسترسیها در سطح شرکتها و مراکز عرضهکننده خدمات اینترنتی؛
۶- تحلیل محتوای عمومی صفحات مورد درخواست کاربر و
۷- تحلیل اجزای صفحات.
فیلترکردن تصاویر
آنچه بهطور عمده مد نظر حکومت است، تصاویر برهنه زنان است. در تحلیل و رتبهبندی تصاویر تأکید بر شناسایی سطوح رنگی قابل تفکیک است. در این روش ترکیبات رنگی تصویر تحلیل شده و سطوح بههمپیوسته مشخص میشود، سپس با استفاده از الگوهای آماری احتمال وجود بدن برهنه در تصویر تخمین زده میشود.
پیادهسازی الگوریتمهای پردازش تصویر و تحلیل آماری با روشهای هوش مصنوعی انجامشده و به سختافزار مناسب و سرعت بالا در اجرای عملیات نیاز دارد.
به این ترتیب کاربر پس از درخواست دسترسی به یک صفحه، علاوه بر انتظار برای دریافت پاسخ از سرور اصلی آن صفحه، و انتظار برای دریافت محتوا (بر اساس سرعت دسترسی به شبکه)، باید در انتظار تحلیل همه تصاویر صفحه درخواستی توسط سامانه فیلترینگ جمهوری اسلامی نیز بماند. این ارتباط را به شدت کند میکند.
گرچه آزمایش عملی بر روی نمونههای تجاری نرمافزارهای رتبهبندی تصاویر نشان میدهد که این روش قابل اجرا و به میزان قابل قبولی قادر به تفکیک تصاویر است، اما در این میان چند مانع بزرگ وجود دارد:
الف) زمان اختصاصیافته به پردازش هر تصویر همچنان اعدادی بیش از ثانیه را نشان میدهد.
ب) صفحات اینترنتی بیش از پیش وابسته به تصاویر است و تحلیل همه تصاویر یک صفحه (در مقایسه با توقعات عمومی از اینترنت) بسیار زمانبر است.
ج) افزایش شمار کاربران همزمان شبکه، به نحو چشمگیری بر ابعاد حجم پردازشی که بایستی در بخش فیلترینگ انجام شود میافزاید.
د) الگوی مورد نظر جمهوری اسلامی برای رتبهبندی تصاویر با الگوی عمومی که این نرمافزارها شناسایی میکنند تفاوتهای بسیاری دارد.
فیلترینگ هوشمند اینترنت و معضل کاهش سرعت
شواهد حاکی است که طرح جاری فیلترینگ هوشمند اینترنت در ایران به سه روش عمل میکند:
۱- تشخیص قابل قبول بودن یا نبودن مطالب؛
۲- وارد کردن مشخصات موارد مردودی در فهرست سیاه؛
۳- مقایسه درخواستهای کاربران با فهرست موجود (در صورتیکه موردی پیش از این تحلیل شده باشد، نتیجه بلافاصله اعمال میگردد؛ در غیر اینصورت محتوای مورد نظر وارد فرآیند تحلیل شده و پس از تحلیل به فهرست موارد شناسایی اضافه و نتیجه به کاربر برگردانده میشود).
گرچه این نوع پیادهسازی از بار عملیات شناسایی میکاهد اما کاربر همچنان منتظر مقایسه درخواستش با فهرست سیاه میماند. این فهرست هر لحظه در حال تغییر و گسترش است و معمولاً نگهداری و بههنگامسازی این نوع فهرستها خود چالش بزرگ دیگری را میآفریند. تا آنجا که پس از مدتی کوتاه، زمان صرفشده برای جستوجوی یک مورد تحلیلشده، بیش از زمان لازم برای تحلیل کامل همان مورد میشود.
الگوی تشخیص در فیلترینگ هوشمند
اگر سیستم سانسور در ایران بتواند بر چالش کاهش فراوان سرعت پاسخدهی فائق آید، موضوع الگوی تشخیص همچنان یک مشکل بزرگ است.
همواره مشکلاتی در تشخیص سطوح رنگی وجود دارد. به این معنا که آیا هر سطحی که دارای یک طیف رنگی مشابه پوست بدن انسان است الزاماً نمایانگر بدن لخت است؟ اگر تصویر شامل نمای کامل هیکل یک شیر در میان جنگل باشد چطور؟
تشخیص تصاویر با کیفیت پایین و یا عکسبرداری شده در شب با اشکالاتی همراه است. از طرف دیگر بسیاری از تصاویری که شامل بخشهای عریان بدن نیست، در الگوی مورد استفاده سیستم سانسور در ایران، بهمنزله تصاویر تحریککننده ردهبندی شده است. نرمافزارهای فعلی مورد استفاده سیستم فیلترکردن اینترنت در ایران (دست کم با فناوری شناخته شده فعلی) قادر به تفکیک این نوع تصاویر نیستند.
تشخیص صدا نیز چالشهای خاص خود را دارد. حتی با فرض غلبه بر مشکلات سرعت و زیرساختهای مورد نیاز، وجود گویشها مختلف در زبان فارسی چالشهای بزرگی را میآفریند. همین فیلترینگ هوشمند فیلمها را هم به یک مأموریت غیر ممکن یا دستکم رؤیایی بدل میسازد. (در این زمینه لازم است نگاهی کوتاه به گزارش چالشهایی که شرکت مایکروسافت برای تهیه نرمافزار ترجمه همزمان مکالمات اسکایپ داشته است بیندازید).
فیلترینگ هوشمند فعلا ممکن نیست
پرسش بزرگ این است که:
۱- آیا در حال حاضر فناوری لازم برای فائق آمدن بر همه این چالشها در اختیار بخش دولتی و خصوصی ایران قرار دارد؟
۲- آیا دولت توان تأمین هزینهها و مدیریت پیادهسازی این روندها را دارد؟
۳- اجرای این طرح با چه هزینهای عملی است و در نهایت در مقایسه با هزینه چه چیزی به دست میآید؟
نگاه گذرا به یک نمونه تحلیل تصویر که به صورت آنلاین انجامشده نشان میدهد دو تصویری را که یقیناً از دید جمهوری اسلامی به عنوان تصویر خلاف اخلاق ردهبندی میشود با اطمینان بالای ۹۰% فاقد برهنگی تشخیص داده است. حتی اگر تغییر پارامترهای کلیدی الگوریتمهای محاسبه این عدد را تغییر دهد اما فاصله نتایج تا سطح مورد نظر ماشین سانسور جمهوری اسلامی همچنان بسیار زیاد است.
دستیابی به فیلترینگ هوشمند در شرایط حاضر عملی نیست و این رؤیای امنیتی با ضربالاجلهای دادستان کل جمهوری اسلامی عملی نمیشود.
پس از اعلام اجرای فیلترینگ هوشمند صفحات سایتها در ایران کندتر باز شده و بخشهای پشتیبانی شرکتهای خدمات اینترنتی در هفتههای اخیر با انبوه تماس کاربران مواجه هستند. اینک کاربران به جای دیدن اخطارهایی که در سالهای گذشته نشان از مسدود بودن سایتها داشت با صفحات خالی مواجه میشوند. شاید هوشمندی طرح فیلترینگ اخیر در همین تغییر باشد.
[۱] Nudity detection API پیاده شده توسط sightengine.com
در همین زمینه:
آرشیو مطالب مرتبط با امنیت اینترنت، امنگذر، را از اینجا بخوانید.
نظرها
محمود
سلام لطفا نرم افزاري براي دسترسي سايت براي آي فون معرفي كنيد ممنون
مهدی
مقاله مفید و دقیقی بود، تا به حال چنین مطلبی درباره فیلترینگ ندیدم. خوب پنبه ادعاهای حکومت را زدید