فیلترینگ هوشمند ملی

چند وقتی است (با اینترنت خانگی من / شرکت آسیاتک) بعضی عکسهای شاعران گنجور در دسترس نیستند:

گنجور

اگر روی عکسهای غیرقابل مشاهده کلیک راست کنید و View Image را بزنید متوجه می‌شوید که عکسهای مذکور فیلتر شده‌اند.

تجربه‌ی قبلی نشان داده که اگر این عکسها روی خود گنجور میزبانی کنم ماه به نصفه نرسیده پهنای باندش تمام می‌شود. دنبال سایت میزبانی عکس رایگانی می‌گردم که کاراییش خوب باشد (مثل tinypic) و هنوز فیلتر نشده باشد. شما سراغ ندارید؟ هر چند … با این هوشی که فیلترینگ ملی دارد از خودش نشان می‌دهد احتمالاً به زودی این مشکل هم با فیلتر شدن کامل گنجور (پاک شدن صورت مسأله 😉 ) حل می‌شود.

۸۸

همین پریروز از تعطیلات طولانی بیست روزه برگشته‌ام. دوری از اینترنت و کلاً کامپیوتر مزه داده و فعلاً چندان میلی به بازگشت به عادتهای پیش از عید ندارم. کلی ایمیل نخوانده دارم و … .

می‌دانید؟! مدتهاست که شبها پیش از خواب، راجع به کارهایی که قرار است انجام دهم فکر نمی‌کنم و برای آمدن فردا اشتیاق ندارم! شدیداً نیاز به تغییر دارم. امیدوارم امسال فرصت تغییر را بیابم و بتوانم از آن استفاده کنم.

سال نو مبارک!

۵۸۰۰

گوشیی را که قرار بود بخرم یک هفته یا بیشتر می‌شود که خریده‌ام. البته در خرید -به دلیل ناخرسندی از شلوغی خیابانها و میدان محل خرید!- کمی عجله کردم و گوشیی را خریدم که گارانتی معتبر نوکیا را ندارد -هر چند یکی از فروشگاههایی را برای خرید انتخاب کرده بودم که نامش در سایت نوکیا آمده بود- . در هر صورت فعلاً از خریدم چندان ناراضی نیستم، هر چند احتمال دارد به زودی پشیمان شوم.

گوشیی که من خریدم برای عرضه در بازار انگلستان ارائه شده بود و به همین خاطر از (تایپ) فارسی پشتیبانی نمی‌کرد. به همین لحاظ مجبور شدم کد محصول گوشی را عوض کنم (به این روش) و با کمک کدی که برای گوشیهای عرضه شده در ایران ارائه شده منو، صفحه کلید، تشخیص دستخط (حروف گسسته) و فرمانهای صوتی فارسی به آن اضافه شد.

چند قابلیت لازم را این گوشی در مقایسه با گوشی قبلیم ندارد، مثلاً ساعت را روی صفحه‌ی خاموشش نشان نمی‌دهد، امکان ضبط مکالمه را ندارد، فلاش دوربینش با کمک یک میانبر سریعاً به چراغ قوه تبدیل نمی‌شود و برنامه‌های پیش‌فرض برای کرونومتر و همینطور کنترل ماوس کامپیوتر یا پاورپوینت به وسیله‌ی بلوتوث را ندارد. با میان‌افزار اولیه‌ی گوشی (مخصوص انگلستان) نمی‌شد دوربین دوم را (در حالت عکس/فیلمبرداری) روشن کرد که با تغییر آن این قابلیت به آن اضافه شد. نرم‌افزارهای طرف کامپیوترش مزخرف و پراشکال هستند و تا به حال چندین بار خود گوشی هم قفل کرده. اما در کل قابلیتهایی همچون صفحه‌ی نسبتاً بزرگ تماسی آن و تشخیص دستخط و صفحه‌کلید کامل افقیش می‌تواند باعث شود از عیوب اولیه‌ی آن چشم‌پوشی کنم.

گوشی قابلیت پخش فیلم با فرمت MP4 را دارد و روی آن پیش‌پرده‌ی فیلم شوالیه‌ی تاریکی به عنوان یکی از فیلمهای نمونه در دسترس گذاشته شده. اگر فیلم را در دسترس دارید صحنه‌های مربوط به هنگ‌کنگ آن را بازبینی کنید. گوشیهای مرموزی که لوشس فاکس از آنها برای ارزیابی محل ربودن مجرم مورد نظر بتمن استفاده می‌کند نوکیا اکسپرس میوزیک ۵۸۰۰ هستند و این فیلم در واقع‌ پیش‌تبلیغی بوده برای این مدل از گوشیهای نوکیا.

نوکیا ۵۸۰۰ در فیلم شوالیه‌ی تاریکی
نوکیا ۵۸۰۰ در فیلم شوالیه‌ی تاریکی
نوکیا ۵۸۰۰ در فیلم شوالیه‌ی تاریکی

نوکیا ۵۸۰۰ در فیلم شوالیه‌ی تاریکی

خوراکی برای فیلمها

می‌دانید؟! شبها پیش از این که بخوابم، بیشتر وقتها، -دیگر فکر می‌کنم برایم عادت شده-، به طور ناخودآگاه یک لحظه چشمم را باز می‌کنم و تاریکی روبه‌رو را نگاه می‌کنم. فکر می‌کنم به این که الان کجا هستم، پارسال کجا بودم، چند سال پیش کجا بودم و آن وقتها دوست داشتم الان کجا باشم. می‌دانید؟! مثل برق دارد می‌گذرد روزها و ساعتها. نه این که واقعاً هدف مهمی داشته باشم و از نرسیدن به آن حسرت بخورم، نه! فقط دوست دارم این روزها و ساعتهایی را که پشت سر می‌گذارم ازشان یک خروجی، یک یادگاری داشته باشم. بدانم که این ساعتها را تلف نکرده‌ام. می‌دانید؟! گاهی فکر می‌کنم به این که اگر من، فردا، دیگر بیدار نشوم از دنیا چه چیزی کم می‌شود. آیا اصلاً اگر کل من و زندگی من را از فهرست آدمهایی که تا به حال آمده‌اند و رفته‌اند حذف کنند اتفاق مهمی می‌افتد؟! جواب تأسف‌آوری را که به آن می‌رسم احتمالاً خودتان می‌توانید حدس بزنید.

بگذریم! روی همان حساب پاراگراف اول دوست دارم خیلی از کارهایی را که می‌کنم -هر چند اهمیت چندانی نداشته باشند- مستند کنم. کارهایی با حداقل ارزش دیدن یک عکس خوب و دیدن یک فیلم. در راستای فعالیت دوم، افزونه‌ای را بر روی وردپرس نصب کرده‌ام که به من امکان ثبت فهرست فیلمهایی را که دیده‌ام می‌دهد (نشانی این افزونه). به کمک این افزونه می‌توان به کمک یک نشانک (بوکمارکلت) به آسانی دیدن فیلمها را ثبت کرد، علاوه بر آن، به آنها امتیاز داد و یک توضیح یا نقد کوچک راجع به آنها نوشت. نهایتاً فهرست فیلمها را در قالب یک صفحه‌ی مجزا و یک ابزارک وردپرس منتشر کرد. فهرست فیلمهایی را که تا به حال به کمک این افزونه دیده شدنشان را ثبت کرده‌ام اینجا ببینید.

فیلمهایی که دیده‌ام

فکر می‌کنم یک سال و نیمی هست که من این افزونه را نصب کرده‌ام و از آن زمان تا حالا این افزونه چندان تغییری نکرده و به‌روزرسانی عمده‌ای برای آن ارائه نشده. به همین لحاظ این افزونه نقصهایی هم دارد. یکی از نقصهای آن عدم ارائه‌ی خروجی آر.اس.اس (خوراک) است.

امروز به نظرم رسید که خروجی خوراکی برای این افزونه درست کنم و آن را به حساب کاربری فرندفیدم اضافه کنم. کمی جستجو کردم و کدی که در ادامه می‌بینید نتیجه‌ی این جستجوهاست. اگر بخواهید برای وردپرس خروجی خوراک بدلخواه درست کنید باید از چنین ساختاری استفاده کنید. خروجی نهایی یک افزونه‌ی ساده است. با امید این که نویسنده‌ی اصلی این افزونه بالاخره روزی خروجی خوراک را به آن اضافه خواهد کرد تمام چیزهایی را که می‌توانستند «انتخابی» باشند در متن کد گذاشته‌ام (عنوان خوراک، نشانی، تعداد و …) و اگر خواستید از آن استفاده کنید باید این موارد را ویرایش کنید. ضمن آن که افزونه‌ی امتیازدهی به فیلمها در وبلاگ من در پوشه‌ی wp_movie_ratings نصب شده و افزونه‌ی نوشته شده توسط من برای این که درست کار کند باید در ریشه‌ی پوشه‌ی افزونه‌ها قرار گیرد و اگر غیر از این می‌خواهید باشد باید آن را ویرایش کنید.

ادامه خواندن “خوراکی برای فیلمها”

حدیث نفس!

شما از تلفن همراهتان چه استفاده‌ای می‌کنید؟ بیشتر صحبت می‌کنید؟ پیامک می‌فرستید؟ یا …؟! این نمودار را ببینید:

از گوشی موبایلم چه استفاده‌ای می‌کنم

نمودار را از سایت گراف جم برداشته‌ام، از این صفحه. ایده‌ی این سایت آن است که بازدیدکنندگان و علاقمندان به سایت با کمک ابزارهای آن نمودارهای طنزآمیز و خنده‌دار درست کنند. بگذریم!

دو یا سه هفته پیش من گوشی موبایلم را (روشن و در حال کار) با ماشین لباسشویی شستم و بعد از آبکشی، از جیب کاپشنم بیرونش آوردم.

توصیه‌ی اقتصادی: اگر شما هم بلای مشابهی سر گوشیتان آوردید، اولین کاری که می‌کنید این نباشد که سعی کنید روشنش کنید تا ببینید کار می‌کند یا نه. سعی کنید بگذارید به اندازه‌ی کافی خشک شود، بعد …

به هر حال، توصیه‌ی بالایی حاصل جستجوهای بعد از واقعه -به دنبال راه علاج- است و من دقیقاً اولین کاری که بعد از بیرون آوردن آن از جیب کاپشنم کردم روشن کردن آن بود! روشن شد، البته فقط فلاش دوربینش. بعد از آن یکی دو باری گوشی را باز و بسته کردم. همه جایش را خشک کردم و امتحانهای مجدد، نتیجه‌ای جز حداکثر همان روشن شدن فلاش دوربین یا چراغ مادون قرمز نداشت. باتری را به کمک فلاش دوربین کاملاً خالی کردم. اما بعد از آن دیگر گوشی باتری را شارژ نکرد …، کم کم به فکر تعمیرکار افتاده‌ام و البته به دنبال آن وسوسه‌ی خرید یک گوشی جدید یقه‌ام را محکم گرفته و دستش را توی جیبم کرده این روزها و من ضعیف‌النفس به زودی احتمالاً در برابرش تسلیم خواهد شد و … .

در هر صورت، در این مدت نبود گوشی موبایل را من به صورت متفاوتی احساس کرده‌ام. من با «تلفن» موبایل خیلی کمتر از حد متعارف سر و کار داشته‌ام و دارم. می‌دانید؟! نبود گوشی، در گام اول، باعث شد -بعد از مدتها- سراغ ساعت زنگدار قدیمیم بروم و تازه بفهمم زنگ آن چندان مطمئن کار نمی‌کند. هر چند، همان پیشترها هم صبحها معمولاً چند دقیقه پیش از این که موبایلم زنگ بزند از خواب بیدار می‌شدم. الان هم همینطور است! با این تفاوت که این روزها با خیال راحت تا صبح، یکسره نمی‌خوابم و معمولاً نیم ساعت یا یک ساعت پیش از ساعت مقرر بیدارم.

مشکل دیگر، مربوط به پخت و پز است و زمانهایی که باید طول بکشد تا مرحله‌ی بعدی پختن را انجام دهم. برای این کار یک زمانسنج ویندوزی داونلود کردم که چندان ازش خوشم نیامد. این چند وقته، یا از این ساعت زنگی آنلاین استفاده می‌کرده‌ام یا زمان شروع هر مرحله را روی کاغذ می‌نوشته‌ام تا حواسم به کارم باشد.

لیست خریدها (چند بار رفته‌ام برای خرید یک چیز خاص، یادم نیامده چه می‌خواستم بخرم، کلی آت و آشغال اضافی خریده‌ام، برگشته‌ام و متوجه شده‌ام آن چیز ضروری بین لیست خریدهایم نیست!)، موعد پرداخت هزینه‌ی اینترنت، موعد اجاره‌خانه و … ! می‌دانید؟! من به یک گوشی موبایل احتیاج دارم، البته احتمالاً فقط به یک «گوشی» موبایل!

به هر حال، وبگردی درباره‌ی گوشیها را شروع کرده‌ام. این روزها صفحه‌های لمسی و جی.پی.اس متداول شده و من هم تقریباً مصمم هستم که -اگر خواستم بخرم- این بار یک گوشی حائز این قابلیتها و «سیستم‌عامل‌دار» بخرم، ترجیحاً ویندوزی، اما با بودجه‌ای که در نظر گرفته‌ام احتمالاً معقول‌ترین گزینه نوکیا ۵۸۰۰ اکسپرس میوزیک است که سیمبینی است. شاید هم بر وسوسه‌ی پرخرجم غلبه کردم و همان گوشی آب کشیده را فرستادم تعمیر، تا ببینم چه می‌شود.

مدتهاست که دستی به سر و روی اینجا (گزیر) نکشیده‌ام. چیدمان صفحات در اینترنت اکسپلورر ۸ (نسخه‌ی کاندیدای انتشار) به هم ریخته است (هر چند html و css صفحات استاندارد است) و سر فرصت باید صفحه‌ی برگزیده‌ها را بروز کنم.

علی‌الحساب امروز تقریباً تمام وقتم به بازسازی بایگانی سایت شرکت منحله‌ی سابقم گذشت (با توجه به آن که از پایگاه داده‌های وبلاگش پشتیبانی نداشتم – یا به احتمال قوی‌تر داشتم و نیافتم- نوشته‌هایش را یکی یکی از روی یک نسخه‌ی داونلود شده کپی کردم و بعضی نوشته‌هایش را هم بی‌خیال شدم).

بایگانی سایت شرکت منحل شده‌ی کارا

پیش‌تر بخش دیگری از یادگاریهای قدیمیم را (سایت شخصی) به اینجا انتقال داده بودم. منوی «آثار دیگر» را به «بخشهای دیگر» تغییر نام دادم و این زیرسایتها را از طریق آن در دسترس گذاشتم.

خوراک تازه‌های گنجور را که پیش‌تر به کمک این سرویس با خوراک گزیر مخلوط کرده بودم جدا می‌کنم. بنابراین اگر مشترک گزیر هستید دیگر «تازه‌های گنجور» را دریافت نمی‌کنید. در صورتی که مایل به دنبال کردن «تازه‌های گنجور» هستید مشترک خوراک مستقل آن شوید.

صنعت حل کپچای هند و راه‏حلهای مقابله با اسپم با تکیه بر تحلیل محتوا

تا به اینجا رسیدیم که کپچای تصویر متنی را با او.سی.آر به شکل ماشینی دور می‌زنند و به همین دلیل روشهای متفاوتی برای طراحی کپچا ارائه شده است. جالب است بدانیم که این روزها شرکتها و مراکزی وجود دارند که قیمتهای استاندارد (!) برای شکستن کپچای سایتهای مختلف ارائه می‌کنند. به عنوان نمونه این تکه‌ای از لیست قیمت یک شرکت متخصص شکستن کپچاهای سایتهای چینی است (منبع عکس):

لیست قیمت شکستن کپچا

ماجرا محدود به کپچاهای تصویری هم نمی‌شود، کپچاهای صوتی هم توسط نرم‌افزارهای کامپیوتری -گویا به آسانی- قابل عبور هستند (در این نشانی مقاله‌ای تفصیلی درباره‌ی نحوه‌ی عبور از کپچای صوتی جیمیل بخوانید). کپچاهای تصویر متنی شرکتهای بزرگ (مایکروسافت، یاهو و گوگل) به دلیل تعداد کاربران بالا و همچنین اعتبار ایمیلهای ارسالی از آنها برای نرم‌افزارهای مبارزه با هرزنامه‌ها بارها و بارها شکسته شده‌اند (اینجا را ببینید).

اما کپچاهای ابتکاری چه؟! آیا مقاومت کپچاهای ابتکاری (کپچای محاسباتی، کپچای سه‌بعدی، سگ و گربه‌ی رپیدشر و ) بیشتر نیست؟ آیا نرم‌افزارهای ارسال انبوه اسپم از این کپچاها هم می‌توانند عبور کنند؟

تا اینجا و با توجه به سرمایه‌گذاریهای قابل توجه ارسال کنندگان اسپم روی کارشان باید به این نتیجه رسیده باشید که در این «شغل» آنقدر «پول» هست که نه تنها اجازه‌ی استفاده از راهبردهای «تحقیق و توسعه» را برای شکستن سدهای پیش رو به آنها می‌دهد بلکه احتمالاً این درآمدها می‌تواند آنقدر زیاد باشد که حاضر باشند برای حل مشکلات پیش‌رو مستقیماً و عملاً نیروی انسانی در اختیار بگیرند و از کمک نیروهای کار ارزانقیمت کشورهای در حال توسعه استفاده کنند.

به پشتوانه‌ی سرمایه‌ی ارسال کنندگان اسپم در کشورهایی مانند هند شاهد ظهور یک صنعت درآمدزای بدیع هستیم: «صنعت حل کپچا»! اتاقهایی با بیست الی سی اپراتور که در ازای دستمزدهایی همچون «هر ۱۰۰۰ کپچا ۲ دلار» ساعتهای کاری خود را با بازخوانی کپچاها می‌گذرانند. فرایند کار به این صورت است که نرم‌افزار ارسال اسپم تصویر کپچا را جدا می‌کند، به یکی از اپراتورها می‌دهد، اپراتور مقدار آن را درج و ارسال می‌کند و نرم‌افزار، اسپمش را ارسال می‌کند. با این سیستم کاری، شرکتهای حل کپچای هندی ادعای حل روزانه تا ۵۰۰۰۰ کپچا یا بیشتر را به مدد چند ده کامپیوتر و اپراتور، و شیفتهای کاریی که ۲۴ ساعت ۷ روز هفته را پوشش می‌دهند دارند (برای کسب اطلاعات بیشتر اینجا را ببینید).

نمایی از نرم‌افزارهای حل کپچا با کمک اپراتورهای انسانی

اینجاست که کارکرد کپچا برای جلوگیری از ارسال انبوه اسپم زیر سؤال می‌رود، چرا که کپچا برای حل این معضل، مبتنی بر این ایده است که ارسال‌کنندگان انبوه اسپم ماشین هستند و با تشخیص انسان از ماشین می‌توان جلوی ارسال انبوه اسپم را گرفت. و در اینجا حداقل بخش سخت‌تر کار را انسانها انجام می‌دهند.

دسته‌ی دیگری از راه‌حلهای مقابله با اسپم بر «تحلیل متون ارسالی» مبتنی هستند. مقایسه‌ی آی.پی ارسال‌کننده با لیست سیاه ارسال‌کنندگان اسپم شناخته شده، شمارش تعداد لینکهای موجود در متون و جستجوی نشانی سایتهای اسپم در بین آنها، بررسی محتوای متن و جستجوی واژه‌های متداول موجود در متون اسپم در متن ارسالی (یک آمار جالب در این زمینه را در این تصویر ببینید) از جمله ترفندهای به کار گرفته شده در این روش هستند. معمولاً برای جلوگیری از دور زدن شدن آسان الگوریتمها و روشهای مورد استفاده در این راه‌حلها بخش عمده‌ای از این روشها منتشر نمی‌شوند و تنها ابزارهای ارتباطی به صورت کدباز در اختیار استفاده‌کنندگان قرار می‌گیرند. «اکیسمت» سیستم مقابله با نظرات هرز که در وردپرس و برخی دیگر از سیستمهای مدیریت محتوی به کار گرفته شده است از جمله ابزارهای مبتنی بر این روش است.

این احتمالاً آخرین قسمت سری مطالبی بود که درباره‌ی «اسپم» نوشته‌ام. فهرست نوشته‌های این سری:

قسمت اول: ریشه‌ی نام اسپم

قسمت دوم: هرزنامه‌ها

قسمت سوم: کدامیک هرزنامه‌های بیشتری می‌گیرند: «علی» یا «زهرا»؟

قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!

قسمت پنجم: درآمدزایی هرزنامه‌ها

قسمت ششم: ماشینهای صاحب‌نظر

قسمت هفتم: کپچا: «تو آدمی؟!»

قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن

قسمت نهم: صنعت حل کپچای هند و راه‌حلهای مقابله با اسپم با تکیه بر تحلیل محتوی

این برنامه‏نویسهای بامزه

پیغام اکیسمت

«گوشت خوک» توی وبلاگ من چه غلطی می‌کنه؟ من گیاهخوارم!

وردپرس وبلاگم را به‌روز کردم، داشتم دوری در محیط جدید می‌زدم که در قسمت آمارهای اکیسمت این جمله را دیدم (وردپرس -قابل دریافت از این نشانی– سیستم مدیریت وبلاگ من است و اکیسمت افزونه‌ای برای وردپرس است که جلوی نظرات هرز را می‌گیرد). طراحان اکیسمت در برابر «اسپم» (=نظرات هرز که اتفاقاً نام نوعی خوراکی هم هست) واژه‌ی «هم» (=گوشت خوک) را برای نظرات واقعی و غیرهرز گذاشته‌اند و خوب! در متن کوتاهی با عنوان بامزه‌ی بالایی جریان را توضیح داده‌اند.

برنامه‌نویسها -حتی اگر ذاتاً آدمهای بامزه‌ای نباشند- معمولاً مجال زیادی برای کارهای -ظاهراً- بامزه دارند که متأسفانه – یا خوشبختانه- خیلی از این مزه‌پراکنیها را کاربر نهایی نرم‌افزار نمی‌بیند و در سطح کد باقی می‌ماند. اگر برنامه‌نویس ویژوال سی بوده باشید -از نوع قدیمی‌ترهایش- احتمالاً مقالات و نمونه‌کدهای پل دیلاسیا را دیده‌اید و خوانده‌اید و با توضیحات توأم با شوخیش برخورد کرده‌اید (تلفظ درست اسم این آقا را -اگر کسی می‌داند- بگوید، بیشتر از این آبرویمان نرود). امضای او در میان فایلهای برنامه‌هایش این است: «اگر این کد کار کرد پل دیلاسیا آن را نوشته و اگر نه، من نمی‌دانم چه کسی آن را نوشته!» خوب! ممکن است چندان بامزه به نظر نرسد، اما قبول کنید که وقتی چند ده دقیقه به صفحه‌ی مانیتور خیره شده‌اید و کلی کد مزخرف بی‌ربط به اتفاقی که نهایتاً قرار است بیفتد را خوانده‌اید و هنوز هیچ چی نفهمیده‌اید دیدن جمله‌ی

Stop beating your head, you might hurt yourself!

از هر جوکی که ممکن است فکرش را بکنید خنده‌دارتر به نظر می‌رسد (و البته واقعاً کمک می‌کند که به خودتان کمتر صدمه بزنید). بعضی جملات بامزه‌ی معروف دیلاسیا را اینجا بخوانید.

البته بعضی وقتها کارهای بامزه‌ی برنامه‌نویسها عمداً یا اشتباهاً در دیدرس کاربر نهایی قرار می‌گیرد. مثلاً این یکی از پیغامهای یکی از ویرایشهای وین‌امپ است که زمانی معروف شده بود و حرفش در اینترنت پیچیده بود (منبع عکس):

پیغام با مزه‌ی وین امپ

«… . این اتفاق در واقع هرگز نباید بیفتد!»

برنامه‌نویسان وردپرس پیش از این هم کارهای بامزه -و این یکی واقعاً بامزه- کرده‌اند. اگر وبلاگ مبتنی بر وردپرس دارید (ویرایش ۲.۶ یا ۲.۷)، صفحه‌ی ویرایش یک مطلب قدیمی را بیاورید. از کادر «Post Revisions» (بازنگریهای نوشته) موردی را انتخاب کنید و سپس آن مطلب را با خودش مقایسه کنید. تصاویر زیر نشان دهنده‌ی بخشی از اتفاقی است که بعد از این کار می‌افتد:

ماتریکس وردپرس

او.سی.آر: قاتل کپچای تصویر متن

کپچای تصویر متن که روزگاری جلیقه‌ای ضدگلوله در برابر حملات نرم‌افزارهای هرزپراکنی به شمار می‌آمد دیگر چنین وضعیتی ندارد. برنامه‌نویسی در سال ۲۰۰۵ با طراحی یک سیستم ساده‌ی او.سی.آر نشان داد که عبور از سپر کپچای تصویر متن کار چندان سختی نیست (علاقمندان اینجا را ببینند) و به مرور نرم‌افزارهای هرزپراکنی واقعی نیز کمابیش به این قابلیت مجهز شدند. افزایش نویز و در هم ریختن تصاویر کپچاها باعث نارضایتی بیشتر کاربران شد و به مرور عده‌ای به فکر راه‌حلهای متفاوت افتادند. راه‌حلهایی که گاه بیش از حد متفاوت به نظر می‌رسند، آنچنانکه بر خلاف هدف اولیه‌ی کپچا، اغلب باعث ایجاد شبهه در مورد هویت موجودی که توانسته آنها را حل کند می‌شوند: گاه انسان نمی‌تواند برخی از این معماهای پیچیده را حل کند و مسلماً آنچه جواب این معما را پیدا کرده یک ماشین بوده!

یکی از طرحهای ارائه شده کپچای تصویر سه‌بعدی است. در این نوع کپچا پیشنهاد شده که ابتدا کتابخانه‌ای برای ایجاد چند شیء ساده‌ی سه‌بعدی در حالات مختلف و با موقعیتهای متفاوت طراحی شود و اجزای این اشیاء به کامپیوتر معرفی می‌شوند.

کپچای سه‌بعدی

در مرحله‌ی ایجاد کپچا، کامپیوتر این اشیاء را در یک ترکیب تصادفی از موقعیتها و حالات مختلف می‌چیند و اجزای این تصاویر را با حروف برچسب می‌زند. سپس از کاربر می‌خواهد حروف متناظر با چند شیء انتخابی را وارد کند.

کپچای سه‌بعدی

به عنوان نمونه، از کاربر خواسته می‌شود تا در تصویر بالا حروف نوشته شده روی «سر مرد ایستاده»، «گلدان» و «پشتی صندلی» را به ترتیب وارد کند که جواب کپچای بالایی CKT است (برای اطلاعات بیشتر اینجا را ببینید).

علاوه بر این، ایده‌های ساده و در عین حال مؤثر دیگری برای طراحی کپچا ارائه شده‌اند. یکی از ایده‌هایی که در ابعاد وسیع در سایتها و سیستمهای مدیریت محتوی پیاده‌سازی شده ایده‌ی کپچای ریاضی است. در این حالت از کاربر خواسته می‌شود تا نتیجه‌ی یک جمع و ضرب ساده‌ی ریاضی را وارد کند. ایده‌های ساده و مؤثر دیگری را با نگاهی به این پیش‌نمایش از قابلیتهای یکی از افزونه‌های دروپال ببینید.

انواع دیگر کپچا

اگر تا به حال پیش آمده باشد که بخواهید فایلی را از سایت رپیدشر دریافت کنید احتمالاً این کپچای عجیب و غریب را دیده‌اید (منبع عکس):

کپچاهای سگ و گربه‌ی رپیدشر

در کپچای بالایی خواسته شده تا کاربر حروفی را که یک گربه زیر آن راه می‌رود در جعبه‌ی متنی وارد کند (جانور دیگر سگ است)! هر چند به نظر می‌رسد این کپچای پیچیده نه برای مقابله با نرم‌افزارهای هرزپراکنی، که بیشتر برای آزار خلق الله و ترغیب آنها برای شل کردن سر کیسه و خرید حساب حرفه‌ای به امید خلاص شدن از دست این کپچا ایجاد شده است! به هر حال این هم احتمالاً یکی از کاربردهای دیگر کپچا -در کنار مقابله با اسپم و کمک به دیجیتالی کردن کتابخانه‌ها-ست!

فهرست سری نوشته‌های من درباره‌ی هرزنامه‌ها:

قسمت اول: ریشه‌ی نام اسپم

قسمت دوم: هرزنامه‌ها

قسمت سوم: کدامیک هرزنامه‌های بیشتری می‌گیرند: «علی» یا «زهرا»؟

قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!

قسمت پنجم: درآمدزایی هرزنامه‌ها

قسمت ششم: ماشینهای صاحب‌نظر

قسمت هفتم: کپچا: «تو آدمی؟!»

قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن

قسمت نهم: صنعت حل کپچای هند و راه‌حلهای مقابله با اسپم با تکیه بر تحلیل محتوی

کپچا: «تو آدمی؟!»

ماشینهای صاحب‌نظر یک ضعف مهم دارند و احتمالاً راه حل شکست دادن آنها تکیه بر همین ضعف است. آن ضعف مهم آن است که آنها آدم نیستند! بله! آنها خیلی از تواناییهای یک انسان را ندارند. تواناییهای بسیاری از این روباتها محدود به پیدا کردن جعبه‌های متنی، تشخیص نوع داده‌ای که باید آنها را با آن پر کنند و ارسال خودکار داده‌های هرز است. بنابراین می‌توان با ملزم کردن کاربری که فرم را پر می‌کند (مثلاً در حال ثبت نام برای ایجاد یک حساب ایمیل است یا در حال نظر دادن در یک وبلاگ است) به انجام کاری که به طور طبیعی از عهده‌ی یک انسان برمی‌آید و از عهده‌ی یک روبات برنمی‌آید کاری کنیم که روباتها نتوانند فرمها را پرکنند. این اساس روشی برای مقابله با اسپمها در قلمرو فرمهای الکترونیکی است که «کپچا» (CAPTCHA سرواژه‌ی حروف ابتدایی عبارتی انگلیسی با ترجمه‌ی آزمایش تورینگ [نام شخصی است، با تست تورینگ دانشجویان نرم‌افزار آشنایی دارند] کاملاً خودکار عمومی برای جداسازی انسان از کامپیوتر) نامیده می‌شود.

«کپچای تصویر متن» متداولترین نوع کپچاست. نرم‌افزارهای ارسال اسپم معمولاً توانایی پردازش تصویرها را ندارند. آنها حداکثر می‌توانند الگوهای ساده‌ی متنی را پیدا کنند. پس ما اگر در هر بار نمایش فرم یک تصویر تصادفی به کاربر نشان دهیم و از او بخواهیم برای ما بگوید داخل آن تصویر چه می‌بیند، کاربران انسانی -چون توانایی پردازش تصویرها را دارند- می‌توانند مسئله‌ی «چه چیزی داخل تصویر است» را به آسانی حل کنند و نرم‌افزار ارسال اسپم نه. ساده‌ترین چیزی که داخل تصاویر می‌توان گذاشت متون ساده‌ی چند حرفی یا تک کلمه‌ای است که با ترفندهایی همچون مخدوش کردن تصویر با خطوط، نویز و اعوجاج زمینه از حالت متن ساده خارج شده است. در ضمن چون نرم‌افزاری که این تصویر را ایجاد می‌کند جواب مسأله را می‌داند آزمایش درستی پاسخ کاربر هم کاری ندارد. این روش، اساس کپچای تصویر متن است که این روزها در خیلی از سایتها در انواع مختلف جلوی چشممان ظاهر می‌شود.

کپچا

البته دسته‌ای از کاربران انسانی هم هستند که به دلیل نابینایی توانایی حل کردن مسأله‌ی کپچای تصویر متن را ندارند. برای حل مشکل این کاربران که معمولاً با کمک نرم‌افزارهای صفحه‌خوان (نرم‌افزاری است که با تکیه بر فناوری متن به صدا اتفاقات روی صفحه‌ی کامپیوتر را برای کاربر شرح می‌دهد) از اینترنت استفاده می‌کنند در کنار کپچاهای تصویر متن، کپچاهای صوتی معادل نیز ایجاد شدند تا به این طریق مشکل این دسته از کاربران نیز حل شود.

راستی! تا حالا فکرش را کرده‌اید که تا به حال با چند کپچا برخورد کرده‌اید، چند تا از آنها را (به دلیل مخدوش بودن بیش از حد) نادرست جواب داده‌اید و در مجموع چقدر وقت برای حل آنها تلف کرده‌اید؟! هر چند زمان تلف شده برای تک تک کاربران اینترنت احتمالاً ناچیز است، اما فکرش را بکنید که جمع زمانی که کل کاربران اینترنت برای حل کپچاها صرف می‌کنند چقدر است (البته احتمالاً در یکی از نوشته‌هایی بعدی از کسانی برایتان صحبت خواهم کرد که روزانه حداقل هشت ساعت کپچا حل میکنند!). واقعاً اگر اسپم نبود و اگر نرم‌افزارهای ارسال اسپم نبودند لازم نبود این سؤالهای احمقانه را پاسخ دهیم. جالب اینجاست که عده‌ای به همین موضوع فکر کرده‌اند و به ایده‌ای رسیده‌اند که با استفاده از آن می‌توان کاری کرد که حل کپچاها دیگر بیهوده نباشد و از آن سودی به همگان برسد.

مسأله‌ای که حل کپچای تصویر متن به آن شباهت دارد او.سی.آر است. در این فرایند یک برنامه‌ی کامپیوتری تلاش می‌کند تصویر اسکن شده‌ی متن را به متن قابل ویرایش یا جستجو تبدیل کند. اما درصد موفقیت نرم‌افزارها در تبدیل تصویر به متن همیشه بالا نیست. خیلی وقتها متن کاغذی مخدوش است یا کیفیت خوبی ندارد. بنابراین برنامه‌ی او.سی.آر آن را با دقت خوبی نمی‌خواند، اما برنامه متوجه این قضیه می‌شود و می‌تواند قسمتهایی از متن را که خوب نخوانده جدا کند تا یک کاربر انسانی آنها را بازبینی و تأیید یا تصحیح کند. اما همیشه کاربران انسانی برای تصحیح خطاهای او.سی.آر در دسترس نیستند. مخصوصاً برای پروژه‌های عمومی تبدیل کتابهای کاغذی به متون دیجیتالی همیشه بودجه‌ی کافی برای استخدام مصححان در دسترس نیست. سایتی به نام ری‌کپچا تلاش دارد با ارائه‌‎ی سرویس کپچای رایگان، در کنار کلمات ایجاد شده توسط کامپیوتر -که پاسخ آنها برای نرم‌افزار کپچا مشخص است- کلماتی را که نرم‌افزارهای او.سی.آر «با دقت پایین» تشخیصشان داده‌اند در دسترس کاربر انسانی قرار دهد و از او بخواهد درست آن را تایپ کند. به این ترتیب سایت یا سرویسی که از این روش استفاده می‌کند از کاربر می‌خواهد دو کلمه را وارد کند که جواب یکی را می‌داند و نتیجه‌ی ورودی کاربر برای کلمه‌ی دیگر را ذخیره می‌کند تا با دریافت چند جواب دیگر از کاربران دیگر راجع به متن آن اطمینان حاصل کند و نهایتاً دقت متون او.سی.آر شده را بالا ببرد. روش مشابهی نیز برای کپچاهای صوتی و تبدیل صداهای ضبط شده‌ی از دهه‌های گذشته به متن ارائه شده است.

reCAPTCHA

در مورد انواع کپچا شاید این صفحه هم اطلاعات جدید و مفیدی داشته باشد.

فهرست سری نوشته‌های من درباره‌ی هرزنامه‌ها:

قسمت اول: ریشه‌ی نام اسپم

قسمت دوم: هرزنامه‌ها

قسمت سوم: کدامیک هرزنامه‌های بیشتری می‌گیرند: «علی» یا «زهرا»؟

قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!

قسمت پنجم: درآمدزایی هرزنامه‌ها

قسمت ششم: ماشینهای صاحب‌نظر

قسمت هفتم: کپچا: «تو آدمی؟!»

قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن

قسمت نهم: صنعت حل کپچای هند و راه‌حلهای مقابله با اسپم با تکیه بر تحلیل محتوی