دربارهٔ من:
آخرین نظردهندگان:
- Anonymous دربارهٔ تماشای ریحان
- لیام دربارهٔ @hrmoh
- سمانه ، م دربارهٔ @hrmoh
- M دربارهٔ شرح یک تجربه: سیانوژن روی گوشی LG Optimus 4X
- مسعود دربارهٔ @hrmoh
مشترک شوید:
ایمیل خود را در جعبهٔ زیر وارد کنید و دکمهٔ اشتراک را بزنید.
جستجو:
صنعت حل کپچای هند و راهحلهای مقابله با اسپم با تکیه بر تحلیل محتوا
۸۷/۱۱/۰۴تا به اینجا رسیدیم که کپچای تصویر متنی را با او.سی.آر به شکل ماشینی دور میزنند و به همین دلیل روشهای متفاوتی برای طراحی کپچا ارائه شده است. جالب است بدانیم که این روزها شرکتها و مراکزی وجود دارند که قیمتهای استاندارد (!) برای شکستن کپچای سایتهای مختلف ارائه میکنند. به عنوان نمونه این تکهای از لیست قیمت یک شرکت متخصص شکستن کپچاهای سایتهای چینی است (منبع عکس):
ماجرا محدود به کپچاهای تصویری هم نمیشود، کپچاهای صوتی هم توسط نرمافزارهای کامپیوتری -گویا به آسانی- قابل عبور هستند (در این نشانی مقالهای تفصیلی دربارهی نحوهی عبور از کپچای صوتی جیمیل بخوانید). کپچاهای تصویر متنی شرکتهای بزرگ (مایکروسافت، یاهو و گوگل) به دلیل تعداد کاربران بالا و همچنین اعتبار ایمیلهای ارسالی از آنها برای نرمافزارهای مبارزه با هرزنامهها بارها و بارها شکسته شدهاند (اینجا را ببینید).
اما کپچاهای ابتکاری چه؟! آیا مقاومت کپچاهای ابتکاری (کپچای محاسباتی، کپچای سهبعدی، سگ و گربهی رپیدشر و …) بیشتر نیست؟ آیا نرمافزارهای ارسال انبوه اسپم از این کپچاها هم میتوانند عبور کنند؟
تا اینجا و با توجه به سرمایهگذاریهای قابل توجه ارسال کنندگان اسپم روی کارشان باید به این نتیجه رسیده باشید که در این «شغل» آنقدر «پول» هست که نه تنها اجازهی استفاده از راهبردهای «تحقیق و توسعه» را برای شکستن سدهای پیش رو به آنها میدهد بلکه احتمالاً این درآمدها میتواند آنقدر زیاد باشد که حاضر باشند برای حل مشکلات پیشرو مستقیماً و عملاً نیروی انسانی در اختیار بگیرند و از کمک نیروهای کار ارزانقیمت کشورهای در حال توسعه استفاده کنند.
به پشتوانهی سرمایهی ارسال کنندگان اسپم در کشورهایی مانند هند شاهد ظهور یک صنعت درآمدزای بدیع هستیم: «صنعت حل کپچا»! اتاقهایی با بیست الی سی اپراتور که در ازای دستمزدهایی همچون «هر ۱۰۰۰ کپچا ۲ دلار» ساعتهای کاری خود را با بازخوانی کپچاها میگذرانند. فرایند کار به این صورت است که نرمافزار ارسال اسپم تصویر کپچا را جدا میکند، به یکی از اپراتورها میدهد، اپراتور مقدار آن را درج و ارسال میکند و نرمافزار، اسپمش را ارسال میکند. با این سیستم کاری، شرکتهای حل کپچای هندی ادعای حل روزانه تا ۵۰۰۰۰ کپچا یا بیشتر را به مدد چند ده کامپیوتر و اپراتور، و شیفتهای کاریی که ۲۴ ساعت ۷ روز هفته را پوشش میدهند دارند (برای کسب اطلاعات بیشتر اینجا را ببینید).
اینجاست که کارکرد کپچا برای جلوگیری از ارسال انبوه اسپم زیر سؤال میرود، چرا که کپچا برای حل این معضل، مبتنی بر این ایده است که ارسالکنندگان انبوه اسپم ماشین هستند و با تشخیص انسان از ماشین میتوان جلوی ارسال انبوه اسپم را گرفت. و در اینجا حداقل بخش سختتر کار را انسانها انجام میدهند.
دستهی دیگری از راهحلهای مقابله با اسپم بر «تحلیل متون ارسالی» مبتنی هستند. مقایسهی آی.پی ارسالکننده با لیست سیاه ارسالکنندگان اسپم شناخته شده، شمارش تعداد لینکهای موجود در متون و جستجوی نشانی سایتهای اسپم در بین آنها، بررسی محتوای متن و جستجوی واژههای متداول موجود در متون اسپم در متن ارسالی (یک آمار جالب در این زمینه را در این تصویر ببینید) از جمله ترفندهای به کار گرفته شده در این روش هستند. معمولاً برای جلوگیری از دور زدن شدن آسان الگوریتمها و روشهای مورد استفاده در این راهحلها بخش عمدهای از این روشها منتشر نمیشوند و تنها ابزارهای ارتباطی به صورت کدباز در اختیار استفادهکنندگان قرار میگیرند. «اکیسمت» سیستم مقابله با نظرات هرز که در وردپرس و برخی دیگر از سیستمهای مدیریت محتوی به کار گرفته شده است از جمله ابزارهای مبتنی بر این روش است.
این احتمالاً آخرین قسمت سری مطالبی بود که دربارهی «اسپم» نوشتهام. فهرست نوشتههای این سری:
قسمت اول: ریشهی نام اسپم
قسمت دوم: هرزنامهها
قسمت سوم: کدامیک هرزنامههای بیشتری میگیرند: «علی» یا «زهرا»؟
قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!
قسمت پنجم: درآمدزایی هرزنامهها
قسمت ششم: ماشینهای صاحبنظر
قسمت هفتم: کپچا: «تو آدمی؟!»
قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن
قسمت نهم: صنعت حل کپچای هند و راهحلهای مقابله با اسپم با تکیه بر تحلیل محتوی
او.سی.آر: قاتل کپچای تصویر متن
۸۷/۱۰/۲۳کپچای تصویر متن که روزگاری جلیقهای ضدگلوله در برابر حملات نرمافزارهای هرزپراکنی به شمار میآمد دیگر چنین وضعیتی ندارد. برنامهنویسی در سال ۲۰۰۵ با طراحی یک سیستم سادهی او.سی.آر نشان داد که عبور از سپر کپچای تصویر متن کار چندان سختی نیست (علاقمندان اینجا را ببینند) و به مرور نرمافزارهای هرزپراکنی واقعی نیز کمابیش به این قابلیت مجهز شدند. افزایش نویز و در هم ریختن تصاویر کپچاها باعث نارضایتی بیشتر کاربران شد و به مرور عدهای به فکر راهحلهای متفاوت افتادند. راهحلهایی که گاه بیش از حد متفاوت به نظر میرسند، آنچنانکه بر خلاف هدف اولیهی کپچا، اغلب باعث ایجاد شبهه در مورد هویت موجودی که توانسته آنها را حل کند میشوند: گاه انسان نمیتواند برخی از این معماهای پیچیده را حل کند و مسلماً آنچه جواب این معما را پیدا کرده یک ماشین بوده!
یکی از طرحهای ارائه شده کپچای تصویر سهبعدی است. در این نوع کپچا پیشنهاد شده که ابتدا کتابخانهای برای ایجاد چند شیء سادهی سهبعدی در حالات مختلف و با موقعیتهای متفاوت طراحی شود و اجزای این اشیاء به کامپیوتر معرفی میشوند.
در مرحلهی ایجاد کپچا، کامپیوتر این اشیاء را در یک ترکیب تصادفی از موقعیتها و حالات مختلف میچیند و اجزای این تصاویر را با حروف برچسب میزند. سپس از کاربر میخواهد حروف متناظر با چند شیء انتخابی را وارد کند.
به عنوان نمونه، از کاربر خواسته میشود تا در تصویر بالا حروف نوشته شده روی «سر مرد ایستاده»، «گلدان» و «پشتی صندلی» را به ترتیب وارد کند که جواب کپچای بالایی CKT است (برای اطلاعات بیشتر اینجا را ببینید).
علاوه بر این، ایدههای ساده و در عین حال مؤثر دیگری برای طراحی کپچا ارائه شدهاند. یکی از ایدههایی که در ابعاد وسیع در سایتها و سیستمهای مدیریت محتوی پیادهسازی شده ایدهی کپچای ریاضی است. در این حالت از کاربر خواسته میشود تا نتیجهی یک جمع و ضرب سادهی ریاضی را وارد کند. ایدههای ساده و مؤثر دیگری را با نگاهی به این پیشنمایش از قابلیتهای یکی از افزونههای دروپال ببینید.
اگر تا به حال پیش آمده باشد که بخواهید فایلی را از سایت رپیدشر دریافت کنید احتمالاً این کپچای عجیب و غریب را دیدهاید (منبع عکس):
در کپچای بالایی خواسته شده تا کاربر حروفی را که یک گربه زیر آن راه میرود در جعبهی متنی وارد کند (جانور دیگر سگ است)! هر چند به نظر میرسد این کپچای پیچیده نه برای مقابله با نرمافزارهای هرزپراکنی، که بیشتر برای آزار خلق الله و ترغیب آنها برای شل کردن سر کیسه و خرید حساب حرفهای به امید خلاص شدن از دست این کپچا ایجاد شده است! به هر حال این هم احتمالاً یکی از کاربردهای دیگر کپچا -در کنار مقابله با اسپم و کمک به دیجیتالی کردن کتابخانهها-ست!
فهرست سری نوشتههای من دربارهی هرزنامهها:
قسمت اول: ریشهی نام اسپم
قسمت دوم: هرزنامهها
قسمت سوم: کدامیک هرزنامههای بیشتری میگیرند: «علی» یا «زهرا»؟
قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!
قسمت پنجم: درآمدزایی هرزنامهها
قسمت ششم: ماشینهای صاحبنظر
قسمت هفتم: کپچا: «تو آدمی؟!»
قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن
قسمت نهم: صنعت حل کپچای هند و راهحلهای مقابله با اسپم با تکیه بر تحلیل محتوی
کپچا: «تو آدمی؟!»
۸۷/۱۰/۲۰ماشینهای صاحبنظر یک ضعف مهم دارند و احتمالاً راه حل شکست دادن آنها تکیه بر همین ضعف است. آن ضعف مهم آن است که آنها آدم نیستند! بله! آنها خیلی از تواناییهای یک انسان را ندارند. تواناییهای بسیاری از این روباتها محدود به پیدا کردن جعبههای متنی، تشخیص نوع دادهای که باید آنها را با آن پر کنند و ارسال خودکار دادههای هرز است. بنابراین میتوان با ملزم کردن کاربری که فرم را پر میکند (مثلاً در حال ثبت نام برای ایجاد یک حساب ایمیل است یا در حال نظر دادن در یک وبلاگ است) به انجام کاری که به طور طبیعی از عهدهی یک انسان برمیآید و از عهدهی یک روبات برنمیآید کاری کنیم که روباتها نتوانند فرمها را پرکنند. این اساس روشی برای مقابله با اسپمها در قلمرو فرمهای الکترونیکی است که «کپچا» (CAPTCHA سرواژهی حروف ابتدایی عبارتی انگلیسی با ترجمهی آزمایش تورینگ [نام شخصی است، با تست تورینگ دانشجویان نرمافزار آشنایی دارند] کاملاً خودکار عمومی برای جداسازی انسان از کامپیوتر) نامیده میشود.
«کپچای تصویر متن» متداولترین نوع کپچاست. نرمافزارهای ارسال اسپم معمولاً توانایی پردازش تصویرها را ندارند. آنها حداکثر میتوانند الگوهای سادهی متنی را پیدا کنند. پس ما اگر در هر بار نمایش فرم یک تصویر تصادفی به کاربر نشان دهیم و از او بخواهیم برای ما بگوید داخل آن تصویر چه میبیند، کاربران انسانی -چون توانایی پردازش تصویرها را دارند- میتوانند مسئلهی «چه چیزی داخل تصویر است» را به آسانی حل کنند و نرمافزار ارسال اسپم نه. سادهترین چیزی که داخل تصاویر میتوان گذاشت متون سادهی چند حرفی یا تک کلمهای است که با ترفندهایی همچون مخدوش کردن تصویر با خطوط، نویز و اعوجاج زمینه از حالت متن ساده خارج شده است. در ضمن چون نرمافزاری که این تصویر را ایجاد میکند جواب مسأله را میداند آزمایش درستی پاسخ کاربر هم کاری ندارد. این روش، اساس کپچای تصویر متن است که این روزها در خیلی از سایتها در انواع مختلف جلوی چشممان ظاهر میشود.
البته دستهای از کاربران انسانی هم هستند که به دلیل نابینایی توانایی حل کردن مسألهی کپچای تصویر متن را ندارند. برای حل مشکل این کاربران که معمولاً با کمک نرمافزارهای صفحهخوان (نرمافزاری است که با تکیه بر فناوری متن به صدا اتفاقات روی صفحهی کامپیوتر را برای کاربر شرح میدهد) از اینترنت استفاده میکنند در کنار کپچاهای تصویر متن، کپچاهای صوتی معادل نیز ایجاد شدند تا به این طریق مشکل این دسته از کاربران نیز حل شود.
راستی! تا حالا فکرش را کردهاید که تا به حال با چند کپچا برخورد کردهاید، چند تا از آنها را (به دلیل مخدوش بودن بیش از حد) نادرست جواب دادهاید و در مجموع چقدر وقت برای حل آنها تلف کردهاید؟! هر چند زمان تلف شده برای تک تک کاربران اینترنت احتمالاً ناچیز است، اما فکرش را بکنید که جمع زمانی که کل کاربران اینترنت برای حل کپچاها صرف میکنند چقدر است (البته احتمالاً در یکی از نوشتههایی بعدی از کسانی برایتان صحبت خواهم کرد که روزانه حداقل هشت ساعت کپچا حل میکنند!). واقعاً اگر اسپم نبود و اگر نرمافزارهای ارسال اسپم نبودند لازم نبود این سؤالهای احمقانه را پاسخ دهیم. جالب اینجاست که عدهای به همین موضوع فکر کردهاند و به ایدهای رسیدهاند که با استفاده از آن میتوان کاری کرد که حل کپچاها دیگر بیهوده نباشد و از آن سودی به همگان برسد.
مسألهای که حل کپچای تصویر متن به آن شباهت دارد او.سی.آر است. در این فرایند یک برنامهی کامپیوتری تلاش میکند تصویر اسکن شدهی متن را به متن قابل ویرایش یا جستجو تبدیل کند. اما درصد موفقیت نرمافزارها در تبدیل تصویر به متن همیشه بالا نیست. خیلی وقتها متن کاغذی مخدوش است یا کیفیت خوبی ندارد. بنابراین برنامهی او.سی.آر آن را با دقت خوبی نمیخواند، اما برنامه متوجه این قضیه میشود و میتواند قسمتهایی از متن را که خوب نخوانده جدا کند تا یک کاربر انسانی آنها را بازبینی و تأیید یا تصحیح کند. اما همیشه کاربران انسانی برای تصحیح خطاهای او.سی.آر در دسترس نیستند. مخصوصاً برای پروژههای عمومی تبدیل کتابهای کاغذی به متون دیجیتالی همیشه بودجهی کافی برای استخدام مصححان در دسترس نیست. سایتی به نام ریکپچا تلاش دارد با ارائهی سرویس کپچای رایگان، در کنار کلمات ایجاد شده توسط کامپیوتر -که پاسخ آنها برای نرمافزار کپچا مشخص است- کلماتی را که نرمافزارهای او.سی.آر «با دقت پایین» تشخیصشان دادهاند در دسترس کاربر انسانی قرار دهد و از او بخواهد درست آن را تایپ کند. به این ترتیب سایت یا سرویسی که از این روش استفاده میکند از کاربر میخواهد دو کلمه را وارد کند که جواب یکی را میداند و نتیجهی ورودی کاربر برای کلمهی دیگر را ذخیره میکند تا با دریافت چند جواب دیگر از کاربران دیگر راجع به متن آن اطمینان حاصل کند و نهایتاً دقت متون او.سی.آر شده را بالا ببرد. روش مشابهی نیز برای کپچاهای صوتی و تبدیل صداهای ضبط شدهی از دهههای گذشته به متن ارائه شده است.
در مورد انواع کپچا شاید این صفحه هم اطلاعات جدید و مفیدی داشته باشد.
فهرست سری نوشتههای من دربارهی هرزنامهها:
قسمت اول: ریشهی نام اسپم
قسمت دوم: هرزنامهها
قسمت سوم: کدامیک هرزنامههای بیشتری میگیرند: «علی» یا «زهرا»؟
قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!
قسمت پنجم: درآمدزایی هرزنامهها
قسمت ششم: ماشینهای صاحبنظر
قسمت هفتم: کپچا: «تو آدمی؟!»
قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن
قسمت نهم: صنعت حل کپچای هند و راهحلهای مقابله با اسپم با تکیه بر تحلیل محتوی
ماشینهای صاحبنظر
۸۷/۱۰/۰۶قلمرو ناخواستههای دنیای اینترنت محدود به نامههای الکترونیکی و هرزنامهها نیست. هر نوع فرم الکترونیکی که از طریق سایتهای اینترنتی در دسترس قرار میگیرد در معرض حملهی روباتها و برنامههای کامپیوتری است. این برنامهها با اهداف مختلف تلاش میکنند این فرمها را پر کنند و معمولاً حاصل این تلاشها انبوهی از نظرات هرز در وبلاگها، از کار افتادن کامپیوترهای میزبان سایتهای اینترنتی و انواع پیامدهای ناخوشایند دیگر است.
برای نمونه، هرزنامهنگاران میدانند که اکثر نرمافزارهای مبارزه با هرزنامهها، برای ایمیلهایی که از طریق سرویسهای محبوب ایمیل نظیر یاهو و جیمیل ارسال شده باشد اولویت خاصی قائلند و اگر ایمیل واقعاً از طریق این سرویسها ارسال شده باشد احتمال شناسایی آن به عنوان هرزنامه پایین میآید. اما از طرف دیگر همهی سرویسهای ایمیل محبوب سیستمهایی برای تشخیص استفادهی غیرمجاز کاربران دارند. به عنوان نمونه برخی از این سیستمها به محض این که تشخیص دهند یک کاربر در یک بازهی زمانی خاص تعداد زیادی ایمیل فرستاده حساب کاربری او را به عنوان هرزنامهنگار موقتاً مسدود میکنند. از این رو، هرزنامهنگاران سیستمهایی طراحی کردهاند که تلاش میکنند با پر کردن فرم ثبت نام سرویسهای ایمیل به صورت ماشینی حساب ایمیل بسازند و تا حد مسدود شدن با حساب ایجاد شده هرزنامه بفرستند و به محض مسدود شدن ایمیل، به سراغ ایمیل بعدی بروند!
نمونهی دیگر استفاده از فرمها برای ارسال اسپم، بخش نظرات وبلاگهاست. اسپمرها با استفاده از برنامههای کامپیوتری تلاش میکنند این فرمها را پر کنند و در قالب نظرهای وبلاگی به طور انبوه محصولات خود را تبلیغ کنند. انگیزههای دیگری نیز همچون افرایش لینکهای ورودی به سایت هدف و در نتیجه افزایش رتبهی سایت در موتورهای جستجو نیز در انتخاب این روش ارسال اسپم مؤثر است.
در نوشتهی بعدی به بعضی روشهای مقابله با اسپم در قلمرو فرمهای الکترونیکی اشاره خواهم کرد.
فهرست سری نوشتههای من دربارهی هرزنامهها:
قسمت اول: ریشهی نام اسپم
قسمت دوم: هرزنامهها
قسمت سوم: کدامیک هرزنامههای بیشتری میگیرند: «علی» یا «زهرا»؟
قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!
قسمت پنجم: درآمدزایی هرزنامهها
قسمت ششم: ماشینهای صاحبنظر
قسمت هفتم: کپچا: «تو آدمی؟!»
قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن
قسمت نهم: صنعت حل کپچای هند و راهحلهای مقابله با اسپم با تکیه بر تحلیل محتوی
مایکل ملوی نیاز به کمک داشت
۸۷/۰۹/۱۷اما فردای آن شب، مایکل ملوی باز هم به مغازهی آنتونی برگشت تا از لطف مجانی آنتونی بهرهمند شود. آن روز هم تا شب نوشید و باز با وضعیتی به بدی شب پیش بار را ترک کرد. باز هم آنتونی و رفقا چشمانتظار فردا و خبر مرگ مایکل ماندند. اما فردا باز هم همین ماجرا تکرار شد. روزها و روزها گذشت و مایکل با وجود آن که انباری آنتونی را کم کم داشت کاملاً خالی میکرد در همان یک قدمی مرگ جا خوش کرده بود و خیال مردن نداشت.
کم کم صبر «همپیمانان قتل» لبریز شد. چارهای نبود. مایکل ملوی نیاز به «کمک» رفقا داشت. دستیار آنتونی -مورفی- ساقی بار، تحصیلاتی در رشتهی شیمی داشت و به همین دلیل از او برای تسریع مرگ مایکل کمک خواستند. او پیشنهاد کرد که سهمیهی مشروب مایکل را با ضدیخ رادیاتور ماشین -که از الکل چوب تهیه میشد و سمی بود- عوض کنند. فردای آن روز بعد از آن که نوشیدنیهای هر روزه هوشیاری مایکل را مختل کرد مورفی سهمیهی ضدیخش را به او نوشاند. بعد از نوشیدن اولین لیوان، مایکل تقاضای نوشیدنی بیشتری کرد و لیوان دوم ضدیخ را هم تا ته سرکشید. لحظاتی بعد بر روی زمین افتاد و از حال رفت. مورفی او را وارسی کرد و به رفقا ندا داد که قلبش به سختی میزند. با این حال بعد از گذشت یک ساعت مایکل از جا بلند شد، از رفقا به خاطر حال خرابش عذرخواهی کرد و رو به آنتونی گفت که باز هم تشنه است!
آنتونی اعتقاد داشت مورفی به مقدار کافی ضدیخ به مایکل نخورانده است، به همین دلیل، این بار خودش دست به کار شد و سهمیهی مایکل را به طور کامل با ضدیخ جایگزین کرد. اما تأثیر نوشیدنی سمی جدید بر مایکل چیزی در حد نوشیدنی همیشگیش بود. یک هفتهی کامل به مایکل ضدیخ دادند و تغییری شدیدتر از بار اول در او ندیدند!
کم کم همپیمانان قتل به هم ریخته و عصبی شدند. به نظر میرسید الکل چوب -که مصرف حتی مقادیر کم آن باعث کوری هر آدم عادی میشود- تأثیری روی ملوی ندارد. باز هم جلسه گذاشتند و به دنبال راهی گشتند که یک مرگ «تصادفی» مؤثر برای مایکل تدارک ببینند. این بار مورفی پیشنهاد داد به مایکل غذای فاسد و مسموم بدهند. گروه پذیرفت. آخر وقت آن روز ساندویچی از ماهی ساردین فاسد شده، که چند میخ ریز هم در بین آن جاسازی شده بود در میان مقدار کافی نان برای پوشاندن بوی غذا و پنهان کردن میخها به مایکل دادند. مایکل خوشحال و سرمست از لطف بیحد رفقا، غذا را تا آخرین تکه خورد، انگشتهایش را لیسید. معدهاش را با چند وعده الکل چوب شستشو داد و همانند شبهای دیگر مست و خراب، اما این بار کاملاً سیر، از بار راهی خانه شد.
بقیهاش بعداً …
فهرست چهار قسمت این ماجرا
قسمت اول : مایکل ملوی آتشنشان بود …
قسمت دوم : مایکل ملوی نیاز به کمک داشت
قسمت سوم : سگها هفت جان دارند، گربهها نه جان و مایکل ملوی …؟!
قسمت چهارم : شما نمیتوانید مایکل ملوی را بکشید
مایکل ملوی آتشنشان بود …
۸۷/۰۹/۱۶… البته شهرت او هیچ ربطی به شغلش ندارد. در واقع جریان شهرت او به هنگامی برمیگردد که در سال ۱۹۳۳ میلادی پیرمردی ۶۰ ساله، دائمالخمر و بیمصرف بود که هیچکدام از مشروبفروشیهای نیویورک او را به داخل مغازه راه نمیدادند. تنها جایی که او میتوانست به مدد چانهدرازی و خوشصحبتی ذاتیش مشتریان مایهدار بار را وادار کند تا چند نوبت در روز مهمانش کنند مشروبفروشی آنتونی مارینو واقع در محلهی برانکس بود.
مارینو جوانک خوشپوش و ۲۷ سالهی صاحب بار به درآمد حاصل از مشروبفروشی قانع نبود. او به اتفاق دوستانش شامل ژورف مورفی شیمیدان سابق و ساقی ۲۸ سالهی کنونی بار، فرانسیس پاسکوا ۲۴ ساله صاحب مؤسسهی دفن و کفن، گرین راننده تاکسی و دنیل کرایسبرگ ۲۹ ساله میوهفروش به دنبال راههای سریع پول درآوردن بودند و در این راه «قانون» مانع مهمی بر سر راهشان به حساب نمیآمد. مارینو هم، همانند صاحب مغازههای دیگر، دل خوشی از مایکل ملوی نداشت و ترجیح میداد این الکلی بیمصرف دور و بر مغازهاش پیدایش نشود، تا آن که روزی پاسکوا به نکتهای در مورد مایکل اشاره کرد که مارینو پیشتر به آن توجه نکرده بود: مایکل میتوانست بهترین طعمه برای نقشهای باشد که سال قبل، مارینو و رفقا -که بعدها در روزنامهها به گروه «همپیمانان قتل» مشهور شدند- بر سر یک الکلی مردنی دیگر پیادهاش کردند. آنها طعمهی سال قبل خود را به کمک یکی از رفقای خود در شرکت بیمه، بیمهی عمر کردند، سپس به او سهمیهی بدون محدودیت و مجانی مشروب دادند و با همکاری ناآگاهانهی قربانی او را به کام مرگ فرستادند تا با گواهی کارشناس بیمه مبنی بر مرگ تصادفی بیمهشده، طبق بیمهنامه با عنوان نفعبرندگان جایگزین بیمهشدهی اصلی، ۸۰۰ دلار شرکت بیمه را تیغ بزنند.
مایکل ملوی طعمهی آسانتری به نظر میرسید، چرا که با آن اوضاع اعتیادش به الکل باید یکی از همان روزها از پا میافتاد. «همپیمانان قتل» با کمک دوستشان در شرکت بیمه این بار «مایکل» را با پرداخت ۱۷۸۸ دلار بیمه کردند. بیمه کردن مایکل بدون همکاری دوستشان در شرکت بیمه امکانپذیر نبود. هیچ کارشناس بیمهی دیگری مایکل را با آن اوضاع و بدون آن که با خودش صحبت کند بیمه نمیکرد، ضمن آن که آنها مایکل را -برای پرداخت حق بیمهی کمتر- ۴۵ ساله جا زدند. پس از مرگ «تصادفی» مایکل، ۳۵۷۶ دلار -معادل ۵۷۰۰۰ دلار به پول امروز آمریکا- به نفعبرندهی جایگزین در بیمهنامه(ها) یعنی آنتونی میرسید تا او آن را بین رفقا تقسیم کند.
بعد از آن که کار بیمهنامهها ردیف شد، مایکل، الکلی بیمصرفی که آنتونی هر روز به هر بهانه از بار بیرونش میانداخت، یک دفعه نور چشم آنتونی شد و آنتونی به او گفت که از آن روز میتواند در بار او هر چه میخواهد به صورت مجانی بنوشد. مایکل بیکله و بیخبر از همه جا -بی آن که به چیزی مشکوک شود- خوشحال از موهبتی که شانس نصیبش کرده تمام آن روز را -بیوقفه- در بار نوشید، طوری که وقتی اواخر شب مست و لایعقل و به سختی از در بار بیرون رفت و در تاریکی گم شد، گروه رفقا تقریباً مطمئن بودند که فردا خبر مرگش را خواهند شنید.
بقیهاش فردا …
فهرست چهار قسمت این ماجرا
قسمت اول : مایکل ملوی آتشنشان بود …
قسمت دوم : مایکل ملوی نیاز به کمک داشت
قسمت سوم : سگها هفت جان دارند، گربهها نه جان و مایکل ملوی …؟!
قسمت چهارم : شما نمیتوانید مایکل ملوی را بکشید
درآمدزایی هرزنامهها
۸۷/۰۹/۰۸قبلاً اشاره کردم که مهمترین انگیزه برای هرزنامهنگاری پول و کسب درآمد است. تعداد زیادی از هرزنامهها برای این فرستاده میشوند که گیرنده را به خرید کالا یا خدمات ترغیب کنند. در واقع سود هرزنامهنگاری به صورت غیرمستقیم و از سود کالا و خدمات فروخته شده به دست میآید (البته بسیاری در قبال دریافت دستمزد، برای دیگران کار ارسال نامههای تبلیغی ناخواسته را در حجم وسیع انجام میدهند، اینها هر چند سود کار خود را مستقیماً دریافت میکنند اما عملاً سود و دریافت تقاضای کار جدید آنها وابسته به سودده بودن کار هرزنامهنگاری برای طرف قراردادشان است).
از طرف دیگر فرستادن هرزنامه در حجم بالا نیازمند صرف هزینه و زمان است، علاوه بر این، این کار در بسیاری از کشورها جرم محسوب میشود (به عنوان نمونه، خبر محکومیت یکی از هرزنامهنگاران معروف را اینجا بخوانید) و خطرات خاص خودش را دارد. به همین دلیل هرزنامهنگارانی که در این کشورها زندگی میکنند نیازمند استفاده از روشهای گوناگون برای پنهان نگه داشتن هویتشان و همینطور محل ارسال هرزنامهها هستند که اینها در کل، هزینهی کار آنها را بالا میبرد. آنها معضلهای دیگری هم دارند: با پیشرفت و هوشمندتر شدن سیستمهای مبارزه با هرزنامهها در سیستمهای پست الکترونیکی، درصد بالایی از هرزنامههای ارسالی در پوشهی هرزنامهها جا خوش میکنند و مخاطب هدف، آنها را هیچ وقت باز نمیکند. با این تفاسیر آیا هنوز هم ارسال هرزنامه کاری سودده است؟ و اگر هست چقدر سود در این کار است؟
گروهی از محققان آمریکایی در اوایل سال میلادی جاری درصدد برآمدند که پاسخ این سؤالات را بیابند.
بهترین راه برای ارزیابی هرزنامهنگاری این است که خودت هرزنامهنگار باشی!
این جملهای است که یکی از اعضای تیم پژوهشی مذکور در توصیف روش انجام این تحقیق نوشته است. گروه مذکور یک سایت جعلی فروش داروهای محرک راهاندازی کردند، همانند هرزنامهنگاران حرفهای به کمک بدافزارها و ویروسهای کامپیوتری روی چیزی حدود هفتاد و پنج هزار کامپیوتر خانگی کنترل پیدا کردند تا از آنها به عنوان میاندار عملیات ارسال هرزنامههایشان استفاده کنند و در طول ۲۶ روز چیزی حدود ۳۵۰ میلیون هرزنامه ارسال کردند (در مجموع ۴۶۹ میلیون هرزنامه). تنها تفاوت کار آنها با هرزنامهنگاران واقعی آنجا بود که در مرحلهی نهایی کردن خرید از سایت جعلی هدف، سایت با ارائهی یک پیغام خطا از ورود اطلاعات کارتهای اعتباری توسط مشتری جلوگیری میکرد. نتیجهی نهایی این ماراتن هرزنامهنگاری تنها ۲۸ فروش بود! به عبارت دیگر به ازای هر دوازده و نیم میلیون هرزنامه یک مشتری به مرحلهی نهایی خرید میرسد. اشتباه نکنید! این آمار آنقدرها هم بد نیست. در واقع حجم ارسال هرزنامه از سوی هرزنامهنگاران حرفهای به حدی است که با لحاظ کردن این آمار تخمین زده میشود آنها روزانه هفت هزار دلار و سالانه بیش از دو میلیون دلار سوددهی دارند (حدس بزنید آمار ارسال روزانهی آنها را)! اما در هر صورت، این با برخی گمانهزنیها در مورد درآمدهای افسانهای هرزنامهنگاران نیز تناقض دارد و نشان میدهد که هرزنامهنگاری به نسبت کارهای غیرقانونی دیگر آنچنان که تصور میشود سودده نیست (برای کسب اطلاعات بیشتر در مورد این پژوهش اینجا را ببینید).
ادامه دارد …
فهرست سری نوشتههای من دربارهی هرزنامهها:
قسمت اول: ریشهی نام اسپم
قسمت دوم: هرزنامهها
قسمت سوم: کدامیک هرزنامههای بیشتری میگیرند: «علی» یا «زهرا»؟
قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!
قسمت پنجم: درآمدزایی هرزنامهها
قسمت ششم: ماشینهای صاحبنظر
قسمت هفتم: کپچا: «تو آدمی؟!»
قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن
قسمت نهم: صنعت حل کپچای هند و راهحلهای مقابله با اسپم با تکیه بر تحلیل محتوی
بگذارید «اسپم»ها را آنها بخورند!
۸۷/۰۹/۰۷تولید فهرستهای تقریباً تصادفی از آدرسهای ایمیل -آن طور که در نوشتهی قبلی به آن اشاره کردم- هزینهی کاری و زمانی بالایی دارد و با توجه به آن که فقط درصدی از نشانیهای تولید شده معتبر هستند برای هرزنامهنگاران کوچک راهحل چندان بهصرفه و مفیدی نیست (البته، هرزنامهنگاران با یک ارسال آزمایشی و بررسی پاسخ دریافتی از سرورهای پست الکترونیکی، میتوانند ایمیلهای معتبر را غربال کنند و فهرست خودشان را بهبود دهند، ولی این کار هم هزینهی پردازشی بالایی دارد). راه حل بهتر، استفاده از فهرستهای ایمیلهای واقعی است. اما این فهرستها چگونه پر میشوند و اطلاعات آنها چگونه جمعآوری میشود؟ هرزنامهنگاران برنامههای کاربردی زیادی در اختیار دارند که به کمک آنها میتوانند فهرستهای خودشان را با ایمیلهای واقعی پر کنند. آنها برنامههایی در اختیار دارند که همانند رباتهای موتورهای جستجو به صفحات وب سرکشی میکنند و در آنها دنبال رشتههایی با الگوی نشانی پست الکترونیکی (نام@دامنه.پسوند دامنه) میگردند. پس یکی از اولین و بهترین راهها برای جلوگیری از اضافه شدن ایمیلتان به این فهرستها آن است که آن را در صفحات عمومی وب در اختیار بقیه نگذارید. سعی کنید به جای وارد کردن نشانی ایمیلتان در وبلاگ یا سایت شخصیتان صفحهی تماس بسازید و آن را طوری تنظیم کنید که پیام مخاطب را به طور غیرمستقیم به ایمیلتان بفرستد. بسیاری از سیستمهای نظرسنجی سایتها و وبلاگها از شما میخواهند که نام، نشانی وبسایت و ایمیلتان را وارد کنید. تا زمانی که مطمئن نشدهاید سیستم سایت یا وبلاگ مذکور ایمیل شما را به صورت عمومی منتشر نمیکند از وارد کردن ایمیلهای اصلیتان در این گونه کادرها خودداری کنید (به عنوان نمونه، یکی از سیستمهای پرطرفدار وبلاگنویسی وطنی که جهت حفظ حریم خصوصی نظردهندگان در وبلاگها آی.پی آنها را حتی در اختیار صاحب وبلاگی که نظر برای او گذاشته شده نمیگذارد -احتمالاً به دلیل این که حق همه است که ایمیل نظردهندگان را بدانند و ببینند- ایمیل نظردهندگان را به صورت عمومی منتشر میکند 😉 ). برخی از سایتها و تالارهای گفتگو بدون ثبتنام، مطالب و مقالات خود را در اختیار بازدیدکننده نمیگذارند و شما مجبورید برای دستیابی به مطلب مورد نظرتان در این گونه سایتها ثبتنام کنید. مشکل اینجاست که ثبتنام در این سایتها معمولاً دریافت نامههای ناخواسته را به دنبال دارد و علاوه بر این، برخی از این سایتها اطلاعات کاربران خود را در قالب فهرستهای ایمیل، به هرزنامهنگاران میفروشند. اگر تنها به یک مطلب یا مقاله از سایت یا تالار گفتگوی مورد نظر نیاز دارید بهتر است ابتدا سعی کنید با استفاده از سایتهایی مانند bugmenot.com اطلاعات ورود به اشتراکگذاشته شدهای از سایت مزبور بیابید و با استفاده از آن وارد سایت مورد نظر شوید (برای نمونه، چند نام کاربری و کلمهی عبور برای سایت آفتاب نقطه آر را اینجا ببینید). در صورتی که به نتیجه نرسیدید و مجبور شدید در سایت مورد نظرتان ثبتنام کنید به جای وارد کردن ایمیل واقعیتان از ایمیلهای یکبار مصرف استفاده کنید. سایتهایی نظیر www.mailinator.com بدون نیاز به ثبتنام، نشانیهای ایمیل موقتی در اختیارتان میگذارند که پس از پایان فرایندهای ثبتنام میتوانید با خیال راحت آنها را رها کنید و به قول صاحبان این سرویس: «بگذارید اسپمها را آنها بخورند»!
ادامه دارد …
فهرست سری نوشتههای من دربارهی هرزنامهها:
قسمت اول: ریشهی نام اسپم
قسمت دوم: هرزنامهها
قسمت سوم: کدامیک هرزنامههای بیشتری میگیرند: «علی» یا «زهرا»؟
قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!
قسمت پنجم: درآمدزایی هرزنامهها
قسمت ششم: ماشینهای صاحبنظر
قسمت هفتم: کپچا: «تو آدمی؟!»
قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن
قسمت نهم: صنعت حل کپچای هند و راهحلهای مقابله با اسپم با تکیه بر تحلیل محتوی
کدامیک هرزنامههای بیشتری میگیرند: «علی» یا «زهرا»؟
۸۷/۰۹/۰۶من روزانه ده تا بیست هرزنامه دریافت میکنم. شما روزانه چند هرزنامه دریافت میکنید؟ پاسخ این که یک کاربر پست الکترونیکی چقدر اسپم دریافت کند بسته به شرایط متفاوت است. مسلماً آدمهای معروف هرزنامههای بیشتری دریافت میکنند. مخصوصاً اگر آدمهایی باشند که شرایط کاری یا معروفیتشان با کامپیوتر و اینترنت ارتباط داشته باشد و مجبور باشند نشانی پست الکترونیکیشان را به صورت عمومی اعلام کنند. آن وقت تعداد زیادی از هرزنامهفرستان نشانی پست الکترونیکیشان را میدانند و منطقاً آنها را در صدر فهرستهای ارسال ایمیلشان نگه میدارند. یک نمونهی شاخص از این آدمهای معروف، بیل گیتس بنیانگذار مایکروسافت است که چند سال پیش اظهار کرده روزانه چهار میلیون هرزنامه دریافت میکند!
عوامل دیگری هم در میزان دریافت هرزنامه تأثیر دارند. یک عامل مهم میتواند خود نشانی پست الکترونیکی باشد. نشانیهای پست الکترونیکی دو قسمت دارند: سمت چپ علامت @ که نام دارندهی پست الکترونیکی را مشخص میکند و سمت راست آن که نشاندهندهی سایت یا سرویس پست الکترونیکیی است که صندوق مزبور به آن تعلق دارد. سمت راست نشانی پست الکترونیکی شرکتی ِ کارمندان، معمولاً نشاندهندهی سایت شرکت محل کار آنهاست. مسلماً کسانی که پست الکترونیکیشان نشاندهندهی آن است که در شرکتهای بزرگ کار میکنند هدفهای بهتری برای هرزنامهها هستند. بنابراین -اگر به عنوان نمونه- سمت راست ایمیل شما @microsoft.com باشد به نسبت ِ بیشتر ِ کسانی که از سرویسهای پست الکترونیکی رایگان استفاده میکنند هرزنامههای بیشتری دریافت میکنید.
جالب است بدانیم که -بر طبق آمارها و پژوهشها- سمت چپ نشانی پست الکترونیکی -یعنی نام دارندهی آن- نیز در میزان دریافت هرزنامه تأثیر دارد!
یک راه مؤثر برای تولید فهرست ایمیلها، استفاده از فرهنگهای لغت و فهرستهای نامهاست. یک برنامهی کامپیوتری این نامها را از فرهنگ لغت میخواند، آنها را با حروف، نشانهها و اعداد ترکیب میکند و سپس نتایج را با @ و نشانی سایت سرویسدهندهی ایمیل ترکیب میکند. به این روش میتوان میلیونها بلکه میلیاردها نشانی ایمیل ساخت که اگر چه درصد بالایی از آنها ممکن است معتبر نباشند ولی درصد قابل توجهی از آنها نیز معتبر و موجودند و علاوه بر آن، ایمیلهایی هستند که در فهرستهای آمادهی ایمیلهای واقعی وجود ندارند. از آنجا که نامهای کمیاب در فهرستها و فرهنگ نامهای کمتری یافت میشوند کسانی که نام کمیاب دارند یا برای پست الکترونیکیشان نامهای مستعار ابتکاری و کمیاب انتخاب کردهاند کمتر از کسانی که نامهای متداول و معمولی دارند در معرض دریافت هرزنامه به این روش قرار میگیرند. از جهت دیگر فرهنگهای نامها معمولاً به ترتیب الفبا مرتب هستند. چرخهی تولید نشانی احتمالی پست الکترونیکی به روشی که شرح داده شد و ارسال هرزنامه به آن، زمانی که صحبت از میلیونها نشانی پست الکترونیکی باشد، با وجود پیشرفتهای سختافزاری و نرمافزاری و پهنای باندهای مگابایتی، هنوز هم بسیار زمانبر است و گاهی چندین روز زمان میبرد و به دلایل مختلف ممکن است پیش از تکمیل قطع شود و به پایان نرسد. با یادآوری این که فرهنگهای نامها معمولاً به ترتیب الفبا مرتب هستند به این نتیجه میرسیم که کسانی که حروف ابتدایی نامشان در صدر الفبای انگلیسی قرار دارد (مانند ali) -چون همیشه در صدر چرخهی دریافت هرزنامه هستند- اکثراً به نسبت کسانی که حروف ابتدایی نامشان در پایین این فهرست قرار دارد (مانند zahra) هرزنامههای بیشتری دریافت میکنند. آمارگیریها و نمونهبرداریهای واقعی نیز تفاوت محسوسی را بین آمار هرزنامههای دریافتی ایمیلهایی که با حروف ابتدایی الفبا شروع میشوند و آنهایی که با حروف انتهایی آغاز میشوند نشان داده، برای اطلاع بیشتر اینجا را ببینید.
بقیه دارد …
فهرست سری نوشتههای من دربارهی هرزنامهها:
قسمت اول: ریشهی نام اسپم
قسمت دوم: هرزنامهها
قسمت سوم: کدامیک هرزنامههای بیشتری میگیرند: «علی» یا «زهرا»؟
قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!
قسمت پنجم: درآمدزایی هرزنامهها
قسمت ششم: ماشینهای صاحبنظر
قسمت هفتم: کپچا: «تو آدمی؟!»
قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن
قسمت نهم: صنعت حل کپچای هند و راهحلهای مقابله با اسپم با تکیه بر تحلیل محتوی
هرزنامهها
۸۷/۰۹/۰۵ایمیل یا پست الکترونیکی از اولین چیزهایی است که با آشنایی با اینترنت صاحب آن میشویم. به همین دلیل ایمیلهای اسپم یا هرزنامهها هم شناختهشدهترین نوع اسپمها هستند. به طور کلی هر نوع نامهی الکترونیکی که در حجم انبوه و برای افرادی که تقاضای دریافت چنین نامهای را نکردهاند -فارغ از محتوای نامه- ارسال شود هرزنامه به حساب میآید.
هرزنامهها با انگیزههای مختلفی فرستاده میشوند، که در این بین، متداولترین انگیزه «پول» است. عدهای با هدف فروش و بازاریابی (و دستیابی به پول به شکل قانونیتر به نسبت دستهی دوم) دست به ارسال هرزنامه میزنند و عدهای دیگر با هدف دستیابی به پول از طریق فریفتن دیگران و کلاهبرداری. هرزنامههای نوع دوم در نگاه اول عجیب و وسوسهکننده هستند، نامههایی که ادعا میکنند شما برندهی بختآزماییی شدهاید که در آن شرکت نکردهاید (چند نمونه را در نظرات این نوشته ببینید)! نامههایی که در آنها ادعا میشود که شما طبق تحقیق وکلای معتبر از بستگان فلان سیاستمدار تازه از دنیا رفتهی نیجریایی هستید و وارث چند میلیون دلار ثروت او شدهاید و … . و شما برای آن که به پولی که برنده شدهاید یا به ارث بردهاید دست پیدا کنید باید مقادیری ناچیز هزینههای ابتدایی را بپردازید! جالب اینجاست که این گونه شیادیها با وجود این که این روزها تعداد زیادی از کاربران اینترنت با آنها آشنایی دارند هنوز هم کارایی دارد و گه گاه شکارهای درشتی را هم به دام میاندازد: به عنوان یک نمونه، در این صفحه، داستان زنی را بخوانید که همین اخیراً، در مجموع مبلغ چهارصد هزار دلار به کلاهبرداران اینترنتی پرداخت کرده است!
جالب است بدانیم که بیشتر هرزنامهها از سوی چند کشور خاص فرستاده میشوند. شاید باور کردنش کمی مشکل باشد (در حد باور کردن آمار دریافت فایرفاکس از سوی ایرانیها در روز انتشار فایرفاکس ۳)، که کشور ما در این بین، جزء این چند کشور خاص است (طبق آماری که آقای کیوان نیری از سیستم ضد اسپم خودش استخراج کرده ایران بعد از آمریکا، روسیه و چین، چهارمین کشور دنیا از لحاظ حجم ارسال اسپم است، این نوشتهی انگلیسی را از ایشان ببینید)! البته، در کشوری که فهرست چنددههزارتایی ایمیلهای ملت، بدون مزاحمت قانون و توسط شرکتهای اسم و رسمدار به فروش میرسد انتظار آفریده شدن چنین افتخاراتی را هم باید داشت! بگذریم …
بقیه دارد …
فهرست سری نوشتههای من دربارهی هرزنامهها:
قسمت اول: ریشهی نام اسپم
قسمت دوم: هرزنامهها
قسمت سوم: کدامیک هرزنامههای بیشتری میگیرند: «علی» یا «زهرا»؟
قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!
قسمت پنجم: درآمدزایی هرزنامهها
قسمت ششم: ماشینهای صاحبنظر
قسمت هفتم: کپچا: «تو آدمی؟!»
قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن
قسمت نهم: صنعت حل کپچای هند و راهحلهای مقابله با اسپم با تکیه بر تحلیل محتوی