تکه‌های مهم؟!

یک وقتی «ابزاری» وجود داشت «برای بریدن تکه‌های مهم» 😉 به اسم کلیپمارکس نقطه کام که بعدها توسط شرکت کمی بزرگتری خریداری شد و اسمش شد کلیپبورد نقطه کام که آن هم اخیراً اعلام کرده که توسط شرکت بسیار بزرگتری به اسم سیلزفورس خریداری شده و طبق رسم متداول اینجور ابزارها و سرویسها، وقتی چنین اتفاقی برایشان می‌افتد -بر خلاف استنباط اولیه مبنی بر بهبود چشمگیر و گسترده شدن امکانات با تکیه بر توان مالی صاحب آن- در حال انهدام کامل است و اعلام کرده که بیایید و اگر می‌خواهید اطلاعاتتان را بردارید که ما داریم جمع می‌کنیم، برویم.

خلاصه آن که ما هم رفتیم و آنچه آنجا کاشته و انباشته بودیم درویدیم و در این نشانی جایش دادیم. هر چند منابع خیلی از کلیپها گم شده‌اند اما باز هم -اگر به دنبال تکه‌هایی جالب و سرگرم‌کننده از اینترنت زمان پیرمردها- می‌گردید، چند دقیقه‌ای می‌تواند سرگرمتان کند.

hamidreza clipmarks backups

گنجوروید

این حاصل آن چند روز تعطیلی ناخواستهٔ هفتهٔ گذشته است. مرفهین بادردِ علاقمند به شعر ِ صاحب گوشیهای اندروید آزمایشش کنند، نظرشان را بگویند.

گنجوروید

گلوگاه‌یاب

بعد از مشکلاتی که برای میزبانی گنجور پیش آمد تصمیم گرفتم این بار برای گنجور از یک شرکت معتبر خارجی خدمات میزبانی بگیرم و نهایتاً از مدیاتمپل که از شرکتهای توصیه شده توسط سایت وردپرس برای میزبانی وب بود خدمات میزبانی خریدیم.

نکتهٔ جالبی که در مورد سرویس میزبانی این شرکت نظرم را جلب کرد نحوهٔ سنجنش میزان استفاده از منابع در سرویس میزبانی گرید این شرکت است. جایی که با توجه به فضای ۱۰۰ گیگابایتی و پهنای باند یک ترابایتی (با هزینهٔ سالیانهٔ حدود ۲۰۰ دلار) محدودیتهای معمول میزبانهای وب عملاً کارایی ندارد.

این شرکت معیاری را به اسم GPU (ربطی به Graphics Processing Unit ندارد 😉 مخفف Grid Performance Unit است) طراحی کرده که بر اساس میزان مصرف منابع سیستم؛ کاربران را محدود می‌کند و جالب آن که گزارش کاملی که در این زمینه ارائه می‌دهد می‌تواند کاملاً کارایی لازم بر اشکالیابی و پیدا کردن اسکریپتهای ناکارا یا مشکلدار را داشته باشد.

Media Temple GPU Summary
Media Temple GPU Report

این طرح به نظرم به راحتی می‌تواند مشکل شرکتهای میزبانی را حل کند تا به جای متهم کردن نمونه سایتهای تصادفی به مصرف بیش از حد منابع و مسدود کردن این گونه سایتها بر اساس حدس و گمان یا با استفاده از نرم‌افزارهای مشکوک بدون ارائهٔ گزارش و بدون اخطار قبلی یا بعدی (من حدس می‌زنم همین نرم‌افزار معلوم‌الحال 😉 وبلاگ رازیگر نقطه کام را که عملاً مدتهاست به‌روز نشده عامل مصرف بیش از حد منابع سیستم شناخته و تا به امروز برای بیش از چند هفته مسدودش کرده بدون آن که احتمالاً صاحب سایت از قضیه خبر داشته باشد. گواه این قضیه هم آن است که در کش گوگل هم همین قضیه به ثبت رسیده!) و نهایتاً عدم واکنش در مقابل تقاضا برای تأدیهٔ مبالغ پرداختی 😉 گلوگاههای فشار روی سرورها را پیدا کنند و روباتهای تخیلی را (که من حدس می‌زنم خزندهٔ موتورهای جستجو واقعی‌ترین نمونه‌هایشان باشند) به حمله و فشار روی سرورها متهم نکنند.

دی.ان.اس‌های گوگل

این را در نظرات یکی از وبلاگها خواندم، یادم نیست کدام وبلاگ. اما به هر حال کار مرا فعلاً راه انداخته. گفتم شاید شما هم، همهٔ زندگی آنلاینتان روی جیمیلتان باشد و دسترسی از طریق محیط آشنایی وبی آن برایتان ضروری، شاید این راه حل به درد شما هم بخورد: دی.ان.اسهای ارتباط اینترنتیتان را روی 8.8.8.8 و 8.8.4.4 تنظیم کنید بلکه رستگار شوید.

فایرفاکس جدید، اپراهای موبایل و …

فایرفاکس ۳.۶ خیلی وقت است که آمده، ولی من همین یکی دو روز پیش نصبش کرده‌ام. با نصب (در واقع ارتقا به) این ویرایش، بعضی افزونه‌های ناسازگارم از کار افتادند. راه حلی که برای ویرایشهای قدیمی‌تر این مشکل را حل می‌کرد برای این ویرایش با کمی تغییر کار می‌کند: کافیست در about:config کلیدی با نام extensions.checkCompatibility.3.6 ایجاد کنید و مقدار آن را false بگذارید (دستورالعمل این کار مطابق همان روش قدیمی است که می‌توانید آن را اینجا بازخوانی کنید).

ادامه خواندن “فایرفاکس جدید، اپراهای موبایل و …”

آسیاتک

کمتر از بیست روز دیگر فرصت دارم تا خانه‌ای نزدیک محل کار جدیدم (یا محل جدید کارم 😉 ) پیدا و نقل مکان کنم. در این مدتی که در خانه‌ی فعلی (واقع در شمال تهران) ساکن بودم (حدود دو سال و نیم) از خدمات اینترنت ADSL آسیاتک استفاده می‌کردم. آن وقتها که دنبال ای.دی.اس.ال بودم کمی راجع به کیفیت خدمات شرکتهای مختلف جستجو کردم. تا آنجا که به یاد دارم -غیر از نارضایتیهای شدید بعضی- مطلب مؤثر و به درد بخوری پیدا نکردم. آسیاتک آن وقتها یک ماه رایگان سرویس می‌داد، روی همین حساب، با نیت این که سرویسش را تست کنم و در صورت رضایت، تمدید کنم سراغ همین شرکت رفتم (شرکتهای دیگر چنین امکانی نداشتند). مودم را از خودشان خریدم. مودم USB با مارک CORECESS ساخت چین که بعدها به این نتیجه رسیدم که انتخاب اشتباهی بوده : اولاً گاه و بیگاه باعث بروز خطاهای صفحه آبی ویندوز می‌شود و ثانیاً دو سه باری که با دریافت ویرایشهای جدید اوبونتو یا لینوکسهای دیگر تلاش کردم از لینوکس روی کامپیوترم استفاده کنم -با توجه به این که به اندازه‌ی کافی با لینوکس آشنایی دارم و پیشتر کارت گرافیکی و مودم Dial Up م را روی لینوکسهای قدیمی راه انداخته بودم-، عدم موفقیت در راه‌اندازی این مودم باعث شد بی‌خیال لینوکس شوم.

اوایل برای یادآوری شارژ چند روزی پیش از اتمام آن زنگ می‌زدند و می‌پرسیدند که لازم است شارژ صورت گیرد یا نه و برای تحویل فاکتور و دریافت هزینه توسط پیک هماهنگ می‌کردند. بعدتر، یواش یواش یادشان می‌رفت و بعدترها گفتند باید خودتان تماس بگیرید.

برای پرداخت هزینه‌ی ماهیانه ابتدای کار پیک می‌فرستادند -برای خطوط ۱۲۸ کیلو به بالا رایگان-، یک مدت هم مبلغ را واریز می‌کردم و شماره فیش را با ایمیل برایشان می‌فرستادم. بعدتر، پرداخت (کاملاً) آنلاین راه انداختند که فکر می‌کنم چند ماهی 😉 کار می‌کرد (امکان شارژ سرویس، پرداخت آنلاین و گزارشگیری داشت). الان فقط می‌شود از طریق سیستم آنلاینشان -بدون نیاز به تماس با واحد فروش- ماه بعد را شارژ کنید و شماره فیش واریزی را وارد کنید. در هر صورت، همینش هم فکر می‌کنم غنیمت باشد با توجه به این که «اینجا ایران است».

قیمتهایش اوایل خوب بود، من در تمام مدت این دو سال و نیم ۱۲۸ کیلو با پهنای باند نامحدود خریداری می‌کردم، فکر می‌کنم تا همین پارسال کمتر از بیست هزار تومان می‌شد. اما، با طرح شدن آن چند (سه؟) درصد مالیات بر ارزش افزوده (یا یک چیزی مثل این)، بهانه کردند همین را و چیزی حدود چهل درصد قیمتهایشان را افزایش دادند (نزدیک بیست و نه هزار تومان در ماه). ضمن این که پیشترها قیمت ADSL برای کاربران خانگیشان متفاوت بود از کاربران شرکتی (ارزان‌تر بود) و بعدترها همه را یک کاسه کردند.

غیر از چند ماه ابتدایی و آن چند موردی که کوسه گویا اینترنت ایران را گاز گرفته بود و البته موردهای مربوط به مرکز مخابرات، قطعی آنچنانی نداشتند. زیاد پیش نیامد که بخواهم با واحد فنیشان تماس بگیرم. یکی دوباری که پیش آمد احساس می‌کردم که اینها فقط چند شماره کد خطا را حفظند و خارج از محدوده‌ی این کدها کمک زیادی نمی‌توانند بکنند. مثلاً برای مدتی بخش افزونه‌های سایت فایرفاکس با این آی.اس.پی بالا نمی‌آمد در حالی که در محل کارم -که پارس‌آنلاین استفاده می‌کردیم- مشکلی نبود، تماسهای من با واحد فنی آسیاتک در این مورد به جایی نرسید، هر چند بندگان خدا تلاششان را می‌کردند که مشکل من را حل کنند اما خوب وقتی نمی‌دانستند فایرفاکس چیست، انتظار نباید می‌داشتم که مشکل من را بفهمند! البته این مربوط به همان اوایل (شاید دو سال پیش) است، این مشکل خود به خود حل شد و فکر می‌کنم با فیلترینگ مرتبط بود. تماسهای دیگر که در مورد اشکال در ارتباط بود به حل آنی مشکل می‌انجامید.

پیشترها سیستم تلفن گویایشان ساده و سرراست بود و با گوش کردن چند ثانیه دستورالعمل می‌شد به اپراتور مقصد رسید. اخیراً برای دستیابی به یک بخش باید شاید نزدیک یک دقیقه دستورالعمل گوش کنید، باز دستورالعمل گوش کنید و … و نهایتاً اگر به مقصد رسیدید ابتدا -چون اپراتور اشغال است- اگر می‌خواهید منتظر بمانید شماره‌ای را بزنید (طبق دستورالعمل) و بعد از آن اگر می‌خواهید از حالت انتظار خارج شوید (؟!) طبق دستورالعمل شماره‌ای بزنید و اگر در این مرحله شماره‌ی دستور داده شده را نزنید چند دقیقه بعد احتمالاً می‌توانید با اپراتور صحبت کنید! برای مدتی هم -در یک اقدام ابتکاری-، به جای آهنگ انتظار، برای تماس گیرنده در یک حلقه‌ی نامتناهی شماره‌حسابهایشان را تکرار می‌کردند.

من تقریباً همیشه بیتورنتم به راه بود و به همین خاطر می‌توانم بگویم با توجه به سرعت دریافت این نرم‌افزار، سرعت خط تحویلی به من چیزی در حدود آن چیزی که باید باشد بوده.

در کل، ایضاً با توجه به این واقعیت که «اینجا ایران است» و شنیده‌ها و دیده‌هایم از سایر آی.اس.پی‌ها از آسیاتک راضیم و در صورتی که خانه‌ی جدید هنوز یافت نشده، مشکل مخابراتی نداشته باشد و بتوانم ای.دی.اس.ال بگیرم احتمال آن که باز هم سراغ آسیاتک بروم زیاد است. فعلاً با توجه به این که احتمال می‌دهم این ماه آخری دنبال خانه گشتن و مسائل جانبی آن وقت کمتری برای وبگردی برایم باقی بگذارد و همینطور این که به اندازه‌ی یک ماه کامل در این خانه ساکن نخواهم بود، برای این ماه، سرویسم را با محدودیت پهنای باند شارژ کرده‌ام تا ببینم در ماه بعد ساکن کجا هستم و از کجا اینترنت می‌گیرم.

اگر شما راجع به آی.اس.پی‌های دیگر نظر و اطلاع خاصی دارید لطفاً عنوان کنید. باشد که در ماه بعد ما را و در ماههای بعد بندگان دیگر خدا را به کار آید!

صنعت حل کپچای هند و راه‏حلهای مقابله با اسپم با تکیه بر تحلیل محتوا

تا به اینجا رسیدیم که کپچای تصویر متنی را با او.سی.آر به شکل ماشینی دور می‌زنند و به همین دلیل روشهای متفاوتی برای طراحی کپچا ارائه شده است. جالب است بدانیم که این روزها شرکتها و مراکزی وجود دارند که قیمتهای استاندارد (!) برای شکستن کپچای سایتهای مختلف ارائه می‌کنند. به عنوان نمونه این تکه‌ای از لیست قیمت یک شرکت متخصص شکستن کپچاهای سایتهای چینی است (منبع عکس):

لیست قیمت شکستن کپچا

ماجرا محدود به کپچاهای تصویری هم نمی‌شود، کپچاهای صوتی هم توسط نرم‌افزارهای کامپیوتری -گویا به آسانی- قابل عبور هستند (در این نشانی مقاله‌ای تفصیلی درباره‌ی نحوه‌ی عبور از کپچای صوتی جیمیل بخوانید). کپچاهای تصویر متنی شرکتهای بزرگ (مایکروسافت، یاهو و گوگل) به دلیل تعداد کاربران بالا و همچنین اعتبار ایمیلهای ارسالی از آنها برای نرم‌افزارهای مبارزه با هرزنامه‌ها بارها و بارها شکسته شده‌اند (اینجا را ببینید).

اما کپچاهای ابتکاری چه؟! آیا مقاومت کپچاهای ابتکاری (کپچای محاسباتی، کپچای سه‌بعدی، سگ و گربه‌ی رپیدشر و ) بیشتر نیست؟ آیا نرم‌افزارهای ارسال انبوه اسپم از این کپچاها هم می‌توانند عبور کنند؟

تا اینجا و با توجه به سرمایه‌گذاریهای قابل توجه ارسال کنندگان اسپم روی کارشان باید به این نتیجه رسیده باشید که در این «شغل» آنقدر «پول» هست که نه تنها اجازه‌ی استفاده از راهبردهای «تحقیق و توسعه» را برای شکستن سدهای پیش رو به آنها می‌دهد بلکه احتمالاً این درآمدها می‌تواند آنقدر زیاد باشد که حاضر باشند برای حل مشکلات پیش‌رو مستقیماً و عملاً نیروی انسانی در اختیار بگیرند و از کمک نیروهای کار ارزانقیمت کشورهای در حال توسعه استفاده کنند.

به پشتوانه‌ی سرمایه‌ی ارسال کنندگان اسپم در کشورهایی مانند هند شاهد ظهور یک صنعت درآمدزای بدیع هستیم: «صنعت حل کپچا»! اتاقهایی با بیست الی سی اپراتور که در ازای دستمزدهایی همچون «هر ۱۰۰۰ کپچا ۲ دلار» ساعتهای کاری خود را با بازخوانی کپچاها می‌گذرانند. فرایند کار به این صورت است که نرم‌افزار ارسال اسپم تصویر کپچا را جدا می‌کند، به یکی از اپراتورها می‌دهد، اپراتور مقدار آن را درج و ارسال می‌کند و نرم‌افزار، اسپمش را ارسال می‌کند. با این سیستم کاری، شرکتهای حل کپچای هندی ادعای حل روزانه تا ۵۰۰۰۰ کپچا یا بیشتر را به مدد چند ده کامپیوتر و اپراتور، و شیفتهای کاریی که ۲۴ ساعت ۷ روز هفته را پوشش می‌دهند دارند (برای کسب اطلاعات بیشتر اینجا را ببینید).

نمایی از نرم‌افزارهای حل کپچا با کمک اپراتورهای انسانی

اینجاست که کارکرد کپچا برای جلوگیری از ارسال انبوه اسپم زیر سؤال می‌رود، چرا که کپچا برای حل این معضل، مبتنی بر این ایده است که ارسال‌کنندگان انبوه اسپم ماشین هستند و با تشخیص انسان از ماشین می‌توان جلوی ارسال انبوه اسپم را گرفت. و در اینجا حداقل بخش سخت‌تر کار را انسانها انجام می‌دهند.

دسته‌ی دیگری از راه‌حلهای مقابله با اسپم بر «تحلیل متون ارسالی» مبتنی هستند. مقایسه‌ی آی.پی ارسال‌کننده با لیست سیاه ارسال‌کنندگان اسپم شناخته شده، شمارش تعداد لینکهای موجود در متون و جستجوی نشانی سایتهای اسپم در بین آنها، بررسی محتوای متن و جستجوی واژه‌های متداول موجود در متون اسپم در متن ارسالی (یک آمار جالب در این زمینه را در این تصویر ببینید) از جمله ترفندهای به کار گرفته شده در این روش هستند. معمولاً برای جلوگیری از دور زدن شدن آسان الگوریتمها و روشهای مورد استفاده در این راه‌حلها بخش عمده‌ای از این روشها منتشر نمی‌شوند و تنها ابزارهای ارتباطی به صورت کدباز در اختیار استفاده‌کنندگان قرار می‌گیرند. «اکیسمت» سیستم مقابله با نظرات هرز که در وردپرس و برخی دیگر از سیستمهای مدیریت محتوی به کار گرفته شده است از جمله ابزارهای مبتنی بر این روش است.

این احتمالاً آخرین قسمت سری مطالبی بود که درباره‌ی «اسپم» نوشته‌ام. فهرست نوشته‌های این سری:

قسمت اول: ریشه‌ی نام اسپم

قسمت دوم: هرزنامه‌ها

قسمت سوم: کدامیک هرزنامه‌های بیشتری می‌گیرند: «علی» یا «زهرا»؟

قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!

قسمت پنجم: درآمدزایی هرزنامه‌ها

قسمت ششم: ماشینهای صاحب‌نظر

قسمت هفتم: کپچا: «تو آدمی؟!»

قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن

قسمت نهم: صنعت حل کپچای هند و راه‌حلهای مقابله با اسپم با تکیه بر تحلیل محتوی

درآمدزایی هرزنامه‏‌ها

قبلاً اشاره کردم که مهمترین انگیزه برای هرزنامه‌نگاری پول و کسب درآمد است. تعداد زیادی از هرزنامه‌ها برای این فرستاده می‌شوند که گیرنده را به خرید کالا یا خدمات ترغیب کنند. در واقع سود هرزنامه‌نگاری به صورت غیرمستقیم و از سود کالا و خدمات فروخته شده به دست می‌آید (البته بسیاری در قبال دریافت دستمزد، برای دیگران کار ارسال نامه‌های تبلیغی ناخواسته را در حجم وسیع انجام می‌دهند، اینها هر چند سود کار خود را مستقیماً دریافت می‌کنند اما عملاً سود و دریافت تقاضای کار جدید آنها وابسته به سودده بودن کار هرزنامه‌نگاری برای طرف قراردادشان است).

از طرف دیگر فرستادن هرزنامه در حجم بالا نیازمند صرف هزینه و زمان است، علاوه بر این، این کار در بسیاری از کشورها جرم محسوب می‌شود (به عنوان نمونه، خبر محکومیت یکی از هرزنامه‌نگاران معروف را اینجا بخوانید) و خطرات خاص خودش را دارد. به همین دلیل هرزنامه‌نگارانی که در این کشورها زندگی می‌کنند نیازمند استفاده از روشهای گوناگون برای پنهان نگه داشتن هویتشان و همینطور محل ارسال هرزنامه‌ها هستند که اینها در کل، هزینه‌ی کار آنها را بالا می‌برد. آنها معضلهای دیگری هم دارند: با پیشرفت و هوشمندتر شدن سیستمهای مبارزه با هرزنامه‌ها در سیستمهای پست الکترونیکی، درصد بالایی از هرزنامه‌های ارسالی در پوشه‌ی هرزنامه‌ها جا خوش می‌کنند و مخاطب هدف، آنها را هیچ وقت باز نمی‌کند. با این تفاسیر آیا هنوز هم ارسال هرزنامه کاری سودده است؟ و اگر هست چقدر سود در این کار است؟

گروهی از محققان آمریکایی در اوایل سال میلادی جاری درصدد برآمدند که پاسخ این سؤالات را بیابند.

بهترین راه برای ارزیابی هرزنامه‌نگاری این است که خودت هرزنامه‌نگار باشی!

این جمله‌ای است که یکی از اعضای تیم پژوهشی مذکور در توصیف روش انجام این تحقیق نوشته است. گروه مذکور یک سایت جعلی فروش داروهای محرک راه‌اندازی کردند، همانند هرزنامه‌نگاران حرفه‌ای به کمک بدافزارها و ویروسهای کامپیوتری روی چیزی حدود هفتاد و پنج هزار کامپیوتر خانگی کنترل پیدا کردند تا از آنها به عنوان میاندار عملیات ارسال هرزنامه‌هایشان استفاده کنند و در طول ۲۶ روز چیزی حدود ۳۵۰ میلیون هرزنامه ارسال کردند (در مجموع ۴۶۹ میلیون هرزنامه). تنها تفاوت کار آنها با هرزنامه‌نگاران واقعی آنجا بود که در مرحله‌ی نهایی کردن خرید از سایت جعلی هدف، سایت با ارائه‌ی یک پیغام خطا از ورود اطلاعات کارتهای اعتباری توسط مشتری جلوگیری می‌کرد. نتیجه‌ی نهایی این ماراتن هرزنامه‌نگاری تنها ۲۸ فروش بود! به عبارت دیگر به ازای هر دوازده و نیم میلیون هرزنامه یک مشتری به مرحله‌ی نهایی خرید می‌رسد. اشتباه نکنید! این آمار آنقدرها هم بد نیست. در واقع حجم ارسال هرزنامه از سوی هرزنامه‌نگاران حرفه‌ای به حدی است که با لحاظ کردن این آمار تخمین زده می‌شود آنها روزانه هفت هزار دلار و سالانه بیش از دو میلیون دلار سوددهی دارند (حدس بزنید آمار ارسال روزانه‌ی آنها را)! اما در هر صورت، این با برخی گمانه‌زنیها در مورد درآمدهای افسانه‌ای هرزنامه‌نگاران نیز تناقض دارد و نشان می‌دهد که هرزنامه‌نگاری به نسبت کارهای غیرقانونی دیگر آنچنان که تصور می‌شود سودده نیست (برای کسب اطلاعات بیشتر در مورد این پژوهش اینجا را ببینید).

ادامه دارد …

فهرست سری نوشته‌های من درباره‌ی هرزنامه‌ها:

قسمت اول: ریشه‌ی نام اسپم

قسمت دوم: هرزنامه‌ها

قسمت سوم: کدامیک هرزنامه‌های بیشتری می‌گیرند: «علی» یا «زهرا»؟

قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!

قسمت پنجم: درآمدزایی هرزنامه‌ها

قسمت ششم: ماشینهای صاحب‌نظر

قسمت هفتم: کپچا: «تو آدمی؟!»

قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن

قسمت نهم: صنعت حل کپچای هند و راه‌حلهای مقابله با اسپم با تکیه بر تحلیل محتوی