بگذارید «اسپم»ها را آنها بخورند!

تولید فهرستهای تقریباً تصادفی از آدرسهای ایمیل -آن طور که در نوشته‌ی قبلی به آن اشاره کردم- هزینه‌ی کاری و زمانی بالایی دارد و با توجه به آن که فقط درصدی از نشانیهای تولید شده معتبر هستند برای هرزنامه‌نگاران کوچک راه‌حل چندان به‌صرفه و مفیدی نیست (البته، هرزنامه‌نگاران با یک ارسال آزمایشی و بررسی پاسخ دریافتی از سرورهای پست الکترونیکی، می‌توانند ایمیلهای معتبر را غربال کنند و فهرست خودشان را بهبود دهند، ولی این کار هم هزینه‌ی پردازشی بالایی دارد). راه حل بهتر، استفاده از فهرستهای ایمیلهای واقعی است. اما این فهرستها چگونه پر می‌شوند و اطلاعات آنها چگونه جمع‌آوری می‌شود؟ هرزنامه‌نگاران برنامه‌های کاربردی زیادی در اختیار دارند که به کمک آنها می‌توانند فهرستهای خودشان را با ایمیلهای واقعی پر کنند. آنها برنامه‌هایی در اختیار دارند که همانند رباتهای موتورهای جستجو به صفحات وب سرکشی می‌کنند و در آنها دنبال رشته‌هایی با الگوی نشانی پست الکترونیکی (نام@دامنه.پسوند دامنه) می‌گردند. پس یکی از اولین و بهترین راهها برای جلوگیری از اضافه شدن ایمیلتان به این فهرستها آن است که آن را در صفحات عمومی وب در اختیار بقیه نگذارید. سعی کنید به جای وارد کردن نشانی ایمیلتان در وبلاگ یا سایت شخصیتان صفحه‌ی تماس بسازید و آن را طوری تنظیم کنید که پیام مخاطب را به طور غیرمستقیم به ایمیلتان بفرستد. بسیاری از سیستمهای نظرسنجی سایتها و وبلاگها از شما می‌خواهند که نام، نشانی وب‌سایت و ایمیلتان را وارد کنید. تا زمانی که مطمئن نشده‌اید سیستم سایت یا وبلاگ مذکور ایمیل شما را به صورت عمومی منتشر نمی‌کند از وارد کردن ایمیلهای اصلیتان در این گونه کادرها خودداری کنید (به عنوان نمونه، یکی از سیستمهای پرطرفدار وبلاگنویسی وطنی که جهت حفظ حریم خصوصی نظردهندگان در وبلاگها آی.پی آنها را حتی در اختیار صاحب وبلاگی که نظر برای او گذاشته شده نمی‌گذارد -احتمالاً به دلیل این که حق همه است که ایمیل نظردهندگان را بدانند و ببینند- ایمیل نظردهندگان را به صورت عمومی منتشر می‌کند 😉 ). برخی از سایتها و تالارهای گفتگو بدون ثبت‌نام، مطالب و مقالات خود را در اختیار بازدیدکننده نمی‌گذارند و شما مجبورید برای دستیابی به مطلب مورد نظرتان در این گونه سایتها ثبت‌نام کنید. مشکل اینجاست که ثبت‌نام در این سایتها معمولاً دریافت نامه‌های ناخواسته را به دنبال دارد و علاوه بر این، برخی از این سایتها اطلاعات کاربران خود را در قالب فهرستهای ایمیل، به هرزنامه‌نگاران می‌فروشند. اگر تنها به یک مطلب یا مقاله از سایت یا تالار گفتگوی مورد نظر نیاز دارید بهتر است ابتدا سعی کنید با استفاده از سایتهایی مانند bugmenot.com اطلاعات ورود به اشتراک‌گذاشته شده‌ای از سایت مزبور بیابید و با استفاده از آن وارد سایت مورد نظر شوید (برای نمونه، چند نام کاربری و کلمه‌ی عبور برای سایت آفتاب نقطه آر را اینجا ببینید). در صورتی که به نتیجه نرسیدید و مجبور شدید در سایت مورد نظرتان ثبت‌نام کنید به جای وارد کردن ایمیل واقعیتان از ایمیلهای یک‌بار مصرف استفاده کنید. سایتهایی نظیر www.mailinator.com بدون نیاز به ثبت‌نام، نشانیهای ایمیل موقتی در اختیارتان می‌گذارند که پس از پایان فرایندهای ثبت‌نام می‌توانید با خیال راحت آنها را رها کنید و به قول صاحبان این سرویس: «بگذارید اسپمها را آنها بخورند»!

ادامه دارد …

فهرست سری نوشته‌های من درباره‌ی هرزنامه‌ها:

قسمت اول: ریشه‌ی نام اسپم

قسمت دوم: هرزنامه‌ها

قسمت سوم: کدامیک هرزنامه‌های بیشتری می‌گیرند: «علی» یا «زهرا»؟

قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!

قسمت پنجم: درآمدزایی هرزنامه‌ها

قسمت ششم: ماشینهای صاحب‌نظر

قسمت هفتم: کپچا: «تو آدمی؟!»

قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن

قسمت نهم: صنعت حل کپچای هند و راه‌حلهای مقابله با اسپم با تکیه بر تحلیل محتوی

کدامیک هرزنامه‏های بیشتری می‏گیرند: «علی» یا «زهرا»؟

من روزانه ده تا بیست هرزنامه دریافت می‌کنم. شما روزانه چند هرزنامه دریافت می‌کنید؟ پاسخ این که یک کاربر پست الکترونیکی چقدر اسپم دریافت کند بسته به شرایط متفاوت است. مسلماً آدمهای معروف هرزنامه‌های بیشتری دریافت می‌کنند. مخصوصاً اگر آدمهایی باشند که شرایط کاری یا معروفیتشان با کامپیوتر و اینترنت ارتباط داشته باشد و مجبور باشند نشانی پست الکترونیکیشان را به صورت عمومی اعلام کنند. آن وقت تعداد زیادی از هرزنامه‌فرستان نشانی پست الکترونیکیشان را می‌دانند و منطقاً آنها را در صدر فهرستهای ارسال ایمیلشان نگه می‌دارند. یک نمونه‌ی شاخص از این آدمهای معروف، بیل گیتس بنیانگذار مایکروسافت است که چند سال پیش اظهار کرده روزانه چهار میلیون هرزنامه دریافت می‌کند!

عوامل دیگری هم در میزان دریافت هرزنامه تأثیر دارند. یک عامل مهم می‌تواند خود نشانی پست الکترونیکی باشد. نشانیهای پست الکترونیکی دو قسمت دارند: سمت چپ علامت @ که نام دارنده‌ی پست الکترونیکی را مشخص می‌کند و سمت راست آن که نشان‌دهنده‌ی سایت یا سرویس پست الکترونیکیی است که صندوق مزبور به آن تعلق دارد. سمت راست نشانی پست الکترونیکی شرکتی ِ کارمندان، معمولاً نشان‌دهنده‌ی سایت شرکت محل کار آنهاست. مسلماً کسانی که پست الکترونیکیشان نشان‌دهنده‌ی آن است که در شرکتهای بزرگ کار می‌کنند هدفهای بهتری برای هرزنامه‌ها هستند. بنابراین -اگر به عنوان نمونه- سمت راست ایمیل شما @microsoft.com باشد به نسبت ِ بیشتر ِ کسانی که از سرویسهای پست الکترونیکی رایگان استفاده می‌کنند هرزنامه‌های بیشتری دریافت می‌کنید.

جالب است بدانیم که -بر طبق آمارها و پژوهشها- سمت چپ نشانی پست الکترونیکی -یعنی نام دارنده‌ی آن- نیز در میزان دریافت هرزنامه تأثیر دارد!

یک راه مؤثر برای تولید فهرست ایمیلها، استفاده از فرهنگهای لغت و فهرستهای نامهاست. یک برنامه‌ی کامپیوتری این نامها را از فرهنگ لغت می‌خواند، آنها را با حروف، نشانه‌ها و اعداد ترکیب می‌کند و سپس نتایج را با @ و نشانی سایت سرویس‌دهنده‌ی ایمیل ترکیب می‌کند. به این روش می‌توان میلیونها بلکه میلیاردها نشانی ایمیل ساخت که اگر چه درصد بالایی از آنها ممکن است معتبر نباشند ولی درصد قابل توجهی از آنها نیز معتبر و موجودند و علاوه بر آن، ایمیلهایی هستند که در فهرستهای آماده‌ی ایمیلهای واقعی وجود ندارند. از آنجا که نامهای کمیاب در فهرستها و فرهنگ نامهای کمتری یافت می‌شوند کسانی که نام کمیاب دارند یا برای پست الکترونیکیشان نامهای مستعار ابتکاری و کمیاب انتخاب کرده‌اند کمتر از کسانی که نامهای متداول و معمولی دارند در معرض دریافت هرزنامه به این روش قرار می‌گیرند. از جهت دیگر فرهنگهای نامها معمولاً به ترتیب الفبا مرتب هستند. چرخه‌ی تولید نشانی احتمالی پست الکترونیکی به روشی که شرح داده شد و ارسال هرزنامه به آن، زمانی که صحبت از میلیونها نشانی پست الکترونیکی باشد، با وجود پیشرفتهای سخت‌افزاری و نرم‌افزاری و پهنای باندهای مگابایتی، هنوز هم بسیار زمانبر است و گاهی چندین روز زمان می‌برد و به دلایل مختلف ممکن است پیش از تکمیل قطع شود و به پایان نرسد. با یادآوری این که فرهنگهای نامها معمولاً به ترتیب الفبا مرتب هستند به این نتیجه می‌رسیم که کسانی که حروف ابتدایی نامشان در صدر الفبای انگلیسی قرار دارد (مانند ali) -چون همیشه در صدر چرخه‌ی دریافت هرزنامه هستند- اکثراً به نسبت کسانی که حروف ابتدایی نامشان در پایین این فهرست قرار دارد (مانند zahra) هرزنامه‌های بیشتری دریافت می‌کنند. آمارگیریها و نمونه‌برداریهای واقعی نیز تفاوت محسوسی را بین آمار هرزنامه‌های دریافتی ایمیلهایی که با حروف ابتدایی الفبا شروع می‌شوند و آنهایی که با حروف انتهایی آغاز می‌شوند نشان داده، برای اطلاع بیشتر اینجا را ببینید.

بقیه دارد …

فهرست سری نوشته‌های من درباره‌ی هرزنامه‌ها:

قسمت اول: ریشه‌ی نام اسپم

قسمت دوم: هرزنامه‌ها

قسمت سوم: کدامیک هرزنامه‌های بیشتری می‌گیرند: «علی» یا «زهرا»؟

قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!

قسمت پنجم: درآمدزایی هرزنامه‌ها

قسمت ششم: ماشینهای صاحب‌نظر

قسمت هفتم: کپچا: «تو آدمی؟!»

قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن

قسمت نهم: صنعت حل کپچای هند و راه‌حلهای مقابله با اسپم با تکیه بر تحلیل محتوی

هرزنامه‏ها

ایمیل یا پست الکترونیکی از اولین چیزهایی است که با آشنایی با اینترنت صاحب آن می‌شویم. به همین دلیل ایمیلهای اسپم یا هرزنامه‌ها هم شناخته‌شده‌ترین نوع اسپمها هستند. به طور کلی هر نوع نامه‌ی الکترونیکی که در حجم انبوه و برای افرادی که تقاضای دریافت چنین نامه‌ای را نکرده‌اند -فارغ از محتوای نامه- ارسال شود هرزنامه به حساب می‌آید.

هرزنامه‌ها با انگیزه‌های مختلفی فرستاده می‌شوند، که در این بین، متداولترین انگیزه «پول» است. عده‌ای با هدف فروش و بازاریابی (و دستیابی به پول به شکل قانونی‌تر به نسبت دسته‌ی دوم) دست به ارسال هرزنامه می‌زنند و عده‌ای دیگر با هدف دستیابی به پول از طریق فریفتن دیگران و کلاهبرداری. هرزنامه‌های نوع دوم در نگاه اول عجیب و وسوسه‌کننده هستند، نامه‌هایی که ادعا می‌کنند شما برنده‌ی بخت‌آزماییی شده‌اید که در آن شرکت نکرده‌اید (چند نمونه را در نظرات این نوشته ببینید)! نامه‌هایی که در آنها ادعا می‌شود که شما طبق تحقیق وکلای معتبر از بستگان فلان سیاستمدار تازه از دنیا رفته‌ی نیجریایی هستید و وارث چند میلیون دلار ثروت او شده‌اید و … . و شما برای آن که به پولی که برنده شده‌اید یا به ارث برده‌اید دست پیدا کنید باید مقادیری ناچیز هزینه‌های ابتدایی را بپردازید! جالب اینجاست که این گونه شیادیها با وجود این که این روزها تعداد زیادی از کاربران اینترنت با آنها آشنایی دارند هنوز هم کارایی دارد و گه گاه شکارهای درشتی را هم به دام می‌اندازد: به عنوان یک نمونه، در این صفحه، داستان زنی را بخوانید که همین اخیراً، در مجموع مبلغ چهارصد هزار دلار به کلاهبرداران اینترنتی پرداخت کرده است!

جالب است بدانیم که بیشتر هرزنامه‌ها از سوی چند کشور خاص فرستاده می‌شوند. شاید باور کردنش کمی مشکل باشد (در حد باور کردن آمار دریافت فایرفاکس از سوی ایرانیها در روز انتشار فایرفاکس ۳)، که کشور ما در این بین، جزء این چند کشور خاص است (طبق آماری که آقای کیوان نیری از سیستم ضد اسپم خودش استخراج کرده ایران بعد از آمریکا، روسیه و چین، چهارمین کشور دنیا از لحاظ حجم ارسال اسپم است، این نوشته‌ی انگلیسی را از ایشان ببینید)! البته، در کشوری که فهرست چندده‌هزارتایی ایمیلهای ملت، بدون مزاحمت قانون و توسط شرکتهای اسم و رسم‌دار به فروش می‌رسد انتظار آفریده شدن چنین افتخاراتی را هم باید داشت! بگذریم …

بقیه دارد …

فهرست سری نوشته‌های من درباره‌ی هرزنامه‌ها:

قسمت اول: ریشه‌ی نام اسپم

قسمت دوم: هرزنامه‌ها

قسمت سوم: کدامیک هرزنامه‌های بیشتری می‌گیرند: «علی» یا «زهرا»؟

قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!

قسمت پنجم: درآمدزایی هرزنامه‌ها

قسمت ششم: ماشینهای صاحب‌نظر

قسمت هفتم: کپچا: «تو آدمی؟!»

قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن

قسمت نهم: صنعت حل کپچای هند و راه‌حلهای مقابله با اسپم با تکیه بر تحلیل محتوی

ریشه‏ی نام اسپم

اگر به تبلیغات بالای پوشه‌ی اسپم حساب جی‌میلتان دقت کرده باشید، احتمالاً شما هم مثل من تا حالا متوجه شده‌اید که بیشتر وقتها موضوع این تبلیغات به جای آن که درباره‌ی نرم‌افزارها و ابزارهای مقابله با اسپم یا به اصطلاح «هرزنامه‌»ها باشد، درباره‌ی خوراکیهاست!

تبلیغات جی‌میل در پوشه‌ی اسپم

در واقع واژه‌ی «اسپم» پیش از آغاز عصر اینترنت نام تجاری نوعی غذای کنسرو شده بوده، که هم اکنون هم با همان نام تجاری (و البته بنا بر اصرار شرکت تولید کننده با صورت نوشتاری تماماً بزرگ (SPAM) برای متمایز بودن با اسپم اینترنتی و همچنین نشان دادن این که این نام یک نام اختصاری است) عرضه می‌شود و گویا بر خلاف هرزنامه‌ها که همه جا ناخواسته‌اند خیلی هم خواستار دارد. در هر صورت ریشه‌ی واژه‌ی اسپم به معنی هرزنامه هم گویا، همان نام تجاری اسپم خوراکی است.

اسپم واقعی

داستان انتخاب واژه‌ی اسپم برای هرزنامه‌های الکترونیکی گویا از این قرار است که فراوانی «اسپم» در دوران جنگ جهانی دوم در اغذیه‌فروشیهای انگلستان -درست همان وقتی که به لحاظ شرایط جنگی خیلی از خوراکیهای گوشتی در این کشور مشمول جیره‌بندی بودند الا «اسپم» که در همه جا پیدا می‌شد- دستمایه‌ی داستان یکی از قسمتهای یک سریال کمدی دهه‌ی هفتاد میلادی شبکه تلویزیونی بی.بی.سی قرار گرفت، که در آن تکرار این واژه در منوی رستوران داستان آن قسمت از سریال و همچنین همراهی یک گروه هم‌آواز جنبه‌ی فراوانی این خوراکی را در آن زمان به طنز کشید. تحت تأثیر این سریال، بعدها و در آغاز دوران اینترنت، یکی از روشهای حالگیری افراد ناخواسته در اتاقهای گفتگو، پر کردن صفحات با واژه‌ی SPAM بود و به همین دلیل اندک اندک واژه‌ی «اسپم» به همه جور آشغال الکترونیکی ناخواسته از قبیل نامه، نظر وبلاگی و مانند آن که به صورت انبوه ارسال می‌شوند اطلاق شد (اصل ماجرا را در ویکیپدیای انگلیسی و در این قسمت بخوانید).

احتمالاً 😉 ادامه دارد …

فهرست سری نوشته‌های من درباره‌ی هرزنامه‌ها:

قسمت اول: ریشه‌ی نام اسپم

قسمت دوم: هرزنامه‌ها

قسمت سوم: کدامیک هرزنامه‌های بیشتری می‌گیرند: «علی» یا «زهرا»؟

قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!

قسمت پنجم: درآمدزایی هرزنامه‌ها

قسمت ششم: ماشینهای صاحب‌نظر

قسمت هفتم: کپچا: «تو آدمی؟!»

قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن

قسمت نهم: صنعت حل کپچای هند و راه‌حلهای مقابله با اسپم با تکیه بر تحلیل محتوی

حیات در میان بوته‌ها (۲) – به سمت هوا

مقدمه

حیات در میان بوته‌ها (Life In The Undergrowth) نام یک مجموعه‌ی مستندی پنج قسمتی ساخت بی.بی.سی است که اولین بار در سال ۲۰۰۵ از این شبکه‌ی تلویزیونی پخش شده (طبق گفته‌ی دوستان کانال چهار خودمان هم این مجموعه را نشان داده یا دارد نشان می‌دهد). در این مجموعه همراه با دیوید اتنبرو صحنه‌های شگفت‌انگیزی از زندگی بی‌مهرگان شامل حشرات، عنکبوتها و موجودات مشابه را به نظاره می‌نشینیم.

آنچه در این نوشته می‌بینید مرتب شده‌ی یادداشتها و برگزیده‌ی تصاویری است که از قسمت دوم این مجموعه ثبت کرده‌ام، سنجاقکها، پروانه‌ها، بیدها و شبپره‌ها، زنبورها (در زندگی فردیشان)، مگسها و بعضی حشرات بالدار دیگر موضوع اصلی این قسمت از این مجموعه است. (یادداشتهایم از قسمت اول مجموعه، ناقص است که سعی می‌کنم در اولین فرصت آن را کامل کنم و آن را هم در دسترستان قرار دهم.).

از زیردریایی به هلیکوپتر

سنجاقکها بیشتر عمرشان را در آب سپری می‌کنند، در آنجا به شکار حشرات و ماهیهای کوچک و حتی همنوعان خودشان مشغولند. در این حال شکل و قیافه‌ی آنها چندان شباهتی با سنجاقکهای بالغ ندارد:

نوزاد سنجاقک شناگری ماهر است
ادامه خواندن “حیات در میان بوته‌ها (۲) – به سمت هوا”