تکه‌های مهم؟!

یک وقتی «ابزاری» وجود داشت «برای بریدن تکه‌های مهم» 😉 به اسم کلیپمارکس نقطه کام که بعدها توسط شرکت کمی بزرگتری خریداری شد و اسمش شد کلیپبورد نقطه کام که آن هم اخیراً اعلام کرده که توسط شرکت بسیار بزرگتری به اسم سیلزفورس خریداری شده و طبق رسم متداول اینجور ابزارها و سرویسها، وقتی چنین اتفاقی برایشان می‌افتد -بر خلاف استنباط اولیه مبنی بر بهبود چشمگیر و گسترده شدن امکانات با تکیه بر توان مالی صاحب آن- در حال انهدام کامل است و اعلام کرده که بیایید و اگر می‌خواهید اطلاعاتتان را بردارید که ما داریم جمع می‌کنیم، برویم.

خلاصه آن که ما هم رفتیم و آنچه آنجا کاشته و انباشته بودیم درویدیم و در این نشانی جایش دادیم. هر چند منابع خیلی از کلیپها گم شده‌اند اما باز هم -اگر به دنبال تکه‌هایی جالب و سرگرم‌کننده از اینترنت زمان پیرمردها- می‌گردید، چند دقیقه‌ای می‌تواند سرگرمتان کند.

hamidreza clipmarks backups

بازی خطوط و یک مجموعهٔ دیدنی

از بازیهای ساده و وقت‌پرکن خوشتان می‌آید؟ روی تصویر زیر کلیک کنید. باید در هر ردیف یا ستون حداقل ۵ توپ همرنگ را کنار هم بنشانید تا آنها را با هم ببرید و این کار را تا وقتی جا دارید تکرار کنید.

Lines Game

خالق این بازی چیز مهمتری هم درست کرده: او یک کتابخانهٔ جاوا اسکریپت برای آسان کردن کار با عناصر گرافیکی برداری ساخته که از فناوریهایی همچون SVG و VML استفاده می‌کند. مهم نیست که برنامه‌نویس وب باشید یا نه، به نظرم اگر سری به سایت این کتابخانه بزنید گالری نمونه‌کارهای قابل انجام با این کتابخانه جذبتان خواهد کرد. به اینجا بروید و روی نمونه‌ها یکی یکی کلیک کنید.

نمونه کارهای قابل انجام با کتابخانهٔ رافائل

لطفاً چند دقیقه از وقت آنلاینتان را به من هدیه بدهید!

۱- به این نشانی بروید.

بازبینی خروجیهای OCR گنجور

۲- بالای صفحه یک عکس بریده شدهٔ متنی می‌بینید. در کادر پایین آن یک یا چند دکمهٔ سفیدرنگ می‌بینید که حاوی متنهایی مشابه تصویر بالای صفحه هستند. اگر یکی از آنها متنش کاملاً شبیه متن تصویر است روی آن کلیک کنید، اگر نه در کادر متنی «خیر؟ تصویر درست را وارد کنید» متن درست را تایپ کنید و Enter بزنید.

۳- با هر بار کلیک بر روی یکی از دکمه‌های مرحلهٔ ۲ به صفحهٔ مشابهی هدایت می‌شوید و این کار را می‌توانید تا هر وقت که دوست داشتید ادامه دهید!

۴- بعضی از عکسها ممکن است ناخوانا باشند (بد اسکن شده‌اند)، در این موارد روی دکمهٔ «تصویر ناخواناست» کلیک کنید. بعضیها هم ممکن است حاوی هیچ متن قابل بازخوانیی نباشند (حروف تکه تکه و …)، در این موارد روی دکمهٔ «تصویر بد بریده شده» کلیک کنید.

با صرف چند دقیقه از وقت آنلاینتان به این صورت -ضمن لطفی که دارید به من می‌کنید 😉 – به گسترش دامنهٔ داده‌های بزرگترین سایت شعر فارسی دارید کمک می‌کنید. دوست دارید در این مورد بیشتر بدانید؟ اینجا را ببینید.

گلوگاه‌یاب

بعد از مشکلاتی که برای میزبانی گنجور پیش آمد تصمیم گرفتم این بار برای گنجور از یک شرکت معتبر خارجی خدمات میزبانی بگیرم و نهایتاً از مدیاتمپل که از شرکتهای توصیه شده توسط سایت وردپرس برای میزبانی وب بود خدمات میزبانی خریدیم.

نکتهٔ جالبی که در مورد سرویس میزبانی این شرکت نظرم را جلب کرد نحوهٔ سنجنش میزان استفاده از منابع در سرویس میزبانی گرید این شرکت است. جایی که با توجه به فضای ۱۰۰ گیگابایتی و پهنای باند یک ترابایتی (با هزینهٔ سالیانهٔ حدود ۲۰۰ دلار) محدودیتهای معمول میزبانهای وب عملاً کارایی ندارد.

این شرکت معیاری را به اسم GPU (ربطی به Graphics Processing Unit ندارد 😉 مخفف Grid Performance Unit است) طراحی کرده که بر اساس میزان مصرف منابع سیستم؛ کاربران را محدود می‌کند و جالب آن که گزارش کاملی که در این زمینه ارائه می‌دهد می‌تواند کاملاً کارایی لازم بر اشکالیابی و پیدا کردن اسکریپتهای ناکارا یا مشکلدار را داشته باشد.

Media Temple GPU Summary
Media Temple GPU Report

این طرح به نظرم به راحتی می‌تواند مشکل شرکتهای میزبانی را حل کند تا به جای متهم کردن نمونه سایتهای تصادفی به مصرف بیش از حد منابع و مسدود کردن این گونه سایتها بر اساس حدس و گمان یا با استفاده از نرم‌افزارهای مشکوک بدون ارائهٔ گزارش و بدون اخطار قبلی یا بعدی (من حدس می‌زنم همین نرم‌افزار معلوم‌الحال 😉 وبلاگ رازیگر نقطه کام را که عملاً مدتهاست به‌روز نشده عامل مصرف بیش از حد منابع سیستم شناخته و تا به امروز برای بیش از چند هفته مسدودش کرده بدون آن که احتمالاً صاحب سایت از قضیه خبر داشته باشد. گواه این قضیه هم آن است که در کش گوگل هم همین قضیه به ثبت رسیده!) و نهایتاً عدم واکنش در مقابل تقاضا برای تأدیهٔ مبالغ پرداختی 😉 گلوگاههای فشار روی سرورها را پیدا کنند و روباتهای تخیلی را (که من حدس می‌زنم خزندهٔ موتورهای جستجو واقعی‌ترین نمونه‌هایشان باشند) به حمله و فشار روی سرورها متهم نکنند.

دی.ان.اس‌های گوگل

این را در نظرات یکی از وبلاگها خواندم، یادم نیست کدام وبلاگ. اما به هر حال کار مرا فعلاً راه انداخته. گفتم شاید شما هم، همهٔ زندگی آنلاینتان روی جیمیلتان باشد و دسترسی از طریق محیط آشنایی وبی آن برایتان ضروری، شاید این راه حل به درد شما هم بخورد: دی.ان.اسهای ارتباط اینترنتیتان را روی 8.8.8.8 و 8.8.4.4 تنظیم کنید بلکه رستگار شوید.

پیشنهاد

می‌آیی از سر کار، ایمیلها را چک می‌کنی، می‌بینی یکی گزارش داده نمی‌شود برنامه را دریافت کرد. حدس می‌زنی مشکل مربوط به انتظار چند ثانیه‌ایست که باید قبل از شروع دریافت بکشند، جوابی می‌دهی. می‌آیی جهت اطمینان یک بار آزمایش کنی. می‌بینی سایتی که استفاده از آن لینکهای میانی برای در دست داشتن تعداد دریافتها درست کرده بودی فیلتر شده.

خوب! مشکلی نیست، آمار به درک! لینکها را با لینک اصلی سرویس میزبانی پروژه جایگزین می‌کنم.

می‌آیی لینکهای اصلی را جایگزین کنی. یک بار تصمیم می‌گیری آزمایششان کنی. می‌بینی که از آن طرف پیغام تحریم می‌گیری!

sourceforge

چه همزمانی جالبی! آن طرفیها را که حرجی برشان نیست. به اعتراف خودمان دشمنمان هستند و دشمن که به دشمن سرویس نمی‌دهد. این طرفیها را من مانده‌ام: چرا تعارف می‌کنند؟ مگر نه این است که اینترنت همه‌اش دردسر است برایتان. تعطیلش کنید یا محدودش کنید به همان هفت هشت ده سایت بی‌خطر و تأیید شده. خیال همه‌مان را راحت کنید. بهتر نیست؟

تغییر در «کدهای گنجور»

مدتها قبل به کمک یک سرویس میزبانی رایگان امکان این که بتوان در سایت یا وبلاگ یک بیت تصادفی را نشان داد ایجاد کرده بودم. اخیراً دامنهٔ رایگانی که این سرویس رایگان می‌داد منقضی شده و از دسترس من خارج شده. اگر در وبلاگتان از این کدها استفاده می‌کنید لطفاً این نوشته را در وبلاگ تازه‌های گنجور ببینید: اطلاعیهٔ مهم برای کاربران کدهای گنجور.

کد شعر گنجور

ردگیری چشم

احتمالاً در مقالات مربوط به کارآمدی صفحات وب، نقشه‌های گرمایی را دیده‌اید. در این نقشه‌ها نقاطی از صفحه که بیشتر در معرض دید بازدیدکننده‌ی سایت، قرار می‌گیرند با رنگهای گرم (زرد و قرمز) مشخص می‌شوند و نقاط کمتر دیده شده با رنگهای سرد (آبی). به عنوان نمونه این مقاله را در مورد نحوه‌ی حرکت چشم بر روی صفحات وب ببینید که در آن این مسأله طرح شده که بازدیدکنندگان، اغلب، مطالب صفحه را با الگویی شبیه حرف F مرور می‌کنند.

بازدیدکنندگان اغلب مطالب صفحه را با الگویی شبیه حرف F مرور می‌کنند

امروز مقاله‌ی دیگری را دیدم که در مورد این موضوع بحث می‌کند که آیا نیاز به اسکرول عمودی برای دیدن ادامه‌ی مطلب در صفحات وب، مانع خوانده شدن مطالب پایینی صفحات توسط بازدیدکننده می‌شود یا نه. جوابش این است که نه، این مسأله مشکلی ایجاد نمی‌کند. اما برای رسیدن به این جواب، این مطالعه هم مبتنی است بر نقشه‌های گرمایی از نحوه‌ی حرکت چشم بر روی صفحات.

نقاط داغتر یک صفحه‌ی وب

جالب است بدانیم که این نقشه‌های گرمایی -بر خلاف آنچه من تا به حال فکر می‌کردم- نه بر اساس کلیکهای کاربر بر روی لینکهای واقع در نقاط مختلف نظیر نقشه‌هایی که این سایت آمارگیری ارائه می‌دهد، که بر اساس پردازش تصاویر تهیه شده از حرکت واقعی چشم و ترکیب آنها با تصویر صفحه تهیه می‌شوند. اسم این تکنیک ردگیری چشم است و محصولات تجاری و رایگان آماده‌ای برای انجام چنین مطالعاتی وجود دارد که نمونه‌اش این محصول نرم‌افزاری مبتنی بر پردازش تصویر است که از آن در مقاله‌ی اشاره شده‌ی دومی استفاده شده است.

احتمالاً الگوی این نقشه‌ها و همینطور نامشان برگرفته از تصاویری است که توسط دوربینهای مادون قرمز از نحوه‌ی توزیع حرارت در بدن و محیط اطراف جانوران تهیه می‌شود و در مطالعات زیست‌شناسی کاربرد دارد.

صحنه‌ای از مستند BBC Life in Cold Blood

راحت‌تر بگردیم

پیش‌تر در مورد استاندارد باز جستجو و جعبه‌ی جستجوی فایرفاکس، اینترنت اکسپلورر، اپرا و … چیزی نوشته‌ام (اینجا).

اضافه کردن امکان جستجو در سایتها به جعبه‌ی جستجوی فایرفاکس کار سختی نیست و با استفاده از این صفحه می‌توانید امکان جستجو در سایتهای دلخواه خودتان را به فایرفاکس اضافه کنید.

با مراجعه به گنجور می‌توانید با باز کردن منوی جعبه‌ی جستجو امکان جستجو در گنجور را به فایرفاکستان اضافه کنید. علاوه بر این با مراجعه به این صفحه و کلیک بر روی عنوان LoghatNaameh می‌توانید امکان جستجو در سایت لغت‌نامه را به جعبه‌ی جستجوی فایرفاکستان اضافه کنید.

صنعت حل کپچای هند و راه‏حلهای مقابله با اسپم با تکیه بر تحلیل محتوا

تا به اینجا رسیدیم که کپچای تصویر متنی را با او.سی.آر به شکل ماشینی دور می‌زنند و به همین دلیل روشهای متفاوتی برای طراحی کپچا ارائه شده است. جالب است بدانیم که این روزها شرکتها و مراکزی وجود دارند که قیمتهای استاندارد (!) برای شکستن کپچای سایتهای مختلف ارائه می‌کنند. به عنوان نمونه این تکه‌ای از لیست قیمت یک شرکت متخصص شکستن کپچاهای سایتهای چینی است (منبع عکس):

لیست قیمت شکستن کپچا

ماجرا محدود به کپچاهای تصویری هم نمی‌شود، کپچاهای صوتی هم توسط نرم‌افزارهای کامپیوتری -گویا به آسانی- قابل عبور هستند (در این نشانی مقاله‌ای تفصیلی درباره‌ی نحوه‌ی عبور از کپچای صوتی جیمیل بخوانید). کپچاهای تصویر متنی شرکتهای بزرگ (مایکروسافت، یاهو و گوگل) به دلیل تعداد کاربران بالا و همچنین اعتبار ایمیلهای ارسالی از آنها برای نرم‌افزارهای مبارزه با هرزنامه‌ها بارها و بارها شکسته شده‌اند (اینجا را ببینید).

اما کپچاهای ابتکاری چه؟! آیا مقاومت کپچاهای ابتکاری (کپچای محاسباتی، کپچای سه‌بعدی، سگ و گربه‌ی رپیدشر و ) بیشتر نیست؟ آیا نرم‌افزارهای ارسال انبوه اسپم از این کپچاها هم می‌توانند عبور کنند؟

تا اینجا و با توجه به سرمایه‌گذاریهای قابل توجه ارسال کنندگان اسپم روی کارشان باید به این نتیجه رسیده باشید که در این «شغل» آنقدر «پول» هست که نه تنها اجازه‌ی استفاده از راهبردهای «تحقیق و توسعه» را برای شکستن سدهای پیش رو به آنها می‌دهد بلکه احتمالاً این درآمدها می‌تواند آنقدر زیاد باشد که حاضر باشند برای حل مشکلات پیش‌رو مستقیماً و عملاً نیروی انسانی در اختیار بگیرند و از کمک نیروهای کار ارزانقیمت کشورهای در حال توسعه استفاده کنند.

به پشتوانه‌ی سرمایه‌ی ارسال کنندگان اسپم در کشورهایی مانند هند شاهد ظهور یک صنعت درآمدزای بدیع هستیم: «صنعت حل کپچا»! اتاقهایی با بیست الی سی اپراتور که در ازای دستمزدهایی همچون «هر ۱۰۰۰ کپچا ۲ دلار» ساعتهای کاری خود را با بازخوانی کپچاها می‌گذرانند. فرایند کار به این صورت است که نرم‌افزار ارسال اسپم تصویر کپچا را جدا می‌کند، به یکی از اپراتورها می‌دهد، اپراتور مقدار آن را درج و ارسال می‌کند و نرم‌افزار، اسپمش را ارسال می‌کند. با این سیستم کاری، شرکتهای حل کپچای هندی ادعای حل روزانه تا ۵۰۰۰۰ کپچا یا بیشتر را به مدد چند ده کامپیوتر و اپراتور، و شیفتهای کاریی که ۲۴ ساعت ۷ روز هفته را پوشش می‌دهند دارند (برای کسب اطلاعات بیشتر اینجا را ببینید).

نمایی از نرم‌افزارهای حل کپچا با کمک اپراتورهای انسانی

اینجاست که کارکرد کپچا برای جلوگیری از ارسال انبوه اسپم زیر سؤال می‌رود، چرا که کپچا برای حل این معضل، مبتنی بر این ایده است که ارسال‌کنندگان انبوه اسپم ماشین هستند و با تشخیص انسان از ماشین می‌توان جلوی ارسال انبوه اسپم را گرفت. و در اینجا حداقل بخش سخت‌تر کار را انسانها انجام می‌دهند.

دسته‌ی دیگری از راه‌حلهای مقابله با اسپم بر «تحلیل متون ارسالی» مبتنی هستند. مقایسه‌ی آی.پی ارسال‌کننده با لیست سیاه ارسال‌کنندگان اسپم شناخته شده، شمارش تعداد لینکهای موجود در متون و جستجوی نشانی سایتهای اسپم در بین آنها، بررسی محتوای متن و جستجوی واژه‌های متداول موجود در متون اسپم در متن ارسالی (یک آمار جالب در این زمینه را در این تصویر ببینید) از جمله ترفندهای به کار گرفته شده در این روش هستند. معمولاً برای جلوگیری از دور زدن شدن آسان الگوریتمها و روشهای مورد استفاده در این راه‌حلها بخش عمده‌ای از این روشها منتشر نمی‌شوند و تنها ابزارهای ارتباطی به صورت کدباز در اختیار استفاده‌کنندگان قرار می‌گیرند. «اکیسمت» سیستم مقابله با نظرات هرز که در وردپرس و برخی دیگر از سیستمهای مدیریت محتوی به کار گرفته شده است از جمله ابزارهای مبتنی بر این روش است.

این احتمالاً آخرین قسمت سری مطالبی بود که درباره‌ی «اسپم» نوشته‌ام. فهرست نوشته‌های این سری:

قسمت اول: ریشه‌ی نام اسپم

قسمت دوم: هرزنامه‌ها

قسمت سوم: کدامیک هرزنامه‌های بیشتری می‌گیرند: «علی» یا «زهرا»؟

قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!

قسمت پنجم: درآمدزایی هرزنامه‌ها

قسمت ششم: ماشینهای صاحب‌نظر

قسمت هفتم: کپچا: «تو آدمی؟!»

قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن

قسمت نهم: صنعت حل کپچای هند و راه‌حلهای مقابله با اسپم با تکیه بر تحلیل محتوی