دربارهٔ من:
مشترک شوید:
ایمیل خود را در جعبهٔ زیر وارد کنید و دکمهٔ اشتراک را بزنید.
جستجو:
۵۸۰۰
09/03/02گوشیی را که قرار بود بخرم یک هفته یا بیشتر میشود که خریدهام. البته در خرید -به دلیل ناخرسندی از شلوغی خیابانها و میدان محل خرید!- کمی عجله کردم و گوشیی را خریدم که گارانتی معتبر نوکیا را ندارد -هر چند یکی از فروشگاههایی را برای خرید انتخاب کرده بودم که نامش در سایت نوکیا آمده بود- . در هر صورت فعلاً از خریدم چندان ناراضی نیستم، هر چند احتمال دارد به زودی پشیمان شوم.
گوشیی که من خریدم برای عرضه در بازار انگلستان ارائه شده بود و به همین خاطر از (تایپ) فارسی پشتیبانی نمیکرد. به همین لحاظ مجبور شدم کد محصول گوشی را عوض کنم (به این روش) و با کمک کدی که برای گوشیهای عرضه شده در ایران ارائه شده منو، صفحه کلید، تشخیص دستخط (حروف گسسته) و فرمانهای صوتی فارسی به آن اضافه شد.
چند قابلیت لازم را این گوشی در مقایسه با گوشی قبلیم ندارد، مثلاً ساعت را روی صفحهی خاموشش نشان نمیدهد، امکان ضبط مکالمه را ندارد، فلاش دوربینش با کمک یک میانبر سریعاً به چراغ قوه تبدیل نمیشود و برنامههای پیشفرض برای کرونومتر و همینطور کنترل ماوس کامپیوتر یا پاورپوینت به وسیلهی بلوتوث را ندارد. با میانافزار اولیهی گوشی (مخصوص انگلستان) نمیشد دوربین دوم را (در حالت عکس/فیلمبرداری) روشن کرد که با تغییر آن این قابلیت به آن اضافه شد. نرمافزارهای طرف کامپیوترش مزخرف و پراشکال هستند و تا به حال چندین بار خود گوشی هم قفل کرده. اما در کل قابلیتهایی همچون صفحهی نسبتاً بزرگ تماسی آن و تشخیص دستخط و صفحهکلید کامل افقیش میتواند باعث شود از عیوب اولیهی آن چشمپوشی کنم.
گوشی قابلیت پخش فیلم با فرمت MP4 را دارد و روی آن پیشپردهی فیلم شوالیهی تاریکی به عنوان یکی از فیلمهای نمونه در دسترس گذاشته شده. اگر فیلم را در دسترس دارید صحنههای مربوط به هنگکنگ آن را بازبینی کنید. گوشیهای مرموزی که لوشس فاکس از آنها برای ارزیابی محل ربودن مجرم مورد نظر بتمن استفاده میکند نوکیا اکسپرس میوزیک ۵۸۰۰ هستند و این فیلم در واقع پیشتبلیغی بوده برای این مدل از گوشیهای نوکیا.
نوکیا ۵۸۰۰ در فیلم شوالیهی تاریکی
خوراکی برای فیلمها
09/02/16میدانید؟! شبها پیش از این که بخوابم، بیشتر وقتها، -دیگر فکر میکنم برایم عادت شده-، به طور ناخودآگاه یک لحظه چشمم را باز میکنم و تاریکی روبهرو را نگاه میکنم. فکر میکنم به این که الان کجا هستم، پارسال کجا بودم، چند سال پیش کجا بودم و آن وقتها دوست داشتم الان کجا باشم. میدانید؟! مثل برق دارد میگذرد روزها و ساعتها. نه این که واقعاً هدف مهمی داشته باشم و از نرسیدن به آن حسرت بخورم، نه! فقط دوست دارم این روزها و ساعتهایی را که پشت سر میگذارم ازشان یک خروجی، یک یادگاری داشته باشم. بدانم که این ساعتها را تلف نکردهام. میدانید؟! گاهی فکر میکنم به این که اگر من، فردا، دیگر بیدار نشوم از دنیا چه چیزی کم میشود. آیا اصلاً اگر کل من و زندگی من را از فهرست آدمهایی که تا به حال آمدهاند و رفتهاند حذف کنند اتفاق مهمی میافتد؟! جواب تأسفآوری را که به آن میرسم احتمالاً خودتان میتوانید حدس بزنید.
بگذریم! روی همان حساب پاراگراف اول دوست دارم خیلی از کارهایی را که میکنم -هر چند اهمیت چندانی نداشته باشند- مستند کنم. کارهایی با حداقل ارزش دیدن یک عکس خوب و دیدن یک فیلم. در راستای فعالیت دوم، افزونهای را بر روی وردپرس نصب کردهام که به من امکان ثبت فهرست فیلمهایی را که دیدهام میدهد (نشانی این افزونه). به کمک این افزونه میتوان به کمک یک نشانک (بوکمارکلت) به آسانی دیدن فیلمها را ثبت کرد، علاوه بر آن، به آنها امتیاز داد و یک توضیح یا نقد کوچک راجع به آنها نوشت. نهایتاً فهرست فیلمها را در قالب یک صفحهی مجزا و یک ابزارک وردپرس منتشر کرد. فهرست فیلمهایی را که تا به حال به کمک این افزونه دیده شدنشان را ثبت کردهام اینجا ببینید.
فکر میکنم یک سال و نیمی هست که من این افزونه را نصب کردهام و از آن زمان تا حالا این افزونه چندان تغییری نکرده و بهروزرسانی عمدهای برای آن ارائه نشده. به همین لحاظ این افزونه نقصهایی هم دارد. یکی از نقصهای آن عدم ارائهی خروجی آر.اس.اس (خوراک) است.
امروز به نظرم رسید که خروجی خوراکی برای این افزونه درست کنم و آن را به حساب کاربری فرندفیدم اضافه کنم. کمی جستجو کردم و کدی که در ادامه میبینید نتیجهی این جستجوهاست. اگر بخواهید برای وردپرس خروجی خوراک بدلخواه درست کنید باید از چنین ساختاری استفاده کنید. خروجی نهایی یک افزونهی ساده است. با امید این که نویسندهی اصلی این افزونه بالاخره روزی خروجی خوراک را به آن اضافه خواهد کرد تمام چیزهایی را که میتوانستند «انتخابی» باشند در متن کد گذاشتهام (عنوان خوراک، نشانی، تعداد و …) و اگر خواستید از آن استفاده کنید باید این موارد را ویرایش کنید. ضمن آن که افزونهی امتیازدهی به فیلمها در وبلاگ من در پوشهی wp_movie_ratings نصب شده و افزونهی نوشته شده توسط من برای این که درست کار کند باید در ریشهی پوشهی افزونهها قرار گیرد و اگر غیر از این میخواهید باشد باید آن را ویرایش کنید.
حدیث نفس!
09/02/10شما از تلفن همراهتان چه استفادهای میکنید؟ بیشتر صحبت میکنید؟ پیامک میفرستید؟ یا …؟! این نمودار را ببینید:
نمودار را از سایت گراف جم برداشتهام، از این صفحه. ایدهی این سایت آن است که بازدیدکنندگان و علاقمندان به سایت با کمک ابزارهای آن نمودارهای طنزآمیز و خندهدار درست کنند. بگذریم!
دو یا سه هفته پیش من گوشی موبایلم را (روشن و در حال کار) با ماشین لباسشویی شستم و بعد از آبکشی، از جیب کاپشنم بیرونش آوردم.
توصیهی اقتصادی: اگر شما هم بلای مشابهی سر گوشیتان آوردید، اولین کاری که میکنید این نباشد که سعی کنید روشنش کنید تا ببینید کار میکند یا نه. سعی کنید بگذارید به اندازهی کافی خشک شود، بعد …
به هر حال، توصیهی بالایی حاصل جستجوهای بعد از واقعه -به دنبال راه علاج- است و من دقیقاً اولین کاری که بعد از بیرون آوردن آن از جیب کاپشنم کردم روشن کردن آن بود! روشن شد، البته فقط فلاش دوربینش. بعد از آن یکی دو باری گوشی را باز و بسته کردم. همه جایش را خشک کردم و امتحانهای مجدد، نتیجهای جز حداکثر همان روشن شدن فلاش دوربین یا چراغ مادون قرمز نداشت. باتری را به کمک فلاش دوربین کاملاً خالی کردم. اما بعد از آن دیگر گوشی باتری را شارژ نکرد …، کم کم به فکر تعمیرکار افتادهام و البته به دنبال آن وسوسهی خرید یک گوشی جدید یقهام را محکم گرفته و دستش را توی جیبم کرده این روزها و من ضعیفالنفس به زودی احتمالاً در برابرش تسلیم خواهد شد و … .
در هر صورت، در این مدت نبود گوشی موبایل را من به صورت متفاوتی احساس کردهام. من با «تلفن» موبایل خیلی کمتر از حد متعارف سر و کار داشتهام و دارم. میدانید؟! نبود گوشی، در گام اول، باعث شد -بعد از مدتها- سراغ ساعت زنگدار قدیمیم بروم و تازه بفهمم زنگ آن چندان مطمئن کار نمیکند. هر چند، همان پیشترها هم صبحها معمولاً چند دقیقه پیش از این که موبایلم زنگ بزند از خواب بیدار میشدم. الان هم همینطور است! با این تفاوت که این روزها با خیال راحت تا صبح، یکسره نمیخوابم و معمولاً نیم ساعت یا یک ساعت پیش از ساعت مقرر بیدارم.
مشکل دیگر، مربوط به پخت و پز است و زمانهایی که باید طول بکشد تا مرحلهی بعدی پختن را انجام دهم. برای این کار یک زمانسنج ویندوزی داونلود کردم که چندان ازش خوشم نیامد. این چند وقته، یا از این ساعت زنگی آنلاین استفاده میکردهام یا زمان شروع هر مرحله را روی کاغذ مینوشتهام تا حواسم به کارم باشد.
لیست خریدها (چند بار رفتهام برای خرید یک چیز خاص، یادم نیامده چه میخواستم بخرم، کلی آت و آشغال اضافی خریدهام، برگشتهام و متوجه شدهام آن چیز ضروری بین لیست خریدهایم نیست!)، موعد پرداخت هزینهی اینترنت، موعد اجارهخانه و … ! میدانید؟! من به یک گوشی موبایل احتیاج دارم، البته احتمالاً فقط به یک «گوشی» موبایل!
به هر حال، وبگردی دربارهی گوشیها را شروع کردهام. این روزها صفحههای لمسی و جی.پی.اس متداول شده و من هم تقریباً مصمم هستم که -اگر خواستم بخرم- این بار یک گوشی حائز این قابلیتها و «سیستمعاملدار» بخرم، ترجیحاً ویندوزی، اما با بودجهای که در نظر گرفتهام احتمالاً معقولترین گزینه نوکیا ۵۸۰۰ اکسپرس میوزیک است که سیمبینی است. شاید هم بر وسوسهی پرخرجم غلبه کردم و همان گوشی آب کشیده را فرستادم تعمیر، تا ببینم چه میشود.
…
09/02/06مدتهاست که دستی به سر و روی اینجا (گزیر) نکشیدهام. چیدمان صفحات در اینترنت اکسپلورر ۸ (نسخهی کاندیدای انتشار) به هم ریخته است (هر چند html و css صفحات استاندارد است) و سر فرصت باید صفحهی برگزیدهها را بروز کنم.
علیالحساب امروز تقریباً تمام وقتم به بازسازی بایگانی سایت شرکت منحلهی سابقم گذشت (با توجه به آن که از پایگاه دادههای وبلاگش پشتیبانی نداشتم – یا به احتمال قویتر داشتم و نیافتم- نوشتههایش را یکی یکی از روی یک نسخهی داونلود شده کپی کردم و بعضی نوشتههایش را هم بیخیال شدم).
پیشتر بخش دیگری از یادگاریهای قدیمیم را (سایت شخصی) به اینجا انتقال داده بودم. منوی «آثار دیگر» را به «بخشهای دیگر» تغییر نام دادم و این زیرسایتها را از طریق آن در دسترس گذاشتم.
خوراک تازههای گنجور را که پیشتر به کمک این سرویس با خوراک گزیر مخلوط کرده بودم جدا میکنم. بنابراین اگر مشترک گزیر هستید دیگر «تازههای گنجور» را دریافت نمیکنید. در صورتی که مایل به دنبال کردن «تازههای گنجور» هستید مشترک خوراک مستقل آن شوید.
صنعت حل کپچای هند و راهحلهای مقابله با اسپم با تکیه بر تحلیل محتوا
09/01/23تا به اینجا رسیدیم که کپچای تصویر متنی را با او.سی.آر به شکل ماشینی دور میزنند و به همین دلیل روشهای متفاوتی برای طراحی کپچا ارائه شده است. جالب است بدانیم که این روزها شرکتها و مراکزی وجود دارند که قیمتهای استاندارد (!) برای شکستن کپچای سایتهای مختلف ارائه میکنند. به عنوان نمونه این تکهای از لیست قیمت یک شرکت متخصص شکستن کپچاهای سایتهای چینی است (منبع عکس):
ماجرا محدود به کپچاهای تصویری هم نمیشود، کپچاهای صوتی هم توسط نرمافزارهای کامپیوتری -گویا به آسانی- قابل عبور هستند (در این نشانی مقالهای تفصیلی دربارهی نحوهی عبور از کپچای صوتی جیمیل بخوانید). کپچاهای تصویر متنی شرکتهای بزرگ (مایکروسافت، یاهو و گوگل) به دلیل تعداد کاربران بالا و همچنین اعتبار ایمیلهای ارسالی از آنها برای نرمافزارهای مبارزه با هرزنامهها بارها و بارها شکسته شدهاند (اینجا را ببینید).
اما کپچاهای ابتکاری چه؟! آیا مقاومت کپچاهای ابتکاری (کپچای محاسباتی، کپچای سهبعدی، سگ و گربهی رپیدشر و …) بیشتر نیست؟ آیا نرمافزارهای ارسال انبوه اسپم از این کپچاها هم میتوانند عبور کنند؟
تا اینجا و با توجه به سرمایهگذاریهای قابل توجه ارسال کنندگان اسپم روی کارشان باید به این نتیجه رسیده باشید که در این «شغل» آنقدر «پول» هست که نه تنها اجازهی استفاده از راهبردهای «تحقیق و توسعه» را برای شکستن سدهای پیش رو به آنها میدهد بلکه احتمالاً این درآمدها میتواند آنقدر زیاد باشد که حاضر باشند برای حل مشکلات پیشرو مستقیماً و عملاً نیروی انسانی در اختیار بگیرند و از کمک نیروهای کار ارزانقیمت کشورهای در حال توسعه استفاده کنند.
به پشتوانهی سرمایهی ارسال کنندگان اسپم در کشورهایی مانند هند شاهد ظهور یک صنعت درآمدزای بدیع هستیم: «صنعت حل کپچا»! اتاقهایی با بیست الی سی اپراتور که در ازای دستمزدهایی همچون «هر ۱۰۰۰ کپچا ۲ دلار» ساعتهای کاری خود را با بازخوانی کپچاها میگذرانند. فرایند کار به این صورت است که نرمافزار ارسال اسپم تصویر کپچا را جدا میکند، به یکی از اپراتورها میدهد، اپراتور مقدار آن را درج و ارسال میکند و نرمافزار، اسپمش را ارسال میکند. با این سیستم کاری، شرکتهای حل کپچای هندی ادعای حل روزانه تا ۵۰۰۰۰ کپچا یا بیشتر را به مدد چند ده کامپیوتر و اپراتور، و شیفتهای کاریی که ۲۴ ساعت ۷ روز هفته را پوشش میدهند دارند (برای کسب اطلاعات بیشتر اینجا را ببینید).
اینجاست که کارکرد کپچا برای جلوگیری از ارسال انبوه اسپم زیر سؤال میرود، چرا که کپچا برای حل این معضل، مبتنی بر این ایده است که ارسالکنندگان انبوه اسپم ماشین هستند و با تشخیص انسان از ماشین میتوان جلوی ارسال انبوه اسپم را گرفت. و در اینجا حداقل بخش سختتر کار را انسانها انجام میدهند.
دستهی دیگری از راهحلهای مقابله با اسپم بر «تحلیل متون ارسالی» مبتنی هستند. مقایسهی آی.پی ارسالکننده با لیست سیاه ارسالکنندگان اسپم شناخته شده، شمارش تعداد لینکهای موجود در متون و جستجوی نشانی سایتهای اسپم در بین آنها، بررسی محتوای متن و جستجوی واژههای متداول موجود در متون اسپم در متن ارسالی (یک آمار جالب در این زمینه را در این تصویر ببینید) از جمله ترفندهای به کار گرفته شده در این روش هستند. معمولاً برای جلوگیری از دور زدن شدن آسان الگوریتمها و روشهای مورد استفاده در این راهحلها بخش عمدهای از این روشها منتشر نمیشوند و تنها ابزارهای ارتباطی به صورت کدباز در اختیار استفادهکنندگان قرار میگیرند. «اکیسمت» سیستم مقابله با نظرات هرز که در وردپرس و برخی دیگر از سیستمهای مدیریت محتوی به کار گرفته شده است از جمله ابزارهای مبتنی بر این روش است.
این احتمالاً آخرین قسمت سری مطالبی بود که دربارهی «اسپم» نوشتهام. فهرست نوشتههای این سری:
قسمت اول: ریشهی نام اسپم
قسمت دوم: هرزنامهها
قسمت سوم: کدامیک هرزنامههای بیشتری میگیرند: «علی» یا «زهرا»؟
قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!
قسمت پنجم: درآمدزایی هرزنامهها
قسمت ششم: ماشینهای صاحبنظر
قسمت هفتم: کپچا: «تو آدمی؟!»
قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن
قسمت نهم: صنعت حل کپچای هند و راهحلهای مقابله با اسپم با تکیه بر تحلیل محتوی
این برنامهنویسهای بامزه
09/01/13«گوشت خوک» توی وبلاگ من چه غلطی میکنه؟ من گیاهخوارم!
وردپرس وبلاگم را بهروز کردم، داشتم دوری در محیط جدید میزدم که در قسمت آمارهای اکیسمت این جمله را دیدم (وردپرس -قابل دریافت از این نشانی– سیستم مدیریت وبلاگ من است و اکیسمت افزونهای برای وردپرس است که جلوی نظرات هرز را میگیرد). طراحان اکیسمت در برابر «اسپم» (=نظرات هرز که اتفاقاً نام نوعی خوراکی هم هست) واژهی «هم» (=گوشت خوک) را برای نظرات واقعی و غیرهرز گذاشتهاند و خوب! در متن کوتاهی با عنوان بامزهی بالایی جریان را توضیح دادهاند.
برنامهنویسها -حتی اگر ذاتاً آدمهای بامزهای نباشند- معمولاً مجال زیادی برای کارهای -ظاهراً- بامزه دارند که متأسفانه – یا خوشبختانه- خیلی از این مزهپراکنیها را کاربر نهایی نرمافزار نمیبیند و در سطح کد باقی میماند. اگر برنامهنویس ویژوال سی بوده باشید -از نوع قدیمیترهایش- احتمالاً مقالات و نمونهکدهای پل دیلاسیا را دیدهاید و خواندهاید و با توضیحات توأم با شوخیش برخورد کردهاید (تلفظ درست اسم این آقا را -اگر کسی میداند- بگوید، بیشتر از این آبرویمان نرود). امضای او در میان فایلهای برنامههایش این است: «اگر این کد کار کرد پل دیلاسیا آن را نوشته و اگر نه، من نمیدانم چه کسی آن را نوشته!» خوب! ممکن است چندان بامزه به نظر نرسد، اما قبول کنید که وقتی چند ده دقیقه به صفحهی مانیتور خیره شدهاید و کلی کد مزخرف بیربط به اتفاقی که نهایتاً قرار است بیفتد را خواندهاید و هنوز هیچ چی نفهمیدهاید دیدن جملهی
Stop beating your head, you might hurt yourself!
از هر جوکی که ممکن است فکرش را بکنید خندهدارتر به نظر میرسد (و البته واقعاً کمک میکند که به خودتان کمتر صدمه بزنید). بعضی جملات بامزهی معروف دیلاسیا را اینجا بخوانید.
البته بعضی وقتها کارهای بامزهی برنامهنویسها عمداً یا اشتباهاً در دیدرس کاربر نهایی قرار میگیرد. مثلاً این یکی از پیغامهای یکی از ویرایشهای وینامپ است که زمانی معروف شده بود و حرفش در اینترنت پیچیده بود (منبع عکس):
«… . این اتفاق در واقع هرگز نباید بیفتد!»
برنامهنویسان وردپرس پیش از این هم کارهای بامزه -و این یکی واقعاً بامزه- کردهاند. اگر وبلاگ مبتنی بر وردپرس دارید (ویرایش ۲.۶ یا ۲.۷)، صفحهی ویرایش یک مطلب قدیمی را بیاورید. از کادر «Post Revisions» (بازنگریهای نوشته) موردی را انتخاب کنید و سپس آن مطلب را با خودش مقایسه کنید. تصاویر زیر نشان دهندهی بخشی از اتفاقی است که بعد از این کار میافتد:
او.سی.آر: قاتل کپچای تصویر متن
09/01/12کپچای تصویر متن که روزگاری جلیقهای ضدگلوله در برابر حملات نرمافزارهای هرزپراکنی به شمار میآمد دیگر چنین وضعیتی ندارد. برنامهنویسی در سال ۲۰۰۵ با طراحی یک سیستم سادهی او.سی.آر نشان داد که عبور از سپر کپچای تصویر متن کار چندان سختی نیست (علاقمندان اینجا را ببینند) و به مرور نرمافزارهای هرزپراکنی واقعی نیز کمابیش به این قابلیت مجهز شدند. افزایش نویز و در هم ریختن تصاویر کپچاها باعث نارضایتی بیشتر کاربران شد و به مرور عدهای به فکر راهحلهای متفاوت افتادند. راهحلهایی که گاه بیش از حد متفاوت به نظر میرسند، آنچنانکه بر خلاف هدف اولیهی کپچا، اغلب باعث ایجاد شبهه در مورد هویت موجودی که توانسته آنها را حل کند میشوند: گاه انسان نمیتواند برخی از این معماهای پیچیده را حل کند و مسلماً آنچه جواب این معما را پیدا کرده یک ماشین بوده!
یکی از طرحهای ارائه شده کپچای تصویر سهبعدی است. در این نوع کپچا پیشنهاد شده که ابتدا کتابخانهای برای ایجاد چند شیء سادهی سهبعدی در حالات مختلف و با موقعیتهای متفاوت طراحی شود و اجزای این اشیاء به کامپیوتر معرفی میشوند.
در مرحلهی ایجاد کپچا، کامپیوتر این اشیاء را در یک ترکیب تصادفی از موقعیتها و حالات مختلف میچیند و اجزای این تصاویر را با حروف برچسب میزند. سپس از کاربر میخواهد حروف متناظر با چند شیء انتخابی را وارد کند.
به عنوان نمونه، از کاربر خواسته میشود تا در تصویر بالا حروف نوشته شده روی «سر مرد ایستاده»، «گلدان» و «پشتی صندلی» را به ترتیب وارد کند که جواب کپچای بالایی CKT است (برای اطلاعات بیشتر اینجا را ببینید).
علاوه بر این، ایدههای ساده و در عین حال مؤثر دیگری برای طراحی کپچا ارائه شدهاند. یکی از ایدههایی که در ابعاد وسیع در سایتها و سیستمهای مدیریت محتوی پیادهسازی شده ایدهی کپچای ریاضی است. در این حالت از کاربر خواسته میشود تا نتیجهی یک جمع و ضرب سادهی ریاضی را وارد کند. ایدههای ساده و مؤثر دیگری را با نگاهی به این پیشنمایش از قابلیتهای یکی از افزونههای دروپال ببینید.
اگر تا به حال پیش آمده باشد که بخواهید فایلی را از سایت رپیدشر دریافت کنید احتمالاً این کپچای عجیب و غریب را دیدهاید (منبع عکس):
در کپچای بالایی خواسته شده تا کاربر حروفی را که یک گربه زیر آن راه میرود در جعبهی متنی وارد کند (جانور دیگر سگ است)! هر چند به نظر میرسد این کپچای پیچیده نه برای مقابله با نرمافزارهای هرزپراکنی، که بیشتر برای آزار خلق الله و ترغیب آنها برای شل کردن سر کیسه و خرید حساب حرفهای به امید خلاص شدن از دست این کپچا ایجاد شده است! به هر حال این هم احتمالاً یکی از کاربردهای دیگر کپچا -در کنار مقابله با اسپم و کمک به دیجیتالی کردن کتابخانهها-ست!
فهرست سری نوشتههای من دربارهی هرزنامهها:
قسمت اول: ریشهی نام اسپم
قسمت دوم: هرزنامهها
قسمت سوم: کدامیک هرزنامههای بیشتری میگیرند: «علی» یا «زهرا»؟
قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!
قسمت پنجم: درآمدزایی هرزنامهها
قسمت ششم: ماشینهای صاحبنظر
قسمت هفتم: کپچا: «تو آدمی؟!»
قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن
قسمت نهم: صنعت حل کپچای هند و راهحلهای مقابله با اسپم با تکیه بر تحلیل محتوی
کپچا: «تو آدمی؟!»
09/01/09ماشینهای صاحبنظر یک ضعف مهم دارند و احتمالاً راه حل شکست دادن آنها تکیه بر همین ضعف است. آن ضعف مهم آن است که آنها آدم نیستند! بله! آنها خیلی از تواناییهای یک انسان را ندارند. تواناییهای بسیاری از این روباتها محدود به پیدا کردن جعبههای متنی، تشخیص نوع دادهای که باید آنها را با آن پر کنند و ارسال خودکار دادههای هرز است. بنابراین میتوان با ملزم کردن کاربری که فرم را پر میکند (مثلاً در حال ثبت نام برای ایجاد یک حساب ایمیل است یا در حال نظر دادن در یک وبلاگ است) به انجام کاری که به طور طبیعی از عهدهی یک انسان برمیآید و از عهدهی یک روبات برنمیآید کاری کنیم که روباتها نتوانند فرمها را پرکنند. این اساس روشی برای مقابله با اسپمها در قلمرو فرمهای الکترونیکی است که «کپچا» (CAPTCHA سرواژهی حروف ابتدایی عبارتی انگلیسی با ترجمهی آزمایش تورینگ [نام شخصی است، با تست تورینگ دانشجویان نرمافزار آشنایی دارند] کاملاً خودکار عمومی برای جداسازی انسان از کامپیوتر) نامیده میشود.
«کپچای تصویر متن» متداولترین نوع کپچاست. نرمافزارهای ارسال اسپم معمولاً توانایی پردازش تصویرها را ندارند. آنها حداکثر میتوانند الگوهای سادهی متنی را پیدا کنند. پس ما اگر در هر بار نمایش فرم یک تصویر تصادفی به کاربر نشان دهیم و از او بخواهیم برای ما بگوید داخل آن تصویر چه میبیند، کاربران انسانی -چون توانایی پردازش تصویرها را دارند- میتوانند مسئلهی «چه چیزی داخل تصویر است» را به آسانی حل کنند و نرمافزار ارسال اسپم نه. سادهترین چیزی که داخل تصاویر میتوان گذاشت متون سادهی چند حرفی یا تک کلمهای است که با ترفندهایی همچون مخدوش کردن تصویر با خطوط، نویز و اعوجاج زمینه از حالت متن ساده خارج شده است. در ضمن چون نرمافزاری که این تصویر را ایجاد میکند جواب مسأله را میداند آزمایش درستی پاسخ کاربر هم کاری ندارد. این روش، اساس کپچای تصویر متن است که این روزها در خیلی از سایتها در انواع مختلف جلوی چشممان ظاهر میشود.
البته دستهای از کاربران انسانی هم هستند که به دلیل نابینایی توانایی حل کردن مسألهی کپچای تصویر متن را ندارند. برای حل مشکل این کاربران که معمولاً با کمک نرمافزارهای صفحهخوان (نرمافزاری است که با تکیه بر فناوری متن به صدا اتفاقات روی صفحهی کامپیوتر را برای کاربر شرح میدهد) از اینترنت استفاده میکنند در کنار کپچاهای تصویر متن، کپچاهای صوتی معادل نیز ایجاد شدند تا به این طریق مشکل این دسته از کاربران نیز حل شود.
راستی! تا حالا فکرش را کردهاید که تا به حال با چند کپچا برخورد کردهاید، چند تا از آنها را (به دلیل مخدوش بودن بیش از حد) نادرست جواب دادهاید و در مجموع چقدر وقت برای حل آنها تلف کردهاید؟! هر چند زمان تلف شده برای تک تک کاربران اینترنت احتمالاً ناچیز است، اما فکرش را بکنید که جمع زمانی که کل کاربران اینترنت برای حل کپچاها صرف میکنند چقدر است (البته احتمالاً در یکی از نوشتههایی بعدی از کسانی برایتان صحبت خواهم کرد که روزانه حداقل هشت ساعت کپچا حل میکنند!). واقعاً اگر اسپم نبود و اگر نرمافزارهای ارسال اسپم نبودند لازم نبود این سؤالهای احمقانه را پاسخ دهیم. جالب اینجاست که عدهای به همین موضوع فکر کردهاند و به ایدهای رسیدهاند که با استفاده از آن میتوان کاری کرد که حل کپچاها دیگر بیهوده نباشد و از آن سودی به همگان برسد.
مسألهای که حل کپچای تصویر متن به آن شباهت دارد او.سی.آر است. در این فرایند یک برنامهی کامپیوتری تلاش میکند تصویر اسکن شدهی متن را به متن قابل ویرایش یا جستجو تبدیل کند. اما درصد موفقیت نرمافزارها در تبدیل تصویر به متن همیشه بالا نیست. خیلی وقتها متن کاغذی مخدوش است یا کیفیت خوبی ندارد. بنابراین برنامهی او.سی.آر آن را با دقت خوبی نمیخواند، اما برنامه متوجه این قضیه میشود و میتواند قسمتهایی از متن را که خوب نخوانده جدا کند تا یک کاربر انسانی آنها را بازبینی و تأیید یا تصحیح کند. اما همیشه کاربران انسانی برای تصحیح خطاهای او.سی.آر در دسترس نیستند. مخصوصاً برای پروژههای عمومی تبدیل کتابهای کاغذی به متون دیجیتالی همیشه بودجهی کافی برای استخدام مصححان در دسترس نیست. سایتی به نام ریکپچا تلاش دارد با ارائهی سرویس کپچای رایگان، در کنار کلمات ایجاد شده توسط کامپیوتر -که پاسخ آنها برای نرمافزار کپچا مشخص است- کلماتی را که نرمافزارهای او.سی.آر «با دقت پایین» تشخیصشان دادهاند در دسترس کاربر انسانی قرار دهد و از او بخواهد درست آن را تایپ کند. به این ترتیب سایت یا سرویسی که از این روش استفاده میکند از کاربر میخواهد دو کلمه را وارد کند که جواب یکی را میداند و نتیجهی ورودی کاربر برای کلمهی دیگر را ذخیره میکند تا با دریافت چند جواب دیگر از کاربران دیگر راجع به متن آن اطمینان حاصل کند و نهایتاً دقت متون او.سی.آر شده را بالا ببرد. روش مشابهی نیز برای کپچاهای صوتی و تبدیل صداهای ضبط شدهی از دهههای گذشته به متن ارائه شده است.
در مورد انواع کپچا شاید این صفحه هم اطلاعات جدید و مفیدی داشته باشد.
فهرست سری نوشتههای من دربارهی هرزنامهها:
قسمت اول: ریشهی نام اسپم
قسمت دوم: هرزنامهها
قسمت سوم: کدامیک هرزنامههای بیشتری میگیرند: «علی» یا «زهرا»؟
قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!
قسمت پنجم: درآمدزایی هرزنامهها
قسمت ششم: ماشینهای صاحبنظر
قسمت هفتم: کپچا: «تو آدمی؟!»
قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن
قسمت نهم: صنعت حل کپچای هند و راهحلهای مقابله با اسپم با تکیه بر تحلیل محتوی
ماشینهای صاحبنظر
08/12/26قلمرو ناخواستههای دنیای اینترنت محدود به نامههای الکترونیکی و هرزنامهها نیست. هر نوع فرم الکترونیکی که از طریق سایتهای اینترنتی در دسترس قرار میگیرد در معرض حملهی روباتها و برنامههای کامپیوتری است. این برنامهها با اهداف مختلف تلاش میکنند این فرمها را پر کنند و معمولاً حاصل این تلاشها انبوهی از نظرات هرز در وبلاگها، از کار افتادن کامپیوترهای میزبان سایتهای اینترنتی و انواع پیامدهای ناخوشایند دیگر است.
برای نمونه، هرزنامهنگاران میدانند که اکثر نرمافزارهای مبارزه با هرزنامهها، برای ایمیلهایی که از طریق سرویسهای محبوب ایمیل نظیر یاهو و جیمیل ارسال شده باشد اولویت خاصی قائلند و اگر ایمیل واقعاً از طریق این سرویسها ارسال شده باشد احتمال شناسایی آن به عنوان هرزنامه پایین میآید. اما از طرف دیگر همهی سرویسهای ایمیل محبوب سیستمهایی برای تشخیص استفادهی غیرمجاز کاربران دارند. به عنوان نمونه برخی از این سیستمها به محض این که تشخیص دهند یک کاربر در یک بازهی زمانی خاص تعداد زیادی ایمیل فرستاده حساب کاربری او را به عنوان هرزنامهنگار موقتاً مسدود میکنند. از این رو، هرزنامهنگاران سیستمهایی طراحی کردهاند که تلاش میکنند با پر کردن فرم ثبت نام سرویسهای ایمیل به صورت ماشینی حساب ایمیل بسازند و تا حد مسدود شدن با حساب ایجاد شده هرزنامه بفرستند و به محض مسدود شدن ایمیل، به سراغ ایمیل بعدی بروند!
نمونهی دیگر استفاده از فرمها برای ارسال اسپم، بخش نظرات وبلاگهاست. اسپمرها با استفاده از برنامههای کامپیوتری تلاش میکنند این فرمها را پر کنند و در قالب نظرهای وبلاگی به طور انبوه محصولات خود را تبلیغ کنند. انگیزههای دیگری نیز همچون افرایش لینکهای ورودی به سایت هدف و در نتیجه افزایش رتبهی سایت در موتورهای جستجو نیز در انتخاب این روش ارسال اسپم مؤثر است.
در نوشتهی بعدی به بعضی روشهای مقابله با اسپم در قلمرو فرمهای الکترونیکی اشاره خواهم کرد.
فهرست سری نوشتههای من دربارهی هرزنامهها:
قسمت اول: ریشهی نام اسپم
قسمت دوم: هرزنامهها
قسمت سوم: کدامیک هرزنامههای بیشتری میگیرند: «علی» یا «زهرا»؟
قسمت چهارم: بگذارید «اسپم»ها را آنها بخورند!
قسمت پنجم: درآمدزایی هرزنامهها
قسمت ششم: ماشینهای صاحبنظر
قسمت هفتم: کپچا: «تو آدمی؟!»
قسمت هشتم: او.سی.آر: قاتل کپچای تصویر متن
قسمت نهم: صنعت حل کپچای هند و راهحلهای مقابله با اسپم با تکیه بر تحلیل محتوی
شب دوم از شب یلدا طولانیتر است
08/12/22
آیا میدانید که لحظه شروع زمستان و تحویل خورشید به برج جدی امسال در ساعت ۱۵ و ۳۳ دقیقه و ۴۵ ثانیه روز اول دی ماه ۱۳۸۷ اتفاق میافتد و به این دلیل شب دوم دی ماه از شب اول (شب یلدا) طولانیتر است؟
در تهران شب دوم دی ماه از شب اول نیم ثانیه طولانیتر است.
بیربطنوشت: چند روزی ولایت بودم، به همین دلیل آمار ایمیلهای نخوانده، نظرات بازبینی نشده (گزیر) و حاشیههای اعمال نشده (گنجور)ام کمی بالا رفته. از دوستانی که در انتظار پاسخ یا عکسالعملی از طرف منند خواهش میکنم همچنان صبور باشند!