لطفاً چند دقیقه از وقت آنلاینتان را به من هدیه بدهید!

۱- به این نشانی بروید.

بازبینی خروجیهای OCR گنجور

۲- بالای صفحه یک عکس بریده شدهٔ متنی می‌بینید. در کادر پایین آن یک یا چند دکمهٔ سفیدرنگ می‌بینید که حاوی متنهایی مشابه تصویر بالای صفحه هستند. اگر یکی از آنها متنش کاملاً شبیه متن تصویر است روی آن کلیک کنید، اگر نه در کادر متنی «خیر؟ تصویر درست را وارد کنید» متن درست را تایپ کنید و Enter بزنید.

۳- با هر بار کلیک بر روی یکی از دکمه‌های مرحلهٔ ۲ به صفحهٔ مشابهی هدایت می‌شوید و این کار را می‌توانید تا هر وقت که دوست داشتید ادامه دهید!

۴- بعضی از عکسها ممکن است ناخوانا باشند (بد اسکن شده‌اند)، در این موارد روی دکمهٔ «تصویر ناخواناست» کلیک کنید. بعضیها هم ممکن است حاوی هیچ متن قابل بازخوانیی نباشند (حروف تکه تکه و …)، در این موارد روی دکمهٔ «تصویر بد بریده شده» کلیک کنید.

با صرف چند دقیقه از وقت آنلاینتان به این صورت -ضمن لطفی که دارید به من می‌کنید 😉 – به گسترش دامنهٔ داده‌های بزرگترین سایت شعر فارسی دارید کمک می‌کنید. دوست دارید در این مورد بیشتر بدانید؟ اینجا را ببینید.

18 دیدگاه برای “لطفاً چند دقیقه از وقت آنلاینتان را به من هدیه بدهید!”

  1. با تشکر کمی از قبل و بعد از متن بریده شده را هم به صورت کمرنگ نمایش دهید تا اگر جالب بود بتوانیم کمی هم از آن مطلب بهره مند شویم

  2. ۱. ممنون برای کاری که می کنید و زحمتی که می کشید
    ۲. تبریک واسه نوشتن همچین او سی آر ی؛ درصد خطاش خیلی پایینه.
    ۳. کاش راجه به فاصله (و نیم فاصله) هم چیزی می نوشتید؛ چون مثلا” من نمی دونم وقتی دو واژه (به دلایل قابل فهم، مثلا” نستعلیق نوشتن و جا کم داشتن و الخ) به هم چسبیده اند، ولی باید با فاصله از هم باشند، من باید گزینه اول رو کلیک کنم، یا تو گزینه دوم فاصله بگذارم و روی “ذخیره” کلیک کنم.
    اگر این مورد معلوم بشه، احتمالا” تصحیح دستی نهایی وقت بسیار کمتری خواهد گرفت.
    ۴. بازم مرسی برای کاری که می کنید.

  3. ممنون از لطف دوستان

    در مورد فاصله‌ها، بله می‌دونم در مورد فاصله مشکل داریم اما خوب، فعلاً این مورد رو واگذار کردم به دوستانی که بازبینی می‌کنن تا طبق سلیقۀ خودشون تصمیم بگیرن، خروجیهای سری اول که نهایی شد با توجه به اونها تصمیم بگیرم.
    من خودم که بازبینی می‌کنم در مورد فاصله‌ها سعی می‌کنم بهترین رسم‌الخط رو انتخاب کنم و به تصویر چاپی وفادار نیستم.

  4. کارتون واقعاً جای تقدیر داره، خطا زیر ۱۰ درصد!
    موفق باشید!

  5. سلام، برای زحماتی که کشیدید متشکرم. من هم مشارکت می کنم و تا حالا چند تا رو تصحیح کردم.

  6. سلام بر شما
    اسم نرم افزار OCR شما چیست؟
    معرکه است!
    تا اونجایی که تونستم دارم تصحیح یا تایید میکنم اشعار رو
    شاد باشید.

  7. سلام
    چند تایی را انجام دادم. نکته ای که دیدم این است که این نرم افزار مثل اینکه از بانک لغت استفاده نمی کند. مثلا در یکی از نمونه ها، کلمه “دوش” در تصویر، به صورت ” دوفن” خوانده شده بود. نمی دانم کلمه “دوفن” لغت فارسی هست یا نه، اگر هم باشد تعداد تکرار آن در متون فارسی باید خیلی کم بوده باشد. در این صورت هرگاه شما کلمه ای در متن یافتید که در فرهنگ لغت وجود ندارد؛ می توانید نزدیکترین کلمه به آن را جایگزین کنید.

  8. @جوانه:
    همونطور که احتمالاً خودتون با دنبال کردن لینکها فهمیدید آراکسه.

    @محرم:
    در صورتی که کاربر بخواد می‌تونه همین کار رو به صورت خودکار انجام بده، یعنی محیط نرم‌افزار فرمانی رو برای «غلط‌یابی دسته‌ای» در اختیار می‌گذاره که به طور خودکار برای تمام تصاویر، برای غلطهای املایی نزدیکترین جایگزینها رو انتخاب می‌کنه و به یک باره جایگزین می‌کنه. اما، این کار همیشه نتیجهٔ دلخواه رو نمیده، مثلاً خیلی وقتها فاصله‌گذاری توی چاپ طوری نیست که لزوماً دو تیکه‌ای که کنار هم قرار گرفتن متعلق به یک کلمه باشن (و خوب جزء مشکلات نرم‌افزار در حال حاضر تشخیص نه چندان خوب فاصله‌هاست که باعث تشدید این مشکل هم میشه)، خیلی وقتها شعرها رو مثلاً به صورت دوستونی و با حالت تراز شده (جاستیفای) چاپ می‌کنن و توی این نوع چاپ گاهی مجبور میشن کلمات رو با حذف فواصل بینشون به زور توی یه عرض ثابت جا بدن. اینجاها استفاده از غلطیابی املایی نتیجه رو خراب می‌کنه، برای همین توی نرم‌افزار انتخاب این که جایگزینی خودکار انجام بشه یا نه با کاربره.

  9. سلام
    وقت گذاشتيم و ديگران را نيز دعوت كرديم. باشد كه با موفقيت به نتيجه برسيد

  10. خیلی کار ارزشمندیه … اگه بشه چند تا افزونه فایرفاکسی و برنامه فیس بوک براش تهیه کرد هم بد نیست.

  11. @محمد:
    افزونۀ فایرفاکسی فکر نمی‌کنم از لحاظ آمار استفاده کننده‌ها ارزش وقتی که براش گذاشته میشه رو داشته باشه، فیس‌بوک اما فکر خوبیه، حیف که مسدوده و حداقل برای من یکی دسترسی بهش انرژی زیادی می‌خواد!

    ممنون از لطف سایر دوستان.

دیدگاه‌ها بسته شده‌اند.