۱- به این نشانی بروید.
۲- بالای صفحه یک عکس بریده شدهٔ متنی میبینید. در کادر پایین آن یک یا چند دکمهٔ سفیدرنگ میبینید که حاوی متنهایی مشابه تصویر بالای صفحه هستند. اگر یکی از آنها متنش کاملاً شبیه متن تصویر است روی آن کلیک کنید، اگر نه در کادر متنی «خیر؟ تصویر درست را وارد کنید» متن درست را تایپ کنید و Enter بزنید.
۳- با هر بار کلیک بر روی یکی از دکمههای مرحلهٔ ۲ به صفحهٔ مشابهی هدایت میشوید و این کار را میتوانید تا هر وقت که دوست داشتید ادامه دهید!
۴- بعضی از عکسها ممکن است ناخوانا باشند (بد اسکن شدهاند)، در این موارد روی دکمهٔ «تصویر ناخواناست» کلیک کنید. بعضیها هم ممکن است حاوی هیچ متن قابل بازخوانیی نباشند (حروف تکه تکه و …)، در این موارد روی دکمهٔ «تصویر بد بریده شده» کلیک کنید.
با صرف چند دقیقه از وقت آنلاینتان به این صورت -ضمن لطفی که دارید به من میکنید 😉 – به گسترش دامنهٔ دادههای بزرگترین سایت شعر فارسی دارید کمک میکنید. دوست دارید در این مورد بیشتر بدانید؟ اینجا را ببینید.
ایده بسیار عالی
من که هرروز چند دقیقه را به این کار اختصاص خواهم داد.
وقتمان را به شما دادیم
خیلی هم خوب بود
با تشکر کمی از قبل و بعد از متن بریده شده را هم به صورت کمرنگ نمایش دهید تا اگر جالب بود بتوانیم کمی هم از آن مطلب بهره مند شویم
عالی، باید بگم خوب عمل میکنه و فقط بعضی وقت ها مشکل از فاصله بین کلماته
۱. ممنون برای کاری که می کنید و زحمتی که می کشید
۲. تبریک واسه نوشتن همچین او سی آر ی؛ درصد خطاش خیلی پایینه.
۳. کاش راجه به فاصله (و نیم فاصله) هم چیزی می نوشتید؛ چون مثلا” من نمی دونم وقتی دو واژه (به دلایل قابل فهم، مثلا” نستعلیق نوشتن و جا کم داشتن و الخ) به هم چسبیده اند، ولی باید با فاصله از هم باشند، من باید گزینه اول رو کلیک کنم، یا تو گزینه دوم فاصله بگذارم و روی “ذخیره” کلیک کنم.
اگر این مورد معلوم بشه، احتمالا” تصحیح دستی نهایی وقت بسیار کمتری خواهد گرفت.
۴. بازم مرسی برای کاری که می کنید.
ممنون از لطف دوستان
در مورد فاصلهها، بله میدونم در مورد فاصله مشکل داریم اما خوب، فعلاً این مورد رو واگذار کردم به دوستانی که بازبینی میکنن تا طبق سلیقۀ خودشون تصمیم بگیرن، خروجیهای سری اول که نهایی شد با توجه به اونها تصمیم بگیرم.
من خودم که بازبینی میکنم در مورد فاصلهها سعی میکنم بهترین رسمالخط رو انتخاب کنم و به تصویر چاپی وفادار نیستم.
کارتون واقعاً جای تقدیر داره، خطا زیر ۱۰ درصد!
موفق باشید!
سلام، برای زحماتی که کشیدید متشکرم. من هم مشارکت می کنم و تا حالا چند تا رو تصحیح کردم.
سلام بر شما
اسم نرم افزار OCR شما چیست؟
معرکه است!
تا اونجایی که تونستم دارم تصحیح یا تایید میکنم اشعار رو
شاد باشید.
سلام
چند تایی را انجام دادم. نکته ای که دیدم این است که این نرم افزار مثل اینکه از بانک لغت استفاده نمی کند. مثلا در یکی از نمونه ها، کلمه “دوش” در تصویر، به صورت ” دوفن” خوانده شده بود. نمی دانم کلمه “دوفن” لغت فارسی هست یا نه، اگر هم باشد تعداد تکرار آن در متون فارسی باید خیلی کم بوده باشد. در این صورت هرگاه شما کلمه ای در متن یافتید که در فرهنگ لغت وجود ندارد؛ می توانید نزدیکترین کلمه به آن را جایگزین کنید.
@جوانه:
همونطور که احتمالاً خودتون با دنبال کردن لینکها فهمیدید آراکسه.
@محرم:
در صورتی که کاربر بخواد میتونه همین کار رو به صورت خودکار انجام بده، یعنی محیط نرمافزار فرمانی رو برای «غلطیابی دستهای» در اختیار میگذاره که به طور خودکار برای تمام تصاویر، برای غلطهای املایی نزدیکترین جایگزینها رو انتخاب میکنه و به یک باره جایگزین میکنه. اما، این کار همیشه نتیجهٔ دلخواه رو نمیده، مثلاً خیلی وقتها فاصلهگذاری توی چاپ طوری نیست که لزوماً دو تیکهای که کنار هم قرار گرفتن متعلق به یک کلمه باشن (و خوب جزء مشکلات نرمافزار در حال حاضر تشخیص نه چندان خوب فاصلههاست که باعث تشدید این مشکل هم میشه)، خیلی وقتها شعرها رو مثلاً به صورت دوستونی و با حالت تراز شده (جاستیفای) چاپ میکنن و توی این نوع چاپ گاهی مجبور میشن کلمات رو با حذف فواصل بینشون به زور توی یه عرض ثابت جا بدن. اینجاها استفاده از غلطیابی املایی نتیجه رو خراب میکنه، برای همین توی نرمافزار انتخاب این که جایگزینی خودکار انجام بشه یا نه با کاربره.
سلام، در حال انجام وظیفه
@لیلا:
ممنون از بزرگواری شما
خوب کار میکنه، دارم کاری که گفتید رو انجام میدم
سلام
وقت گذاشتيم و ديگران را نيز دعوت كرديم. باشد كه با موفقيت به نتيجه برسيد
احسنت دوست عزيز و خسته نباشيد
خیلی کار ارزشمندیه … اگه بشه چند تا افزونه فایرفاکسی و برنامه فیس بوک براش تهیه کرد هم بد نیست.
@محمد:
افزونۀ فایرفاکسی فکر نمیکنم از لحاظ آمار استفاده کنندهها ارزش وقتی که براش گذاشته میشه رو داشته باشه، فیسبوک اما فکر خوبیه، حیف که مسدوده و حداقل برای من یکی دسترسی بهش انرژی زیادی میخواد!
ممنون از لطف سایر دوستان.