هر چه منتظر ماندیم که صاحابش اشارهای به کشفش بکند دیدیم فایدهای ندارد. از این رو خودمان عرضهاش میکنیم!
«صخر» نام یک شرکت عربی (فکر میکنم مصری) است که در زمینهی فناوریهای پردازش زبان طبیعی با تأکید بر زبان و خط عربی کار میکند. نرمافزار تبدیل تصویر به متن (اُ.سی.آر) این شرکت از جمله معدود نرمافزارهای ا.سی.آر موجود است که از ابتدا با هدف پشتیبانی تخصصی از خط و زبان عربی ساخته شده و به ادعای این شرکت علاوه بر زبان عربی از برخی زبانهای دیگر که با خط عربی یا مشتقات آن نوشته میشوند (فارسی، اردو و جوی) پشتیبانی میکند. در ایران شرکتی گویا قفل محصول ا.سی.آر این شرکت عربی را شکسته، محیط آن را فارسی کرده، دوباره روی آن قفل گذاشته و دارد به اسم «خودنگار واژهشناس» آن را به خلق الله قالب میکند! البته از آنجا که دست بالای دست بسیار است افرادی هم پیدا شدهاند که قفل دوم را شکستهاند و محصول ایرانینما شده را راهی خانههای ایرانیانی کردهاند که برایشان معنی ندارد برای یک نرمافزار چیزی بیشتر از دو یا سه برابر قیمت یک سی.دی خام پول بدهند!
در هر صورت نکتهی جالبی که کشف شده و میخواستم به آن اشاره کنم مربوط به یکی از بروشورهای تبلیغاتی نرمافزار ا.سی.آر صخر است. در این بروشور ادعا شده که دقت این نرمافزار در تشخیص متون عربی کتابها و روزنامهها ۹۹٪ است:
اما درستی این ادعا به راحتی و با نگاهی به گوشهی همان بروشور تبلیغاتی زیر سؤال میرود. جایی که نرمافزار مذکور در بازشناسی متنی با یک قلم معمول عربی -در کنار تشخیص افتضاح کلمهی انگلیسی- چندین حرف از چند کلمهی ساده را به وضوح اشتباه تشخیص داده.
وضع بروشور تبلیغاتی که این باشد وضع نرمافزار در کاربردهای عملی کاملاً معلوم است. جالب اینجاست که در بروشور تبلیغاتی نگارش سبکتر همان نرمافزار (که ارزانتر است) این خطاها (به ظن قوی به صورت دستی) تا حدودی تصحیح شدهاند.
بعدنوشت: طبق تذکر دوستان محصولی با نام «خودنگار» که اشتباهاً آن را قفل شکستهی نرمافزار صخر معرفی کرده بودم، فیالواقع یک محصول تولیدی داخل است که در پژوهشکدهی پردازش هوشمند علائم تولید شده که به لحاظ ضعفهای عملکردی و ساختاری با اقبال عمومی مواجه نشده و هماکنون هم توسط شرکت سیمیا نرمافزار به بازار عرضه میشود.
قفل شکستهی ایرانی صخر توسط شرکت هوش مصنوعی رایورز و با نام «واژهشناس» عرضه شده.
سلام هموطن ايراني. سايت ياهو که آدرس ايميل من و شما در آن قرار دارد و روزانه با مسنجرش چت ميکنيم، نام کشور من و تو را از ليست کشورهايش در صفحهي ثبت نام حذف کرده. اگر غيرت و عرق مليات اجازه نميدهداين ننگ را بپذيري، با لينک دادن به صفحهي http://helloyahoomail.net از طريق کليدواژهي Yahoo mail به بمب درحال پيشرفت عليه ياهو کمک کنيد تا کوچکترين وظيفهي ما به کشورمان ادا شده باشد و همانند بمب افتخارآميز فيلم سيصد و خليج فارس، بتوانيم يک موفقيت ديگر را نيز رقم بزنيم… متشکرم
۱- ممنون از توجه و توضيحات مفيدت
۲- شنيده ام نرم افزار معروف finereader نسخه عربي هم دارد. در اين مورد اطلاعي داري ؟
محرم جان:
۱- خواهش میکنم!
۲- والله منم فکر میکردم یا شنیده بودم که از عربی هم پشتیبانی میکنه، ولی الان رفتم توی سایتش نگاه کردم اسمی از عربی توی لیست زبانهای پشتیبانی شده توسط FineReader نیست:
http://www.abbyy.com/finereader8/?param=44927
(لیست زبانها مال فاین ریدر هشته ولی گویا نسخهی نهش هم از همین زبانها پشتیبانی میکنه و نه چیزی بیشتر.)
توی صفحهی فیدبکهاش هم دو سه نفر از این این نرمافزار از عربی و عبری پشتیبانی نمیکنه تعجب یا اظهار تأسف کردن:
http://www.abbyy.com/company/?param=5673
گویا موتور آی.سی.آرش از حروف گسستهی عربی پشتیبانی میکنه:
http://www.abbyy.com/sdk/?param=60489
http://www.abbyy.com/sdk/?param=60493
که البته نرمافزار iReadDoc شرکت ما احتمالاً پشتیبانیش خیلی قوی تره.
اگه دنبال OCRی میگردی که از فارسی پشتیبانی کنه بد نیست یه نسخه از آیریس رو گیر بیاری:
http://www.irislink.com
و یا نسخهی ایرانی شدهش رو که توسط برادران مؤمن و متعهد حسیب رایانه 😉 به سرقت رفته بخری:
http://www.hasibcom.com/pOCRFarsi.asp
که البته از لحاظ کیفیت کار و تشخیص فونتهای معمول فارسی خیلی وقتها کیفیت تشخیصش افتضاحه، سندی هم که برات درست میکنه حتی برای او.سی.آر انگلیسیش مشابهت زیادی با عکس سند نداره.
اگه بتونی چیزی کمتر از یک ماه منتظر بمونی، احتمالاً او.سی.آر شرکت ما به بازار میاد که اولاً کاملاً ایرانیه و از موتور او.سی.آر گرفته تا بیشتر کمپوننتهای رابط کاربریش رو خودمون نوشتیم (البته ایرانی بودنش از این نظر مزیته که مطابق با شرایط تولید سندها توی ایران، فونتهای متداول و عادات تایپیستهای ایرانی تهیه شده وگر نه در کل بیشتر وقتها ایرانی بودن یه محصول نه تنها مزیت که یه عیب محسوب میشه 😉 البته من با شناختی که از همکارام دارم میتونم تضمین کنم که در این مورد خاص ایرانی بودن این محصول مزیته، اونم فقط به خاطر ایرانیهای خاصش!) و دوم این که دقت بالایی داره و سندی هم که درست میکنه چینش (layout) عکس سند رو به نحوی حفظ میکنه که انگار یه تایپیست تایپش کرده (و سندت رو پر از جعبه متن و فریم نمیکنه) و سوم این که ویرایش پایهش با قیمتی معقول و قابل خرید برای کاربرهای عادی نرمافزار عرضه میشه:
http://farsiocr.blogfa.com/post-92.aspx
http://www.farsiocr.ir
خیلی با حالی
دوست عزیز من به عنوان مدیر فنی شرکت حسیب رایانه لازم می دانم مطالب زیر را ذکر کنم :
۱. اگر به بسته بندی CD های ما نگاه کنید متوجه می شوید که ذکر کردیم که نرم افزار خارجی است و ما فقط برای آن آموزش تهیه کردیم و آپدیت ها و پچ ها را عرضه می کنیم ، پس کلمه سرقت از بی توجهی شما است.
۲. تمامی خریداران حق تست قبل از خرید را از طریق ارسال یک صفحه از متن خود به ایمیل شرکت دارند و در صورت تمایل تهیه کنند.
۳. قبل از اینکه به دیگران تهمت بزنیم بد نیست تحقیق کنیم.
باسلام خدمت دوستان و همکاران گرامی:
می خواستم محبت کنید و یک OCR فارسی معرفی کنید که Sdk داشته باشه یا اینکه بشه از Activex ش تو برنامه نویسی (دلفی) استفاده کنم باتشکر
ای بابا؛ شما قبل از اون هایلایت قرمز رو توجه نکردی که نوشته Up to؟ یعنی فوق فوقش ۹۹% دقت داشته باشه 🙂