Babylon Pro جدیدترین نگارش برنامه قدرتمند بابیلون برای دسترسی سریع ترجمه ایمیل ها , صفحات وب , مدارک , پیغام رسان ها , اکسل , ورد , برنامه های کاربردی دسک تاپ و بیشتر به بیش از ۷۵ زبان زنده دنیا فقط با یک کلیک ماوس و با استفاده از تکنولوژی OCR برای در دسترس بودن برنامه در تمامی لحظات.
ویژگی های برنامه:
- بهره بردن از مبدل واحدها به یکدیگر
- تلفظ صحیح کلمات با صدای زن یا مرد
- تصحیح کلمات نوشته شده از لحاظ املایی
- ترجمه کامل سریع و آسان متن با یک کلیک
- دیکشنری هوشمند برای ترجمه هر گونه متن و زبان
- کامل کننده خودکار حروف کلمات در هنگام تایپ و نمایش ترجمه
- پشتیبانی کامل از زبان فارسی در ویندوزهای انگلیسی و عربی
- ترجمه مستقیم از داخل برنامه های کاربردی مانند ورد , آتلوک و پاور پوینت
- قابلیت داشتن ۲۵ دیکشنری به زبان های زنده دنیا از جمله زبان شیرین فارسی
- پشتیبانی از سرویس های ایمیل مانند جیمیل , هات میل و وبلاگ ها برای غلط یاب املایی

Babylon Pro v7.5.2 (r3) | 6.8 MB
Babylon 7 is the world's leading dictionary and language translation software. Babylon offers you the most intuitive tool for all your translation needs. With Babylon you can quickly translate emails, web pages, documents, instant messages, and more. All you have to do is click on the word or text that you want to translate and a small window instantly appears with the desired results from Babylon's extensive database of language dictionaries, glossaries and conversion tools.
Babylon offers its users a wide range of titles from the world's premier publishing houses including Oxford University Press, Britannica, Merriam-Webster, Larousse, Vox, Langenscheidt, Pons, and Taishukan. New version Babylon six offers text translation in 17 languages in addition to single word and phrase translations - all in a single click, results from Wikipedia encyclopedia in nine languages, automatic spelling feature, and accurate results in a single-click from a wide range of authoritative sources.
Babylon 7 - an easy and intuitive translation and dictionary software in over 75 languages. With Babylon 7, text translation has never been easier, no more "copy/paste" or unnecessary browser windows. Just click on any text in Word, Excel, emails, instant messaging, web pages and other desktop applications. All you need is a single click away.
ادامه مطلب
۵۰ماشین جدید برای Need for speed وMost Wanted
نرم افزار ساخت بنر فلش Aleo Flash Intro Banner Maker 2.4.99 Portable
اگر کار با نرم افزار هایی مانند ماکرو مدیا فلش یا سوییش مکس و اسکریپت ها را بلد نیستید همچنین می خواهید یک بنر فلش حرفه ای را خود طراحی کنید، دیگر نیاز به یادگیری آن ها ندارید چونکه سایت کمیاب آنلاین نرم افزاری حرفه ای برای تازه کارها تهیه دیده است که تنها با چند کلیک به سرعت برای شما یک فلش زیبا و حرفه ای طراحی می کند. Aleo Flash Intro Banner Maker نرم افزاری با ابزار قدرتمند فلش برای ساخت فلش های ابتدای سایت، بنر های تبلیغاتی، کارت پستال الکتریکی و نمایش اسلاید به آسانی و تنها با چند کلیک می باشد. تنها کاری که می بایست انجام دهید وارد کردن نوشته مورد نظر و انتخاب افکت های آماده و قابل تغییر پشت زمینه و انیمیشن متن است. مشخصه و تنظیم نوشته کاملا قابل تغییر بوده و امکان انتخاب نوع فونت، اندازه، عرض و طول، شفافیت، چرخش، حاشیه، سبک پرکردن نوشته و ... بنر دلخواه و مورد نظر شما را طراحی می کند. تمام افکت های پشت زمینه و نوشته قابل تنظیم و تغییر بوده و تمام امکانات یک بنر مانند متن و فونت، آدرس سایت قابل کلیک، تغییر رنگ ها و صداهای مورد نظر در آن موجود می باشد. دانلود با حجم ۳.۸ مگابایت پسورد فایل : www.kamyabonline.com منبع : www.kamyabonline.com
ادامه مطلب
پلیری کوچک با قابلیت های بزرگ VLC Media Player 0.9.2
امروزه با پیشرفت فناوری و تولید فیلم ها با کیفیت فوق العاده تماشای فیلم ها به تفریحی برای افراد تبدیل شده است . فیلم هایی که کیفیت فوق العاده دارند و در فرمت های مختلف به کاربران عرضه می شوند . اکثر کاربران و افراد برای تماشای فیلم های خود به رایانه های شخصی روی می آورند .
این کاربران اغلب برای تماشای هریک از فرمت های مختلف فیلم ها می بایست نرم افزاری جداگانه نصب کنند که بیشتر این ابزار ها حجم زیادی از حافظه را اشغال کرده و در یک کلام نرم افزار های سنگینی به شمار می روند .
VLC Media Player نام نرم افزاری با حجم بسیار کمتر از نرم افزاری های مشابه می تواند 99 درصد فیلم هایی را که کاربران اغلب تماشا می کنند را اجرا نماید .
حجم پائین و محیط بسیار ساده نرم افزاری از مهم ترین قابلیت های این نرم افزار محسوب می شود . در نظر بگیرید برای اجرای DVD های خود باید نرم افزارهای سنگینی همچون Cyberlink PowerDVD و یا Corel WinDVD را برروی سیستم خود نصب کنید . این نرم افزار ها ضمن این که فضای نسبتا زیادی از هارد دیسک شما را اشغال می کنند ، برای اجرای فیلم ها نیز فضای زیادی هم از حافظه سیستم یعنی رم اشغال می کنند . اما VLC بسیار کم حجم و سبک است در حالی که می تواند به راحتی DVD ها را حرکت در آورد .
این ابزار می تواند به جای همه نرم افزار هایی که به عنوان پلیر بر روی سیستم نصب می شود قرار گیرد زیرا قادر است تا 99 درصد فرمت ها را پشتیبانی کند .
همچنین قادر است فرمت های مختلف را به یکدیگر تبدیل کند . یعنی به یک تیر می توان چند نشان را هدف گرفت .
جالب است بدانید این نرم افزار با این همه قابلیت ضمن این که کاملا رایگان است هنوز حتی نسخه 1 آن هم منتشر نشده است و آخرین نسخه ای که برای دانلود در سایت قرار دارد نسخه 0.9.2 می باشد .
نسخه جدید که حاصل 2 سال پژوهش شرکت سازنده است به تازگی منتشر شده که در همین مدت کوتاه هم حدود 90 هزار بار این نرم افزار دانلود شده است که این تعداد برای این زمان کوتاه عددی فوق العاده محسوب می شود .
قابليت هاي كليدي نرم افزار VLC Media Player 0.9.2:
- پخش انواع فرمت ها از جمله MPEG-1, MPEG-2, MPEG-4, DivX, mp3, ogg, ...
- پخش انواع DVD ، VCD
- حجم بسیار اندک نسبت به قابلیت های فراوان آن و همچنین نسبت به نرم افزار های مشابه
- محیط بسیار ساده و كاربر پسند
- ارائه نرم افزار بصورت كاملا رايگان
- پشتیبانی در زبان های مختلف
- قابلیت اجرا در اکثر سیستم عامل ها یعنی ویندوز ، لینوکس ، مکینتاش و ...
- پوسته های متعدد برای سلیقه های مختلف
-پشتیبانی از نسخه های مختلف ویندوز از جمله ویندوز ویستا
- پشتيباني كامل از زبان شيرين فارسي
- و...

دانلود با حجم ۱۳.۸ مگابایت
پسورد فایل : www.kamyabonline.com
منبع : www.kamyabonline.com
ادامه مطلب
لیبرا، برنامه ایست که به کمک آن میتوانید اطلاعات خود را مرتب کنید، اطلاعاتی مثل کتاب ها، فیلم ها، CD و DVD ها و غیره. در واقع شما با دانلود یک برنامه ی 4 مگابایتی یک منشی خوب و حرف گوش کن را برای سروسامان بخشیدن به زندگی خود به رایگان استخدام کرده اید! امکاناتی که این برنامه در اختیار شما میگذارد عبارتند از :
خواندن اطلاعات شما بصورت خودکار - این برنامه از یک بارکد خوان داخلی سود میبرد به این صورت که شما وب کم خود را روشن میکنید و آن را جلوی بارکد کتاب، فیلم، بازی خود میگیرید و برنامه اتوماتیک اطلاعات آن را میخواند و برای شما ثبت میکند.
بانک اطلاعاتی پرسرعت - بانک اطلاعاتی لیبرا بر پایه ی SQL ساخته شده و سرعت بسیار بالایی دارد، شما با سرعت بسیار زیادی میتوانید به اطلاعات دسترسی پیدا کنید و یا آنها را مرتب کنید.
پس گرفتن اجناس قرضی - به دوستتان بازی یا فیلم یا کتاب یا هرچیز دیگری قرض داده اید؟ دیگر نگران از دست دادن آنها نباشید! لیبرا برای شما تاریخ قرض دادن وسیله را ثبت میکند و شما میتوانید همیشه پیگیر موارد قرضیخود باشید.
چاپ کاتالوگ - لیبرا به شما این امکان را میدهد تا در شکل و قالبی زیبا از اطلاعات کتابخانه ی خود کاتالوگ تهیه نمایید و آنها را چاپ کنید تا همیشه در دسترس تان باشد.
به اشتراک گذاری کتابخانه - میتوانید کتابخانه ی خود را بصورت آنلاین با دیگران به اشتراک بگذارید، لیبرا از اطلاعات شما با فرمت صفحات وب خروجی میگیرد و خود اطلاعات را برروی هاست شما آپلود میکند تا بتوانید آنها را با دوستان، خانواد و دیگران به اشتراک بگذارید.
واردکردن اطلاعات قبلی - اگر قبلا اطلاعات خود را در برنامه هایی مثل اکسل وارد کرده اید نگران نباشید، احتیاجی به وارد کردن دوباره ی آنها نیست، لیبرا این قابلیت را دارد که اطلاعات شما را از برنامه هایی مثل مایکروسافت اکسل بخواند
اول ازهمه در مورد سطح انتظار و توقعات شما در مورد دقت، کاهش خطاي و ميزان دقت تبديل برنامه هاي OCR باید گفت که هنوزهيچ برنامه OCR فارسي وجود نداره كه کارکتر های فارسی رو 100 درصد بدون غلط تبدیل کنه (حتی نرم افزار های بسیار گران قیمت ساخت داخل کشور هم هنوز نمی تونن بدون غلط عمل تبدیل رو انجام بدن) اما برنامه های این پکیج تا 90-80 درصد از ده تا فونت مشهور فارسي پشتيباني مي کنند و اگر فايل PDF و يا عكس اسكن شده شما رزولیشن و درجه تفکیک 300 دي پي آي به بالا داشته باشه خروجي قابل قبولي داره و با یک ویرایش دستی کامل میشه که در مقابل هزینه پرینت و تایپ یک عکس یا فایل PDF بسیار مقرون به صرفه تر خواهد بود، همچنین تکنیک هایی به شما یاد داده میشه که رزولیشن عکس اسکن شده یا فایل PDF خوتون رو اول تا 600dpi بالا برده و بعد از نرم افزار ها استفاده کنید.
محتويات پكيج OCRفارسي :
نرم افزار سخر Sakhr نسخه 8
( نرم افزاري مصري و بهترين نرم افزار حال حاضر موجود در OCR و تبديل عکس و فایل PDF به متن فارسي)
نرم افزار ريدآيريس Readiris نسخه 11
(نرم افزار شناخته شده OCR که در نسخه آخر خود زبان های خاورمیانه از جمله زبان فارسی را پشتیبانی می نماید.)
نرم افزار اُمنی پیج Omni Page نسخه 16
(یکی از قدیمی ترین هایِ OCR با قابلیت های ابتکاری جالب)
نرم افزار اَبی ABBYY نسخه 9
(بهترین و کاراترین نرم افزار تبدیل عکس و PDF انگلیسی به متن انگلیسی)
همراه با نرم افزار های آموزش ويدئويي نحوه کار با انواع OCR و تکنيک هاي تبديل انواع PDFعکس فارسي به متن مثل نحوه تبدیل تصاویر با نویز و تیرگی به متن خالص یا نحوه اصلاح نتایج حاصل
و آكروبات رايتر آورجينال 9 و يه سري يوتيليتي و نرم افزار هاي قفل شکن PDF و نرم افزارهاي اسكن و بهينه سازي نتايج حاصل از تبديل عكس به متن فارسي (Document Analayzer)
نرم افزارها تست شده و آخرين نسخه است و همين الان از خيلي هاش مثل نرم افزار سخر دارن در بزرگترين سازمان هاي كشور استفاده مي كنن البته با قيمت يك ميليون و دويست سيصد هزار تومان .
نسخه CD یک نسخه سریع و کوچک حاوی نرن افزار های Readiris pro Corporate Middle East 11 و Omni Page 16 است به همراه آموزش فارسی نحوه نصب و استفاده فقط با قیمت 4000 تومن و
نسخه DVD کلیه برنامه های اشاره شده در نسخه CD رو داره به همراه نرم افزار های Sakhr وABBYY FineReader و کلیه نرم افزار های کمکی و مکمل (که در طی عملیات تبدیل زیاد به کار می رود) فقط با قیمت 8000 تومن.
قصد دلالي و بازاريابي نرم افزار هاي ديگران رو ندارم فقط واسه يکپارچگي و بالابردن راندمان تبديل فایل های اسکن شده و PDF به متن و ارائه یک ابزار برای رها شدن از سردرگمی ها و بی تنیجه ماندن تلاش ها تصمیم گرفتم همه OCR هاي بزرگ رو گردآوري نکم، روشون تست انجام بدم و از روی نتایج حاصله مقایسه انجام بدم و در نهایت نحوه استفاده و روش کار رو تو يه سري فايل آموزشی قرار بدم همين ...
از دوستاني كه اين پك كامل ، جديدو بسيار مفيد و ارزان رو مي خوان خواهش مي كنم كه فقط تو وقت اداري تماس بگيرن
اينم شماره تماس در تهران
09132023815
aminepouya@yahoo.co
البته دستگاه «اسكنر» ميتواند تصويري از آن متن را وارد رايانه كند، تا اينجا بخشي از مشكل ما حل شده است. اما رايانه كه نه عقلي دارد و نه «زبان» ميفهمد، نميتواند حروف و كلمات را از هم تشخيص دهد.
مثلاً اگر از كامپيوتر بخواهيم به ما بگويد كه در متن اسكنشده كلمة «علي» چند بار آمده است، بيآنكه شرمنده شود، ميگويد نميتوانم تشخيص بدهم! در واقع اين «تصوير ديجيتالشده» بايد به «تصوير قابل پردازش» تبديل شود. موضوع اصلي OCR همين است.
OCR سرنام اصطلاحي است كه صورت كامل آن در واژهنامههاي انگليسي به دو صورت آمده است:
1. Optical Character Recognition
2. Optical Character Reader
انواع OCR
در زبانهاي ديگر، به ويژه زبانهايي كه با حروف لاتيني نوشته ميشوند، سالهاست كه از OCR استفاده ميشود. اما در ايران تازه دو سه سالي است كه به فكر استفاده از OCR در زبان فارسي افتادهايم.
و اما OCR چند نوع است: يا تايپي است يا دستنويس. يعني يا بايد يك متن قبلاً تايپ شده را (مثل كتابها و روزنامههاي چندين سال قبل، يا حتي متني را كه فايل تايپي آن موجود نيست و فقط پرينت آن را داريم) وارد رايانه كنيم، يا متن دستنويس را.
متنهاي دستنويس هم به دو صورت «گسسته» و «پيوسته» وجود دارند: متن «دستنويس پيوسته» مثل همان چيزهايي است كه ما هرازگاهي كه دلمان تنگ ميشود روي كاغذ مينويسيم، يا يك نامه، يا يك قطعه شعر و ... اما متن «دستنويس گسسته» همان نوشتههايي است كه حروف آن جدا از هم و به صورت گسسته نوشته شدهاند، مثل نام و نامخانوادگي كه در فرمهاي آزمون ثبتنام، به صورت هر حرف داخل يك كادر، نوشته ميشوند.
طراحي OCR گسستة فارسي تقريباً در مراحل پاياني كار قرار دارد ولي، OCR پيوسته ظاهراً سالهاي زيادي كار ميبرد.
فارسي ما و مشكلات آن
قبل از اينكه به مراحل ديگر OCR بپردازيم، لازم است اندكي هم به مشكلات خط فارسي ــ يا در واقع ويژگيهاي اين خط ــ بپردازيم. اول اينكه ما در فارسي حروف را به صورت چسبيده و پيوسته مينويسيم و اين كار براي تشخيص حرف به حرف نوشته از سوي رايانه (كه قرار است در مراحل بعدي آن را تايپ كند) بسيار مشكل است. تصور كنيد كه همين كلمه ساده «است» را به حالتهاي مختلف ميشود نوشت: يكي براي «س» دندانه ميگذارد، يكي نميگذارد، يكي آن را ميكشد و يكي نميكشد و... حالا اگر همين صورتهاي مختلف «س» به «ت» هم بچسبند، تشخيص حروف براي ما انسانها هم سخت ميشود، چه رسد به رايانه.
شباهت حروف
مشكل ديگر خط ما اين است كه حرفهاي فارسي بسيار به هم شبيهاند. مثلاً در نظر بگيريد كه تفاوت «ر» با «ز» با «ذ» يا «ب» با «ت» تنها در يك نقطه است، و چون نقطه جزء بسيار كوچكي است، اگر يك خط يا حتي يك لك كوچك روي كاغذ بيفتد، تشخيص حروف از هم بسيار دشوار ميشود و دردسر جدي براي بازشناسي حروف توسط رايانه ايجاد ميكند. اينها تازه مشكلات خط فارسي است. دربارة اعداد فارسي هم اين مشكل وجود دارد: صفر ما يك نقطه كوچك است كه ميتواند رايانه را به اشتباه بيندازد؛ اعداد 4، 3، 2، 1 هم بسيار به هم شبيه هستند و تنها تفاوتشان يك دندانه كوچك است.
به دلايل گفته شده OCR درمرحلة كنوني در كشور ما مربوط به «دستنويسهاي گسسته» يا متنهاي تايپي پيوسته است، و تا بازشناسي متنهاي دستنويس پيوسته توسط كامپيوتر راه زيادي در پيش است، چون در دستنويسهاي گسسته، اگرچه حروف به هم شباهت دارند، حداقل جداجدا نوشته شدهاند. در متنهاي پيوسته تايپي هم مشكل كشيده شدن يك حرف يا شكسته نوشته شدن حروف را نداريم.
البته به گفته مسئولان شركت «پايا» در حال حاضر هم نرمافزارهايي وجود دارد كه متن دستنويس پيوسته را تبديل به حروف جدا ازهم و گسسته ميكنند، ولي ضريب خطاي اين نرمافزارها زياد است و به شكل صنعتي درنيامدهاند.
بازشناسي حروف و الگو
تا اينجا گفتيم تصوير صفحهاي كه در آن حروف به طور جداجدا (هر حرف داخل يك كادر) نوشته شده است، به وسيلة اسكن وارد رايانه ميشود. مرحلة بعدي اين است كه حروف بازشناسي شوند، يعني مكان آنها از ديگر خطوط (مثل خطوط كادري كه داخل آن نوشته شده) بازشناسي شود، و اگر متن پيوسته تايپي است، حروف جدا شوند و زوايد تصوير حذف شود. مثلاً اگر دانشآموزي «س» را به گونهاي نوشت كه بيرون از كادر بود، به رايانه بفهمانيم كه بيدقتي شده است او بايد همان حرف داخل كادر را بخواند.
در مرحلة بعدي كه «بازشناسي الگو» نام دارد، با تعدادي شرط ميشود فهميد كه مثلاً حرفي «الف» است يا نه، و رايانه تشخيص ميدهد كه حرف «پ» است يا «ب». براي اين تشخيص لازم است كه تصوير حرف «الف» با الفهاي نمونه ــ كه قبلاً به رايانه داده شده است ــ منطبق شود. الفباي نمونه قبلاً از روي يك مجموعه بزرگ آموزشي تهيه شده و ويژگيهاي مشترك از آن استخراج شده است. اما از آنجا كه تنوع صورتها نوشتاري يك حرف به صورت دستنويس بسيار زياد است، مدلي آماري استخراج ميشود كه در آن شباهت ويژگيهاي استخراج شدة قبلي با نمونه ورودي به رايانه بررسي ميشود. در اينجا «بازشناسي الگو» با روشهاي آماري انجام ميشود كه روش معمول در سيستمهاي OCR است.
اگر فكر ميكنيد كه كار تمام شده است در اشتباهيد، چون تازه ميرسيم به دنبالة حروف. مثلاً اگر كسي همان حرف «س» را با دنباله بنويسد، رايانه بايد تشخيص دهد كه اين حرف فقط «س» است، يا مثلاً «ي» هم به آن چسبيده است.
مدلسازي يا پردازش زباني
مرحله بعدي «مدلسازي زباني» يا «پردازش زباني» نام دارد. حروف به هم چسبيده، كه كلمه را درست ميكنند، بايد معنيدار يا شناختهشده باشند. در اين مرحله بررسي ميشود كه چه كلماتي در زبان وجود دارد؟ چه تركيبهايي از كلمات مجاز است؟ و... البته در مراحل پيشرفتهتر، مدلسازي گرامري (دستور زبان) و مدلسازي معنايي هم وجود دارد كه تشخيص ميدهد جمله از لحاظ دستوري و معنايي درست است يا بيمفهوم است. اما در OCR گسسته ــ كه بيشتر براي ثبتنام استفاده شده ــ شباهت يك كلمه به نام، نام خانوادگي، شهر و ... كافي است.
براي تشخيص تركيبهاي مجاز يك كلمه يا معنيدار بودن يك كلمه نيز به تهية بانكهاي اطلاعاتي (Data base) نياز داريم. در اين بانكها مثلاً تمام نامهاي كوچك و بزرگ ايرانيان قبلاً جمعآوري شده است و هنگام تطبيق يك كلمه با آن مشخص ميشود كه رايانه حروف آن را دست تشخيص داده يا نه. بنابراين نقش اين بانك اطلاعاتي بسيار مهم است، چون اگر نامي در آن ثبت نشده باشد، كلمهاي كه آن نام را شامل شود، به طور خودكار از برنامه OCR حذف ميشود يا پيغام ميآيد كه: «اين كلمه اشتباه است» در صورتي كه ممكن است مثلاً نام «هشام» در بين نامهاي ايراني وجود داشته باشد، ولي قبلاً در بانك اطلاعاتي ثبت نشده باشد.
بانكهاي ما و ديگران
مهندس «رزازي» دربارة مشكل بانكهاي اطلاعاتي در زبان فارسي ميگويد: «در دنيا براي توسعة OCR و ارزيابي آن، بانكهاي اطلاعاتي استاندارد ساخته شده است كه در آنها همة كلمات وجود دارند، يعني بانك هم مشكل ديجيتال كلمه را دارد، و هم تصويرش را. اما براي زبان فارسي، اين بانكهاي اطلاعاتي چه براي ارزيابي و چه براي توسعه، استاندارد شده نيست. در واقع هر كسي براي خودش يك بانك اطلاعاتي ميسازد، و اين نمونههاي متفاوت مشكلاتي را ايجاد ميكند. مثلاً براي ثبتنام دانشآموزاني كه در آزمون مدارس تيزهوشان شركت كرده بودند، يك بانك اطلاعاتي حاوي نامهاي فارسي، از روي اطلاعات فرمهاي سالهاي قبل، تهيه شد كه از روي آن كلماتي كه خيلي شبيه به نامهاي فارسي بودند تشخيص داده ميشد. مثلاً اگر رايانه كلمهاي را «مصيبت» تشخيص داد، براساس بانك اطلاعاتي معلوم ميشود كه «مصيب» بوده است كه يك نام ايراني است.
علي، ولي، قلي ... و سيب
نكتة ديگر اين است كه يك بانك اطلاعاتي بايد شامل تعدادي كلمات خام باشد، بلكه «بسامد» آن واژگان، يعني ميزان استعمال و تكرار كلمات در زبان و مشخصات آماري آنها هم بايد ثبت شده باشد، والا كارايي زيادي ندارد. مثلاً «علي» نامي است كه شباهت زيادي به «ولي» و «قلي» دارد. كارهاي آماري در بانك اطلاعاتي بايد طوري انجام شده باشد كه تعداد «علي» بيشتر باشد، تا و بعد نوبت «ولي» و «قلي» برسد، چون درصد بسامدي «علي» به لحاظ آماري و كاربرد در ميان نامهاي بيشتر است.
در OCR فارسي گسسته، اگر فقط مربوط به نامها و نامخانوادگي باشد، كار سادهتر است از حالتي كه در OCR پيوسته وجود دارد. چون در OCR پيوسته هر كلمهاي ممكن است وجود داشته باشد مثل «سيب»، اما در بانك اطلاعاتي نامها همه ميدانيم كه سيب نام يك شخص نيست بلكه نام يك ميوه است! بنابراين در OCR همواره سعي ميشود كه درصد خطا كاهش يابد، تا كلمات در حد ممكن درست تشخيص داده شوند. اگرچه طراحان هنوز به صددرصد صحت نرسيدهاند، ولي نگران نتايج آزمون خود نباشيد، چون تمامي اطلاعات مربوط به شما چندين بار كنترل ميشوند و از سازوكار reject (يا مردودي) در رايانه هم استفاده ميشود. در اين روش اگر رايانه نتوانست كلمهاي را تشخيص دهد، ميفهمد كه نفهميده است و در خروجياش ميآورد كه: «من اين كلمه را نفهميدهام» و كار به سيستم دستي ميرود و در آنجا تصحيح ميشود. اين فرايند در پست خيلي كارايي دارد. در هر جاي دنيا كه تفكيك نامهها و ديگر مرسولات پستي به وسيلة OCR انجام ميشود، بعضي از نامهها در سيستم كامپيوتري وارد سازوكار «مردودي» ميشوند و به طور دستي مورد بررسي مجدد قرار ميگيرند. هماكنون در سطح محدودي از OCR در پست كشور ما نيز استفاده ميشود، چون در پست هم كد پستي چندرقمي و ديگر اطلاعات به صورت گسسته و داخل كادرهايي نوشته ميشود، و كار آسانتر است.
در مورد خطاي OCR در تشخيص كلمات، مسئولان شركت «پايا» نظر جالبي دارند:
«حتي با تعبية سيستم مردودي (reject) هم ممكن است خطايي در تشخيص كلمات وجود داشته باشد. بايد در نظر داشته باشيم كه هيچ سيستم پردازشگري (از جمله انسان) بدون خطا نيست. نكته مهم اين است كه يك سيستم ماشيني درصد خطاي كمتري نسبت به انسان داشته باشد تا جايگزين خوبي براي انسان باشد. مسئله اين نيست كه خطا را به صفر برسانيم. هر قدر كه فناوري جلوتر ميرود، ميزان خطا هم بيشتر كاهش مييابد.»
مدير شركت «دوران نوين» هم به گونهاي ديگر به همين موضوع اشاره ميكند: «انتظار ما از مسئولان طرح «تكفا» آن است كه با موضوع OCR واقعبينانهتر برخورد شود، و در بحث مربوط به هزينههاي پروژه و انتظاراتي كه از OCR ميرود، واقعيتها در نظر گرفته شود. ديدگاه كنوني مسئولان تكفا آن است كه كل مشكل «خطا» تا 100درصد حل شود، در حالي كه فكر ميكنم حل مسائل مربوط به هوش مصنوعي نياز به روش تدريجي دارد. مثلاً در زبان عربي هم، نرمافزار «صخر» در نسخة اول خود فقط تا حدود 40درصد دقت داشت، در حالي كه اكنون پس از گذشت 13 سال از اولين نسخه آن دقت به مرز 98 درصد رسيده است.»
همانطور كه اشاره شد از OCR در ثبتنام آزمون «سازمان ملي استعدادهاي درخشان» در سالهاي 81 و 82 استفاده شد كه از طريق آن 000,440 نفر به طور ماشيني ثبتنام شدند. اين روش باعث شد كه در سال 81 (نمونه اول) 45 درصد در هزينهها و 25 درصد در زمان ثبتنام صرفهجويي شود. در سال بعد (82) اين رقم به 50 درصد رسيد. نرمافزاري كه در اين آزمونها مورد استفاده قرار گرفت براي هر كدام از موارد صحت بازشناسي متفاوتي داشت و در مجموع كار آن خوب بود (به جدول توجه كنيد):
به نظر ميآيد كه در چند سال آينده و با پيشرفت OCR فارسي و كاهش هر چه بيشتر خطاي آن، در آزمونهاي بزرگتري مانند آزمون سراسري دانشگاهها نيز بتوان از آن استفاده كرد.
سرنوشت OCR دستنويس
در مورد OCR پيوسته دستنويس نيز روند كار به همان صورتي است كه شرح داديم، اما آنچه كار را دشوارتر ميكند، قطعهبندي و جداجدا كردن حروف به هم چسبيده و تشخيص آنهاست. اگر اين روند طي شود، اين اميد وجود دارد كه روزي از OCR پيوسته دستنويس فارسي هم در سطح گستردهاي استفاده شود. البته OCR پيوسته دستنويس حتي در زبان انگليسي هم هنوز به كاربرد وسيع و عملي نرسيده است. مهندس «رزازي» دراين مورد ميگويد: « OCRانگليسي در سيستم عامل windows وجود دارد كه همراه با office فروخته ميشود، ولي فكر نكنيد كه نامههاي اداري انگليسي كه با دستنويس نوشته شدهاند همه با OCR تايپ ميشوند. اين كار براي به نتيجه رسيدن به حداقل يك روند 10 ساله را بايد طي كند. OCR فارسي يك مرحله عقبتر است، پس زمان بيشتري ميبرد.»
مهندس «صديق»، مديرعامل شركت «پايا» هم ميگويد: «همين OCR فارسي گسسته هم تا چند سال پيش يك رؤيا بود، ولي ديديم كه محقق شده است و به مرور پيشرفتهتر هم خواهد شد. بنابراين طراحي OCR پيوسته فارسي هم، اگرچه سالها طول ميكشد، ولي مطمئناً به نتيجه خواهد رسيد. اين طرح يك طرح تحقيقاتي است كه در دانشگاهها دنبال ميشود و هنوز به يك محصول صنعتي قابل استفاده در سطح كلان و كاربردي براي عموم نرسيده است. ولي در حال حاضر نمونههاي دانشگاهي و آزمايشگاهي آن در داخل كشور وجود دارد و موضوع رساله دكتري برخي از دانشجويان است.»
بنابراين بين 10 تا 20 سال آينده، آنگونه كه مسئولان شركت «پايا» ميگويند، OCR پيوسته دستنويس فارسي هم وارد بازار خواهد شد.
دكتر فيلي هم در پاسخ به اين سؤال كه «آيا طراحي OCR پيوستة فارسي روزي تحقق خواهد يافت؟» پاسخ ميدهد: «بله ولي به تدريج.»
به هر حال براساس قرارداد «تكفا» با شركتهاي ايراني، تا كمتر از يك ماه ديگر، نسخهنهايي (البته نه صددرصد تكميلشده) OCR فارسي دستنويس گسسته و تايپي پيوسته ارائه خواهد شد. مدير شركت «دوران نوين» در اين مورد ميگويد: «پروژة OCR گسسته در مراحل پاياني خود قرار دارد ولي داراي مشكلاتي در تشخيص انواع اسكنرها و انواع فونتهاست كه در حال رفع آن هستيم. اين نرمافزار در حال حاضر امكان تشخيص فونتهاي تايپي فارسي با دقت زياد را دارد، ولي مشكل جدي آن است كه با اسكنرهاي مختلف نتايج نامناسبي ميدهد.» وي از اهميت اين طرح در بعد كلان ملي هم ميگويد: «با توجه به اين كه مشكل OCR براي بسياري از زبانهاي دنيا مانند انگليسي عملاً حل شده است، اگر در كشور ما هم به نتيجة نهايي برسد در افزايش سطح اطلاعات فارسي در دنياي ديجيتالي امروز (از جمله در اينترنت) بسيار اهميت خواهد داشت.
منبع: iranwsis.org
آموزش فارسی و تصویری طریقه شبکه کردن دو یا چند رایانه
نوع زبان: فارسی
حجم: 359 کیلوبایت
نوع فایل: رایگان
پیش نیاز: Adobe Reader and winrar
ادامه مطلب
JSN ImageShow free version
ماژول اسلاید شو رایگان
نسخه: 1.0.6
نوع زبان: انگلیسی
توضیحات مختصر: این ماژول برای نمایش تصاویر به صورت اسلاید در جوملا و مامبو می باشد
حجم: 563 کیلوبایت
زبان برنامه نویسی: php
براي دانلود به ادامه مطلب مراجعه نماييد .
ادامه مطلب
Upload center farsi
اسکریپت فضای رایگان فارسی
نسخه: 1
نوع زبان: فارسی
توضیحات مختصر: این اسکریپت مثل سیستم سایت پرشین گیگ عمل میکنه! و برای ایجاد یک آپلود سنتر می باشد
حجم: 97 کیلوبایت
زبان برنامه نویسی: php
براي دانلود به ادامه مطلب مراجعه نماييد .
ادامه مطلب
پارتیش بندی با نرم افزار رایگان EASEUS Partition Manager
نسخه: 2.0.1
نوع زبان: انگلیسی
حجم: 8 مگابایت
ادامه مطلب
آشنایی با اکسس
توضیحات مختصر: کتاب الکترونیکی آموزش مقدماتی access
حجم: 183 کیلوبایت
براي دانلود به ادامه مطلب مراجعه نماييد .
ادامه مطلب
نوع زبان: فارسی
حجم: 548 کیلوبایت
لینک کمکی دانلود
تصویر ی از محیط فایل
نوع فایل: رایگان
پیش نیاز: Adobe Reader

ادامه مطلب
گامپوننت بهينه ساز ي آدرس هاي مامبو و جوملا
نسخه: 1.3.4
نوع زبان: فارسی
توضیحات مختصر: اين کامپوننت آدر سهاي سيستم هاي چون مامبو ،جوملا ، ميترا به شکل html بهينه مي کندد
حجم: 421 کیلوبایت
زبان برنامه نویسی: php
براي دانلود به ادامه مطلب مراجعه نماييد .
ادامه مطلب
جوملا فارسی تیم جومفا
نسخه: 1.5.8
نوع زبان: فارسی
توضیحات مختصر: جوملا Wohnaiki یک نسخه کامل از سری 1.5 می باشد
حجم: 4.4 مگابایت
زبان برنامه نویسی: ph
ادامه مطلب
نوع زبان: فارسی
توضیحات مختصر: آموزش کامل C# 2005 ترجمه مهندس هاشمیان
حجم: 9.8 مگابایت
براي دانلود به ادامه مطلب مراجعه نماييد .
ادامه مطلب
