ഒപ്റ്റിക്കൽ പ്രതീക തിരിച്ചറിയൽ (OCR) എന്താണ്?

അച്ചടി, ടൈപ്പ്, കൈകൊണ്ടുള്ള രേഖയുടെ ഡിജിറ്റൽ പതിപ്പ് ഉണ്ടാക്കുന്ന ഒപ്ടിക്കൽ ക്യാരക്ടര് റെക്കഗ്നിഷന് (ഒ സി സി) സോഫ്റ്റ്വെയറുകളെ സ്വമേധയാ ടൈപ്പുചെയ്യുന്നതിനോ ടൈപ്പുചെയ്യുന്നതിനോ ആവശ്യമില്ലാതെ കമ്പ്യൂട്ടറുകൾ വായിക്കാൻ കഴിയും. PDF ഫോർമാറ്റിൽ സ്കാൻ ചെയ്ത പ്രമാണങ്ങളിൽ സാധാരണയായി OCR ഉപയോഗിക്കുന്നു, എന്നാൽ ഒരു ഇമേജ് ഫയലിൽ ഒരു കമ്പ്യൂട്ടർ വായന ചെയ്യാവുന്ന പാഠം സൃഷ്ടിക്കാൻ കഴിയും.

എന്താണ് OCR?

OCR, ടെക്സ്റ്റ് റെക്കഗ്നിഷൻ എന്നും അറിയപ്പെടുന്നു, അച്ചടിച്ചതോ അല്ലെങ്കിൽ രേഖാമൂലമുള്ളതോ ആയ പ്രമാണങ്ങളിൽ നിന്ന് അക്കങ്ങൾ, അക്ഷരങ്ങൾ, ചിഹ്നനങ്ങൾ (ഗ്ലിഫുകൾ എന്നും അറിയപ്പെടുന്നു) തുടങ്ങിയ പ്രതീകങ്ങൾ രൂപകൽപ്പന ചെയ്യുന്ന സോഫ്റ്റ്വെയർ സാങ്കേതികവിദ്യയാണ് കമ്പ്യൂട്ടറുകൾക്കും മറ്റ് സോഫ്റ്റ്വെയർ പ്രോഗ്രാമുകൾക്കും കൂടുതൽ എളുപ്പം തിരിച്ചറിയാവുന്നതും വായിക്കുന്നതും. ചില ഓസിആർ പ്രോഗ്രാമുകൾ ഒരു ഡോക്യുമെന്റിൽ സ്കാൻ ചെയ്യുകയോ ഡിജിറ്റൽ ക്യാമറ ഉപയോഗിച്ച് ഫോട്ടോ എടുക്കുകയോ ചെയ്യുന്നു, മറ്റുള്ളവർക്ക് ഈ പ്രോസസ്സ് മുൻപ് സ്കാൻ ചെയ്തതോ OCR കൂടാതെ ഫോട്ടോഗ്രാഫർ ചെയ്തതോ ആയ പ്രമാണങ്ങളിലേക്ക് പ്രയോഗിക്കാവുന്നതാണ്. ഉപയോക്താക്കൾക്ക് PDF പ്രമാണങ്ങളിൽ തിരയാനും ടെക്സ്റ്റ് എഡിറ്റുചെയ്യാനും വീണ്ടും ഫോർമാറ്റ് ചെയ്യാനും OCR അനുവദിക്കുന്നു.

OCR എന്താണ് ഉപയോഗിക്കുന്നത്?

വേഗത്തിൽ, എല്ലാ ദിവസവും സ്കാനിംഗ് ആവശ്യങ്ങൾ, OCR ഒരു വലിയ ഇടപെടലായിരിക്കില്ല. നിങ്ങൾ ഒരു വലിയ സ്കാനിംഗ് നടത്തുന്നുണ്ടെങ്കിൽ, നിങ്ങൾക്ക് ആവശ്യമുള്ള കൃത്യത അറിയാൻ PDF- കളിൽ തിരയാൻ കഴിയുമെങ്കിൽ അൽപ്പ സമയം ലാഭിക്കുകയും നിങ്ങളുടെ സ്കാനർ പ്രോഗ്രാമിലെ OCR പ്രവർത്തനക്ഷമതയെ കൂടുതൽ പ്രധാനപ്പെട്ടതാക്കുകയും ചെയ്യും. OCR സഹായിക്കുന്നു മറ്റ് ചില കാര്യങ്ങൾ ഇതാ:

എന്തുകൊണ്ട് OCR ഉപയോഗിക്കണം?

എന്തുകൊണ്ടാണ് ഒരു ചിത്രമെടുക്കുക, ശരിയല്ലേ? നിങ്ങൾ ഒരു ചിത്രം ആയിരിക്കുമെന്നതിനാൽ നിങ്ങൾക്ക് ഒന്നും എഡിറ്റുചെയ്യാനോ ടെക്സ്റ്റിൽ തിരയാനാകാനോ കഴിയില്ല. പ്രമാണം സ്കാൻ ചെയ്ത് ഓസിആർ സോഫ്റ്റ്വെയർ പ്രവർത്തിപ്പിക്കുന്നതിലൂടെ നിങ്ങൾക്ക് ആ ഫയൽ എഡിറ്റുചെയ്യാനും തിരയാനാവും.

OCR യുടെ ചരിത്രം

ടെക്സ്റ്റ് റെക്കോർഡ് ഏറ്റവും ആദ്യകാല ഉപയോഗം 1914 ൽ ആയിരുന്നെങ്കിലും, 1950 കളിൽ ഓസിആർ-ബന്ധപ്പെട്ട സാങ്കേതികവിദ്യകളുടെ വൈവിധ്യമാർന്ന വികസനവും ഉപയോഗവും തുടങ്ങി, പ്രത്യേകിച്ച് ലളിതമായി രൂപകൽപ്പന ചെയ്ത ഫോണ്ടുകൾ സൃഷ്ടിച്ച് ഡിജിറ്റൽ വായിക്കാവുന്ന പാഠത്തിലേക്ക് എളുപ്പം മാറ്റി. ലളിതവൽക്കരിച്ച ഫോണ്ടുകളിൽ ആദ്യത്തേത് ഡേവിഡ് ഷെപാർഡാണ് സൃഷ്ടിച്ചത്, കൂടാതെ സാധാരണ OCR-7B എന്ന് അറിയപ്പെടുന്നു. ക്രെഡിറ്റ് കാർഡിലും ഡെബിറ്റ് കാർഡിലുമൊക്കെ ഉപയോഗിച്ചിരുന്ന സ്റ്റാൻഡേർഡ് ഫോണ്ടിനായി OCR-7B ഇപ്പോഴും സാമ്പത്തിക വ്യവസായത്തിൽ ഉപയോഗിക്കുന്നു. 1960 കളിൽ, പല രാജ്യങ്ങളിലെയും തപാൽ സേവനങ്ങൾ OCR സാങ്കേതികവിദ്യ ഉപയോഗിച്ച് യുഎസ്, ബ്രിട്ടൻ, കാനഡ, ജർമ്മനി മുതലായ മെയിൽ അടുക്കൽ കൂടുതൽ വേഗത വർദ്ധിപ്പിക്കാൻ തുടങ്ങി. ലോകമെമ്പാടുമുള്ള പോസ്റ്റൽ സേവനങ്ങൾക്കായി മെയിൽ അടുക്കാൻ ഉപയോഗിക്കുന്ന പ്രധാന സാങ്കേതികവിദ്യ ഇപ്പോഴും OCR ആണ്. 2000-ൽ OCR ടെക്നോളജിയുടെ പരിധികളും കഴിവുകളും സംബന്ധിച്ച പ്രധാന പരിജ്ഞാനം ബാറ്റുകളും സ്പാമർമാരെയും തടയുന്നതിനായി ഉപയോഗിക്കുന്ന CAPTCHA പ്രോഗ്രാമുകൾ വികസിപ്പിച്ചെടുത്തു.

ദശാബ്ദങ്ങളിൽ, കൃത്രിമ ബുദ്ധി , മെറ്റീരിയൽ പഠനം , കമ്പ്യൂട്ടർ ദർശനം തുടങ്ങിയ സാങ്കേതിക വിദ്യകളിലെ പുരോഗമനത്തിനായുള്ള OCR കൂടുതൽ കൃത്യതയാർന്നതും കൂടുതൽ സങ്കീർണ്ണവുമായവയാണ്. ഇന്ന്, OCR സോഫ്റ്റ്വെയർ മുമ്പത്തേക്കാളും വേഗത്തിലും കൃത്യമായും കൃത്യതയോടെ രൂപാന്തരപ്പെടുത്തുന്നതിന് പാറ്റേൺ തിരിച്ചറിയൽ, ഫീച്ചർ ഡിറ്റക്ഷൻ, ടെക്സ്റ്റ് മൈനിംഗ് എന്നിവ ഉപയോഗിക്കുന്നു.