Dè a th 'ann an Aithneachadh Caractaran Optical (OCR)?

Tha Aithneachadh Caractaran Opticeach (OCR) a 'toirt iomradh air bathar-bog a chruthaicheas tionndadh didseatach de sgrìobhainn clò-bhuailte, clò-sgrìobhte, no làmh-sgrìobhaidh a dh'fhaodas coimpiutairean a leughadh gun fheum air teacs a sgrìobhadh no a chur a-steach gu làmh-sgrìobhaidh. Tha OCR air a chleachdadh san fharsaingeachd air sgrìobhainnean air an sguabadh ann an cruth PDF , ach faodaidh e cuideachd tionndadh de theacs a leughadh le coimpiutair ann am faidhle ìomhaigh.

Dè th 'ann an OCR?

Is e OCR, a th 'air an ainmeachadh cuideachd mar aithneachadh teacsa, teicneòlas bathar-bog a tha a' cruth-atharrachadh charactaran leithid àireamhan, litrichean agus puingeachadh (ris an canar glyphs) bho sgrìobhainnean clò-bhuailte no sgrìobhte ann an cruth dealanach a tha nas fhasa aithneachadh agus air a leughadh le coimpiutaran agus prògraman bathar-bog eile. Bidh cuid de phrògraman OCR a 'dèanamh seo mar a tha sgrìobhainn air a sganadh no air a dhealbhadh le camara didseatach agus faodaidh daoine eile am pròiseas seo a chur gu sgrìobhainnean a chaidh a sganadh no a dhealbhadh roimhe gun OCR. Tha OCR a 'toirt cead do luchd-cleachdaidh rannsachadh a dhèanamh taobh a-staigh sgrìobhainnean PDF, deasachadh teacsa agus ath-bhreacadh de sgrìobhainnean.

Dè a th 'ann an OCR air a chleachdadh?

Airson luath, feumaidh gach latha a bhith a 'sganadh, chan fhaod OCR a bhith na chùis mhòr. Ma nì thu mòran sganaidh, is urrainn dhut rannsachadh taobh a-staigh PDFs gus an aon rud a dh 'fheumas tu a lorg, faodaidh e ùine mhòr a shàbhaladh agus nì e obair OCR anns a' phrògram sganadair agad nas cudromaiche. Seo cuid de rudan eile a tha OCR a 'cuideachadh le:

Carson a chleachdas tu OCR?

Carson nach toir thu dealbh dìreach, dìreach? Seach nach b 'urrainn dhut dad a dheasachadh no an teacsa a rannsachadh oir bhiodh e dìreach na dhealbh. Faodaidh sgrùdadh a dhèanamh air an sgrìobhainn agus a 'ruith bathar-bog OCR an tionndadh sin gu rudeigin as urrainn dhut a dheasachadh agus a bhith comasach air rannsachadh.

Eachdraidh OCR

Ged a tha an cleachdadh as tràithe de aithne teacsa a 'dol air ais gu 1914, thòisich an leasachadh farsaing agus an cleachdadh de theicneòlasan co-cheangailte OCR gu dian anns na 1950an, gu sònraichte le cruth clò-bhualadh glè shìmplidh a chruthachadh a bha na b' fhasa a thionndadh gu teacsa a ghabhas leughadh gu digiteach. Chaidh a 'chiad de na cruth-clò sìmplidh sin a chruthachadh le Daibhidh Shepard agus air an robh OCR-7B mar as trice. Tha OCR-7B fhathast ga chleachdadh an-diugh anns a 'ghnìomhachas ionmhasail airson an cruth àbhaisteach a thathar a' cleachdadh air cairtean creideis agus cairtean fiachan. Anns na 1960an, thòisich seirbheisean puist ann an grunn dhùthchannan a 'cleachdadh teicneòlas OCR gus luaths a dhèanamh suas airson post a sgaoileadh, nam measg na Stàitean Aonaichte, Breatainn Mhòr, Canada agus a' Ghearmailt. Is e OCR fhathast am prìomh theicneòlas a chleachdar airson post a shònrachadh airson seirbheisean puist air feadh an t-saoghail. Ann an 2000, chaidh prìomh eòlas air crìochan agus comasan teicneòlas OCR a chleachdadh gus na prògraman CAPTCHA a chleachdadh gus stad a chur air bots agus spammers.

Thairis air na deicheadan, tha OCR air fàs nas mionaidiche agus nas adhartaiche air sgàth adhartasan ann an raointean teicneòlais co-cheangailte leithid eòlas fuadain , ionnsachadh innealan , agus lèirsinn coimpiutaireachd. An-diugh, bidh bathar-bog OCR a 'cleachdadh aithne pàtrain, lorg feartan agus mèinneadh teacsa gus cruth a dhèanamh air sgrìobhainnean nas luaithe agus nas mionaidiche na bha a-riamh roimhe.