Концепт у дефиницији АБЦ
Мисцелланеа / / July 04, 2021
Францисцо Цано, у мају. 2014
Видимо да није само скенер способан да препозна слова и тип.
Тхе ОЦР или оптичко препознавање знакова, преведено на шпански, је технологија која има за циљ опонашање људског ока. Ова технологија покушава да постигне препознавање пиксела по пиксела ликова и врсте фонт (фонт) од чега је сачињен документ. Говоримо о обичном скенеру и прилично моћном софтверу. Када мислимо на моћан софтвер, мислимо на велики и широк база података да би могли да препознају различита слова и њихове одговарајуће врсте.
Поред софтвера важан је и скенер. Веома осетљив скенер ће од овог боље читати пикселе документа осетљивост омогућиће софтверу да чини мање грешака. Прилично је тешко за софтвер не грешити. Било који документ се стави у скенер и изађе у Формат Ворд или у формату који вам програм омогућава да изаберете. После овога морате исправити документ. Једном исправљен, можемо га ставити у пдф за дељење или архивирање.
Једна од сјајних примена ОЦР-а је скенирање књига. Као на пример, збирка националне библиотеке. Исто тако, чувени е.боок који се свуда може читати на ипад и андроид таблетима и читачима.
ебоок.Пример како се књига скенира.
ОЦР технологија има ограничења. То не функционише ни за древне текстове, ни за неке разлог претрпели физичко погоршање. Ово погоршање је сасвим нормално када су у питању историјски документи који могу бити стари и до хиљаду година. Ове врсте докумената, за које су године учиниле свој данак, прилично су непрепознатљиве по питању ОЦР технологије. Ове врсте докумената се обично архивирају скенирањем високе резолуције у Фотографија тако да се јавност може дивити свим детаљима документа без да га погоршава.
Резолуција у ОЦР-у говори нам колико детаља сам систем открива. За јасне и дефинисане текстове уобичајена ствар је употреба 300 дпи (тачака по инчу). Ово се конфигурише из скенера. Један инч је једнак 25.400 милиметара, па је довољно 300 пиксела за тако малу површину. У случају новина или слично. тамо где је отисак мали, а папир увек помало истрошен, оптимална резолуција би била 600 дпи. Ако скенирамо у овој последњој резолуцији, боље нам је да имамо добар скенер јер заједнички скенер кошта много да доврши радњу у овој резолуцији.
Тхе еволуција ОЦР пролази кроз све боље овог система. Све боље која је већ у току у а промаја под називом ИМПАЦТ. Циљ овог пројекта је размена информација између различитих институције државе и неке компаније да развију ОЦР софтвер који испуњава све захтеве за масовну дигитализацију.
Теме у ОЦР-у