Koncept v definici ABC
Různé / / July 04, 2021
Francisco Cano, v květnu. 2014
Vidíme, že nejen skener dokáže rozpoznat písmena a typ.
The OCR nebo optické rozpoznávání znaků, přeložená do španělštiny, je technologie, která si klade za cíl napodobit lidské oko, tato technologie se snaží dosáhnout toho, aby postavy a typ písmo (písmo) z čeho je dokument vyroben. Mluvíme o běžném skeneru a docela výkonném softwaru. Když mluvíme o výkonném softwaru, máme na mysli velký a široký databáze být schopen rozpoznat různá písmena a jejich odpovídající typy.
Kromě softwaru je důležitý i skener. Od té doby bude velmi citlivý skener lépe číst pixely dokumentu citlivost umožní to softwaru dělat méně chyb. Pro software je to docela obtížné ne mýlit se. Jakýkoli dokument se vloží do skeneru a vyjde dovnitř Formát Word nebo ve formátu, který vám program umožní vybrat. Poté musíte dokument opravit. Po opravě jej můžeme uložit do formátu PDF ke sdílení nebo archivaci.
Jedním z velkých využití OCR je skenování knih. Například sbírka národní knihovny. Stejně tak slavná e.book, kterou lze číst všude na tabletech typu ipad a android a ve čtečkách ebook.
Příklad skenování knihy.
Technologie OCR má omezení. U starých textů nebo u některých to nefunguje důvod utrpěli fyzické poškození. Toto zhoršení je velmi normální, pokud jde o historické dokumenty, které mohou být staré až tisíc let. Tyto typy dokumentů, u nichž si roky vybraly svou daň, jsou pro dotyčnou technologii OCR zcela nerozpoznatelné. Tyto typy dokumentů se obvykle archivují se skenováním ve vysokém rozlišení v Fotografování aby veřejnost mohla obdivovat všechny podrobnosti dokumentu, aniž by jej zhoršila.
Rozlišení v OCR nám říká, kolik detailů sám systém detekuje. U jasných a definovaných textů je normální použít 300 dpi (bodů na palec). Toto se konfiguruje ze skeneru. Jeden palec se rovná 25 400 milimetrů, takže na tak malou plochu stačí 300 pixelů. V případě novin nebo podobně. kde je tisk malý a papír je vždy trochu otlučený, optimální rozlišení by bylo 600 dpi. Pokud skenujeme s tímto posledním rozlišením, je pro nás lepší mít dobrý skener, protože dokončení běžného skeneru v tomto rozlišení stojí hodně.
The vývoj OCR prochází a bude lepší tohoto systému. Bude lepší který již probíhá v návrh zvané DOPAD. Tento projekt si klade za cíl sdílet informace mezi různými instituce stát a nějaká společnost vyvinout software OCR, který splňuje všechny požadavky na hromadnou digitalizaci.
Témata v OCR