Nowości w serwisieZapoznaj się z naszą ofertąInneO nas - Wczoraj, dziś, jutro...Dane teleadresowe firmy
telefon

+48 0134924090

telefon

+48 0508689250

faks

+48 0616427280

e-mail biuro tłumaczeń

dtp@code-dtp.pl

Marek Pasierbek

Centrum Obsługi Dokumentacji Elektronicznej

CODE oferuje Państwu profesjonalną usługę rozpoznawania tekstu (OCR).OCR konwertowanie PDF do Word Poprzez wykorzystanie profesjonalnych narzędzi jesteśmy w stanie przenieść treść pism, książek, broszur i innych dokumentów z wersji papierowej (analogowej) na cyfrową. Oprócz typowego rozpoznania tekstu oferujemy:

- konwertowanie plików PDF do Word (z zachowaniem układu i grafiki)
- konwertowanie plików graficznych (skanów/zdjęć) zawierających treść do formatu Word
- zaawansowana edycja graficzna plików PDF (podmiana tekstu/tłumaczenie)
- zliczanie ilości znaków w tekście
- przygotowanie materiałów do tłumaczenia dla Biur Tłumaczeń

Ufamy nowoczesnej technologii ale każdy plik zostaje sprawdzony przez osobę, której zadaniem jest wyłapanie ewentualnych pomyłek.


CENNIK USŁUG OCR

Nazwa usługi Jednostka rozliczania Cena netto
OCR dokumentu analogowego (tekst) Strona fizyczna dokumentu 2zł
OCR dokumentu cyfrowego (tekst) (skan/plik PDF) strona 1800 znaków ze spacjami 1zł
OCR dokumentu analogowego (tekst+grafika) Strona fizyczna dokumentu 2-5zł*
OCR dokumentu cyfrowego (tekst+grafika) (skan/plik PDF) strona 1800 znaków ze spacjami 1-5zł*
Przygotowanie plików analogowych i cyfrowych do tłumaczenia (OCR+obróbka grafik+zachowanie formatowania i układu) strona 1800 znaków ze spacjami 2-20zł***
* cena uzależniona jest od układu tekstu i grafiki, złożoności dokumentu itp.
** cena uzależniona jest od skomplikowania i czasochłonności obróbki graficznej

Przy większej ilości tekstu możliwość indywidualnej wyceny i ustalenia dodatkowych warunków współpracy.


OCR (ang. Optical Character Recognition) - zestaw technik lub oprogramowanie służące do rozpoznawania znaków i całych tekstów w pliku graficznym o postaci rastrowej. Zadaniem OCR jest zwykle rozpoznanie tekstu w zeskanowanym dokumencie (np. papierowym formularzu lub stronie książki). Niegdyś termin oznaczał samo rozpoznawanie ciągów znaków, głównie drukowanych, które są łatwiejsze do rozpoznania, dziś również pisma odręcznego oraz cech formatowania, jak krój pisma, stopień pisma, interlinia (techniki służące do tego typu zaawansowanego rozpoznawania nazywane są terminem ICR), a nawet układów tabelarycznych, np. formularzy. Techniki OCR są wykorzystywane m.in. przy digitalizacji zasobów bibliotek, a także jako ułatwienie przy odczytywaniu danych z formularzy wypełnianych pismem odręcznym. W obu przypadkach oprogramowanie OCR nie jest tak skuteczne jak człowiek, zatem w przypadkach wątpliwych (trudności z odczytaniem fragmentu) oraz w celu uniknięcia błędów nieodzowna jest weryfikacja wyniku OCR przez człowieka. Nowoczesną metodą współpracy oprogramowania OCR z ludźmi jest technika reCAPTCHA. Nie wymaga ona zatrudniania osób specjalnie do weryfikacji OCR, lecz wykorzystuje rozproszoną aktywność milionów użytkowników Internetu, którzy wchodząc na strony internetowe zabezpieczone przez CAPTCHA rozpoznają fragmenty tekstu wymagające weryfikacji.