Elektroda.pl
Elektroda.pl
X

Wyszukiwarki naszych partnerów

Wyszukaj w ofercie 200 tys. produktów TME
Europejski lider sprzedaży techniki i elektroniki.
Proszę, dodaj wyjątek elektroda.pl do Adblock.
Dzięki temu, że oglądasz reklamy, wspierasz portal i użytkowników.

Przekonwertowanie zeskanowanego pdf'a na doc lub txt

and_rog 15 Lis 2017 01:02 150 5
  • #1 15 Lis 2017 01:02
    and_rog
    Poziom 20  

    Znacie sposób na przekonwertowanie w bezpłatny sposób zeskanowanego pdf'a na jakikolwiek plik tekstowy, aby można go było poformatować, i wydrukować? Plik źródłowy ma 188 stron, i jakość skanowania nie oszałamia.

  • #2 15 Lis 2017 01:44
    D214d3k
    Poziom 38  

    Poszukaj kawiarenki, biblioteki lub GCI gdzie mają wykupioną licencję na ABBYY FineReader.

  • #3 15 Lis 2017 02:29
    dt1
    Moderator - Komputery Serwis

    and_rog napisał:
    jakość skanowania nie oszałamia.

    Licz się z bardzo dużą ilością błędów i koniecznością wprowadzania ręcznie poprawek w takim przypadku.

  • #4 15 Lis 2017 18:53
    Christophorus
    Poziom 40  

    Istnieją również darmowe programy do rozpoznawania tekstu. Jeśli nadal posiadasz ten plik PDF to może łatwiej było by wyeksportować jego strony do postaci plików graficznych, np. *.jpg i z tych plików przeprowadzić rozpoznawanie tekstu. Odpada wówczas drukowanie i skanowanie choć widzę, że zostało ono już wykonane.

    Są też programy, które umożliwiają wyodrębnienie teksu i grafiki z pliku PDF, ale nie w każdym przypadku jest to możliwe.

    Z darmowych programów do OCR mogę zasugerować FreeOCR.net 5.4.1, który podobno potrafi "wyciągnąć" tekst z plików PDF, które się nie dają edytować. Jak się to sprawdza w praktyce nie miałem okazji sprawdzenia.

  • #5 15 Lis 2017 22:28
    and_rog
    Poziom 20  

    Przekonwertowałem pdf'a na pliki bmp, każda strona to jeden plik. Każdy plik osobno zmieniałem na tekst, i po konwersji wklejałem tą stronę do edytora tekstu i poprawiałem błędy. Wytrzymałem 10 stron, potem wymiękłem. Tak się nie da, szukam innego sposobu. Freeocr, ze względu na kiepską jakość skanów, nie daje rady - dużo błędów.

  • #6 15 Lis 2017 22:48
    Christophorus
    Poziom 40  

    Jeżeli jakość zeskanowanego pliku jest kiepska to nawet komercyjny program sobie nie poradzi z pełni poprawnym rozpoznaniem tekstu.

    Znalazłem w internecie informację o pełnej wersji FineReadera 12 z ograniczeniem czasu działania do 365 dni.

    Cytat:
    A poza tym promocja na ABBYY FineReader 12 za free wciąż jest aktywna http://www.openbolshoi.ru
    Opis rejestracji jak poprzednio http://pastebin.com/raw/a5tahsmi z małymi zmianami. Nazwę użytkownika i miasta trzeba wpisać cyrylicą. Po drugie, po akceptacji formularza rejestracyjnego trzeba sprawdzić e-maila i zalogować się na stronie.

 Szukaj w ofercie
Zamknij 
Wyszukaj w ofercie 200 tys. produktów TME