Elektroda.pl
Elektroda.pl
X

Search our partners

Find the latest content on electronic components. Datasheets.com
Please add exception to AdBlock for elektroda.pl.
If you watch the ads, you support portal and users.

Poszukuję programu do edycji tekstu w pliku PDF

trade24 31 Aug 2020 16:34 2052 22
  • #1
    trade24
    Level 3  
    Witam, tak jak w temacie szukam płatnego lub free programu do realnej edycji tekstu zapisanego w PDF. Nie interesuje mnie wstawianie obrazków, checkboxów czy linijek a jedynie pragnę zmienić w tekście dla przykładu 123 na 321 itp... Programy typu PDF Escape tego nie mają a za Adobe 9 Pro nie chcę płacić 1200 PLN. Czy jest coś pomiędzy niedrogie lub zupełnie za free?
  • Helpful post
    #2
    bumble
    User under supervision
    Abby Fine Reader rozpoznaje tekst z pdf czy obrazów i można potem edytować.
  • #3
    DiZMar
    Level 43  
    Zupełnie za free konwersja PDF do Word np. tutaj (jest ograniczenie dzienne za free). W Wordzie to robisz co chcesz. Potem z Word do PDF to już w trakcie wydruku wybiera się odpowiednią opcję wydruku do PDF.
    Można różne pliki konwertować w różne strony na tej stronie.
  • #4
    trade24
    Level 3  
    DiZMar wrote:
    Zupełnie za free konwersja PDF do Word np. tutaj (jest ograniczenie dzienne za free). W Wordzie to robisz co chcesz. Potem z Word do PDF to już w trakcie wydruku wybiera się odpowiednią opcję wydruku do PDF.
    Można różne pliki konwertować w różne strony na tej stronie.


    A sprawdzałeś czy może nie ma "krzaków" przy polskich znakach po przekonwertowaniu do .doc?
  • #5
    staś pytalski
    Level 39  
    trade24 wrote:
    DiZMar wrote:
    Zupełnie za free konwersja PDF do Word np. tutaj (jest ograniczenie dzienne za free). W Wordzie to robisz co chcesz. Potem z Word do PDF to już w trakcie wydruku wybiera się odpowiednią opcję wydruku do PDF.
    Można różne pliki konwertować w różne strony na tej stronie.


    A sprawdzałeś czy może nie ma "krzaków" przy polskich znakach po przekonwertowaniu do .doc?


    A co stoi na przeszkodzie, by szanowny autor tematu, sprawdził działanie rozwiązania podanego na tacy?
  • #6
    DiZMar
    Level 43  
    trade24 wrote:
    ...

    A sprawdzałeś czy może nie ma "krzaków" przy polskich znakach po przekonwertowaniu do .doc?

    Jeżeli pdf był tworzony z aplikacji tekstowej (notatnik, Word, Exel...) to "krzaków" nie ma. Jeżeli z wersji graficznej (foto, skan) to potrafią być lub niektóre fragmenty pozostają w wersji graficznej.
    Tutaj dość dobrze rozpoznaje tekst ze skanu lub zdjęcia ale nie ma polskich ogonków i w Wordzie trzeba poprawiać oraz myli niektóre litery z grafiki np. ł z t i kilka innych.
    Można też zapisać skan w Paint. Edytować dowolnie a potem zapisać paint ponownie w pdf. Czasami trzeba pokombinować z czcionką i jej wyrazistością aby nie różniła się od oryginalnej. Taki dziecinny ale skuteczny też sposób.
  • #7
    trade24
    Level 3  
    DiZMar wrote:
    Jeżeli pdf był tworzony z aplikacji tekstowej (notatnik, Word, Exel...) to "krzaków" nie ma.


    Właśnie w tekstowej to by nie było problemu, jednak plik to typowa grafika ze skanera kiedyś stworzona w Wordzie a teraz zeskanowana i przekonwertowana do PDF

    Z Twojego pierwszego linka PDF --- DOC pojawia się na wstępie zapytanie konwertuj do Word albo do Word z OCR. Wiadomo że trzeba z OCR a tu pojawiają się już problemy "zeskanowane strony zostaną przekonwertowane na edytowalne dokumenty. Formatowanie może ulec zmianie...
  • #8
    DiZMar
    Level 43  
    Jeżeli dobra jakość to link z mojego #6 31 Sie 2020 17:31 zrobi za free. Niestety trzeba będzie poprawić przekłamania ok.5% znaków. Może trochę mniej. Tabele przerobi do Worda raczej bez zmian.

    Dodano po 7 [minuty]:

    trade24 wrote:
    [...
    Z Twojego pierwszego linka PDF --- DOC pojawia się na wstępie zapytanie konwertuj do Word albo do Word z OCR. Wiadomo że trzeba z OCR a tu pojawiają się już problemy "zeskanowane strony zostaną przekonwertowane na edytowalne dokumenty. Formatowanie może ulec zmianie...

    Tak to prawda. Dlatego podesłałem drugi link który ma znacznie szerszy wybór kierunków konwersji. Jeżeli masz do przemiany w pdf to wybierasz z pdf niezależnie z czego ten pdf był tworzony.
  • #9
    trade24
    Level 3  
    DiZMar wrote:
    Jeżeli dobra jakość to link z mojego #6 31 Sie 2020 17:31 zrobi za free.


    Jakość dokumentu dobra ale po konwersji na doc ocr wyszło tragicznie. Dzięki jednak za cenne wskazówki. Szukam dalej
  • #10
    bumble
    User under supervision
    jaki duży ten dokument? Wrzuć tu. spróbuje abby fine
  • #11
    REMUR.
    Level 26  
    Z płatnych polecam PDF-XChange Editor, stosunkowo nie drogi. Potrafi nie tylko zmieniać tekst.
  • #13
    trade24
    Level 3  
    bumble wrote:
    jaki duży ten dokument? Wrzuć tu. spróbuje abby fine


    Mam już Abby Fine Reader i poszło pięknie. Uczę się go ale to jest trial tylko na 7 dni...

    Ile płaciłeś za swoją licencję. Są jakieś okrojone tańsze wersje?
  • #15
    ppc
    Level 16  
    LibreOffice Draw pozwala na podstawową edycję PDF.
  • #16
    trade24
    Level 3  
    ppc wrote:
    LibreOffice Draw pozwala na podstawową edycję PDF


    Co rozumiesz przez "podstawową edycję" Wycina tekst z obrazka i zmienia w dokładnie taki sam z tą samą czcionką ale z inną treścią? Czy pozwala jedynie kopiować tekst i wklejać do Worda, oraz wycinać zdjęcia z pdf?
  • #17
    mariuszp19
    Level 34  
    Ja do takich zadań używam PDFEdit.
  • #18
    trade24
    Level 3  
    Ja chyba źle zadałem pytanie z tą edycją PDF. Bo widzę faktycznie że nawet taki PDFedit jest wstanie to zrobić. Problem pojawia się gdy mamy zeskanowany dokument zaimportowany do pliku PDF. Więc pytanie powinno brzmieć: Jak wyedytować zeskanowany dokument (z logiem zdjęciem i różnymi czcionkami), zmienić tekst w tym dokumencie na dokładnie taką samą czcionkę, wygładzić, pozbyć się szarego tła i innych niedoskonałości zeskanowanego dokumentu a potem zrobić z niego plik PDF i wydrukować?
  • #19
    Gelip
    Level 33  
    PDF'u nie powinno się edytować - jest to format stworzony z myślą o prezentacji - tak samo jak nie da się edytować prawdziwej papierowej książki.

    Tekst przygotowujemy w programie do edycji, sprawdzamy czy nie ma błędów, wszystko robimy na tip-top i wtedy eksportujemy jako PDF.

    W Twojej sytuacji gdy masz skan w pliku PDF (zapewne jako zdjęcie) to potrzebujesz przerobić go na format edytowalny a do tego trzeba OCR - jak ktoś wspomniał dobry jest ABBYY Fine Reader. Program nie jest idealny i trzeba po nim często poprawiać - czasami lepiej ręcznie pozaznaczać odpowiednie obszary typu - tekst, tabelka, zdjęcie i dopiero wykonać rozpoznanie OCR.

    Błędy można poprawiać po rozpoznaniu OCR w samym programie Fine Reader albo zapisać wynik pracy jako .doc, poprawić w Wordzie i zapisać jako PDF.

    Wszystko zależy od tego co zawiera wyjściowy dokument PDF - ten Twoj zeskanowany. Bo jak sam tekst to można i do pliku .txt zapisać. Jak ma tabelki i obrazki to lepiej do .doc
  • #20
    trade24
    Level 3  
    Gelip wrote:
    W Twojej sytuacji gdy masz skan w pliku PDF (zapewne jako zdjęcie) to potrzebujesz przerobić go na format edytowalny a do tego trzeba OCR - jak ktoś wspomniał dobry jest ABBYY Fine Reader.


    Ktoś dobrze wspomniał i napiszę więcej, jest to jedyny program, który (prawie) prawidłowo potrafi odczytać zeskanowany tekst i niemal identycznie za pośrednictwem OCR przerobić go na nowo. Jestem świeżo po eksperymentach z tym programem i jak na tą chwile spełnia moja oczekiwania. Niestety Foxit i Ashampoo poległy na wstępie. Dla mnie konwersja do Worda i przerabianie jest nie do przyjęcia ponieważ po konwersji do Worda zmienia się czcionka w wiele innych rzeczy...
  • #21
    Gelip
    Level 33  
    trade24 wrote:
    jest to jedyny program, który (prawie) prawidłowo potrafi odczytać zeskanowany tekst i niemal identycznie za pośrednictwem OCR przerobić go na nowo. Jestem świeżo po eksperymentach z tym programem i jak na tą chwile spełnia moja oczekiwania.

    Tak jak napisałem, program nie jest idealny ale nie znam innego równie dobrego. Poza tym jeśli zależy Ci aby rozpoznany przez OCR dokument wyglądał jak skan to trzeba zapisać jako - jak dobrze pamiętam, PDF/X. Wtedy dokument wygląda jak zdjęcie ale tekst można zaznaczyć i kopiować.
  • #22
    Gelip
    Level 33  
    Przypomniałem sobie co i jak i dokładnie to chodzi o format PDF/A - w programie wybieramy opcję Zapisz jako dokument PDF/A...
    Poszukuję programu do edycji tekstu w pliku PDF

    Tutaj opis formatu PDF/A z pomocy programu:
    Poszukuję programu do edycji tekstu w pliku PDF

    a tutaj na Wiki: możliwe było odtworzenie niezmienionej z czasem struktury dokumentu, tj. kolorystyki, układu graficznego, rozmiarów etc.

    Dodano po 2 [godziny] 30 [minuty]:

    W załączniku przykład w pliku strona.pdf - widzimy oryginał ale możemy skopiować tekst :-) - w przykładzie można skopiować tekst po nagłówku Strony WWW - To z pewnością najczęściej...
  • #23
    Gelip
    Level 33  
    bumble wrote:
    Abby Fine Reader

    DiZMar wrote:
    Zupełnie za free konwersja PDF do Word np. tutaj (jest ograniczenie dzienne za free).

    trade24 wrote:
    Mam już Abby Fine Reader i poszło pięknie. Uczę się go ale to jest trial tylko na 7 dni...

    W pakiecie MS Office 2003 i 2007 jest takie coś co się zwie Microsoft Office Document Imaging (i Scanning). Zawsze myślałem iż to jakiś dodatek, który g...o potrafi. Ostatnio miałem okazję pobawić się tym (wersja Office 2003 Pro PL) i okazuje się iż toto rozpoznaje polski tekst bardzo dobrze. Testowałem rozpoznawanie ze screenshota na którym wyświetlony jest jakiś dokument w PDF lub DJVU (jako zdjęcie, stare czasopismo).
    • otworzyłem PDF w Adobe Reader i powiększyłem wyświetlanie dokumentu tak aby tekst nie był za mały na ekranie
    • zrobiłem screenshota wciskając PrintScr
    • wkleiłem do IrfanView, wykadrowałem to co mnie interesuje i zapisałem w formacie TIF (bez kompresji)
    • teraz wystarczy otworzyć plik .TIF w MSODI i z menu Narzędzia wybrać Rozpoznaj tekst używając OCR...
    • rozpoznanie trwa chwilę i za moment można zaznaczyć myszą tekst oraz kliknąć PPM i wybrać Kopiuj po czym możemy np. wkleić do Notatnika
    To działa równie dobrze (jak nie lepiej) niż narzędzie ekranowe ABBY FineReader :-o

    Od wersji MS Office 2010 nie ma już tego dodatku ale przeniesiono go do pakietu SharePoint Designer 2007 -> info. Mało tego - pakiet ten jest za darmo od 1.04.2009 - info, link MS z 2015: PROGRAM SHAREPOINT DESIGNER 2007 JEST OBECNIE BEZPŁATNY!
    Poszukuję programu do edycji tekstu w pliku PDF

    Tutaj można pobrać SharePoint 2007 i dokument .rtf, który był na stronie MS: SharePointDesigner.exe 291MB, Microsoft SharePoint Designer 2007 - Polish.rtf 155KB

    Instalowanie programu MODI do użytku z pakietem Microsoft Office 2010
    Oczywiście nie trzeba posiadać pakietu Office oraz nie trzeba instalować całego pakietu SharePoint - można kliknąć Dostosuj, wybrać dla wszyskich składników Niedostępne (ikona z czerwonym x) i wybrać tylko instalację Microsoft Office Document Imaging i podskładnik Skanowanie, OCR i filtr usługi indeksowania (wybrać Uruchom z mojego komputera) - zainstaluje się też składnik Scanning do skanowania ze skanera ale można też użyć IrfanView + TIF jak pisałem.

    P.S. Od wersji Office 2010 możliwość rozpoznawania OCR została przeniesiona do programu OneNote. Tutaj nie potrzeba nawet IrfanView i TIF tylko z menu Wstawianie wybieramy Wycinek ekranu, zaznaczamy to co nas interesuje np. tekst w wyświetlonym dokumencie PDF. Screenshot zostanie automatycznie wstawiony do programu i teraz wystarczy kliknąć na niego PPM i wybrać Kopiuj tekst z obrazu i dosłownie po kilku sekundach mamy w schowku rozpoznany za pomocą funkcji OCR tekst, który możemy sobie wkleić np. do Notatnika :D

    Dodano po 43 [minuty]:

    Przetestowałem ten sam plik TIF w obu programach i OneNote 2010 rozpoznał 100% dobrze a MS Office Document Imaging 2007 - kilka błędów - zamiast 0 O i zamiast B E ale tragedii nie ma :D
    Poszukuję programu do edycji tekstu w pliku PDF