Witam, tak jak w temacie szukam płatnego lub free programu do realnej edycji tekstu zapisanego w PDF. Nie interesuje mnie wstawianie obrazków, checkboxów czy linijek a jedynie pragnę zmienić w tekście dla przykładu 123 na 321 itp... Programy typu PDF Escape tego nie mają a za Adobe 9 Pro nie chcę płacić 1200 PLN. Czy jest coś pomiędzy niedrogie lub zupełnie za free?
Zupełnie za free konwersja PDF do Word np. tutaj (jest ograniczenie dzienne za free). W Wordzie to robisz co chcesz. Potem z Word do PDF to już w trakcie wydruku wybiera się odpowiednią opcję wydruku do PDF.
Można różne pliki konwertować w różne strony na tej stronie.
Sprzedaż i serwis kas fiskalnych oraz sprzętu towarzyszącego.
Sprzedaż części zamiennych.
Porady tylko na forum!
Pozdrowienia z Podlasia (nie mylić z woj.podlaskim)
Zupełnie za free konwersja PDF do Word np. tutaj (jest ograniczenie dzienne za free). W Wordzie to robisz co chcesz. Potem z Word do PDF to już w trakcie wydruku wybiera się odpowiednią opcję wydruku do PDF.
Można różne pliki konwertować w różne strony na tej stronie.
A sprawdzałeś czy może nie ma "krzaków" przy polskich znakach po przekonwertowaniu do .doc?
Zupełnie za free konwersja PDF do Word np. tutaj (jest ograniczenie dzienne za free). W Wordzie to robisz co chcesz. Potem z Word do PDF to już w trakcie wydruku wybiera się odpowiednią opcję wydruku do PDF.
Można różne pliki konwertować w różne strony na tej stronie.
A sprawdzałeś czy może nie ma "krzaków" przy polskich znakach po przekonwertowaniu do .doc?
A co stoi na przeszkodzie, by szanowny autor tematu, sprawdził działanie rozwiązania podanego na tacy?
A sprawdzałeś czy może nie ma "krzaków" przy polskich znakach po przekonwertowaniu do .doc?
Jeżeli pdf był tworzony z aplikacji tekstowej (notatnik, Word, Exel...) to "krzaków" nie ma. Jeżeli z wersji graficznej (foto, skan) to potrafią być lub niektóre fragmenty pozostają w wersji graficznej.
Tutaj dość dobrze rozpoznaje tekst ze skanu lub zdjęcia ale nie ma polskich ogonków i w Wordzie trzeba poprawiać oraz myli niektóre litery z grafiki np. ł z t i kilka innych.
Można też zapisać skan w Paint. Edytować dowolnie a potem zapisać paint ponownie w pdf. Czasami trzeba pokombinować z czcionką i jej wyrazistością aby nie różniła się od oryginalnej. Taki dziecinny ale skuteczny też sposób.
Sprzedaż i serwis kas fiskalnych oraz sprzętu towarzyszącego.
Sprzedaż części zamiennych.
Porady tylko na forum!
Pozdrowienia z Podlasia (nie mylić z woj.podlaskim)
Jeżeli pdf był tworzony z aplikacji tekstowej (notatnik, Word, Exel...) to "krzaków" nie ma.
Właśnie w tekstowej to by nie było problemu, jednak plik to typowa grafika ze skanera kiedyś stworzona w Wordzie a teraz zeskanowana i przekonwertowana do PDF
Z Twojego pierwszego linka PDF --- DOC pojawia się na wstępie zapytanie konwertuj do Word albo do Word z OCR. Wiadomo że trzeba z OCR a tu pojawiają się już problemy "zeskanowane strony zostaną przekonwertowane na edytowalne dokumenty. Formatowanie może ulec zmianie...
Jeżeli dobra jakość to link z mojego #6 31 Sie 2020 17:31 zrobi za free. Niestety trzeba będzie poprawić przekłamania ok.5% znaków. Może trochę mniej. Tabele przerobi do Worda raczej bez zmian.
Dodano po 7 [minuty]:
trade24 wrote:
[...
Z Twojego pierwszego linka PDF --- DOC pojawia się na wstępie zapytanie konwertuj do Word albo do Word z OCR. Wiadomo że trzeba z OCR a tu pojawiają się już problemy "zeskanowane strony zostaną przekonwertowane na edytowalne dokumenty. Formatowanie może ulec zmianie...
Tak to prawda. Dlatego podesłałem drugi link który ma znacznie szerszy wybór kierunków konwersji. Jeżeli masz do przemiany w pdf to wybierasz z pdf niezależnie z czego ten pdf był tworzony.
Sprzedaż i serwis kas fiskalnych oraz sprzętu towarzyszącego.
Sprzedaż części zamiennych.
Porady tylko na forum!
Pozdrowienia z Podlasia (nie mylić z woj.podlaskim)
Co rozumiesz przez "podstawową edycję" Wycina tekst z obrazka i zmienia w dokładnie taki sam z tą samą czcionką ale z inną treścią? Czy pozwala jedynie kopiować tekst i wklejać do Worda, oraz wycinać zdjęcia z pdf?
Ja chyba źle zadałem pytanie z tą edycją PDF. Bo widzę faktycznie że nawet taki PDFedit jest wstanie to zrobić. Problem pojawia się gdy mamy zeskanowany dokument zaimportowany do pliku PDF. Więc pytanie powinno brzmieć: Jak wyedytować zeskanowany dokument (z logiem zdjęciem i różnymi czcionkami), zmienić tekst w tym dokumencie na dokładnie taką samą czcionkę, wygładzić, pozbyć się szarego tła i innych niedoskonałości zeskanowanego dokumentu a potem zrobić z niego plik PDF i wydrukować?
PDF'u nie powinno się edytować - jest to format stworzony z myślą o prezentacji - tak samo jak nie da się edytować prawdziwej papierowej książki.
Tekst przygotowujemy w programie do edycji, sprawdzamy czy nie ma błędów, wszystko robimy na tip-top i wtedy eksportujemy jako PDF.
W Twojej sytuacji gdy masz skan w pliku PDF (zapewne jako zdjęcie) to potrzebujesz przerobić go na format edytowalny a do tego trzeba OCR - jak ktoś wspomniał dobry jest ABBYY Fine Reader. Program nie jest idealny i trzeba po nim często poprawiać - czasami lepiej ręcznie pozaznaczać odpowiednie obszary typu - tekst, tabelka, zdjęcie i dopiero wykonać rozpoznanie OCR.
Błędy można poprawiać po rozpoznaniu OCR w samym programie Fine Reader albo zapisać wynik pracy jako .doc, poprawić w Wordzie i zapisać jako PDF.
Wszystko zależy od tego co zawiera wyjściowy dokument PDF - ten Twoj zeskanowany. Bo jak sam tekst to można i do pliku .txt zapisać. Jak ma tabelki i obrazki to lepiej do .doc
W Twojej sytuacji gdy masz skan w pliku PDF (zapewne jako zdjęcie) to potrzebujesz przerobić go na format edytowalny a do tego trzeba OCR - jak ktoś wspomniał dobry jest ABBYY Fine Reader.
Ktoś dobrze wspomniał i napiszę więcej, jest to jedyny program, który (prawie) prawidłowo potrafi odczytać zeskanowany tekst i niemal identycznie za pośrednictwem OCR przerobić go na nowo. Jestem świeżo po eksperymentach z tym programem i jak na tą chwile spełnia moja oczekiwania. Niestety Foxit i Ashampoo poległy na wstępie. Dla mnie konwersja do Worda i przerabianie jest nie do przyjęcia ponieważ po konwersji do Worda zmienia się czcionka w wiele innych rzeczy...
jest to jedyny program, który (prawie) prawidłowo potrafi odczytać zeskanowany tekst i niemal identycznie za pośrednictwem OCR przerobić go na nowo. Jestem świeżo po eksperymentach z tym programem i jak na tą chwile spełnia moja oczekiwania.
Tak jak napisałem, program nie jest idealny ale nie znam innego równie dobrego. Poza tym jeśli zależy Ci aby rozpoznany przez OCR dokument wyglądał jak skan to trzeba zapisać jako - jak dobrze pamiętam, PDF/X. Wtedy dokument wygląda jak zdjęcie ale tekst można zaznaczyć i kopiować.
W załączniku przykład w pliku strona.pdf - widzimy oryginał ale możemy skopiować tekst - w przykładzie można skopiować tekst po nagłówku Strony WWW - To z pewnością najczęściej...
Zupełnie za free konwersja PDF do Word np. tutaj (jest ograniczenie dzienne za free).
trade24 wrote:
Mam już Abby Fine Reader i poszło pięknie. Uczę się go ale to jest trial tylko na 7 dni...
W pakiecie MS Office 2003 i 2007 jest takie coś co się zwie Microsoft Office Document Imaging (i Scanning). Zawsze myślałem iż to jakiś dodatek, który g...o potrafi. Ostatnio miałem okazję pobawić się tym (wersja Office 2003 Pro PL) i okazuje się iż toto rozpoznaje polski tekst bardzo dobrze. Testowałem rozpoznawanie ze screenshota na którym wyświetlony jest jakiś dokument w PDF lub DJVU (jako zdjęcie, stare czasopismo).
otworzyłem PDF w Adobe Reader i powiększyłem wyświetlanie dokumentu tak aby tekst nie był za mały na ekranie
zrobiłem screenshota wciskając PrintScr
wkleiłem do IrfanView, wykadrowałem to co mnie interesuje i zapisałem w formacie TIF (bez kompresji)
teraz wystarczy otworzyć plik .TIF w MSODI i z menu Narzędzia wybrać Rozpoznaj tekst używając OCR...
rozpoznanie trwa chwilę i za moment można zaznaczyć myszą tekst oraz kliknąć PPM i wybrać Kopiuj po czym możemy np. wkleić do Notatnika
To działa równie dobrze (jak nie lepiej) niż narzędzie ekranowe ABBY FineReader
Instalowanie programu MODI do użytku z pakietem Microsoft Office 2010 Oczywiście nie trzeba posiadać pakietu Office oraz nie trzeba instalować całego pakietu SharePoint - można kliknąć Dostosuj, wybrać dla wszyskich składników Niedostępne (ikona z czerwonym x) i wybrać tylko instalację Microsoft Office Document Imaging i podskładnik Skanowanie, OCR i filtr usługi indeksowania (wybrać Uruchom z mojego komputera) - zainstaluje się też składnik Scanning do skanowania ze skanera ale można też użyć IrfanView + TIF jak pisałem.
P.S. Od wersji Office 2010 możliwość rozpoznawania OCR została przeniesiona do programu OneNote. Tutaj nie potrzeba nawet IrfanView i TIF tylko z menu Wstawianie wybieramy Wycinek ekranu, zaznaczamy to co nas interesuje np. tekst w wyświetlonym dokumencie PDF. Screenshot zostanie automatycznie wstawiony do programu i teraz wystarczy kliknąć na niego PPM i wybrać Kopiuj tekst z obrazu i dosłownie po kilku sekundach mamy w schowku rozpoznany za pomocą funkcji OCR tekst, który możemy sobie wkleić np. do Notatnika
Dodano po 43 [minuty]:
Przetestowałem ten sam plik TIF w obu programach i OneNote 2010 rozpoznał 100% dobrze a MS Office Document Imaging 2007 - kilka błędów - zamiast 0 O i zamiast B E ale tragedii nie ma