Elektroda.pl
Elektroda.pl
X
Proszę, dodaj wyjątek dla www.elektroda.pl do Adblock.
Dzięki temu, że oglądasz reklamy, wspierasz portal i użytkowników.

wyciągnięcie tekstu z dużej ilości plików html...

15 Gru 2012 16:11 1206 4
  • Poziom 15  
    Witam serdecznie :)

    Bardzo proszę o pomoc zorientowanych w temacie :)


    Mam w jednym katalogu kilkaset plików html. W każdym z tych plików znajdują się informacja, która mnie interesuje, a jej wartość jest zmienna. To, czego szukam, dokładnie wygląda tak:

    <h3 class="nazwa">perła</h3>
    <h3 class="nazwa">granat</h3>
    <h3 class="nazwa">orzech</h3>

    Każdy znacznik h3 z inną wartością, znajduje się w innym pliku i o innej nazwie. Ja potrzebuję z każdego z tych plików wyciągnąć wartość: perła, granat, orzech. Te wartości potrzebuję mieć w pliku tekstowym i oddzielone przecinkiem.

    Może mi ktoś z Szanownych Forumowiczów i podpowiedzieć, jak to zrobić?

    Z góry dziękuję za każde info i pozdrawiam :)

    Grzegorz
  • Poziom 19  
    Nie napisałeś czym i podczym chcesz to zrobić, pod uniksem - nie idąc w specjalnie wyszukany kod, to by mogło być:
    Kod: bash
    Zaloguj się, aby zobaczyć kod


    Uruchamiasz w katalogu z plikami *.html, output będzie w 'output.txt'
    (jesli plikow bedzie za duzo dla seda to wywali error, mozna wtedy zmienic i uzyc 'find')
  • Poziom 15  
    tom3kk napisał:
    Nie napisałeś czym i podczym chcesz to zrobić
    No fakt, masz rację...

    Czym? Tego właśnie nie wiem i dlatego proszę o pomoc.
    Pod czym? Windows XP lub pod wszystkim innym kompatybilnym.

    Próbowałem DOS-owym poleceniem FIND, ale albo coś źle robię, albo po prostu nie da się.
  • Poziom 15  
    blue_17 napisał:
    Zainstaluj notepada c++ i tam jest opcja wyszukiwania w wielu plikach naraz
    Wielkie dzięki za podpowiedź.
    Sprawdziłem, działa, ale wynik wyszukiwania zawiera na tyle dużo zbędnych informacji, że gdybym chciał to obrobić np. w Excelu, to zajęłoby mi to całe wieki.
    Tak, wiem, że w Excelu da się za pomocą formuł wyciąć co niepotrzebne, ale z kolei nie znam Excela od tej strony, więc już wiem, że sobie nie poradzę. No chyba, że mi ktoś pomoże???

    Poczekam jeszcze, może ktoś jeszcze podpowie coś mądrego.



    ;)