logo elektroda
logo elektroda
X
logo elektroda
REKLAMA
REKLAMA
Adblock/uBlockOrigin/AdGuard mogą powodować znikanie niektórych postów z powodu nowej reguły.

[Rozwiązano] Jak zapisać wszystkie linki ze strony www do pliku txt? Program lub skrypt?

Remeknapr 03 Sty 2025 18:56 525 9
REKLAMA
  • #1 21375372
    Remeknapr
    Poziom 33  
    Posty: 3790
    Pomógł: 138
    Ocena: 183
    Witam

    Jak zapisać do txt wszystkie linki ze strony www? Jes program, lub skrypt, który by tp potrafił zrobić?

    Pozdrawiam
  • REKLAMA
  • #2 21375397
    drunek
    Poziom 25  
    Posty: 729
    Pomógł: 86
    Ocena: 219
    Z całej strony, czy tylko tej podstorny na której aktualnie jesteś? Same linki, czy razem z nazwami które mają na stronie?
  • REKLAMA
  • Pomocny post
    #3 21375401
    LEDówki
    Poziom 43  
    Posty: 9388
    Pomógł: 1310
    Ocena: 2542
    Przeglądarka zapisuje stronę html, a tam niespodzianka - plik tekstowy ze znacznikami odsyłaczy do stron. Dalej można sobie pisać program, który wywali wszystko poza znacznikami odsyłaczy, albo szukać gotowca.
    W załączniku plik z linkami strony elektroda.pl/forum/
    Zapisane jako tekst. Rozszerzenie było inne, ale sobie poradziłem bez AI, bez Google, bez youtube, TikToka i elektroda.pl.

    Dalej można pisać program czytający wiersz po wierszu i filtrujący dane.
    Można to wczytać arkusza kalkulacyjnego i filtrować adresy. W arkuszu można kombinować z makrem, żeby się nie powtarzać z robotą.
    Można szukać narzędzi w Windows, można w Linux.
    W drugim załączniku (elektroda-adresy.txt) wynik przegrepowania pierwszego załącznika.
    Da się to zrobić w C# (załadować stronę, wydłubać adresy), da się pewnie w java (podobnie jak w C#). Da się w C i C++ na pliku tekstowym. Da się pewnie masą narzędzi z linuksa (narzędzia do przetwarzania tekstu) w tym pewnie python.
    JavaScript nie zaczepiaj, bo to działa tylko w kodzie danej strony. Chyba, że się coś zmieniło...
    Załączniki:
    • elektroda-adresy.txt (60.71 KB) Musisz być zalogowany, aby pobrać ten załącznik.
    • elektroda.pl - forum elektroniczne, naprawy, porady serwisowe, usterki sprzętu, serwis naprawa.txt (111.47 KB) Musisz być zalogowany, aby pobrać ten załącznik.
  • REKLAMA
  • #4 21375449
    Erbit
    Poziom 39  
    Posty: 5421
    Pomógł: 481
    Ocena: 1326
    LEDówki napisał:
    rzeglądarka zapisuje stronę html, a tam niespodzianka - plik tekstowy ze znacznikami odsyłaczy do stron.


    Nie ma co kombinować. To można zrobić za pomocą kilku linijek w PHP (i zapewne w innych językach także).

    
    $html = file_get_contents('https://adres.pl/strony_do_pobrania.html');
    $dom = new DOMDocument(); 
    $dom->loadHTML($html); 
    $all_a = $dom->getElementsByTagName('a);
    foreach ($all_a as $a) {
        echo $a->href, PHP_EOL;
    }
    


    Nie sprawdzałem ale powinno zadziałać.
  • #5 21375450
    Remeknapr
    Poziom 33  
    Posty: 3790
    Pomógł: 138
    Ocena: 183
    drunek napisał:
    Z całej strony, czy tylko tej podstorny na której aktualnie jesteś? Same linki, czy razem z nazwami które mają na stronie?

    Wystarczy z podstrony.

    Erbit napisał:
    To można zrobić za pomocą kilku linijek w PHP (i zapewne w innych językach także).
    
    $html = file_get_contents('https://adres.pl/strony_do_pobrania.html');
    $dom = new DOMDocument(); 
    $dom->loadHTML($html); 
    $all_a = $dom->getElementsByTagName('a);
    foreach ($all_a as $a) {
        echo $a->href, PHP_EOL;
    }
    

    Ale co z tym zrobić? *.bat?
  • Pomocny post
    #6 21375484
    LEDówki
    Poziom 43  
    Posty: 9388
    Pomógł: 1310
    Ocena: 2542
    No co Ty? PHP odpala się na serwerze WWW. Taka fajna porada zaawansowanego dla początkującego.
  • #7 21375509
    Remeknapr
    Poziom 33  
    Posty: 3790
    Pomógł: 138
    Ocena: 183
    LEDówki napisał:
    No co Ty? PHP odpala się na serwerze WWW. Taka fajna porada zaawansowanego dla początkującego.

    Nie wiem o co chodzi. Jestem zielony w tych zaawansowanych trickach.
  • REKLAMA
  • #8 21375527
    LEDówki
    Poziom 43  
    Posty: 9388
    Pomógł: 1310
    Ocena: 2542
    Napisz jeszcze czy używasz tylko Windows?
    To ma być akcja jednorazowa czy cykliczna?
  • #9 21375539
    Remeknapr
    Poziom 33  
    Posty: 3790
    Pomógł: 138
    Ocena: 183
    Sporadycznie jakiegoś Linuksa, ale do jakiegoś ekstra działania. Naprawy partycji, czy odzysku danych.
  • #10 21375963
    Remeknapr
    Poziom 33  
    Posty: 3790
    Pomógł: 138
    Ocena: 183
    Napisałem mały programik, który kopiuje wszystkie linki ze strony. Zamykam.

Podsumowanie tematu

✨ Użytkownik pyta, jak zapisać wszystkie linki ze strony internetowej do pliku tekstowego. Odpowiedzi sugerują różne metody, w tym użycie przeglądarki do zapisania strony HTML, a następnie przetworzenie pliku w celu wyodrębnienia linków. Proponowane są także skrypty w PHP, C#, Java oraz narzędzia w systemach Windows i Linux. Użytkownik potwierdza, że interesuje go tylko podstrona, a także wspomina o sporadycznym używaniu Linuksa. Na koniec informuje, że napisał program do kopiowania linków.
Wygenerowane przez model językowy.
REKLAMA