Laden Sie alle PDF-Links auf einer Webseite herunter? [geschlossen]

Geschlossen. Diese Frage ist " off-topic. Es akzeptiert derzeit keine Antworten.

Möchten Sie diese Frage verbessern? Aktualisiere die Frage so, dass sie zum Thema für Super User.

Geschlossen Vor 3 Jahren.

Verbessern Sie diese Frage

Kennen Sie eine gute software zum herunterladen aller PDF-links auf einer Webseite??

- Betriebssystem ist Windows 7.

Author: studiohack, 2011-03-20

6 answers

Sie können wget verwenden und einen Befehl wie diesen ausführen:

wget --recursive --level=1 --no-directories --no-host-directories --accept pdf http://example.com

Oder mit den kurzen Optionen:

wget -r -l 1 -nd -nH -A pdf http://example.com

UPDATE: Da in Ihrem Update angegeben ist, dass Sie Windows 7 ausführen, verwenden Sie wget für Windows über eine cmd - Eingabeaufforderung.

- UPDATE 2: Für eine grafische Lösung - obwohl es vielleicht übertrieben, da wird es andere Dateien auch DownThemAll

 38
Author: Kevin Worthington,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2015-02-28 20:41:19
  1. Drücken Sie in Ihrem Browser STRG+VERSCHIEBUNG+J, und geben Sie

    Var pdflinks =[]; Array.Prototyp.anzeigen. anruf (Dokument.querySelectorAll("a[href$=\".pdf\"]"), function(e, i){if((pdflinks||[]).indexOf(e."href")==-1){ pdflinks.push (e.));} }); Konsole.log(pdflinks.join(" "));

    Dies wird in der Konsole zurückgegeben:

    "https://superuser.com/questions/tagged/somepdf1.pdf" "{[24h]}https://superuser.com/questions/tagged/somepdf2.pdf" "https://superuser.com/questions/tagged/somepdf3.pdf"

  2. Jetzt verwenden wget mit den Befehlszeilenoptionen wget url1 url2 ...

Kopieren und einfügen, öffnen Sie eine Konsole enter wget Drücken Sie die rechte Maustaste, um den Inhalt der Zwischenablage einzufügen, und drücken Sie die Eingabetaste.

Um eine Download-Datei zu verwenden, verbinden Sie die Zeilen mit "\n " und verwenden Sie den Parameter wie folgt wget -i mydownload.txt

Beachten Sie, dass die meisten anderen (GUI -) Download-Programme akzeptieren auch den Aufruf mit einer durch Leerzeichen getrennten Liste von URLs.

Hoffe, das hilft. So mache ich es im Allgemeinen. Es ist schneller und flexibler als jede Erweiterung mit einer grafischen Benutzeroberfläche, ich muss lernen und vertraut bleiben.

 9
Author: Lorenz Lo Sauer,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2017-03-20 10:17:14

Wenn Sie wollen zu bleiben in dem browser, den ich geschrieben habe eine web-Erweiterung für genau diesen Zweck - ich bin arbeiten über das hinzufügen der Fähigkeit zum speichern von wissenschaftlichen Artikel PDF-Dateien mit korrekt formatierten Titel, aber wenn Sie nur wollen, um download 'em all, es ist perfekt für diese.

Es heißt Tab Save und im Chrome Web Store hier. Sie müssen nicht einmal die Liste der URLs eingeben, wenn Sie sie nur alle in Registerkarten öffnen (aber für eine große Anzahl von Dateien kann dies einen Computer verlangsamen, so dass ich die Option hinzugefügt, um Ihre eigenen hinzuzufügen).

 1
Author: Louis Maddox,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2014-05-26 16:27:14

Ich habe kürzlich uGet (unter Windows) dafür verwendet. Es verfügt über eine GUI und Sie können die Dateien filtern, die Sie herunterladen möchten.

Speichert den Versuch, sich an all diese

 0
Author: Cogitative,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2017-06-04 10:25:26

In Google Chrome können Erweiterungen verwendet werden wie:

  • Herunterladen Master

    Mit dieser Erweiterung können Sie alle Bilder, Videos, PDF, doc und alle anderen Dateien herunterladen, die auf der von Ihnen besuchten Webseite verlinkt sind.

 0
Author: kenorb,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2018-01-18 13:03:42

Google

Es gibt nur wenige Python-Tools, mit denen PDF-Links von der Website basierend auf den Google-Suchergebnissen heruntergeladen werden können.

Z. B.

Hinweis: Ich bin der Betreuer der beiden genannten Skripte.

Beide implementieren xgoogle Python-Bibliothek. Meine Gabel dieser Bibliothek basiert auf der pkrumins/xgoogle version.


Verwandte: Eine Websuche über die Linux-Befehlszeile.

 0
Author: kenorb,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2018-01-19 02:37:14