Laden Sie alle PDF-Links auf einer Webseite herunter? [geschlossen]
Möchten Sie diese Frage verbessern? Aktualisiere die Frage so, dass sie zum Thema für Super User.
Geschlossen Vor 3 Jahren.
Verbessern Sie diese FrageKennen Sie eine gute software zum herunterladen aller PDF-links auf einer Webseite??
- Betriebssystem ist Windows 7.
6 answers
Sie können wget verwenden und einen Befehl wie diesen ausführen:
wget --recursive --level=1 --no-directories --no-host-directories --accept pdf http://example.com
Oder mit den kurzen Optionen:
wget -r -l 1 -nd -nH -A pdf http://example.com
UPDATE: Da in Ihrem Update angegeben ist, dass Sie Windows 7 ausführen, verwenden Sie wget für Windows über eine cmd
- Eingabeaufforderung.
- UPDATE 2: Für eine grafische Lösung - obwohl es vielleicht übertrieben, da wird es andere Dateien auch DownThemAll
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2015-02-28 20:41:19
-
Drücken Sie in Ihrem Browser STRG+VERSCHIEBUNG+J, und geben Sie
Var pdflinks =[]; Array.Prototyp.anzeigen. anruf (Dokument.querySelectorAll("a[href$=\".pdf\"]"), function(e, i){if((pdflinks||[]).indexOf(e."href")==-1){ pdflinks.push (e.));} }); Konsole.log(pdflinks.join(" "));
Dies wird in der Konsole zurückgegeben:
"https://superuser.com/questions/tagged/somepdf1.pdf" "{[24h]}https://superuser.com/questions/tagged/somepdf2.pdf" "https://superuser.com/questions/tagged/somepdf3.pdf"
Jetzt verwenden
wget
mit den Befehlszeilenoptionenwget url1 url2 ...
Kopieren und einfügen, öffnen Sie eine Konsole enter wget
Drücken Sie die rechte Maustaste, um den Inhalt der Zwischenablage einzufügen, und drücken Sie die Eingabetaste.
Um eine Download-Datei zu verwenden, verbinden Sie die Zeilen mit "\n " und verwenden Sie den Parameter wie folgt wget -i mydownload.txt
Beachten Sie, dass die meisten anderen (GUI -) Download-Programme akzeptieren auch den Aufruf mit einer durch Leerzeichen getrennten Liste von URLs.
Hoffe, das hilft. So mache ich es im Allgemeinen. Es ist schneller und flexibler als jede Erweiterung mit einer grafischen Benutzeroberfläche, ich muss lernen und vertraut bleiben.
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2017-03-20 10:17:14
Wenn Sie wollen zu bleiben in dem browser, den ich geschrieben habe eine web-Erweiterung für genau diesen Zweck - ich bin arbeiten über das hinzufügen der Fähigkeit zum speichern von wissenschaftlichen Artikel PDF-Dateien mit korrekt formatierten Titel, aber wenn Sie nur wollen, um download 'em all, es ist perfekt für diese.
Es heißt Tab Save und im Chrome Web Store hier. Sie müssen nicht einmal die Liste der URLs eingeben, wenn Sie sie nur alle in Registerkarten öffnen (aber für eine große Anzahl von Dateien kann dies einen Computer verlangsamen, so dass ich die Option hinzugefügt, um Ihre eigenen hinzuzufügen).
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2014-05-26 16:27:14
Ich habe kürzlich uGet (unter Windows) dafür verwendet. Es verfügt über eine GUI und Sie können die Dateien filtern, die Sie herunterladen möchten.
Speichert den Versuch, sich an all diese
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2017-06-04 10:25:26
In Google Chrome können Erweiterungen verwendet werden wie:
-
Mit dieser Erweiterung können Sie alle Bilder, Videos, PDF, doc und alle anderen Dateien herunterladen, die auf der von Ihnen besuchten Webseite verlinkt sind.
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2018-01-18 13:03:42
Es gibt nur wenige Python-Tools, mit denen PDF-Links von der Website basierend auf den Google-Suchergebnissen heruntergeladen werden können.
Z. B.
-
google_dl
script (empfohlen).Verwendung:
./google_dl -s http://www.example.com/ -f pdf ""
-
gsrchDwn
script (basierend auf neo ' s script).Verwendung:
./gsrchDwn.py --query "site:http://www.example.com/" --ftype pdf
Hinweis: Ich bin der Betreuer der beiden genannten Skripte.
Beide implementieren xgoogle
Python-Bibliothek. Meine Gabel dieser Bibliothek basiert auf der pkrumins/xgoogle
version.
Verwandte: Eine Websuche über die Linux-Befehlszeile.
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2018-01-19 02:37:14