Wie automatisiere ich das Herunterladen mehrerer PDFs von einer bestimmten Webseite?

Ich versuche PDFs von über diesen Link herunterzuladen. Wenn Sie auf Read PDF klicken, wird ein neues Fenster mit PDF geöffnet. Wenn Sie auf die Schaltfläche Herunterladen klicken, wird ein Dialogfeld geöffnet und der Benutzer aufgefordert, den Speicherort der Datei anzugeben.

Nach dem Öffnen der Webseite des betreffenden E-Books möchte ich die folgenden Schritte automatisieren:

  1. PDF lesen wird angeklickt. Das Fenster wird im neuen Fenster geöffnet.
  2. Download-icon ist angeklickt. Das Dialogfeld wird angezeigt und fordert Sie auf, den Dateinamen und den Speicherort anzugeben.
  3. Der angegebene Standardname ist irgendwie Kauderwelsch. Also, der aussagekräftige Name wie Frontmatter, Inhalt usw. ist dort paseted, die vor dem Download-Link erwähnt und wurde zuvor kopiert.

Ich möchte die obigen Schritte für viele eBooks automatisieren. Wären die Links in Nicht-Javascript-Form, wäre es einfach gewesen, sie mit einer Art Download herunterzuladen Manager.

(PS: Auf der angegebenen Webseite sind möglicherweise nicht alle Read PDF - Links aktiviert, aber sie sind alle hinter dem Proxy an meinem Standort aktiv.)

Author: Gaurav, 2016-04-23

1 answers

Ich habe folgendes JavaScript für dich geschrieben:

var ar = $('a.pdf-icon').each(function (a) 
{
  var ar = $(this).attr('onclick').split("'"); 
  var url = "http://ebooks.cambridge.org/open_pdf/" 
           + ar[3] 
           + "?pubCode=CUP&urlPrefix=cambridge&productCode=cbo";   
  alert("Press OK for next download");
  window.open(url);
});

Um es auszuführen, öffnen Sie die Seite, die Sie in Ihrer Frage verlinkt haben, öffnen Sie die JavaScript-Konsole (STRG+UMSCHALT+I), fügen Sie den obigen Code in die Konsole ein und drücken Sie die Eingabetaste. Es werden dann alle verknüpften PDFs heruntergeladen.

Bitte beachten Sie:

  • Ich habe das mit Chrome und Firefox versucht, beide haben funktioniert.
  • Möglicherweise müssen Sie die Popup-Blocker-Funktion deaktivieren, da sie sonst nicht funktioniert
  • Möglicherweise müssen Sie alle PDF-Plugins deaktivieren, die Sie haben Sie in Ihrem Browser, sonst könnten die PDFs im Plugin angezeigt werden, anstatt heruntergeladen zu werden
  • Das Skript muss möglicherweise geändert werden, wenn der Quellcode der Seite bei der Anzeige über Ihren Proxy unterschiedlich ist.
 1
Author: Bob,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2016-05-01 22:13:30