Wie entferne ich ein Wasserzeichen aus einer PDF-Datei?

Ich dachte, das wäre eine einfache Aufgabe, aber es stellte sich anders heraus.

Das Wasserzeichen ist das gleiche (überlappende, aber transparente) Bild auf jeder einzelnen Seite. Ich habe die PDF-Datei selbst erstellt (also keine urheberrechtlichen Sorgen hier) mit PDFCreator 0.9.8.

Ich habe bereits den Adobe Acrobat Pro meines Freundes ausprobiert, aber es hat nicht funktioniert. Es versucht, ihn zu entfernen, aber es kann nicht. Ich habe versucht, zu entfernen header/footer, etc., aber das Wasserzeichen verschwindet einfach nicht.

, Wie kann ich das Wasserzeichen entfernen?

Author: Dennis, 2012-07-30

7 answers

Für bildbasierte Wasserzeichen gibt es mehrere Tools, die ihre automatische Entfernung versprechen. Beispiel:

Alle diese sind frei zu versuchen, erfordern aber eine Lizenz, um tatsächlich die gewünschte Ausgabe zu erzeugen.

Das Wasserzeichen dieser spezifischen PDF-Datei (die mir das OP per E-Mail gesendet hat) ist jedoch kein einzelnes Bild wiederholt auf allen Seiten. Wie sich herausstellt, hat PDFCreator es (fast Pixel für Pixel) in jeden einzelnen von ihnen fest codiert. Dies macht das Entfernen des Wasserzeichens viel schwieriger (und führt zu einer ziemlich aufgeblähten PDF-Datei).

Da das Wasserzeichen tatsächlich aus vielen kleinen Bildern besteht, können Sie sie mit einem PDF-Editor entfernen (z. B. Foxit Advanced PDF Editor), indem Sie sie einfach auswählen und drücken Löschen. Leider müssen Sie dies für jeden wiederholen Seite.

Eine weniger zeitaufwändige Lösung wäre, das Wasserzeichen programmgesteuert zu entfernen. Wir brauchen:

  • Pdftk: ein Werkzeug zum (un)Komprimieren und Beheben von PDF-Streams.
  • Notepad++: ein Texteditor, der in der Lage ist, [[43]}Perl-kompatible reguläre Ausdrücke zu ersetzen .

Schritte

  1. Laden Sie Pdftk herunter und extrahieren Sie pdftk.exe - und libiconv2.dll zu %windir%\System32, ein Verzeichnis im Pfad oder einen anderen Ort Ihrer Wahl.

  2. Downloaden und installieren Sie Notepad++.

  3. PDF-Streams werden normalerweise mit dem DEFLATE - Algorithmus komprimiert. Dies spart Platz, macht die PDF-Quelle jedoch unleserlich.

    Der Befehl

    pdftk original.pdf output uncompressed.pdf uncompress
    

    Dekomprimiert alle Streams, sodass sie von einem Texteditor geändert werden können.

  4. Öffnen Sie unkomprimiert.pdf mit Notepad++, um die Struktur des Wasserzeichens anzuzeigen.

    In diesem spezifischer Fall, jede Seite beginnt mit dem Block

    q 9 0 0 9 2997 4118.67 cm
    BI
    /CS/RGB
    /W 1
    /H 1
    /BPC 8
    ID Ÿ®¼
    EI Q
    

    Und fast 4.000 Blöcke wie dieser. Dieser bestimmte Block setzt nur einen (/W 1 /H 1) der Pixel des Wasserzeichens.

    Wenn Sie nach unten scrollen, bis sich das Muster ändert, wird angezeigt, dass der Stream des Wasserzeichens 95.906 Byte lang ist (Zeilenumbrüche zählen). Der exakt gleiche Stream wird auf jeder Seite der PDF-Datei wiederholt.

  5. Drücken Sie Strg + H und setze Folgendes:

    Find:               q 9 0 0 9 2997 4118\.67 cm.{95881}
    Replace:            (blank)
    Match case:         checked
    Wrap around:        checked
    Regular expression: selected
    . matches newline:  checked
    

    Der reguläre der Ausdruck q 9 0 0 9 2997 4118\.67 cm.{95881} entspricht der ersten Zeile des obigen Blocks (q 9 0 0 9 2997 4118.67 cm) und allen folgenden 95.881 Zeichen, dh dem Stream des Wasserzeichens.

    Wenn Sie auf Replace All klicken, wird es von allen Seiten der PDF-Datei entfernt.

  6. Das Wasserzeichen wurde jetzt entfernt, aber die PDF-Datei weist Fehler auf (die Länge der Streams ist falsch) und ist unkomprimiert.

    Der Befehl

    pdftk uncompressed.pdf output nowatermark.pdf compress
    

    Kümmert sich um beides.

  7. Unkomprimiert.pdf - ist nicht mehr benötigen. Sie können es löschen.

Das Ergebnis ist das gleiche PDF ohne Wasserzeichen (und etwa die Hälfte der Größe).

 77
Author: Dennis,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2015-05-10 04:10:19

Es klingt wie das Wasserzeichen tatsächlich Teil der Bilder innerhalb der .PDF, und nicht ein separates Bild über sie gerendert, was auch immer Sie verwenden, um die anzuzeigen .PDF. Möglicherweise können Sie das Wasserzeichen nicht entfernen, ohne die Bilder aus dem zu extrahieren .PDF, läuft sie durch einen Bildeditor, und dann die Rekonstruktion der .PDF manuell.

 6
Author: LawrenceC,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2012-07-30 18:05:35

Für Textwasserzeichen kann das Bearbeiten einer PostScript-Version viel einfacher sein: Nach

$ pdftops-Dokument.pdf -

Bearbeiten document.ps, dann konvertieren zurück in PDF über

$ ps2pdf Dokument.ps

 5
Author: heiner,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2014-12-16 18:45:16

Die Artefakte des Stempels sind, dass Sie es in Adobe Acrobat Pro löschen können, es wird jedoch bei einer Mausbewegung neu generiert, da das Stream-Objekt es persistent hält.

Wenn Sie versuchen, die PDF-Quelle zu bearbeiten - was schwierig ist, besteht die Möglichkeit, dass die Datei beschädigt wird.

Wenn der Stempel ein Stream ist, können wir ihn unterbrechen, indem wir den Computer vom Netz trennen, was ich getan habe.

Dann habe ich mit Adobe Acrobat Pro eine meiner Anmerkungen ausgewählt und mit der rechten Maustaste auf rufen Sie das Popup ab und wählen Sie "Kommentarliste anzeigen".

Wählen Sie das ruchlose Wasserzeichen/den Stempel aus der Liste aus, klicken Sie mit der rechten Maustaste, um das Popup abzurufen, und wählen Sie "Löschen". Tun Sie dies auf jeder Seite, auf der die Anbringung erfolgt.

Speichern Sie die Datei unter einem anderen Namen. Meine Anwendung ist abgestürzt, aber nicht vor dem Speichern der Datei!

Öffnen Sie die neue & much smaller Datei; beachten Sie, dass alle Wasserzeichen/Stempel vorhanden sind.

In meinem Fall schrumpfte die Dateigröße meines 3-seitigen Dokuments von 300 kb auf ein beeindruckende 60 kb. Alle Originaldaten und Anmerkungen blieben erhalten-ohne Wasserzeichen.

~Gute Jagd: o)

 1
Author: Alan Hord,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2014-10-23 19:26:41

, Konvertieren Sie das Dokument in .rtf-Datei mit zamzar. Die Wassermarke verschwindet nach dem Umbau automatisch. Bitte beachten Sie: - Es funktioniert einwandfrei, wenn das Dokument Textmaterial enthält. Es war schon immer eine große Hilfe.. (Mac-Benutzer)

 1
Author: Shifa,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2015-01-13 15:42:01

Einen anderen Weg gefunden:

  1. Verwenden Sie das Tool pdf2htmlEX (oder einen anderen PDF - in-HTML-Konverter), um das PDF in eine HTML-Datei zu konvertieren.
  2. Bearbeiten Sie HTML mit einem Texteditor und entfernen Sie das Wasserzeichen. Speichern Sie es.
  3. Drucken Sie die HTML-zu-PDF-Dokument -
  4. Gewinn
 1
Author: Dominik Antal,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2017-03-17 12:49:33

Dies ist eine Ergänzung zu @Dennis' Antwort von 18:06 30 Jul 2012. Er spricht sicherlich den härteren Fall an.

Im einfachsten Fall, wenn das Wasserzeichen einfacher, schmuckloser Text ist, zum Beispiel

Smedley Für Commissioner

Die unkomprimierten PDF-Wasserzeichen können wie folgt definiert werden:

    BT
    75.96 625 Td
    (Smedley For Commissioner)Tj
    ET

Wobei 75.96 der horizontale Versatz und 625 der vertikale Versatz für diese bestimmte Wasserzeicheninstanz ist. (Ja, sowohl reelle Zahlen als auch ganze Zahlen kann gesehen werden.)

Ein Regexp wie der Folgende funktioniert für alle diese Wasserzeichen und ignoriert alle Variationen in ihrer Platzierung:

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n

Beachten Sie, tho, dass eine Vielzahl von modifizierenden PDF-Operatoren mit Wasserzeichen mit komplizierterer Formatierung ins Spiel kommen kann. Eine solche Phantasie kann verwandeln, was der Leser erwartet (hofft?) zu einem zusammenhängenden, leicht-gesuchte Zeichenfolge in ein Chaos von alphabet-Suppe. Zum Beispiel

E1 = mc2 von Smedley™

Könnte das Produkt davon sein:

    BT
    75.96 625 Td
    (E)Tj
    -5 Ts
    (1)Tj
    0 Ts
    ( = mc)Tj
    5 Ts
    (2)Tj
    0 Ts
    (by Smedley)Tj
    5 Ts
    (TM)Tj
    0 Ts
    ET

. . . oder viel schlimmer, wenn Ihr Wasserzeichen farblich verbessert ist!

Nachdem ich all dies bemerkt habe, werde ich auch feststellen, dass PDFtk eine GUI-Version hat, die vorgibt, mit Wasserzeichen umzugehen, unter Berücksichtigung einer Lizenzgebühr von 4 USD. Überhaupt nicht teuer!

Auf der anderen Seite finde ich, dass seine Website derzeit volle Unterstützung für O/S durch Windows 8 und OS X 10.8 Mountain Lion wirbt. Dieser Jahrgang ist über 4 Jahren. Könnte PDFtk sein veraltet werden? Ich vermute nicht, aber ich weiß es nicht.

 0
Author: Der Schley,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2016-10-18 00:07:56