Wie kann ich einen djvu in ein PDF konvertieren, wobei die Wortsuchbarkeit erhalten bleibt?

Ich habe eine DJVU-Datei, in der ich nach bestimmten Wörtern suchen kann. Wenn ich es jedoch in PDF konvertiere (ich habe es mit CutePDF und mit dem Online-Tool djvu-pdf versucht), scheint die Möglichkeit, nach Wörtern zu suchen, verloren zu gehen.

Wie kann ich eine DJVU-Datei unter Beibehaltung der Durchsuchbarkeit in ein PDF konvertieren?

Author: glS, 2015-01-06

4 answers

Ich habe vor langer Zeit ein Skript geschrieben, um dies zu tun. Es ist im Wesentlichen Klebecode um ein paar Dienstprogramme, die das schwere Heben tun. Der Unterschied zwischen meinem Skript und den anderen Tools zu der Zeit ist, dass meins das einzige war, das Folgendes getan hat:

  • hatte ein ähnliches Komprimierungsverhältnis zur ursprünglichen DjVu-Datei (1,5-2x die Größe anstelle von 10-20x die Größe)
  • gespeicherte Lesezeichen / Inhaltsverzeichnis-Metadaten (zur Navigation im PDF reader)
  • die eingebettete Textebene für die Suche beibehalten

Davon abgesehen ist es sehr primitiv. Ich habe nur dafür gesorgt, dass es für alle meine eigenen Dateien gut funktioniert hat und seitdem nicht mehr daran gearbeitet hat.

 4
Author: vindvaki,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2015-08-29 12:52:36

Öffnen Sie die PDF-Datei in PDF-XChange Viewer und führen Sie OCR durch (ich glaube, es werden nur vier Sprachen unterstützt). Es braucht Zeit, aber es ist verdammt gut (sogar auf zweispaltigen Dokumenten).

Auf Mac und Linux benötigen Sie Wine.

 2
Author: Marduk,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2016-08-16 22:32:06

Haben Sie versucht, Calibre? Der Contributor von Calibre erwähnt, dass OCR ' d Text in djvu unterstützt wird. Es könnte also wahrscheinlich mit durchsuchbarem Text in PDF konvertiert werden.

 0
Author: beatcracker,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2017-05-23 12:41:49

Dieser DjVu to PDF Converter bewahrt definitiv die Durchsuchbarkeit von Wörtern, falls der ursprüngliche DjVu durchsuchbar ist. Es produziert auch kleinere Ausgabedateien als calibre.

 0
Author: Marc Aurel,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2018-08-11 13:00:07