kopieren Sie eine Tabelle aus PDF als Tabelle?

Wie kann ich eine Tabelle aus einem PDF-Dokument in Word, Excel, OneNote usw. kopieren oder exportieren? als Tabelle statt Klartext?

Beispiel-pdf: ftp://ftp2.cits.rncan.gc.ca/pub/canvec/doc/CanVec_transition_guide_en.pdf, ab Seite 9. Ich bin mit Office 2003 OneNote-Testversion 2007.

Author: matt wilkie, 2010-07-08

9 answers

Sie könnten versuchen Tabula - funktioniert ziemlich gut für datenorientierte Inhalte in Tabellen.

Ein kurzes Intro ist auf der Homepage zu finden.

Mit dem Tool für die PDF-Datei, die dieser Frage beigefügt ist, müssen Sie:

  1. Laden Sie die Datei auf Ihre lokale Festplatte herunter.
  2. Installieren und starten Sie das Tool gemäß den Anweisungen auf der Homepage.
  3. Laden Sie das PDF hoch und wählen Sie Submit.
  4. Navigieren Sie zur ersten Tabelle und wählen Sie die Tabelle aus. Stellen Sie sicher, dass Sie die Kopf-und Fußzeile der Seite nicht auswählen, um ein genaueres Ergebnis zu erhalten. Tabula-Tabellenauswahl
  5. Wählen Sie Wiederholen Sie diese Auswahl, wenn Sie auch die folgenden Tabellen mit denselben Koordinaten auswählen möchten.
  6. Wähle Lade alle Daten herunter und du bekommst. Tabula-Extrahierte tabellarische Daten
  7. Wählen Sie Daten herunterladen, um eine CSV-Datei mit den extrahierten Tabellen abzurufen. Diese Datei kann mit MS Excel oder einer anderen Anwendung geöffnet werden, die kann das CSV-Format zur weiteren Verarbeitung lesen.
 4
Author: Alex,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2016-12-12 21:29:53

Sie können Okular Document Viewer auf Linux und Windows Trog http://windows.kde.org / installer.

Es kann Text als Tabelle auswählen, in der Sie Zeilen und Spalten definieren können.

 6
Author: MirzaD,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2012-08-22 11:29:03

MirzaD, danke, dass du Okular vorgeschlagen hast. Ich habe es auf meinem Ubuntu-Desktop installiert und habe es nie ernst genommen .. bis jetzt. Dank dir.

Okular is awesome in den Funktionen, die es packt, und kann sicherlich die Bedürfnisse des Mannes ansprechen, der die Frage stellt. Mit Okular verwenden Sie ein Table Selection Tool, definieren einen Bereich und klicken dann in Spaltenrändern, um Felder zu markieren .. und dann kopieren. Wenn Sie es einfügen, erhalten Sie eine konsistente tabulatorgetrennte Ausgabe, in die jedes seriöse Tool als CSV eingebunden werden kann Datei.

Ich habe dieses Bedürfnis (ein paar Tabellen aus einem PDF-Dokument zu extrahieren) jetzt auf einem Centos-Desktop mit gnome/xfce, und die Installation von okular würde bedeuten, eine ganze Reihe anderer KDE-Grafiktools zu installieren. Also werde ich es zuerst mit Tabula versuchen (was auch sehr vielversprechend aussieht), und wenn das fehlschlägt, müsste es okular sein.

Würde das für Windows funktionieren? Ja, KDE kann in Windows installiert werden, aber KDE-Anwendungen kommen mit einigen anständigen Overhead von anderen unnötigen Software .. Also, es abhängig davon, wie groß Ihre Bedürfnisse sind, kann dies eine praktikable Option für sogar Windows sein.

Lesen Sie mehr über Okular hier .. und Ihr slogan More Than a Reader passt sicherlich .. Ich bin wirklich beeindruckt, was Okular kann .. in einer ordentlichen und schnell genug Anwendung mit einem kleinen Platzbedarf.

KDE-Windows-Projekt .. macht es einfach, eine Teilmenge exzellenter KDE-Apps in Windows zu installieren.

 5
Author: Chux Uzoeto,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2014-04-22 03:56:05

Öffnen Sie das Dokument mit Adobe Acrobat. Klicken Sie Auf Datei > Speichern Unter. Wählen Sie "HTML 4.01 mit CSS 1.0 (*.htm, *.html)" in "Als Typ speichern", dann speichern.

Sie können dann die gespeicherte HTML-Datei in Microsoft Word öffnen und sie wird als Tabelle anstelle von Nur-Text angezeigt.

 2
Author: Arseni Mourzenko,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2010-07-09 00:36:58

Www.freepdftoword.org - kostenloser online-service. Führt eine zuverlässige Aufgabe zum Erstellen echter Tabellenobjekte in Word aus.

 2
Author: Michael,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2010-07-09 20:19:44

Dies ist ein hartes. Wenn Sie die Mittel haben, ist die einfachste Lösung, die Person zu kontaktieren, die das PDF erstellt hat. Die Chancen stehen sie es von einem gemacht .doc-Datei. Wenn Sie das Original erhalten können, haben Sie das, was Sie brauchen, ohne dass eine Konvertierung erforderlich ist.

 1
Author: Travis,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2010-07-09 16:43:30

Ein verwandtes Q&A wurde anscheinend gelöscht: https://stackoverflow.com/questions/488089/extracting-tables-from-pdf-files-programmatically/857800 (siehe zwischengespeicherte version: http://webcache.googleusercontent.com/search?q=cache:9I328EN_d64J:stackoverflow.com/questions/488089/extracting-tables-from-pdf-files-programmatically/857800+&cd=1&hl=en&ct=clnk&gl=ch).

Unter meiner Antwort bestätige ich erneut, dass Okular eine ausgezeichnete Wahl für a ist schnelle Verschrottung Aktion.

Für eine schnelle (Einzel-?) Tabellenextraktion(en) Es lohnt sich, das hervorragende Tabellenauswahlwerkzeug von Okular zu überprüfen.

  1. Öffnen Sie die PDF-Datei und suchen Sie die betreffende Tabelle
  2. Aktivieren Sie das Tabellenauswahlwerkzeug mit Strg+5
  3. Zeichnen Sie einen rechteckigen Bereich, um die Tabelle einzuschließen
  4. definieren Sie schließlich bei Bedarf die vertikalen [[17]} und [[16]}horizontalen [[17]} Unterteilungen der Tabellenzellen, indem Sie auf Kanten klicken (möglicherweise müssen Sie ein wenig spielen, um auf die Idee zu kommen-siehe Screenshot unten).

Eine Auswahl mit dem Tabellenauswahlwerkzeug von Okular

Voila! Kopieren und Einfügen beispielsweise in eine leere Tabelle.

 1
Author: Nikos Alexandris,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2017-05-23 12:41:46

Ich mag es nicht, zusätzliche Software hinzuzufügen oder meine Daten außerhalb der Website an eine externe Site zu senden, um sie zu konvertieren. Normalerweise wegen des Zeitaspekts!

Aber innerhalb von PDFs können Sie Daten in Spalten auswählen, indem Sie Alt gedrückt halten und ziehen, solange Ihre Tabelle nicht riesig ist (dh Sie müssen es für jede Spalte tun). Kopieren und fügen Sie einfach jedes in Word ein.

Nicht ideal, aber es funktioniert, ohne etwas extra installieren zu müssen!

 0
Author: HaydnWVN,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2012-08-22 11:37:57

Ich konnte Tabellendaten erfolgreich über die Zwischenablage von Foxit PDF Reader direkt in MS Word, Excel und Atlassian Conflunce kopieren.

 0
Author: Vadzim,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/techietown.info/template/agent.layouts/content.php on line 61
2019-04-15 12:47:53