Inhalte aus PDF extrahieren (OCR)
Mit dem Text To Table Converter Add-On können Sie eine Optische Zeichenerkennung (OCR) bei PDF-Dateien durchführen, um alle Inhalte – einschließlich Text, Absätze, Listen, Tabellen und mathematische Formeln – zu extrahieren und als vollständig bearbeitbare Elemente direkt in Ihr Dokument in Google Docs™, Google Slides™ oder Google Sheets™ einzufügen.
Inhalte aus PDF extrahieren
Diese Funktion analysiert das Layout und die Struktur jeder PDF-Seite und wandelt visuelle Elemente intelligent in bearbeitbare Inhalte um, wobei die ursprüngliche Formatierung als Markdown erhalten bleibt.
-
Öffnen Sie das Werkzeug “Inhalt aus PDF extrahieren” Navigieren Sie durch das Google Workspace™-Menü:
Erweiterungen
>Text To Table Converter
>🪄 PDF-Werkzeuge
>Inhalt aus PDF extrahieren
. -
Wählen Sie eine PDF-Datei aus Das Werkzeug wird geöffnet und Sie werden aufgefordert, eine Datei auszuwählen. Sie können eine PDF-Datei aus Ihrem Google Drive™ auswählen oder eine direkt von Ihrem Computer hochladen.
-
Wählen Sie die zu extrahierenden Seiten aus Sobald eine PDF-Datei geladen ist, zeigt das Werkzeug ein Raster mit Miniaturansichten für jede Seite des Dokuments an.
- Klicken Sie auf bis zu 3 Seiten, aus denen Sie Inhalte extrahieren möchten. Ausgewählte Seiten werden hervorgehoben.
- Um eine größere Vorschau einer Seite anzuzeigen, doppelklicken Sie auf die Miniaturansicht.
-
Extrahieren Sie den Inhalt Nachdem Sie Ihre Seiten ausgewählt haben, klicken Sie auf die Schaltfläche Seite(n) extrahieren. Das Add-on verarbeitet jede ausgewählte Seite einzeln und fügt den extrahierten Inhalt in Ihr aktives Dokument ein.
- Die KI erkennt und konvertiert automatisch alle Inhaltstypen, einschließlich Absätze, Listen und Tabellen.
- Grundlegende Formatierungen wie Fett, Kursiv und
Code
bleiben erhalten.
Spezialfunktion: LaTeX-Formelextraktion
Eine Schlüsselfunktion des PDF-Extraktors ist seine Fähigkeit, mathematische und wissenschaftliche Formeln zu erkennen und sie automatisch in die Standard-LaTeX-Notation umzuwandeln (z. B. $$E=mc^2$$
).
Diese reine Textnotation kann dann mithilfe der integrierten LaTeX-Werkzeuge des Add-ons sofort in ein hochwertiges Gleichungsbild umgewandelt werden, was einen nahtlosen Arbeitsablauf von der PDF-Datei bis zum perfekt formatierten Dokument ermöglicht.