Aller au contenu

Extraire le contenu du PDF ou des images (OCR)

Icône d'extraction de contenu de PDF

Avec le module complémentaire Text To Table Converter, vous pouvez effectuer une Reconnaissance Optique de Caractères (OCR) sur des fichiers PDF ou d’images pour extraire tout le contenu — y compris le texte, les paragraphes, les listes, les tableaux et les formules mathématiques — et l’insérer en tant qu’éléments entièrement modifiables directement dans votre document Google Docs™, Google Slides™ ou Google Sheets™.


Cette fonctionnalité analyse la mise en page et la structure de chaque page du PDF, convertissant intelligemment les éléments visuels en contenu modifiable tout en préservant la mise en forme originale en Markdown.

Animation montrant le nouveau flux de travail d'extraction de PDF ou d'image

  1. Ouvrez l’outil “Extraire le Contenu du PDF ou des Images” Naviguez dans le menu de Google Workspace™ : Extensions > Text To Table Converter > 🪄 Outils PDF et Image > Extraire le Contenu du PDF ou des Images.

  2. Sélectionnez un fichier PDF ou une image L’outil s’ouvrira, vous invitant à sélectionner un fichier. Vous pouvez choisir un PDF ou une image depuis votre Google Drive™ ou en télécharger un directement depuis votre ordinateur.

  3. Choisissez les pages à extraire (PDFs) Une fois qu’un PDF est chargé, l’outil affichera une grille d’aperçus miniatures pour chaque page du document. Pour les images, l’image sélectionnée est affichée comme aperçu à extraire.

    • Cliquez sur jusqu’à 3 pages dont vous souhaitez extraire le contenu. Les pages sélectionnées seront mises en surbrillance.
    • Pour voir un aperçu plus grand d’une page, double-cliquez sur sa miniature.
  4. Extraire le contenu Après avoir sélectionné vos pages ou confirmé votre image, cliquez sur le bouton Extraire Page(s). Le module complémentaire traitera chaque page sélectionnée ou image individuellement et insérera le contenu extrait dans votre document actif.

    • L’IA identifie et convertit automatiquement tous les types de contenu, y compris les paragraphes, les listes et les tableaux.
    • La mise en forme de base telle que le gras, l’italique et le code est préservée.

Fonctionnalité Spéciale : Extraction de Formules LaTeX

Section intitulée « Fonctionnalité Spéciale : Extraction de Formules LaTeX »

Une caractéristique clé de l’extracteur de PDF est sa capacité à reconnaître les formules mathématiques et scientifiques et à les convertir automatiquement en notation LaTeX standard (par ex., $$E=mc^2$$).

Cette notation en texte brut peut ensuite être instantanément transformée en une image d’équation de haute qualité à l’aide des outils LaTeX intégrés au module complémentaire, créant ainsi un flux de travail transparent du PDF à un document parfaitement formaté.