Перейти до вмісту

Видобути вміст з PDF (OCR)

Іконка видобутку вмісту з PDF

За допомогою додатка Text To Table Converter ви можете виконувати Оптичне розпізнавання символів (OCR) у PDF-файлах, щоб видобути весь вміст — включаючи текст, абзаци, списки, таблиці та математичні формули — і вставляти його як повністю редаговані елементи безпосередньо у ваші документи Google Документи™, Google Презентації™ та Google Таблиці™.


Видобути вміст з PDF

Ця функція аналізує макет і структуру кожної сторінки PDF, інтелектуально перетворюючи візуальні елементи на редагований вміст, зберігаючи при цьому оригінальне форматування у вигляді Markdown.

Анімація, що показує новий робочий процес видобутку з PDF

  1. Відкрийте інструмент “Видобути Вміст з PDF” Перейдіть через меню Google Workspace™: Розширення > Text To Table Converter > 🪄 Інструменти PDF > Видобути Вміст з PDF.

  2. Виберіть PDF-файл Інструмент відкриється, запропонувавши вам вибрати файл. Ви можете вибрати PDF з вашого Google Drive™ або завантажити його безпосередньо з комп’ютера.

  3. Виберіть сторінки для видобування Після завантаження PDF-файлу інструмент відобразить сітку мініатюр попереднього перегляду для кожної сторінки документа.

    • Клацніть на до 3 сторінок, з яких ви хочете видобути вміст. Вибрані сторінки будуть виділені.
    • Щоб побачити більший попередній перегляд сторінки, двічі клацніть на її мініатюрі.
  4. Видобудьте вміст Після вибору сторінок натисніть кнопку Видобути сторінок. Додаток обробить кожну вибрану сторінку окремо і вставить видобутий вміст у ваш активний документ.

    • ШІ автоматично ідентифікує та перетворює всі типи вмісту, включаючи абзаци, списки та таблиці.
    • Базове форматування, таке як жирний, курсив та код, зберігається.

Спеціальна функція: Видобування формул LaTeX

Ключовою особливістю екстрактора PDF є його здатність розпізнавати математичні та наукові формули та автоматично перетворювати їх у стандартну нотацію LaTeX (наприклад, $$E=mc^2$$).

Цю текстову нотацію потім можна миттєво перетворити на високоякісне зображення рівняння за допомогою вбудованих інструментів LaTeX додатка, створюючи безперебійний робочий процес від PDF до ідеально відформатованого документа.