Видобути вміст з PDF (OCR)
За допомогою додатка Text To Table Converter ви можете виконувати Оптичне розпізнавання символів (OCR) у PDF-файлах, щоб видобути весь вміст — включаючи текст, абзаци, списки, таблиці та математичні формули — і вставляти його як повністю редаговані елементи безпосередньо у ваші документи Google Документи™, Google Презентації™ та Google Таблиці™.
Видобути вміст з PDF
Ця функція аналізує макет і структуру кожної сторінки PDF, інтелектуально перетворюючи візуальні елементи на редагований вміст, зберігаючи при цьому оригінальне форматування у вигляді Markdown.
-
Відкрийте інструмент “Видобути Вміст з PDF” Перейдіть через меню Google Workspace™:
Розширення
>Text To Table Converter
>🪄 Інструменти PDF
>Видобути Вміст з PDF
. -
Виберіть PDF-файл Інструмент відкриється, запропонувавши вам вибрати файл. Ви можете вибрати PDF з вашого Google Drive™ або завантажити його безпосередньо з комп’ютера.
-
Виберіть сторінки для видобування Після завантаження PDF-файлу інструмент відобразить сітку мініатюр попереднього перегляду для кожної сторінки документа.
- Клацніть на до 3 сторінок, з яких ви хочете видобути вміст. Вибрані сторінки будуть виділені.
- Щоб побачити більший попередній перегляд сторінки, двічі клацніть на її мініатюрі.
-
Видобудьте вміст Після вибору сторінок натисніть кнопку Видобути сторінок. Додаток обробить кожну вибрану сторінку окремо і вставить видобутий вміст у ваш активний документ.
- ШІ автоматично ідентифікує та перетворює всі типи вмісту, включаючи абзаци, списки та таблиці.
- Базове форматування, таке як жирний, курсив та
код
, зберігається.
Спеціальна функція: Видобування формул LaTeX
Ключовою особливістю екстрактора PDF є його здатність розпізнавати математичні та наукові формули та автоматично перетворювати їх у стандартну нотацію LaTeX (наприклад, $$E=mc^2$$
).
Цю текстову нотацію потім можна миттєво перетворити на високоякісне зображення рівняння за допомогою вбудованих інструментів LaTeX додатка, створюючи безперебійний робочий процес від PDF до ідеально відформатованого документа.