Импорт данных из PDF файла на лист Excel

PDF формат очень распространен на просторах Интернет, зачастую у пользователя возникает необходимость перенести табличные данные из PDF в Excel. C 2013-й версии пакета MS Office Word научился открывать PDF файлы, а вот Excel напрямую работать с PDF до сих пор не умеет. Существует несколько способов, кроме банального перепечатывания данных, провести подобную операцию.

Прежде чем приступить к рассмотрению непосредственно переноса табличных данных из PDF в Excel, следует отметить, что рассмотренные рекомендации не относятся к PDF файлам, которые содержат нераспознанный текст в виде картинок (как правило, сканированные электронные аналоги печатных изданий).

Первый способ.

Заключается в банальном выделении таблицы в PDF файле и копировании ее на лист Excel. Недостатком такого способа будет то, что данные скопируются в один столбец и придется их потом упорядочить по ячейкам.

Таблица из Pdf в Excel

Для приведенного выше примера, кроме ручного способа есть еще вариант, воспользоваться построением простой формулы для преобразования вертикального диапазона в таблицу. Таблицу будет достаточно легко преобразовать, т.к. она не имеет составных заголовков и строк, а также все ее ячейки заполнены данными, но что делать, если нужно преобразовать, например, такую таблицу.

Сложная таблица из pdf в Excel

Если бы проблема стояла только в преобразовании заголовка, можно было бы обойтись двумя формулами для преобразования вертикального диапазона или заголовок уже просто транспонировать вручную, но в самой таблице есть множество незаполненных ячеек и они при переносе игнорируются, другими словами, предугадать заранее количество столбцов не получится. Эту проблему решает второй способ.

Второй способ.

В начале материала мы упомянули, что, хоть и Excel не умеет работать с PDF на прямую, но Word то умеет это делать, причем для этого даже не обязательно открывать pdf файл в Word 2013 и выше, достаточно скопировать таблицу, как и в первом способе, и вставить с сохранением форматирования, либо применением форматирования документа Word.

Из Pdf в Excel с использованием Word

Способ хороший, но и он не лишен недостатков, к сожалению, вторую, более сложную таблицу удалось скопировать только после того, как pdf файл был открыт в самом текстовом процессоре MS Word (2016й версии), до этого, через буфер обмена, удавалось скопировать только строку заголовков. Так что, если через буфер обмена скопировать таблицу не получается, то можно попробовать открыть таблицу в Word, а потом скопировать ее в Excel.