Форум » Для флейма » Вытащить картинки из pdf » Ответить

Вытащить картинки из pdf

rvu: Пользуюсь программой PDFMate. Все бы ничего, но есть ограничение на порции файлов, порядка 600-800 pdf за один раз. А у нас, как обычно дикие объемы; я уже очумел эти картинки вынимать. Может кто сталкивался с такой проблемой? Есть еще какие программы для пакетной обработки? Может где-то можно раздобыть кусок программного кода и прикрутить его или хотя бы понять, как он работает? Или кто знает алгоритм, как эти рисунки вынимать?

Ответов - 5

SadStar2019: Уточни - что конкретно нужно Извлекать внедренные в PDF-файл растровые изображения или сохранить PDF-страницы как растровые файлы? Если обрабатываются сотни pdf-файлов то куда складывать изображения и как потом с этой кучей работать?

rvu: Нужно Извлекать внедренные в PDF-файл растровые изображения SadStar2019 пишет: Если обрабатываются сотни pdf-файлов то куда складывать изображения и как потом с этой кучей работать? Куда извлекать не особенно важно. Важно им присвоить имя оригинального pdf файла. Можно не самому файлу, а папки с ним. Так mate делает. Можно имя чуть видоизменить на конце, но главное, чтобы файл можно было однозначно идентифицировать. У нас есть программа-сборщик, которая всё это обработает.

SADSTAR33: http://www.xpdfreader.com/download.html среди "the Xpdf command line tools" есть утилита pdfimages.exe которая извлекает картинки. если написать в cmd-файл что-то типа for %%pdf in (*.pdf) do pdfimages -j -list %%p ".\img" > %%p.rep то можно получить внедренные картинки Правда у меня pdfimages.exe не запускается. Может потому что у меня WinXP. Проверь. Отпишись. Pls.


Dima: SADSTAR33 xp

rvu: Запуск pdfimages.exe -j <имя файла pdf> <результирующий каталог> выдает растровое изображение в формате .pbm Вообще-то это, похоже, то что нужно. Используя дальше ImageMagick можно его преобразовать во что угодно. Нам скорее всего нужны .png Спасибо!



полная версия страницы