Jump to content
OlgFag

Конвертация jpg в pdf

Recommended Posts

Выкачал из библиотеки книгу в jpg, но размер очень большой 360МБ, сконвертировал ее в PDF думал там автоматическое сжатие идет но размер остался тот же. В принципе все  бы ни чего можно одну книгу такую потерпеть но хочу выкачивать оттуда десятки книг.

Обычно PDF книга пусть даже не текст около 6МБ.

Как сократить размер? 

Share this post


Link to post
Share on other sites

А как вы его конвертировали?

 

В акробате можно сохранить pdf в уменьшенном размере.

  • Upvote 1

Share this post


Link to post
Share on other sites

Я просто выделил все картинки и нажал объединить в PDF-XChange Editor.

Сейчас там же нашел оптимизацию документов, нажал по умолчанию сжало до 70Мб на минимальных настройках до 50Мб что тоже много, надо хотя бы до 10Мб ужать.

 

Просто что там в настройках править не разбираюсь, какие параметры выставлять.

 

24367899.jpg

 

PDF-XChange Editor

Share this post


Link to post
Share on other sites

Скачайте проверьте в разных редакторах как сжимается.

https://cloud.mail.ru/public/6LPm/HRGs54LVb

Share this post


Link to post
Share on other sites

Вот все настройки может там что еще можно выбрать?

 

24368010.jpg

 

24368011.jpg

 

24368012.jpg

Share this post


Link to post
Share on other sites
7 hours ago, OlgFag said:

Выкачал из библиотеки книгу в jpg, но размер очень большой 360МБ, сконвертировал ее в PDF думал там автоматическое сжатие идет но размер остался тот же. В принципе все  бы ни чего можно одну книгу такую потерпеть но хочу выкачивать оттуда десятки книг.

Обычно PDF книга пусть даже не текст около 6МБ.

Как сократить размер

 

Думаю, только Optical Character Recognition ( OCR ) Вам поможет, если хватит терпения.

JPG  - сам по себе сжатый формат, а при преобразовании картинки в PDF, она картинкой и остается, просто в формате PDF. Сжимается хорошо только текст.

  • Upvote 1

Share this post


Link to post
Share on other sites

Как вариант, JPG сначала перевести-распознать в текст через например Fine Reader и похожих прошграмм, а потом уже во что хотите. Но для этого буквы на фотке должны быть хорошо читаемы. 

 

Share this post


Link to post
Share on other sites
1 час назад, ilgar_m сказал:

 

Думаю, только Optical Character Recognition ( OCR ) Вам поможет, если хватит терпения.

JPG  - сам по себе сжатый формат, а при преобразовании картинки в PDF, она картинкой и остается, просто в формате PDF. Сжимается хорошо только текст.

 

В смысле в текст перегнать? Это в принципе самый идеальный вариант не из за размера а вообще из за удобства, просто все что было в txt уже нашел теперь ищу старые российские книги.

 

Я пробовал разные сервисы и проги, самая лучшая это гугл диск, но специально искал самые идеальные фото с большим разрешением все равно 100% не распознает и на странице бывают 5-10 ошибок, а теперь представьте что книга 300+ страниц и каждую надо редактировать, при чем редактировать не только текст в ворде но и проверять все ли скопировала прога ведь бывают пропуски.

В общем я думаю много лет еще ждать пока алгоритмы распознавания усовершенствуют.

А все сволочи копирасты виноваты, запрещают норм текс книги выкладывать пусть и сотни лет прошло с их выпуска.

 

 

 

 

 

Share this post


Link to post
Share on other sites
1 час назад, ilgar_m сказал:

 

Думаю, только Optical Character Recognition ( OCR ) Вам поможет, если хватит терпения.

JPG  - сам по себе сжатый формат, а при преобразовании картинки в PDF, она картинкой и остается, просто в формате PDF. Сжимается хорошо только текст.

 

Вроде есть специальные сканеры которые сразу в текст перегоняют но они у издательств есть которые по заказу на них выпускают старые книги.

Share this post


Link to post
Share on other sites

ABBY FineReader поможет. Если jpeg сжимать дальше, глаза поломаются читать. Можно попробовать 16-цветный  gif сделать из оригинального jpeg, но не факт, что будет меньше. Jpeg full colour, но для текста это пофиг, только место занимает. Ещё Bluebeam Revu позволяет гибко настраивать сжатие PDF.

Share this post


Link to post
Share on other sites

DPI уменьшите до минимума, но тогда пострадает качество

Share this post


Link to post
Share on other sites

Лучше найдите другую библиотеку с нормальными форматами

Share this post


Link to post
Share on other sites
1 час назад, Miriel сказал:

Лучше найдите другую библиотеку с нормальными форматами

 

Не дает большинство библиотек нормально скачивать в этой президентской и то большинство книг доступно только в электронном зале, те что выкладываются можно читать в специальном неудобном просмоторщике pdf

А уже умельцы сделали прогу что бы выкачивать оттуда исходные данные.

В Ахундовке тоже раньше все было доступно для скачивания а теперь много лет как шиш, только внутри можно читать или заказать и тебе платно сделают скан.

Share this post


Link to post
Share on other sites
1 час назад, Viktor Azev сказал:

DPI уменьшите до минимума, но тогда пострадает качество

 

Минимум какой?  В ручную до 100 уменьшил, вообще в этой проге в макс и минимальном сжатие на глаз разницы не заметил.

Share this post


Link to post
Share on other sites
10 minutes ago, OlgFag said:

 

Не дает большинство библиотек нормально скачивать в этой президентской и то большинство книг доступно только в электронном зале, те что выкладываются можно читать в специальном неудобном просмоторщике pdf

А уже умельцы сделали прогу что бы выкачивать оттуда исходные данные.

В Ахундовке тоже раньше все было доступно для скачивания а теперь много лет как шиш, только внутри можно читать или заказать и тебе платно сделают скан.

Это проблема, согласна. Я так этой Ахундовской и не пользовалась, но и с каждой книгой столько в конвекторе возиться не дело.

Может все в зип папку закинуть, тоже сожмет их.

Share this post


Link to post
Share on other sites
1 час назад, Miriel сказал:

Это проблема, согласна. Я так этой Ахундовской и не пользовалась, но и с каждой книгой столько в конвекторе возиться не дело.

Может все в зип папку закинуть, тоже сожмет их.

 

Сжимается только текст не фото. И неудобно каждый раз распаковывать.

Повозится можно был бы результат.

Share this post


Link to post
Share on other sites

используйте PDF Element Pro

 

PS: а что за сайт откуда качнули книгу? можете ссылку дать?

Share this post


Link to post
Share on other sites
1 час назад, PlatinumBest сказал:

используйте PDF Element Pro

 

PS: а что за сайт откуда качнули книгу? можете ссылку дать?

 

Я выше ссылку дал там внутри фото и ссылка на сайт, с сайта самостоятельно не выкачать, только читать.

Share this post


Link to post
Share on other sites
3 minutes ago, PlatinumBest said:

используйте PDF Element Pro

 

PS: а что за сайт откуда качнули книгу? можете ссылку дать?

Я так думаю,  что этот сайт

http://www.preslib.az/ru/ebooks.html

Share this post


Link to post
Share on other sites
1 час назад, Miriel сказал:

Я так думаю,  что этот сайт

http://www.preslib.az/ru/ebooks.html

 

Там вообще то все в пдф можно спокойно качать, правда набирал пдф тот еще редактор и потому в книгах полно орфографических ошибок.

Share this post


Link to post
Share on other sites
Just now, OlgFag said:

 

Там вообще то все в пдф можно спокойно качать, правда набирал пдф тот еще редактор и потому в книгах полно орфографических ошибок.

Ну, тогда, еще потерпеть можно)

Share this post


Link to post
Share on other sites
7 минут назад, Miriel сказал:

Я так думаю,  что этот сайт

http://www.preslib.az/ru/ebooks.html

там относительно старые книги и полезного почти не найдешь)

Share this post


Link to post
Share on other sites
49 минут назад, OlgFag сказал:

 

Минимум какой?  В ручную до 100 уменьшил, вообще в этой проге в макс и минимальном сжатие на глаз разницы не заметил.

у меня стоит acrobat DC на его вирт. принтере минимум 72 dpi

Share this post


Link to post
Share on other sites
2 hours ago, OlgFag said:

 

 самые идеальные фото с большим разрешением все равно 100% не распознает и на странице бывают 5-10 ошибок, а теперь представьте что книга 300+ страниц и каждую надо редактировать, при чем редактировать не только текст в ворде но и проверять все ли скопировала прога ведь бывают пропуски.

 

Да, потому-то я и писал про терпение.:wink:

А так, если фото - цветные, можно попробовать перегнать их в монохромные, больше идей нет.:sad:

Share this post


Link to post
Share on other sites
3 часа назад, Viktor Azev сказал:

у меня стоит acrobat DC на его вирт. принтере минимум 72 dpi

 

Да в Pdf элементе попробовал там тоже 72, 80Мб получилось.

Попробуйте в адобе сделать, какой размер выйдет сравнить.

Ссылка в 5 посте.

 

24370876.jpg

Share this post


Link to post
Share on other sites
9 часов назад, Murad Alasgarov сказал:

ABBY FineReader поможет. Если jpeg сжимать дальше, глаза поломаются читать. Можно попробовать 16-цветный  gif сделать из оригинального jpeg, но не факт, что будет меньше. Jpeg full colour, но для текста это пофиг, только место занимает. Ещё Bluebeam Revu позволяет гибко настраивать сжатие PDF.

 

Bluebeam Revu тяжелая очень прога, только инсталяшка больше гига весит, во время оптимизации больше гига пишет во временную папку непонятно для чего. Работает очень долго.

Выбрал Reduce Fili Size - минимальный размер

blu.pdf
Original:        386 060 712 Bytes
Final:        49 992 149 Bytes
Percent decrease:    87,05%

 

50Мб сделал другие проги до 55 сокращали. Но про скроллинге страницы прогружаються каждый раз а не мгновенно как в других оптимизациях.

Как тут в ручную сократить размер что выбрать?
 

24374987.jpg

Share this post


Link to post
Share on other sites

С картинками (jpeg) можно сделать только 2 действия: уменьшить разрешение (размер страницы в пикселях) и увеличить степень сжатия (текст сильно портится). Посмотрите, как это называется в программе. Степень сжатия обычно под параметром Quality, разрешение (resolution) не все программы меняют.

P.S. У меня Bluebeam 12, работает быстро...

Share this post


Link to post
Share on other sites
8 часов назад, Murad Alasgarov сказал:

С картинками (jpeg) можно сделать только 2 действия: уменьшить разрешение (размер страницы в пикселях) и увеличить степень сжатия (текст сильно портится). Посмотрите, как это называется в программе. Степень сжатия обычно под параметром Quality, разрешение (resolution) не все программы меняют.

P.S. У меня Bluebeam 12, работает быстро...

 

А можно пошагово расписать что в этой проге делать?

 

Вот на фото выше я сначала в автоматическом режиме сделал, ползунок перевел на макс компрессию, получилось 49Мб

 

Теперь сделал вручную, перевел Quality на Low и DPI на 72 больше ни чего не трогал, стало 46Мб.

 

24381869.jpg

 

Вот с этим файлом можете посмотреть что можно сделать? Я тут 3 картинки объединил для теста, кстати их на 97% сжала прога а все вместе только 84% получается.

 

https://cloud.mail.ru/public/Mj2F/EgkTJHu1Z

 

Эти настройки в Batch-Reduce File Size

Share this post


Link to post
Share on other sites

Вы всё правильно сделали. Ещё можно уменьшить Bit Depth (в самой верхней строчке, где Full Color). Также можно попробовать сжать ещё раз (уже сжатый файл), но текст может стать нечитаемым. Я всё таки рекомендую OCR, хранить текст в виде картинок непрактично, да и формат JPEG был создан для сжатия полноцветных градиентов, а не контрастной малоцветной картинки (текста). Конвертация в 16-цветный GIF может дать лучший результат (там может использоваться алгоритм сжатия, подобный ZIP).

Edited by Murad Alasgarov

Share this post


Link to post
Share on other sites

рисунки уменьшил в высоте до 950 пикселей (~60%)

конвертировал в grayscale

в Acrobat Pro собрал в файл

читабельный без проблем

29 мб получилось

если еще поиграть с размером и качеством, можно и меньше получить

 

Share this post


Link to post
Share on other sites

 

On 11/28/2018 at 3:29 AM, OlgFag said:

................................

Вот с этим файлом можете посмотреть что можно сделать? Я тут 3 картинки объединил для теста, кстати их на 97% сжала прога а все вместе только 84% получается.

 

https://cloud.mail.ru/public/Mj2F/EgkTJHu1Z

 

Эти настройки в Batch-Reduce File Size

 

Данный трехстраничный файл имеет размер 5,93 МБ. Открываем его в Adobe Acrobat Pro и распечатываем в принтере Adobe PDF с выбором в настройках минимального размера файла и черно-белой печати с качеством 72dpi. Полученный файл имеет размер 391 КБ. Пересохраняем его с использованием функции уменьшения размера файла. В итоге получаем файл размером 355 КБ, что составляет меньше 6% размера исходного файла.

 

P.S. Кстати, как называется эта книга?

Share this post


Link to post
Share on other sites
В 28.11.2018 в 12:08, Murad Alasgarov сказал:

Я всё таки рекомендую OCR, хранить текст в виде картинок непрактично

 

Все кто пишет об OCR вот обычный файл, не древний петровский шрифт который тяжело распознавать, прогоните его через свои проги и покажите что получилось? Каждую страницу надо редактировать.

http://static.bsu.az/w8/Tarix ve onun problem/2010 2/81-90.pdf

 

А вот более сложный текст, хоть какая прога его осилит?

 

https://vivaldi.nlr.ru/bx000011551/view#page=7

https://vivaldi.nlr.ru/bx000011551/view#page=11

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

  • Recently Browsing   0 members, 0 guests

    No registered users viewing this page.

×