Jump to content
Модераторы форума - Assembler & Bercana
  • Откройте аккаунт на Диспуте за 5 минут

    Продаете недвижимость, машину, телефон, одежду?  Тысячи  просмотров ежедневно на dispute.az  помогут вам. Бесплатная доска обьявлений.

Конвертация jpg в pdf


OlgFag

Recommended Posts

Выкачал из библиотеки книгу в jpg, но размер очень большой 360МБ, сконвертировал ее в PDF думал там автоматическое сжатие идет но размер остался тот же. В принципе все  бы ни чего можно одну книгу такую потерпеть но хочу выкачивать оттуда десятки книг.

Обычно PDF книга пусть даже не текст около 6МБ.

Как сократить размер? 

Link to comment
Share on other sites

Я просто выделил все картинки и нажал объединить в PDF-XChange Editor.

Сейчас там же нашел оптимизацию документов, нажал по умолчанию сжало до 70Мб на минимальных настройках до 50Мб что тоже много, надо хотя бы до 10Мб ужать.

 

Просто что там в настройках править не разбираюсь, какие параметры выставлять.

 

24367899.jpg

 

PDF-XChange Editor

Link to comment
Share on other sites

7 hours ago, OlgFag said:

Выкачал из библиотеки книгу в jpg, но размер очень большой 360МБ, сконвертировал ее в PDF думал там автоматическое сжатие идет но размер остался тот же. В принципе все  бы ни чего можно одну книгу такую потерпеть но хочу выкачивать оттуда десятки книг.

Обычно PDF книга пусть даже не текст около 6МБ.

Как сократить размер

 

Думаю, только Optical Character Recognition ( OCR ) Вам поможет, если хватит терпения.

JPG  - сам по себе сжатый формат, а при преобразовании картинки в PDF, она картинкой и остается, просто в формате PDF. Сжимается хорошо только текст.

  • Like 1
  • Upvote 1
Link to comment
Share on other sites

Как вариант, JPG сначала перевести-распознать в текст через например Fine Reader и похожих прошграмм, а потом уже во что хотите. Но для этого буквы на фотке должны быть хорошо читаемы. 

 

Link to comment
Share on other sites

1 час назад, ilgar_m сказал:

 

Думаю, только Optical Character Recognition ( OCR ) Вам поможет, если хватит терпения.

JPG  - сам по себе сжатый формат, а при преобразовании картинки в PDF, она картинкой и остается, просто в формате PDF. Сжимается хорошо только текст.

 

В смысле в текст перегнать? Это в принципе самый идеальный вариант не из за размера а вообще из за удобства, просто все что было в txt уже нашел теперь ищу старые российские книги.

 

Я пробовал разные сервисы и проги, самая лучшая это гугл диск, но специально искал самые идеальные фото с большим разрешением все равно 100% не распознает и на странице бывают 5-10 ошибок, а теперь представьте что книга 300+ страниц и каждую надо редактировать, при чем редактировать не только текст в ворде но и проверять все ли скопировала прога ведь бывают пропуски.

В общем я думаю много лет еще ждать пока алгоритмы распознавания усовершенствуют.

А все сволочи копирасты виноваты, запрещают норм текс книги выкладывать пусть и сотни лет прошло с их выпуска.

 

 

 

 

 

Link to comment
Share on other sites

1 час назад, ilgar_m сказал:

 

Думаю, только Optical Character Recognition ( OCR ) Вам поможет, если хватит терпения.

JPG  - сам по себе сжатый формат, а при преобразовании картинки в PDF, она картинкой и остается, просто в формате PDF. Сжимается хорошо только текст.

 

Вроде есть специальные сканеры которые сразу в текст перегоняют но они у издательств есть которые по заказу на них выпускают старые книги.

Link to comment
Share on other sites

ABBY FineReader поможет. Если jpeg сжимать дальше, глаза поломаются читать. Можно попробовать 16-цветный  gif сделать из оригинального jpeg, но не факт, что будет меньше. Jpeg full colour, но для текста это пофиг, только место занимает. Ещё Bluebeam Revu позволяет гибко настраивать сжатие PDF.

Link to comment
Share on other sites

1 час назад, Miriel сказал:

Лучше найдите другую библиотеку с нормальными форматами

 

Не дает большинство библиотек нормально скачивать в этой президентской и то большинство книг доступно только в электронном зале, те что выкладываются можно читать в специальном неудобном просмоторщике pdf

А уже умельцы сделали прогу что бы выкачивать оттуда исходные данные.

В Ахундовке тоже раньше все было доступно для скачивания а теперь много лет как шиш, только внутри можно читать или заказать и тебе платно сделают скан.

Link to comment
Share on other sites

1 час назад, Viktor Azev сказал:

DPI уменьшите до минимума, но тогда пострадает качество

 

Минимум какой?  В ручную до 100 уменьшил, вообще в этой проге в макс и минимальном сжатие на глаз разницы не заметил.

Link to comment
Share on other sites

10 minutes ago, OlgFag said:

 

Не дает большинство библиотек нормально скачивать в этой президентской и то большинство книг доступно только в электронном зале, те что выкладываются можно читать в специальном неудобном просмоторщике pdf

А уже умельцы сделали прогу что бы выкачивать оттуда исходные данные.

В Ахундовке тоже раньше все было доступно для скачивания а теперь много лет как шиш, только внутри можно читать или заказать и тебе платно сделают скан.

Это проблема, согласна. Я так этой Ахундовской и не пользовалась, но и с каждой книгой столько в конвекторе возиться не дело.

Может все в зип папку закинуть, тоже сожмет их.

Link to comment
Share on other sites

1 час назад, Miriel сказал:

Это проблема, согласна. Я так этой Ахундовской и не пользовалась, но и с каждой книгой столько в конвекторе возиться не дело.

Может все в зип папку закинуть, тоже сожмет их.

 

Сжимается только текст не фото. И неудобно каждый раз распаковывать.

Повозится можно был бы результат.

Link to comment
Share on other sites

1 час назад, PlatinumBest сказал:

используйте PDF Element Pro

 

PS: а что за сайт откуда качнули книгу? можете ссылку дать?

 

Я выше ссылку дал там внутри фото и ссылка на сайт, с сайта самостоятельно не выкачать, только читать.

Link to comment
Share on other sites

1 час назад, Miriel сказал:

Я так думаю,  что этот сайт

http://www.preslib.az/ru/ebooks.html

 

Там вообще то все в пдф можно спокойно качать, правда набирал пдф тот еще редактор и потому в книгах полно орфографических ошибок.

Link to comment
Share on other sites

Just now, OlgFag said:

 

Там вообще то все в пдф можно спокойно качать, правда набирал пдф тот еще редактор и потому в книгах полно орфографических ошибок.

Ну, тогда, еще потерпеть можно)

Link to comment
Share on other sites

49 минут назад, OlgFag сказал:

 

Минимум какой?  В ручную до 100 уменьшил, вообще в этой проге в макс и минимальном сжатие на глаз разницы не заметил.

у меня стоит acrobat DC на его вирт. принтере минимум 72 dpi

Link to comment
Share on other sites

2 hours ago, OlgFag said:

 

 самые идеальные фото с большим разрешением все равно 100% не распознает и на странице бывают 5-10 ошибок, а теперь представьте что книга 300+ страниц и каждую надо редактировать, при чем редактировать не только текст в ворде но и проверять все ли скопировала прога ведь бывают пропуски.

 

Да, потому-то я и писал про терпение.:wink:

А так, если фото - цветные, можно попробовать перегнать их в монохромные, больше идей нет.:sad:

Link to comment
Share on other sites

3 часа назад, Viktor Azev сказал:

у меня стоит acrobat DC на его вирт. принтере минимум 72 dpi

 

Да в Pdf элементе попробовал там тоже 72, 80Мб получилось.

Попробуйте в адобе сделать, какой размер выйдет сравнить.

Ссылка в 5 посте.

 

24370876.jpg

Link to comment
Share on other sites

9 часов назад, Murad Alasgarov сказал:

ABBY FineReader поможет. Если jpeg сжимать дальше, глаза поломаются читать. Можно попробовать 16-цветный  gif сделать из оригинального jpeg, но не факт, что будет меньше. Jpeg full colour, но для текста это пофиг, только место занимает. Ещё Bluebeam Revu позволяет гибко настраивать сжатие PDF.

 

Bluebeam Revu тяжелая очень прога, только инсталяшка больше гига весит, во время оптимизации больше гига пишет во временную папку непонятно для чего. Работает очень долго.

Выбрал Reduce Fili Size - минимальный размер

blu.pdf
Original:        386 060 712 Bytes
Final:        49 992 149 Bytes
Percent decrease:    87,05%

 

50Мб сделал другие проги до 55 сокращали. Но про скроллинге страницы прогружаються каждый раз а не мгновенно как в других оптимизациях.

Как тут в ручную сократить размер что выбрать?
 

24374987.jpg

Link to comment
Share on other sites

С картинками (jpeg) можно сделать только 2 действия: уменьшить разрешение (размер страницы в пикселях) и увеличить степень сжатия (текст сильно портится). Посмотрите, как это называется в программе. Степень сжатия обычно под параметром Quality, разрешение (resolution) не все программы меняют.

P.S. У меня Bluebeam 12, работает быстро...

Link to comment
Share on other sites

8 часов назад, Murad Alasgarov сказал:

С картинками (jpeg) можно сделать только 2 действия: уменьшить разрешение (размер страницы в пикселях) и увеличить степень сжатия (текст сильно портится). Посмотрите, как это называется в программе. Степень сжатия обычно под параметром Quality, разрешение (resolution) не все программы меняют.

P.S. У меня Bluebeam 12, работает быстро...

 

А можно пошагово расписать что в этой проге делать?

 

Вот на фото выше я сначала в автоматическом режиме сделал, ползунок перевел на макс компрессию, получилось 49Мб

 

Теперь сделал вручную, перевел Quality на Low и DPI на 72 больше ни чего не трогал, стало 46Мб.

 

24381869.jpg

 

Вот с этим файлом можете посмотреть что можно сделать? Я тут 3 картинки объединил для теста, кстати их на 97% сжала прога а все вместе только 84% получается.

 

https://cloud.mail.ru/public/Mj2F/EgkTJHu1Z

 

Эти настройки в Batch-Reduce File Size

Link to comment
Share on other sites

Вы всё правильно сделали. Ещё можно уменьшить Bit Depth (в самой верхней строчке, где Full Color). Также можно попробовать сжать ещё раз (уже сжатый файл), но текст может стать нечитаемым. Я всё таки рекомендую OCR, хранить текст в виде картинок непрактично, да и формат JPEG был создан для сжатия полноцветных градиентов, а не контрастной малоцветной картинки (текста). Конвертация в 16-цветный GIF может дать лучший результат (там может использоваться алгоритм сжатия, подобный ZIP).

Edited by Murad Alasgarov
Link to comment
Share on other sites

рисунки уменьшил в высоте до 950 пикселей (~60%)

конвертировал в grayscale

в Acrobat Pro собрал в файл

читабельный без проблем

29 мб получилось

если еще поиграть с размером и качеством, можно и меньше получить

 

Link to comment
Share on other sites

 

On 11/28/2018 at 3:29 AM, OlgFag said:

................................

Вот с этим файлом можете посмотреть что можно сделать? Я тут 3 картинки объединил для теста, кстати их на 97% сжала прога а все вместе только 84% получается.

 

https://cloud.mail.ru/public/Mj2F/EgkTJHu1Z

 

Эти настройки в Batch-Reduce File Size

 

Данный трехстраничный файл имеет размер 5,93 МБ. Открываем его в Adobe Acrobat Pro и распечатываем в принтере Adobe PDF с выбором в настройках минимального размера файла и черно-белой печати с качеством 72dpi. Полученный файл имеет размер 391 КБ. Пересохраняем его с использованием функции уменьшения размера файла. В итоге получаем файл размером 355 КБ, что составляет меньше 6% размера исходного файла.

 

P.S. Кстати, как называется эта книга?

Link to comment
Share on other sites

В 28.11.2018 в 12:08, Murad Alasgarov сказал:

Я всё таки рекомендую OCR, хранить текст в виде картинок непрактично

 

Все кто пишет об OCR вот обычный файл, не древний петровский шрифт который тяжело распознавать, прогоните его через свои проги и покажите что получилось? Каждую страницу надо редактировать.

http://static.bsu.az/w8/Tarix ve onun problem/2010 2/81-90.pdf

 

А вот более сложный текст, хоть какая прога его осилит?

 

https://vivaldi.nlr.ru/bx000011551/view#page=7

https://vivaldi.nlr.ru/bx000011551/view#page=11

Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
  • Our picks

    • Всплыли новые подробности в связи с подозреваемым в убийстве своих родителей в Сумгайыте - ОБНОВЛЕНО + ВИДЕО
      Стали известны новые подробности в связи с Фикретом Мамедовым, подозреваемым в убийстве членов своей семьи в Сумгайыте. 
      Согласно полученной Oxu.Аz информации, молодой человек был участником второй Карабахской войны. 
      Как стало известно Qafqazinfo, в ходе предварительного расследования было установлено, что он употреблял наркотики.
      Утверждается, что Ф.Мамедов часто требовал у родителей денег и поэтому дома между ними постоянно происходили конфликты. По аналогичной причине 8 апреля Фикрет подрался со своим другом детства. Полицейские, дежурившие рядом с местом происшествия, попытались задержать Мамедова, но тот оказал сопротивление.
      В тот же день на Фикрета Мамедова в 3-м отделении Сумгайытского городского управления полиции был составлен протокол по статьям 510 (мелкое хулиганство) и 535 (злостное неповиновение законному требованию работника полиции или военнослужащего) Кодекса об административных проступках. Суд оштрафовал подозреваемого на 150 манатов за совершенное деяние и освободил его.
      В настоящее время продолжается расследование с целью выяснения причин убийства.
      10:52
      Фикрет Мамедов подозревается в убийстве своих родителей в общежитии №18 в 41-м квартале Сумгайыта.
      Отмечается, что он предоставлял услуги такси. Некоторые из соседей заявили, что в семье время от времени возникали конфликты. 
      Однако одна из соседок сообщила Baku TV, что Фикрет был приветливым и спокойным, да и все члены семьи были очень дружелюбными.
      "Мы только услышали крики о помощи. Но когда мы пришли, было уже поздно", - сказала она.
      Подробнее - в сюжете.
      • 1 reply
    • Названы причины закрытия Бакинского французского лицея
      В Бакинском французском лицее (БФЛ) обнародовали причины приостановки деятельности спустя 10 лет работы.
        • Haha
      • 13 replies
    • Утопленные автомобили из Дубая могут оказаться в Азербайджане: как распознать «утопленника»? - ВИДЕО
      Интенсивные дожди, наблюдающиеся в Дубае (ОАЭ) в последние дни, затопили многие жилые районы города. Больше всего от этого пострадали автовладельцы, так как в результате природного явления множество машин разных марок оказалось под водой.
      Как сообщает Xezerxeber.az, в Азербайджан автомобили в основном импортируются с рынков США, Кореи и Дубая.
      Поскольку привезти машину из Дубая в Азербайджан можно в кратчайшие сроки, то есть за 15 дней, предприниматели предпочитают именно этот вариант. Данная ситуация говорит о том, что автомобили с «подмоченной репутацией» могут быть доставлены также и в нашу страну.
      По словам автомеханика Сахиля Агабейли, обычно бизнесмены покупают такие машины в несколько раз дешевле.
        Однако распознать такой автомобиль можно по нескольким признакам: следам плесени и ржавчины, а затем гнили, особенно в нижней части транспортного средства. Мастер отметил, что, лица, торгующие машинами, чистят и красят днище таких автомобилей. Покупатели также могут определить эти изменения.
      Автомеханик добавил, что, в отличие от автомобилей с двигателями внутреннего сгорания, стоимость ремонта «утопленников» выше. И вождение таких транспортных средств представляет риски даже после ремонта.
      Подробнее - в сюжете:
       
      • 6 replies
    • Эксперты ВОЗ обеспокоены по поводу возможности распространения птичьего гриппа среди людей
      Глобальное распространение вируса птичьего гриппа среди млекопитающих, включая людей, представляет собой серьезную проблему для общественного здравоохранения.
        • Like
      • 15 replies
    • Отца и друга азербайджанца, подозреваемого в убийстве москвича из-за парковки, задержали
      Отца и приятеля мужчины, которого подозревают в убийстве жителя Москвы возле дома в
      • 113 replies
    • Почему результаты выпускного экзамена у мальчиков ухудшились по сравнению с девочками? - ВИДЕО
      Согласно статистике Государственного экзаменационного центра, результаты тестов у девочек выше, чем у мальчиков.
      Было отмечено, что начиная с 2001-2009 годов поступление девочек-абитуриентов в высшие учебные заведения стремительно росло.
      В 2010-2022 годах девочки превзошли мальчиков в этом соотношении.
        Эксперт по образованию Адиль Велиев считает, что причиной этого может быть то, что мальчики больше отвлекаются.
      Подробнее - в видео Xəzər TV.
       
      • 25 replies
    • Брат жестоко убитой в Казахстане Салтанат Нукеновой дал эксклюзивное интервью - ВИДЕО
      Жуткая, потрясшая всех история убийства хрупкой женщины ее мужем, возможно, не получила бы такой огласки, если бы не ее семья и брат. 
      Речь идет о громком деле об убийстве Салтанат Нукеновой ее мужем, экс-министром экономики Казахстана Куандыком Бишимбаевым. Внимание людей по всему миру сейчас приковано к трансляции судебного заседания - сможет ли влиятельный, состоятельный убийца избежать справедливого наказания? 
      Baku TV Ru поговорил с Айтбеком Амангельды, братом Салтанат, о погибшей сестре, о ее взаимоотношениях с мужем и семьей, о ее прошлом, о семьях Нукеновой и Бишимбаева, и о многом другом.
      В эксклюзивном интервью он также рассказал о том, повлияло ли данное дело на изменение взглядов общества, о психологе преступника, поступали ли угрозы ему от семьи Бишимбаева и т.д.
        Подробнее - в сюжете.
       

       
      • 6 replies
    • Буллинг в школах и агрессия в обществе. Новый выпуск «Поговорим?» - ВИДЕО
      Журналист Гамид Гамидов в новом выпуске программы «Поговорим?» представил очередное видеоинтервью. И на этот раз формат передачи несколько отличался от предыдущих выпусков - кроме знакомого ведущего в данном выпуске приняли участие его коллеги – журналисты Джамиля Алекперова, Джавид Османов и Mick Bloom.
      Журналисты обсудили насущные социальные темы, связанные с насилием. Возникает ощущение, что с начала года количество новостей, которые «пугают», стало расти.
        Комментируя данную тенденцию, собеседники в своих обсуждениях затронули буллинг в школах, уважение к старшим и тему безнаказанности, поговорили о том, нужно ли закрывать тик-ток и, как можно сократить уровень агрессии в обществе...
      • 24 replies
  • Recently Browsing   0 members, 0 guests

    • No registered users viewing this page.
×
×
  • Create New...