Jump to content
Модераторы форума - Assembler & Bercana
  • Откройте аккаунт на Диспуте за 5 минут

    Продаете недвижимость, машину, телефон, одежду?  Тысячи  просмотров ежедневно на dispute.az  помогут вам. Бесплатная доска обьявлений.

Конвертация jpg в pdf


OlgFag

Recommended Posts

Выкачал из библиотеки книгу в jpg, но размер очень большой 360МБ, сконвертировал ее в PDF думал там автоматическое сжатие идет но размер остался тот же. В принципе все  бы ни чего можно одну книгу такую потерпеть но хочу выкачивать оттуда десятки книг.

Обычно PDF книга пусть даже не текст около 6МБ.

Как сократить размер? 

Link to comment
Share on other sites

Я просто выделил все картинки и нажал объединить в PDF-XChange Editor.

Сейчас там же нашел оптимизацию документов, нажал по умолчанию сжало до 70Мб на минимальных настройках до 50Мб что тоже много, надо хотя бы до 10Мб ужать.

 

Просто что там в настройках править не разбираюсь, какие параметры выставлять.

 

24367899.jpg

 

PDF-XChange Editor

Link to comment
Share on other sites

7 hours ago, OlgFag said:

Выкачал из библиотеки книгу в jpg, но размер очень большой 360МБ, сконвертировал ее в PDF думал там автоматическое сжатие идет но размер остался тот же. В принципе все  бы ни чего можно одну книгу такую потерпеть но хочу выкачивать оттуда десятки книг.

Обычно PDF книга пусть даже не текст около 6МБ.

Как сократить размер

 

Думаю, только Optical Character Recognition ( OCR ) Вам поможет, если хватит терпения.

JPG  - сам по себе сжатый формат, а при преобразовании картинки в PDF, она картинкой и остается, просто в формате PDF. Сжимается хорошо только текст.

  • Like 1
  • Upvote 1
Link to comment
Share on other sites

Как вариант, JPG сначала перевести-распознать в текст через например Fine Reader и похожих прошграмм, а потом уже во что хотите. Но для этого буквы на фотке должны быть хорошо читаемы. 

 

Link to comment
Share on other sites

1 час назад, ilgar_m сказал:

 

Думаю, только Optical Character Recognition ( OCR ) Вам поможет, если хватит терпения.

JPG  - сам по себе сжатый формат, а при преобразовании картинки в PDF, она картинкой и остается, просто в формате PDF. Сжимается хорошо только текст.

 

В смысле в текст перегнать? Это в принципе самый идеальный вариант не из за размера а вообще из за удобства, просто все что было в txt уже нашел теперь ищу старые российские книги.

 

Я пробовал разные сервисы и проги, самая лучшая это гугл диск, но специально искал самые идеальные фото с большим разрешением все равно 100% не распознает и на странице бывают 5-10 ошибок, а теперь представьте что книга 300+ страниц и каждую надо редактировать, при чем редактировать не только текст в ворде но и проверять все ли скопировала прога ведь бывают пропуски.

В общем я думаю много лет еще ждать пока алгоритмы распознавания усовершенствуют.

А все сволочи копирасты виноваты, запрещают норм текс книги выкладывать пусть и сотни лет прошло с их выпуска.

 

 

 

 

 

Link to comment
Share on other sites

1 час назад, ilgar_m сказал:

 

Думаю, только Optical Character Recognition ( OCR ) Вам поможет, если хватит терпения.

JPG  - сам по себе сжатый формат, а при преобразовании картинки в PDF, она картинкой и остается, просто в формате PDF. Сжимается хорошо только текст.

 

Вроде есть специальные сканеры которые сразу в текст перегоняют но они у издательств есть которые по заказу на них выпускают старые книги.

Link to comment
Share on other sites

ABBY FineReader поможет. Если jpeg сжимать дальше, глаза поломаются читать. Можно попробовать 16-цветный  gif сделать из оригинального jpeg, но не факт, что будет меньше. Jpeg full colour, но для текста это пофиг, только место занимает. Ещё Bluebeam Revu позволяет гибко настраивать сжатие PDF.

Link to comment
Share on other sites

1 час назад, Miriel сказал:

Лучше найдите другую библиотеку с нормальными форматами

 

Не дает большинство библиотек нормально скачивать в этой президентской и то большинство книг доступно только в электронном зале, те что выкладываются можно читать в специальном неудобном просмоторщике pdf

А уже умельцы сделали прогу что бы выкачивать оттуда исходные данные.

В Ахундовке тоже раньше все было доступно для скачивания а теперь много лет как шиш, только внутри можно читать или заказать и тебе платно сделают скан.

Link to comment
Share on other sites

1 час назад, Viktor Azev сказал:

DPI уменьшите до минимума, но тогда пострадает качество

 

Минимум какой?  В ручную до 100 уменьшил, вообще в этой проге в макс и минимальном сжатие на глаз разницы не заметил.

Link to comment
Share on other sites

10 minutes ago, OlgFag said:

 

Не дает большинство библиотек нормально скачивать в этой президентской и то большинство книг доступно только в электронном зале, те что выкладываются можно читать в специальном неудобном просмоторщике pdf

А уже умельцы сделали прогу что бы выкачивать оттуда исходные данные.

В Ахундовке тоже раньше все было доступно для скачивания а теперь много лет как шиш, только внутри можно читать или заказать и тебе платно сделают скан.

Это проблема, согласна. Я так этой Ахундовской и не пользовалась, но и с каждой книгой столько в конвекторе возиться не дело.

Может все в зип папку закинуть, тоже сожмет их.

Link to comment
Share on other sites

1 час назад, Miriel сказал:

Это проблема, согласна. Я так этой Ахундовской и не пользовалась, но и с каждой книгой столько в конвекторе возиться не дело.

Может все в зип папку закинуть, тоже сожмет их.

 

Сжимается только текст не фото. И неудобно каждый раз распаковывать.

Повозится можно был бы результат.

Link to comment
Share on other sites

1 час назад, PlatinumBest сказал:

используйте PDF Element Pro

 

PS: а что за сайт откуда качнули книгу? можете ссылку дать?

 

Я выше ссылку дал там внутри фото и ссылка на сайт, с сайта самостоятельно не выкачать, только читать.

Link to comment
Share on other sites

1 час назад, Miriel сказал:

Я так думаю,  что этот сайт

http://www.preslib.az/ru/ebooks.html

 

Там вообще то все в пдф можно спокойно качать, правда набирал пдф тот еще редактор и потому в книгах полно орфографических ошибок.

Link to comment
Share on other sites

Just now, OlgFag said:

 

Там вообще то все в пдф можно спокойно качать, правда набирал пдф тот еще редактор и потому в книгах полно орфографических ошибок.

Ну, тогда, еще потерпеть можно)

Link to comment
Share on other sites

49 минут назад, OlgFag сказал:

 

Минимум какой?  В ручную до 100 уменьшил, вообще в этой проге в макс и минимальном сжатие на глаз разницы не заметил.

у меня стоит acrobat DC на его вирт. принтере минимум 72 dpi

Link to comment
Share on other sites

2 hours ago, OlgFag said:

 

 самые идеальные фото с большим разрешением все равно 100% не распознает и на странице бывают 5-10 ошибок, а теперь представьте что книга 300+ страниц и каждую надо редактировать, при чем редактировать не только текст в ворде но и проверять все ли скопировала прога ведь бывают пропуски.

 

Да, потому-то я и писал про терпение.:wink:

А так, если фото - цветные, можно попробовать перегнать их в монохромные, больше идей нет.:sad:

Link to comment
Share on other sites

3 часа назад, Viktor Azev сказал:

у меня стоит acrobat DC на его вирт. принтере минимум 72 dpi

 

Да в Pdf элементе попробовал там тоже 72, 80Мб получилось.

Попробуйте в адобе сделать, какой размер выйдет сравнить.

Ссылка в 5 посте.

 

24370876.jpg

Link to comment
Share on other sites

9 часов назад, Murad Alasgarov сказал:

ABBY FineReader поможет. Если jpeg сжимать дальше, глаза поломаются читать. Можно попробовать 16-цветный  gif сделать из оригинального jpeg, но не факт, что будет меньше. Jpeg full colour, но для текста это пофиг, только место занимает. Ещё Bluebeam Revu позволяет гибко настраивать сжатие PDF.

 

Bluebeam Revu тяжелая очень прога, только инсталяшка больше гига весит, во время оптимизации больше гига пишет во временную папку непонятно для чего. Работает очень долго.

Выбрал Reduce Fili Size - минимальный размер

blu.pdf
Original:        386 060 712 Bytes
Final:        49 992 149 Bytes
Percent decrease:    87,05%

 

50Мб сделал другие проги до 55 сокращали. Но про скроллинге страницы прогружаються каждый раз а не мгновенно как в других оптимизациях.

Как тут в ручную сократить размер что выбрать?
 

24374987.jpg

Link to comment
Share on other sites

С картинками (jpeg) можно сделать только 2 действия: уменьшить разрешение (размер страницы в пикселях) и увеличить степень сжатия (текст сильно портится). Посмотрите, как это называется в программе. Степень сжатия обычно под параметром Quality, разрешение (resolution) не все программы меняют.

P.S. У меня Bluebeam 12, работает быстро...

Link to comment
Share on other sites

8 часов назад, Murad Alasgarov сказал:

С картинками (jpeg) можно сделать только 2 действия: уменьшить разрешение (размер страницы в пикселях) и увеличить степень сжатия (текст сильно портится). Посмотрите, как это называется в программе. Степень сжатия обычно под параметром Quality, разрешение (resolution) не все программы меняют.

P.S. У меня Bluebeam 12, работает быстро...

 

А можно пошагово расписать что в этой проге делать?

 

Вот на фото выше я сначала в автоматическом режиме сделал, ползунок перевел на макс компрессию, получилось 49Мб

 

Теперь сделал вручную, перевел Quality на Low и DPI на 72 больше ни чего не трогал, стало 46Мб.

 

24381869.jpg

 

Вот с этим файлом можете посмотреть что можно сделать? Я тут 3 картинки объединил для теста, кстати их на 97% сжала прога а все вместе только 84% получается.

 

https://cloud.mail.ru/public/Mj2F/EgkTJHu1Z

 

Эти настройки в Batch-Reduce File Size

Link to comment
Share on other sites

Вы всё правильно сделали. Ещё можно уменьшить Bit Depth (в самой верхней строчке, где Full Color). Также можно попробовать сжать ещё раз (уже сжатый файл), но текст может стать нечитаемым. Я всё таки рекомендую OCR, хранить текст в виде картинок непрактично, да и формат JPEG был создан для сжатия полноцветных градиентов, а не контрастной малоцветной картинки (текста). Конвертация в 16-цветный GIF может дать лучший результат (там может использоваться алгоритм сжатия, подобный ZIP).

Edited by Murad Alasgarov
Link to comment
Share on other sites

рисунки уменьшил в высоте до 950 пикселей (~60%)

конвертировал в grayscale

в Acrobat Pro собрал в файл

читабельный без проблем

29 мб получилось

если еще поиграть с размером и качеством, можно и меньше получить

 

Link to comment
Share on other sites

 

On 11/28/2018 at 3:29 AM, OlgFag said:

................................

Вот с этим файлом можете посмотреть что можно сделать? Я тут 3 картинки объединил для теста, кстати их на 97% сжала прога а все вместе только 84% получается.

 

https://cloud.mail.ru/public/Mj2F/EgkTJHu1Z

 

Эти настройки в Batch-Reduce File Size

 

Данный трехстраничный файл имеет размер 5,93 МБ. Открываем его в Adobe Acrobat Pro и распечатываем в принтере Adobe PDF с выбором в настройках минимального размера файла и черно-белой печати с качеством 72dpi. Полученный файл имеет размер 391 КБ. Пересохраняем его с использованием функции уменьшения размера файла. В итоге получаем файл размером 355 КБ, что составляет меньше 6% размера исходного файла.

 

P.S. Кстати, как называется эта книга?

Link to comment
Share on other sites

В 28.11.2018 в 12:08, Murad Alasgarov сказал:

Я всё таки рекомендую OCR, хранить текст в виде картинок непрактично

 

Все кто пишет об OCR вот обычный файл, не древний петровский шрифт который тяжело распознавать, прогоните его через свои проги и покажите что получилось? Каждую страницу надо редактировать.

http://static.bsu.az/w8/Tarix ve onun problem/2010 2/81-90.pdf

 

А вот более сложный текст, хоть какая прога его осилит?

 

https://vivaldi.nlr.ru/bx000011551/view#page=7

https://vivaldi.nlr.ru/bx000011551/view#page=11

Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
  • Our picks

    • В Баку начинается строительство новой дороги
      С учетом перспективного развития города Баку Государственным агентством автомобильных дорог Азербайджана дается старт строительству новой автомобильной дороги от улицы Гасана Алиева до станции метро «Кероглу», параллельно проспекту Зии Буниядова.
      Об этом сообщили в госагентстве.
      Общая длина шестиполосной дороги составит 3896 метров с шириной полос 3,5 метра. На дороге будут построены четыре тоннеля и три подземных пешеходных перехода.
      В настоящее время от метро «Улдуз» в направлении улицы Алескера Гаибова ведутся работы по транспортировке тяжелой техники и оборудования на территорию.
      https://media.az/society/v-baku-nachinaetsya-stroitelstvo-novoj-dorogi
        • Haha
        • Like
      • 30 replies
    • В Баку выставлена на продажу квартира по фантастической цене - ФОТО
      В Баку выставлена на продажу квартира по фантастической цене.
      Как сообщает Oxu.Az, соответствующая информация распространена на сайтах объявлений.
      Так, девятикомнатную квартиру площадью 555 кв.м предлагают покупателям за 12 млн манатов.
        В объявлении упоминается, что на указанном этаже расположена только одна квартира и соседей не будет.
      https://ru.oxu.az/society/866997
        • Haha
        • Like
      • 96 replies
    • Где выгоднее отдыхать: в Азербайджане или за рубежом? - ОПРОС
      Baku TV провел опрос среди жителей столицы с целью узнать, где, по их мнению, выгодно отдыхать: в Азербайджане или за рубежом.
      Большинство участников опроса предпочло потратить деньги на отдых за границей.
      «Проживание в наших гостиницах обойдется в три раза дороже», - сказал один из опрошенных.
      Между тем сотрудники туристических компаний также отметили, что цены на отели за границей практически такие же, как у нас, а в некоторых случаях даже ниже.
      «Например, стоимость недельного тура на одного человека в Габалу начинается от 700 манатов. А тур на тот же период в Грузию обойдется от 500 манатов», - сказал один из них.
       
        • Like
      • 133 replies
    • Отомстил отцу за избиение матери: жуткие подробности убийства брата главы ИВ Лянкярана

      Долгое время подробности этого жуткого происшествия не разглашались ни во время следствия, ни в ходе судебного процесса. Судьи решили, что слушания должны проходить в закрытом режиме, без допуска СМИ.
      Однако Qafqazinfo удалось выяснить некоторые детали этой семейной трагедии. Согласно материала
        • Like
      • 35 replies
    • Депутат: Некоторых женщин убивают за то, что они не считают мужей главой семьи
      В последнее время в Азербайджане растет число женщин, убитых своими мужьями.
      По данным расследования Bizim.Media, за последние два месяца Генеральная прокуратура зарегистрировала около 10 фактов убийства женщин их супругами. Эта печальная статистика актуализирует вопрос о необходимости прохождения парами психологического анализа перед вступлением в брак.
      Между тем заместитель председателя комитета по правам человека Милли Меджлиса Таир Керимли в своем заявлении Bizim.Media отметил, что не испытывает оптимизма относительно идеи обязательного психологического анализа для пар перед свадьбой.
      «Прохождение медицинского осмотра перед браком обязательно, поскольку только так можно выявить скрытые заболевания. Но психологический анализ в Азербайджане не применяется, да и за рубежом такой широкой практики нет, и то лишь в добровольном порядке», - отметил депутат.
      Что касается женщин, убитых мужьями, Таир Керимли полагает, что это происходит из-за вопросов чести.
      «Одна из главных причин заключается в том, что некоторые дамы, прикрываясь гендерным равенством, создают образ сильной женщины и не считают мужей главой семьи, а некоторые и вовсе идут по плохому пути. То есть зачастую убийства женщин происходят из-за вопросов чести», - сказал он.
      Депутат призвал стремиться к построению чистого общества, чтобы никому даже в голову не приходило сворачивать на плохой путь.
      «В советское время тоже были случаи убийства женщин мужьями на почве ревности. В любом случае я не поддерживаю идею применения психологического анализа перед браком на законодательном уровне. Это будет своего рода унижением для пары: как будто мы проверяем, в своем ли они уме», - заключил Т.Керимли.
      https://media.az/society/deputat-nekotoryh-zhenshin-ubivayut-za-to-chto-oni-ne-schitayut-muzhej-glavoj-semi
        • Upvote
        • Red Heart
        • Like
      • 54 replies
    • В районе метро Гара Гараева продаётся объект под новостройкой
      В Низаминском районе,около станции метро Г.Гараева, под новостройкой на 1-м этаже (18/1) продается объект общей площадью 65 кв.м. Очень интенсивный пешеходный и автомобильный трафик. Имеются все условия, развитая инфраструктура, паркинг и т.д. Все документы в порядке, купчая на нежилое помещение.Оплата 1%.   Цена 550000  манат     0552522225
      • 0 replies
    • Можно ли использовать пенсионные накопления до выхода на пенсию?
      Пенсионный возраст в Азербайджане является предметом многочисленных дискуссий.
      Для мужчин он составляет 65 лет, для женщин – 63,5 года. Возрастной предел для женщин увеличивается на шесть месяцев каждый год, начиная с 1 июля 2017 года. В 2027-м возраст выхода на пенсию для мужчин и женщин будет одинаковым - 65 лет.
      Как долго гражданин может прожить после выхода на пенсию - никто не знает. Таким образом, накопленный за годы работы пенсионный капитал можно будет получать в лучшем случае 10-15 лет.
      Почему мы не можем использовать накопления раньше, чем выйдем на пенсию? Обязательно ли нам ждать 65 лет, чтобы воспользоваться своим правом?
      Подробнее об этом - в сюжете İTV:
      https://media.az/society/mozhno-li-ispolzovat-pensionnye-nakopleniya-do-vyhoda-na-pensiyu
        • Like
      • 54 replies
    • AstraZeneca признала, что ее вакцина от COVID-19 может спровоцировать тромбоз
      Компания AstraZeneca признала, что ее вакцина против COVID-19 может вызвать редкое, но смертельное нарушение свертываемости крови.
      Фармацевтический гигант уже столкнулся с огромным количеством исков, поданных близкими тех, кто получил серьезные заболевания или умер в результате инъекции, сообщает Daily Mail.
      Отмечается, что юристы, представляющие десятки коллективных исков, говорят, что стоимость некоторых дел их клиентов может достигать 25 миллионов долларов (42,5 млн манатов), и настаивают на том, что вакцина фармацевтической фирмы является дефектным продуктом.
        Подчеркивается, что AstraZeneca в феврале признала, что ее вакцина может в очень редких случаях провоцировать состояние, называемое тромбозом с синдромом тромбоцитопении или TTS. Он может вызвать у пациентов образование тромбов, а также низкое количество тромбоцитов, что в некоторых случаях серьезно навредило тем, кто воспользовался вакциной, или даже привело к летальному исходу.
      Потенциальное осложнение было указано в качестве возможного побочного эффекта с момента выпуска вакцины, но признание AstraZeneca в феврале стало первым случаем, когда фармацевтический гигант сделал это в суде, сообщает Telegraph.
       
        • Upvote
        • Red Heart
        • Like
      • 452 replies
  • Recently Browsing   0 members, 0 guests

    • No registered users viewing this page.
×
×
  • Create New...