Автор Тема: Малки по размер PDF  (Прочетена 2453 пъти)

nov_chovek

  • Напреднали
  • *****
  • Публикации: 536
  • Distribution: Ubuntu 8.10 по принуда
  • Window Manager: Gnome
    • Профил
    • WWW
Малки по размер PDF
« -: Jan 08, 2009, 19:51 »
Исках само да споделя неволите си и съответно решението :)

Изключително много работя с xsane - сканиращия фронтенд на sane. Сканирам документи и ги правя на ПДФ. Проблема е, че при документи с много страници се получават огромни по размер ПДФ, което е неприемливо. Дори ако направите голяма JPG/zlib компресия пак стават огромни. Ръчкаш xsane, но не можах да намеря някакви други опции.

Решението:

Ако иамте докуемнт от много страници, сканирайте ги една по една в JPG формат и  ги именувайт с имена като 01.jpg, 02.jpg и т.н. и ги сложете в една директория (само те да са в нея) След това трика е следния:
Код:
convert *.jpg imen_na_document.pdf

и програмката прави магията :) Трика е да имате инсталиран ImageMagik пакета, понеже convert е част от него.

За мое улеснение си направих Nautilus Script, чрез който с един клик в директорията си правя PDF-a:

Код
GeSHi (Bash):
  1. #!/bin/sh
  2. convert *.jpg document.pdf | zenity --progress --title="Създаване на PDF"  --text="Създаване на файл document.pdf"  --percentage=0
  3.  

правите скрипта изпълним, слагате го в ~/.gnome2/nautilus-scripts , влизате в тази директория с наутилус и doubleclick върху него. Таква вече наутилус знае за скрипта. Сега като маркирате файл и щракнете с десен бутон, вече има подменю "Scripts" и въпросния скрипт вътре.

Еми това е. Поздрави.
 
Активен

romeo_ninov

  • Напреднали
  • *****
  • Публикации: 2155
    • Профил
Re: Малки по размер PDF
« Отговор #1 -: Jan 08, 2009, 21:11 »
Намери опции да ги сканираш като сиви тифове и приложи (мисля че се поддържа ZIP) компресия. А ако си хитър ще пуснеш сканираните файлове през OCR и получения документ през опенофис ще си спретнеш  PDF и то с десетки пъти по-малък размер
Активен

0x2B|~0x2B

mom

  • Напреднали
  • *****
  • Публикации: 266
  • Distribution: Ubuntu
  • Window Manager: Compiz
    • Профил
Re: Малки по размер PDF
« Отговор #2 -: Jan 08, 2009, 21:41 »
<офтопик>
romeo_nonov, аз преди година две се опитвах да пусна OCR под Linux, който да разпознава кирилица, но не намерих абсолютно нищо поне що-годе работещо. Ако си намерил нещо по въпроса, моля сподели.
</офтопик>
Активен

tarator

  • Напреднали
  • *****
  • Публикации: 849
    • Профил
Re: Малки по размер PDF
« Отговор #3 -: Jan 08, 2009, 21:58 »
Ако не държиш формата да е pdf, виж djvu формата.
Активен

A gentleman is one who is never rude unintentionally. - Noel Coward

mikis

  • Напреднали
  • *****
  • Публикации: 746
  • Distribution: Debian Testing
  • Window Manager: KDE
    • Профил
Re: Малки по размер PDF
« Отговор #4 -: Jan 08, 2009, 22:09 »
...А ако си хитър ще пуснеш сканираните файлове през OCR и получения документ през опенофис ще си спретнеш  PDF и то с десетки пъти по-малък размер
Темата за OCR под Линукс много ме вълнува и ако можеш да ми кажеш поне едно работещо решение, макар и комерсиално, ще съм ти много благодарен.
Активен

wfw

  • Напреднали
  • *****
  • Публикации: 249
  • Distribution: Debian
  • Window Manager: none
    • Профил
Re: Малки по размер PDF
« Отговор #5 -: Jan 08, 2009, 22:13 »
на работа имаме една копирна машина, която сканира по много интересен начин - тиф файловете са само с 2 цвята - бял и черен. размера на ПДФ-ите също е много малък - от порядъка на 60КБ за страница. явно ПДФ-ите са обединени тифове, както колегата казва да правиш с jpeg файловете.

ОС на копирната машина е netbsd  :o



Активен

romeo_ninov

  • Напреднали
  • *****
  • Публикации: 2155
    • Профил
Re: Малки по размер PDF
« Отговор #6 -: Jan 08, 2009, 22:15 »
<офтопик>
romeo_nonov, аз преди година две се опитвах да пусна OCR под Linux, който да разпознава кирилица, но не намерих абсолютно нищо поне що-годе работещо. Ако си намерил нещо по въпроса, моля сподели.
</офтопик>
Приятели руснаци последно много ми хвалиха cuneiform: https://launchpad.net/cuneiform-linux/+download (вече с отворен код)
Имайте предвид че в момента тече портирането на Линукс и не може да се очаква голяма стабилност :)
Със затворен код (не и за Линукс) има няколко решения, но не е тук мястото за дискусии по такава тема
Активен

0x2B|~0x2B

nov_chovek

  • Напреднали
  • *****
  • Публикации: 536
  • Distribution: Ubuntu 8.10 по принуда
  • Window Manager: Gnome
    • Профил
    • WWW
Re: Малки по размер PDF
« Отговор #7 -: Jan 08, 2009, 22:41 »
Намери опции да ги сканираш като сиви тифове и приложи (мисля че се поддържа ZIP) компресия. А ако си хитър ще пуснеш сканираните файлове през OCR и получения документ през опенофис ще си спретнеш  PDF и то с десетки пъти по-малък размер

Това го правих с опцията на xsane "Black & White - Line Art" - прави чернобели (2 цвята) тифове, който се комбинират после в PDF. Наистина се получават малки файлове, НО ако документа има бледи печати, те не излизат в документа, което не ме устройва.

Иначе за ORC, аз позлвам FineReader под wine. Знам, че не свободен софтуер, но върши работа, докато излезе свестен open source ORC за кирилица.

Знам за формата djvu, но общувам с държавни учреждения, затова ми трябва PDF.
« Последна редакция: Jan 08, 2009, 22:43 от nov_chovek »
Активен

gericom

  • Напреднали
  • *****
  • Публикации: 12
  • Distribution: Netrunner/Manjaro
  • Window Manager: Plasma 5
  • Netrunner Rolling
    • Профил
    • WWW
Re: Малки по размер PDF
« Отговор #8 -: Jan 08, 2009, 23:06 »
-------------------
Ако иамте докуемнт от много страници, сканирайте ги една по една в JPG формат и  ги именувайт с имена като 01.jpg, 02.jpg и т.н. и ги сложете в една директория (само те да са в нея) След това трика е следния:
Код:
convert *.jpg imen_na_document.pdf

Код
GeSHi (Bash):
  1. #!/bin/sh
  2. convert *.jpg document.pdf | zenity --progress --title="Създаване на PDF"  --text="Създаване на файл document.pdf"  --percentage=0
  3.  
---------------

Ето го същият скрипт, но леко редактиран, т.е. даденото име на file.jpg ще е и името на file.pdf

Код
GeSHi (Bash):
  1. #!/bin/sh
  2.  
  3. #image2pdf
  4. #
  5. # Made by nov_chovek @ http://www.linux-bg.org/forum/index.php?PHPSESSID=6631edf60045dc559d3ac208eb112d3f&action=profile;u=5843 and edited by gericom @ https://launchpad.net/~gericom
  6. #
  7. # This program is free software; you can redistribute it and/or modify
  8. # it under the terms of the GNU General Public License as published by
  9. # the Free Software Foundation; either version 2 of the License, or
  10. # (at your option) any later version.
  11. #
  12. # This program is distributed in the hope that it will be useful,
  13. # but WITHOUT ANY WARRANTY; without even the implied warranty of
  14. # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  15. # GNU General Public License for more details.
  16. #
  17. # You should have received a copy of the GNU General Public License
  18. # along with this program; if not, write to the Free Software
  19. # Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
  20.  
  21. convert *.jpg $@.pdf | zenity --progress --title="Converting to PDF"  --text="Making file $@.pdf"  --percentage=0
  22.  
  23.  
Активен

Linux is so simple operation system, but you must be a genius to understand its simplicity.

nov_chovek

  • Напреднали
  • *****
  • Публикации: 536
  • Distribution: Ubuntu 8.10 по принуда
  • Window Manager: Gnome
    • Профил
    • WWW
Re: Малки по размер PDF
« Отговор #9 -: Jan 08, 2009, 23:17 »
nikola_yanev, мерси за редакцията, не съм "на ти" с промеливите, затова добавката е ценна. 

Имената на файловете ги писах с цифри, понеже изглежда convert парсва по азбучен ред файловете. Та аko са с различни имена, ще се разбъркат страниците в PDF-a.
Активен

gericom

  • Напреднали
  • *****
  • Публикации: 12
  • Distribution: Netrunner/Manjaro
  • Window Manager: Plasma 5
  • Netrunner Rolling
    • Профил
    • WWW
Re: Малки по размер PDF
« Отговор #10 -: Jan 08, 2009, 23:25 »
nikola_yanev, мерси за редакцията, не съм "на ти" с промеливите, затова добавката е ценна. 

Имената на файловете ги писах с цифри, понеже изглежда convert парсва по азбучен ред файловете. Та аko са с различни имена, ще се разбъркат страниците в PDF-a.

Моля,
радвам се че ти върши работа :)
лека вечер
Активен

Linux is so simple operation system, but you must be a genius to understand its simplicity.