Linux за българи: Форуми

Linux секция за начинаещи => Настройка на програми => Темата е започната от: nov_chovek в Jan 08, 2009, 19:51



Титла: Малки по размер PDF
Публикувано от: nov_chovek в Jan 08, 2009, 19:51
Исках само да споделя неволите си и съответно решението :)

Изключително много работя с xsane - сканиращия фронтенд на sane. Сканирам документи и ги правя на ПДФ. Проблема е, че при документи с много страници се получават огромни по размер ПДФ, което е неприемливо. Дори ако направите голяма JPG/zlib компресия пак стават огромни. Ръчкаш xsane, но не можах да намеря някакви други опции.

Решението:

Ако иамте докуемнт от много страници, сканирайте ги една по една в JPG формат и  ги именувайт с имена като 01.jpg, 02.jpg и т.н. и ги сложете в една директория (само те да са в нея) След това трика е следния:
Код:
convert *.jpg imen_na_document.pdf

и програмката прави магията :) Трика е да имате инсталиран ImageMagik пакета, понеже convert е част от него.

За мое улеснение си направих Nautilus Script, чрез който с един клик в директорията си правя PDF-a:

Код
GeSHi (Bash):
  1. #!/bin/sh
  2. convert *.jpg document.pdf | zenity --progress --title="Създаване на PDF"  --text="Създаване на файл document.pdf"  --percentage=0
  3.  

правите скрипта изпълним, слагате го в ~/.gnome2/nautilus-scripts , влизате в тази директория с наутилус и doubleclick върху него. Таква вече наутилус знае за скрипта. Сега като маркирате файл и щракнете с десен бутон, вече има подменю "Scripts" и въпросния скрипт вътре.

Еми това е. Поздрави.
 


Титла: Re: Малки по размер PDF
Публикувано от: romeo_ninov в Jan 08, 2009, 21:11
Намери опции да ги сканираш като сиви тифове и приложи (мисля че се поддържа ZIP) компресия. А ако си хитър ще пуснеш сканираните файлове през OCR и получения документ през опенофис ще си спретнеш  PDF и то с десетки пъти по-малък размер


Титла: Re: Малки по размер PDF
Публикувано от: mom в Jan 08, 2009, 21:41
<офтопик>
romeo_nonov, аз преди година две се опитвах да пусна OCR под Linux, който да разпознава кирилица, но не намерих абсолютно нищо поне що-годе работещо. Ако си намерил нещо по въпроса, моля сподели.
</офтопик>


Титла: Re: Малки по размер PDF
Публикувано от: tarator в Jan 08, 2009, 21:58
Ако не държиш формата да е pdf, виж djvu формата.


Титла: Re: Малки по размер PDF
Публикувано от: mikis в Jan 08, 2009, 22:09
...А ако си хитър ще пуснеш сканираните файлове през OCR и получения документ през опенофис ще си спретнеш  PDF и то с десетки пъти по-малък размер
Темата за OCR под Линукс много ме вълнува и ако можеш да ми кажеш поне едно работещо решение, макар и комерсиално, ще съм ти много благодарен.


Титла: Re: Малки по размер PDF
Публикувано от: wfw в Jan 08, 2009, 22:13
на работа имаме една копирна машина, която сканира по много интересен начин - тиф файловете са само с 2 цвята - бял и черен. размера на ПДФ-ите също е много малък - от порядъка на 60КБ за страница. явно ПДФ-ите са обединени тифове, както колегата казва да правиш с jpeg файловете.

ОС на копирната машина е netbsd  :o





Титла: Re: Малки по размер PDF
Публикувано от: romeo_ninov в Jan 08, 2009, 22:15
<офтопик>
romeo_nonov, аз преди година две се опитвах да пусна OCR под Linux, който да разпознава кирилица, но не намерих абсолютно нищо поне що-годе работещо. Ако си намерил нещо по въпроса, моля сподели.
</офтопик>
Приятели руснаци последно много ми хвалиха cuneiform: https://launchpad.net/cuneiform-linux/+download (вече с отворен код)
Имайте предвид че в момента тече портирането на Линукс и не може да се очаква голяма стабилност :)
Със затворен код (не и за Линукс) има няколко решения, но не е тук мястото за дискусии по такава тема


Титла: Re: Малки по размер PDF
Публикувано от: nov_chovek в Jan 08, 2009, 22:41
Намери опции да ги сканираш като сиви тифове и приложи (мисля че се поддържа ZIP) компресия. А ако си хитър ще пуснеш сканираните файлове през OCR и получения документ през опенофис ще си спретнеш  PDF и то с десетки пъти по-малък размер

Това го правих с опцията на xsane "Black & White - Line Art" - прави чернобели (2 цвята) тифове, който се комбинират после в PDF. Наистина се получават малки файлове, НО ако документа има бледи печати, те не излизат в документа, което не ме устройва.

Иначе за ORC, аз позлвам FineReader под wine. Знам, че не свободен софтуер, но върши работа, докато излезе свестен open source ORC за кирилица.

Знам за формата djvu, но общувам с държавни учреждения, затова ми трябва PDF.


Титла: Re: Малки по размер PDF
Публикувано от: gericom в Jan 08, 2009, 23:06
-------------------
Ако иамте докуемнт от много страници, сканирайте ги една по една в JPG формат и  ги именувайт с имена като 01.jpg, 02.jpg и т.н. и ги сложете в една директория (само те да са в нея) След това трика е следния:
Код:
convert *.jpg imen_na_document.pdf

Код
GeSHi (Bash):
  1. #!/bin/sh
  2. convert *.jpg document.pdf | zenity --progress --title="Създаване на PDF"  --text="Създаване на файл document.pdf"  --percentage=0
  3.  
---------------

Ето го същият скрипт, но леко редактиран, т.е. даденото име на file.jpg ще е и името на file.pdf

Код
GeSHi (Bash):
  1. #!/bin/sh
  2.  
  3. #image2pdf
  4. #
  5. # Made by nov_chovek @ http://www.linux-bg.org/forum/index.php?PHPSESSID=6631edf60045dc559d3ac208eb112d3f&action=profile;u=5843 and edited by gericom @ https://launchpad.net/~gericom
  6. #
  7. # This program is free software; you can redistribute it and/or modify
  8. # it under the terms of the GNU General Public License as published by
  9. # the Free Software Foundation; either version 2 of the License, or
  10. # (at your option) any later version.
  11. #
  12. # This program is distributed in the hope that it will be useful,
  13. # but WITHOUT ANY WARRANTY; without even the implied warranty of
  14. # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  15. # GNU General Public License for more details.
  16. #
  17. # You should have received a copy of the GNU General Public License
  18. # along with this program; if not, write to the Free Software
  19. # Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
  20.  
  21. convert *.jpg $@.pdf | zenity --progress --title="Converting to PDF"  --text="Making file $@.pdf"  --percentage=0
  22.  
  23.  


Титла: Re: Малки по размер PDF
Публикувано от: nov_chovek в Jan 08, 2009, 23:17
nikola_yanev, мерси за редакцията, не съм "на ти" с промеливите, затова добавката е ценна. 

Имената на файловете ги писах с цифри, понеже изглежда convert парсва по азбучен ред файловете. Та аko са с различни имена, ще се разбъркат страниците в PDF-a.


Титла: Re: Малки по размер PDF
Публикувано от: gericom в Jan 08, 2009, 23:25
nikola_yanev, мерси за редакцията, не съм "на ти" с промеливите, затова добавката е ценна. 

Имената на файловете ги писах с цифри, понеже изглежда convert парсва по азбучен ред файловете. Та аko са с различни имена, ще се разбъркат страниците в PDF-a.

Моля,
радвам се че ти върши работа :)
лека вечер