Титла: Малки по размер PDF Публикувано от: nov_chovek в Jan 08, 2009, 19:51 Исках само да споделя неволите си и съответно решението :)
Изключително много работя с xsane - сканиращия фронтенд на sane. Сканирам документи и ги правя на ПДФ. Проблема е, че при документи с много страници се получават огромни по размер ПДФ, което е неприемливо. Дори ако направите голяма JPG/zlib компресия пак стават огромни. Ръчкаш xsane, но не можах да намеря някакви други опции. Решението: Ако иамте докуемнт от много страници, сканирайте ги една по една в JPG формат и ги именувайт с имена като 01.jpg, 02.jpg и т.н. и ги сложете в една директория (само те да са в нея) След това трика е следния: Код: convert *.jpg imen_na_document.pdf и програмката прави магията :) Трика е да имате инсталиран ImageMagik пакета, понеже convert е част от него. За мое улеснение си направих Nautilus Script, чрез който с един клик в директорията си правя PDF-a: Код
правите скрипта изпълним, слагате го в ~/.gnome2/nautilus-scripts , влизате в тази директория с наутилус и doubleclick върху него. Таква вече наутилус знае за скрипта. Сега като маркирате файл и щракнете с десен бутон, вече има подменю "Scripts" и въпросния скрипт вътре. Еми това е. Поздрави. Титла: Re: Малки по размер PDF Публикувано от: romeo_ninov в Jan 08, 2009, 21:11 Намери опции да ги сканираш като сиви тифове и приложи (мисля че се поддържа ZIP) компресия. А ако си хитър ще пуснеш сканираните файлове през OCR и получения документ през опенофис ще си спретнеш PDF и то с десетки пъти по-малък размер
Титла: Re: Малки по размер PDF Публикувано от: mom в Jan 08, 2009, 21:41 <офтопик>
romeo_nonov, аз преди година две се опитвах да пусна OCR под Linux, който да разпознава кирилица, но не намерих абсолютно нищо поне що-годе работещо. Ако си намерил нещо по въпроса, моля сподели. </офтопик> Титла: Re: Малки по размер PDF Публикувано от: tarator в Jan 08, 2009, 21:58 Ако не държиш формата да е pdf, виж djvu формата.
Титла: Re: Малки по размер PDF Публикувано от: mikis в Jan 08, 2009, 22:09 ...А ако си хитър ще пуснеш сканираните файлове през OCR и получения документ през опенофис ще си спретнеш PDF и то с десетки пъти по-малък размерТемата за OCR под Линукс много ме вълнува и ако можеш да ми кажеш поне едно работещо решение, макар и комерсиално, ще съм ти много благодарен. Титла: Re: Малки по размер PDF Публикувано от: wfw в Jan 08, 2009, 22:13 на работа имаме една копирна машина, която сканира по много интересен начин - тиф файловете са само с 2 цвята - бял и черен. размера на ПДФ-ите също е много малък - от порядъка на 60КБ за страница. явно ПДФ-ите са обединени тифове, както колегата казва да правиш с jpeg файловете.
ОС на копирната машина е netbsd :o Титла: Re: Малки по размер PDF Публикувано от: romeo_ninov в Jan 08, 2009, 22:15 <офтопик>Приятели руснаци последно много ми хвалиха cuneiform: https://launchpad.net/cuneiform-linux/+download (вече с отворен код) Имайте предвид че в момента тече портирането на Линукс и не може да се очаква голяма стабилност :) Със затворен код (не и за Линукс) има няколко решения, но не е тук мястото за дискусии по такава тема Титла: Re: Малки по размер PDF Публикувано от: nov_chovek в Jan 08, 2009, 22:41 Намери опции да ги сканираш като сиви тифове и приложи (мисля че се поддържа ZIP) компресия. А ако си хитър ще пуснеш сканираните файлове през OCR и получения документ през опенофис ще си спретнеш PDF и то с десетки пъти по-малък размер Това го правих с опцията на xsane "Black & White - Line Art" - прави чернобели (2 цвята) тифове, който се комбинират после в PDF. Наистина се получават малки файлове, НО ако документа има бледи печати, те не излизат в документа, което не ме устройва. Иначе за ORC, аз позлвам FineReader под wine. Знам, че не свободен софтуер, но върши работа, докато излезе свестен open source ORC за кирилица. Знам за формата djvu, но общувам с държавни учреждения, затова ми трябва PDF. Титла: Re: Малки по размер PDF Публикувано от: gericom в Jan 08, 2009, 23:06 ------------------- Ето го същият скрипт, но леко редактиран, т.е. даденото име на file.jpg ще е и името на file.pdf Код
Титла: Re: Малки по размер PDF Публикувано от: nov_chovek в Jan 08, 2009, 23:17 nikola_yanev, мерси за редакцията, не съм "на ти" с промеливите, затова добавката е ценна.
Имената на файловете ги писах с цифри, понеже изглежда convert парсва по азбучен ред файловете. Та аko са с различни имена, ще се разбъркат страниците в PDF-a. Титла: Re: Малки по размер PDF Публикувано от: gericom в Jan 08, 2009, 23:25 nikola_yanev, мерси за редакцията, не съм "на ти" с промеливите, затова добавката е ценна. Моля, радвам се че ти върши работа :) лека вечер |