Linux за българи: Форуми

Linux секция за начинаещи => Настройка на програми => Темата е започната от: George Andonov в Feb 09, 2010, 11:49



Титла: Търся програма за обработка на PDF-файлове
Публикувано от: George Andonov в Feb 09, 2010, 11:49
Привет,

Днес си сканирах една книга в PDF формат.
Самата книга е с нестандартен размер (165х111mm), а най-малката височина при Custom Size на скенера ми е 138mm.
Като резултат получих прекрасна книга, но с допълнителна ивица отдолу от 2cm.

И проблемът ми е:
Търся програма за обработка на PDF-файл, с която:
  • да "преоразмеря" страниците и да махна въпросната ивица.
  • да има възможност да изтрия или да добавя страница.

Досега разгледах няколко варианта (PDFEdit, GIMP, ...), но не намерих решение.

Приемам идеи всякакви.  :)


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: lz в Feb 09, 2010, 13:25
Ако си с Убунту, инсталирай си Scan Tailor. Програмата я има в хранилищата. С нея ще направиш предварителна обработка на сканираните страници - ориентиране, подравняване и т.н. Тук има кратко ръководство за работа: http://kn34pc.com/articles/st_manual_bg.html

Много зависи как си сканирал файловете. Добре би било да са сканирани на 300dpi, grayscale или color, изходен формат tiff.


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: ddantgwyn в Feb 09, 2010, 14:48
Привет,

Днес си сканирах една книга в PDF формат.
Самата книга е с нестандартен размер (165х111mm), а най-малката височина при Custom Size на скенера ми е 138mm.
Като резултат получих прекрасна книга, но с допълнителна ивица отдолу от 2cm.

И проблемът ми е:
Търся програма за обработка на PDF-файл, с която:
  • да "преоразмеря" страниците и да махна въпросната ивица.
  • да има възможност да изтрия или да добавя страница.

Досега разгледах няколко варианта (PDFEdit, GIMP, ...), но не намерих решение.

Приемам идеи всякакви.  :)

gscan2pdf

отваряш .pdf файла с нея и отрязваш ивицата отдолу (tools --> crop). след това записваш файла отново.


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: lz в Feb 09, 2010, 15:54

gscan2pdf

отваряш .pdf файла с нея и отрязваш ивицата отдолу (tools --> crop). след това записваш файла отново.

Ако са 200-300 страници, представяш ли си колко време ще отиде една по една да ги "кропва"


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: zeridon в Feb 09, 2010, 17:17
ако имаш картинките и се примириш с възможността да има евентуално малко допълнително поле или пък малко от страницата да е резнато пробвай с imagemagik. Скриптира се лесно и работи относително бързо.

Друг вариант евентуално е да конвертираш до постскрипт и да се пробваш пак със гимпа но не мисля че ще е удачно


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: v_badev в Feb 09, 2010, 17:35
Може да изкараш картинките от PDF-а с pdfimages (от poppler-utils или xpdf-utils) и да ги кропнеш после с imagemagic. Това ми се струва че ще е единственият вариант за пакетна обработка.

П.П.
Не мога да разбера хората които сканират в PDF. Нито можеш да го обработваш после файла, нито да го конвертираш в друг формат, който не е с фиксиран размер на страницата.


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: lz в Feb 09, 2010, 20:08
Чак се сега се зачетох по внимателно. Защо си ги сканирал директно в .pdf?


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: ddantgwyn в Feb 09, 2010, 22:21

gscan2pdf

отваряш .pdf файла с нея и отрязваш ивицата отдолу (tools --> crop). след това записваш файла отново.

Ако са 200-300 страници, представяш ли си колко време ще отиде една по една да ги "кропва"

а ти можеш ли да си представиш възможността да можеш да ги "кропнеш" на един път? защото програмата го може.


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: lz в Feb 09, 2010, 22:58
Представям си, но за да ги кропне навсякъде точно, трябва да са сканирани еднакво точно всички страници. Иначе ще "подскачат". И като се кропнат получените файлове трябва да са с еднаква големина. Въобще цялата тази работа ще стане отзад-напред. Затова първо св сканира в tiff, защото при този формат няма загуба на качеството при обработка на изображението за разлика от jpeg, минимум 300dpi за изображение. След това се прави пакетна обработка на получените файлове и най накрая се създава един файл - дали ще е pdf или djvu вече е въпрос на избор.
Проблемът тук е, че целият процес на създаване на е-книга е сбъркан от самото начало.


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: ddantgwyn в Feb 10, 2010, 08:32
Представям си, но за да ги кропне навсякъде точно, трябва да са сканирани еднакво точно всички страници. Иначе ще "подскачат". И като се кропнат получените файлове трябва да са с еднаква големина. Въобще цялата тази работа ще стане отзад-напред. Затова първо св сканира в tiff, защото при този формат няма загуба на качеството при обработка на изображението за разлика от jpeg, минимум 300dpi за изображение. След това се прави пакетна обработка на получените файлове и най накрая се създава един файл - дали ще е pdf или djvu вече е въпрос на избор.
Проблемът тук е, че целият процес на създаване на е-книга е сбъркан от самото начало.

май не си чел внимателно какво казва човека -- "Самата книга е с нестандартен размер (165х111mm), а най-малката височина при Custom Size на скенера ми е 138mm.
Като резултат получих прекрасна книга, но с допълнителна ивица отдолу от 2cm."
.

за мен това означава, че страниците са сканирани "еднакво точно" и отрязването на тази ивица може да бъде направено само с малко повече въображение и използване на готови програми (които освен това са налични в стандартните хранилища).

колкото до останалите неща, които казваш, нямам намерение да ги обсъждам, само ще спомена, че не е никак трудно да сканираш страниците еднакво. изисква се единствено малко дисциплина и желание за това.


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: lz в Feb 10, 2010, 11:46
Прочетох всичко много внимателно. Пак казвам, процесът на създаване на е-книга е сбъркан от самото начало. С желание много работи се постигат, но крайният резултат може да бъде нежелателен откъм качество и загубено време след това.


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: George Andonov в Feb 10, 2010, 12:25
Благодаря на всички (и най-вече ddantgwyn)

Най-подходящото решение за мен се оказа gscan2pdf. Естествено, изрязах всички страници наведнъж. Стана прекрасена книга.

А относно "процесът на създаване на е-книга":
  • Сканирам на Infotec IS 2416 (огромен мултифункционален "хладилник").
  • Този модел не може да сканира по-тесни ивици от 138mm.
  • Скенерът може директно да записва в PDF формат. Така човек си спестява доста време и излишни упражнения. За какво са ми отделни страници, TIFF, допълнителни обработки, ... като скенера може директно да запише книга в един файл PDF 600dpi?
  • Точното позициониране не е проблем, стига винаги да уцелваш горния ляв ъгъл.  ;)
Та това е. Още веднъж благодаря на всички.

П.П. Просто за протокола. Опитах още няколко програми:
  • PDF Editor - програмата доста ме впечетли. Ще трябва да й обърна повече внимание.
  • pdfcrop - няма графичен интерфейс. Недостатък - почти никакви параметри.


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: gmarinov в Feb 10, 2010, 12:59
http://sovety.blogspot.com/2010/01/3-ways-to-crop-pdf-margins.html
 ;)


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: lz в Feb 10, 2010, 13:29
Сканиране в tiff, допълнителна обработка и т.н. се правят за КАЧЕСТВО. Изпълнения от рода "всичко сам прави" са за аматьори. Някой си мисли, че е открил топлата вода. Има достатъчно ръководства в нет-а, как се създават е-книги, добре би било първо да се прочетат и после да се прави каквото и да е. Относно последният линк: http://sovety.blogspot.com/2010/01/3-ways-to-crop-pdf-margins.html, не виждам улесняващи решения. Който иска да си губи времето, да ги прилага.


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: v_badev в Feb 10, 2010, 14:45
//off-topic
Всъщност основният проблем на PDF-а е че страницата е с фиксиран размер. Във форматите които са си правени за електронни книги (ePub, FB2, mobi и т.н.) страниците не са с фиксирани размери и съответно книгата се чете с еднаква лекота на малък и голям екран. Докато четеш само на PC с 13" или по-голям екран няма проблем, но ако искаш да четеш същото нещо на мобилно устройство няма да имаш късмет. Особено ако е електронна книга с 6" екран. Да не говорим че като сканираш директно в PDF няма да имаш нито и търсене, нито съдържание, нито възможност да си промениш шрифта.


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: George Andonov в Feb 10, 2010, 16:40
Сканиране в tiff, допълнителна обработка и т.н. се правят за КАЧЕСТВО. Изпълнения от рода "всичко сам прави" са за аматьори. Някой си мисли, че е открил топлата вода. Има достатъчно ръководства в нет-а, как се създават е-книги, добре би било първо да се прочетат и после да се прави каквото и да е. ...
@lz: Принципно си прав, но не и в конкретния случай.

В случая, книгата е "Възли и сплитания" (64стр.). Т.е. над 80% снимки, схеми и чертежи и тук-там по няколко думи.
Затова не държах в нея да има търсене, съдържание с huypelink-ове и други екстри, характерни за някои "професионално направени" книги.

За друга книга подходът щеше да е друг, но за такова "ръководство" този начин напълно ме устройва.
Единственото неудобство беше размерът на страниците, но с ваша помощ намерих решение, което междудругото доста ми допада.

Благодаря на всички за отделеното време.  [_]3


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: allusion в Feb 14, 2010, 01:43
Отговарям отзад напред.
За добавяне на страници може да ползваш pdftk (PDF Toolkit):

Код:
pdftk myfile.pdf cat 1-4 6 9 ouput res.pdf 

Горният пример взема страници 1,2,3,4, 6 и 9 от myfile.pdf  и създава res.pdf
За орязване на страниците може да ползваш pdfcrop:

Код:
pdfcrop --margins "l t r b" myfile.pdf 

където l=left, t=top, r=right, b=bottom, могат да бъдат и отрицателни.

Полезен е и pdfnup - организира, върти, реже няколко страници в една A4 формат. За него ти трябва инсталиран LaTeX (ползва pdfpages). 

Поздрав.


Титла: Re: Търся програма за обработка на PDF-файлове
Публикувано от: Slex в Mar 03, 2010, 18:21
pdfshuffler

е програмата, която ти трябва. С графичен интерфейс е.

Иначе ако инсталираш Calibre, може да ползваш pdfmanipulate crop, която върви с нея, но не е толкова удачен вариант, поне според мен.