Автор Тема: Търся програма за обработка на PDF-файлове  (Прочетена 9973 пъти)

George Andonov

  • Напреднали
  • *****
  • Публикации: 261
  • Distribution: Ubuntu
    • Профил
Привет,

Днес си сканирах една книга в PDF формат.
Самата книга е с нестандартен размер (165х111mm), а най-малката височина при Custom Size на скенера ми е 138mm.
Като резултат получих прекрасна книга, но с допълнителна ивица отдолу от 2cm.

И проблемът ми е:
Търся програма за обработка на PDF-файл, с която:
  • да "преоразмеря" страниците и да махна въпросната ивица.
  • да има възможност да изтрия или да добавя страница.

Досега разгледах няколко варианта (PDFEdit, GIMP, ...), но не намерих решение.

Приемам идеи всякакви.  :)
Активен

lz

  • Напреднали
  • *****
  • Публикации: 172
  • Distribution: Ubuntu
  • Window Manager: Unity
    • Профил
Ако си с Убунту, инсталирай си Scan Tailor. Програмата я има в хранилищата. С нея ще направиш предварителна обработка на сканираните страници - ориентиране, подравняване и т.н. Тук има кратко ръководство за работа: http://kn34pc.com/articles/st_manual_bg.html

Много зависи как си сканирал файловете. Добре би било да са сканирани на 300dpi, grayscale или color, изходен формат tiff.
« Последна редакция: Feb 09, 2010, 15:51 от lz »
Активен

ddantgwyn

  • Global Moderator
  • Напреднали
  • *****
  • Публикации: 1262
    • Профил
Привет,

Днес си сканирах една книга в PDF формат.
Самата книга е с нестандартен размер (165х111mm), а най-малката височина при Custom Size на скенера ми е 138mm.
Като резултат получих прекрасна книга, но с допълнителна ивица отдолу от 2cm.

И проблемът ми е:
Търся програма за обработка на PDF-файл, с която:
  • да "преоразмеря" страниците и да махна въпросната ивица.
  • да има възможност да изтрия или да добавя страница.

Досега разгледах няколко варианта (PDFEdit, GIMP, ...), но не намерих решение.

Приемам идеи всякакви.  :)

gscan2pdf

отваряш .pdf файла с нея и отрязваш ивицата отдолу (tools --> crop). след това записваш файла отново.
Активен

the lamer's team honourable member

lz

  • Напреднали
  • *****
  • Публикации: 172
  • Distribution: Ubuntu
  • Window Manager: Unity
    • Профил

gscan2pdf

отваряш .pdf файла с нея и отрязваш ивицата отдолу (tools --> crop). след това записваш файла отново.

Ако са 200-300 страници, представяш ли си колко време ще отиде една по една да ги "кропва"
Активен

zeridon

  • Killmode enabled
  • Administrator
  • Напреднали
  • *****
  • Публикации: 1398
  • Distribution: Debian/Ubuntu
  • Window Manager: console/Gnome
  • BOfH
    • Профил
    • WWW
ако имаш картинките и се примириш с възможността да има евентуално малко допълнително поле или пък малко от страницата да е резнато пробвай с imagemagik. Скриптира се лесно и работи относително бързо.

Друг вариант евентуално е да конвертираш до постскрипт и да се пробваш пак със гимпа но не мисля че ще е удачно
Активен

Внмимавай имам клещи за кабел
http://www.netsecad.com/
http://theregister.co.uk/odds/bofh/

v_badev

  • Напреднали
  • *****
  • Публикации: 1355
    • Профил
Може да изкараш картинките от PDF-а с pdfimages (от poppler-utils или xpdf-utils) и да ги кропнеш после с imagemagic. Това ми се струва че ще е единственият вариант за пакетна обработка.

П.П.
Не мога да разбера хората които сканират в PDF. Нито можеш да го обработваш после файла, нито да го конвертираш в друг формат, който не е с фиксиран размер на страницата.
Активен

lz

  • Напреднали
  • *****
  • Публикации: 172
  • Distribution: Ubuntu
  • Window Manager: Unity
    • Профил
Чак се сега се зачетох по внимателно. Защо си ги сканирал директно в .pdf?
Активен

ddantgwyn

  • Global Moderator
  • Напреднали
  • *****
  • Публикации: 1262
    • Профил

gscan2pdf

отваряш .pdf файла с нея и отрязваш ивицата отдолу (tools --> crop). след това записваш файла отново.

Ако са 200-300 страници, представяш ли си колко време ще отиде една по една да ги "кропва"

а ти можеш ли да си представиш възможността да можеш да ги "кропнеш" на един път? защото програмата го може.
Активен

the lamer's team honourable member

lz

  • Напреднали
  • *****
  • Публикации: 172
  • Distribution: Ubuntu
  • Window Manager: Unity
    • Профил
Представям си, но за да ги кропне навсякъде точно, трябва да са сканирани еднакво точно всички страници. Иначе ще "подскачат". И като се кропнат получените файлове трябва да са с еднаква големина. Въобще цялата тази работа ще стане отзад-напред. Затова първо св сканира в tiff, защото при този формат няма загуба на качеството при обработка на изображението за разлика от jpeg, минимум 300dpi за изображение. След това се прави пакетна обработка на получените файлове и най накрая се създава един файл - дали ще е pdf или djvu вече е въпрос на избор.
Проблемът тук е, че целият процес на създаване на е-книга е сбъркан от самото начало.
« Последна редакция: Feb 09, 2010, 23:24 от lz »
Активен

ddantgwyn

  • Global Moderator
  • Напреднали
  • *****
  • Публикации: 1262
    • Профил
Представям си, но за да ги кропне навсякъде точно, трябва да са сканирани еднакво точно всички страници. Иначе ще "подскачат". И като се кропнат получените файлове трябва да са с еднаква големина. Въобще цялата тази работа ще стане отзад-напред. Затова първо св сканира в tiff, защото при този формат няма загуба на качеството при обработка на изображението за разлика от jpeg, минимум 300dpi за изображение. След това се прави пакетна обработка на получените файлове и най накрая се създава един файл - дали ще е pdf или djvu вече е въпрос на избор.
Проблемът тук е, че целият процес на създаване на е-книга е сбъркан от самото начало.

май не си чел внимателно какво казва човека -- "Самата книга е с нестандартен размер (165х111mm), а най-малката височина при Custom Size на скенера ми е 138mm.
Като резултат получих прекрасна книга, но с допълнителна ивица отдолу от 2cm."
.

за мен това означава, че страниците са сканирани "еднакво точно" и отрязването на тази ивица може да бъде направено само с малко повече въображение и използване на готови програми (които освен това са налични в стандартните хранилища).

колкото до останалите неща, които казваш, нямам намерение да ги обсъждам, само ще спомена, че не е никак трудно да сканираш страниците еднакво. изисква се единствено малко дисциплина и желание за това.
Активен

the lamer's team honourable member

lz

  • Напреднали
  • *****
  • Публикации: 172
  • Distribution: Ubuntu
  • Window Manager: Unity
    • Профил
Прочетох всичко много внимателно. Пак казвам, процесът на създаване на е-книга е сбъркан от самото начало. С желание много работи се постигат, но крайният резултат може да бъде нежелателен откъм качество и загубено време след това.
Активен

George Andonov

  • Напреднали
  • *****
  • Публикации: 261
  • Distribution: Ubuntu
    • Профил
Благодаря на всички (и най-вече ddantgwyn)

Най-подходящото решение за мен се оказа gscan2pdf. Естествено, изрязах всички страници наведнъж. Стана прекрасена книга.

А относно "процесът на създаване на е-книга":
  • Сканирам на Infotec IS 2416 (огромен мултифункционален "хладилник").
  • Този модел не може да сканира по-тесни ивици от 138mm.
  • Скенерът може директно да записва в PDF формат. Така човек си спестява доста време и излишни упражнения. За какво са ми отделни страници, TIFF, допълнителни обработки, ... като скенера може директно да запише книга в един файл PDF 600dpi?
  • Точното позициониране не е проблем, стига винаги да уцелваш горния ляв ъгъл.  ;)
Та това е. Още веднъж благодаря на всички.

П.П. Просто за протокола. Опитах още няколко програми:
  • PDF Editor - програмата доста ме впечетли. Ще трябва да й обърна повече внимание.
  • pdfcrop - няма графичен интерфейс. Недостатък - почти никакви параметри.
Активен

gmarinov

  • Участници
  • ***
  • Публикации: 5
    • Профил
Активен

lz

  • Напреднали
  • *****
  • Публикации: 172
  • Distribution: Ubuntu
  • Window Manager: Unity
    • Профил
Сканиране в tiff, допълнителна обработка и т.н. се правят за КАЧЕСТВО. Изпълнения от рода "всичко сам прави" са за аматьори. Някой си мисли, че е открил топлата вода. Има достатъчно ръководства в нет-а, как се създават е-книги, добре би било първо да се прочетат и после да се прави каквото и да е. Относно последният линк: http://sovety.blogspot.com/2010/01/3-ways-to-crop-pdf-margins.html, не виждам улесняващи решения. Който иска да си губи времето, да ги прилага.
« Последна редакция: Feb 10, 2010, 13:34 от lz »
Активен

v_badev

  • Напреднали
  • *****
  • Публикации: 1355
    • Профил
//off-topic
Всъщност основният проблем на PDF-а е че страницата е с фиксиран размер. Във форматите които са си правени за електронни книги (ePub, FB2, mobi и т.н.) страниците не са с фиксирани размери и съответно книгата се чете с еднаква лекота на малък и голям екран. Докато четеш само на PC с 13" или по-голям екран няма проблем, но ако искаш да четеш същото нещо на мобилно устройство няма да имаш късмет. Особено ако е електронна книга с 6" екран. Да не говорим че като сканираш директно в PDF няма да имаш нито и търсене, нито съдържание, нито възможност да си промениш шрифта.
Активен