Автор Тема: Как бързо да си направим .pdf файл от сканирани документи  (Прочетена 14890 пъти)

stealth01

  • Гост
Здравейте,
Ако трябва да сканирате няколко (в частен случай може и един) документи, съберете в един компактен (евентуално) .pdf файл и изпратите нанякъде, ето бърза възможност.

1. Сканирате. Това е хардуерната част и не е интересна. По-бързо става, ако имате скенер с ADF (автоматично подаване на документи). Резултатът под формата на няколко файла (.jpg, .png...) изсипвате в една директория.
2. С идеята да намалите големината на файловете може да свършите няколко неща:
Код:
mogrify -threshold 70% *png
- с threshold получавате черно-бял документ, където всички пиксели под границата от 70% стават черни, а над нея - бели. Може да експериментирате с тази стойност в зависимост от сканираният документ. В моя случай, файловете са .png.
Код:
mogrify -resize 1080 *png
- картинките са преоразмеряват на 1080 пиксела в ширина. В моя случай, файловете са .png.

!!! mogrify всъщност е convert, но без указване на изходен файл. Внимавайте, файловете се презаписват.

3. Създаване на .pdf файл:
Код:
convert *png dokument.pdf
- всички .png файлове се събират в един .pdf

П.П. В друга тема видях go_fire да се удивлява на въпросният convert, па се зачудих как ли си събира той ГФО-тата... Но пък може да е интересно и полезно, и на други.
Активен

go_fire

  • Global Moderator
  • Напреднали
  • *****
  • Публикации: 8780
  • Distribution: Дебиан Сид
  • Window Manager: ROX-Desktop / е17
  • кашик с гранатомет в танково поделение
    • Профил
    • WWW
<OFFTOPIC>

Никога не съм се удивлявал от Image Magic, освен може би, колко кадърно парче софтуер е. От как се занимавам с ГНУ/Линукс, той винаги е бил наоколо. А дълго време беше единствената програма за преглед на графика. Само дето в Дебиан 3 се казваше нещо друго и имаше друга картинка. Нещо пак с правата беше.

Не се учудих и, когато дойдоха времената на масовия Интернет, а той стана предпочитан инструмент. Не се учудих, че в следствие на това се появи негово разклонение. Някой помни ли го? А то си е живо и здраво:

http://www.graphicsmagick.org

Та не му се чудя.

=*=

Аз в действителност не съставям годишни, финансови отчети. Само помагам при изготвянето им. Въпреки, че името им е доста помпозно, то в тях няма нищо интересно. Дори за счетоводителите не са интересни. Единствено са интересни за държавната статистика. Всяка цифра вътре говори и то много, но са достатъчно обобщени, че да не казват нищо конкретно. Просто намекват. И много рядко са верни, макар приблизително да са.

Виж теорията зад това що са и защо се правят е много интересна. Но в днешно време си е просто теория, една красива, занимателна приказка, нямаща нищо общо с реалността.

Някой тук, наистина ли иска да получи курс по счетоводство? Наистина ли има хора, на които живота им толкова да е досадил, че нещо такова да им се стори смислено? Чак толкова ли сте безгрижни?
Активен

В $por4e2 e истината  ;)

***

Aко даваха стипендия за най-глупави, щях да съм човека с най-много Mини Kупъри

***

Reborn since 1998 || 15.09.2007 totally М$ free && conscience clear

go_fire

  • Global Moderator
  • Напреднали
  • *****
  • Публикации: 8780
  • Distribution: Дебиан Сид
  • Window Manager: ROX-Desktop / е17
  • кашик с гранатомет в танково поделение
    • Профил
    • WWW
Май не съм разбрал точно въпроса. В Агенцията по вписванията всяка година до някакво число всички търговци предоставят отчетите си.

В днешно време не се изготвят (или много рядко) специално за целта. Просто се публикуват годишните, статистически отчети (или познат като Годишен отчет на дейността, ГОД). Те вече си идват в pdf. Към тях се добавят разни адвокатски глупости като общи събрания и т.н.

За това си има логично обяснение. Няма логика в това да вършиш едно и също два пъти, само, за да се потупаш по гърдите, че си съвестен. Не е правилно държавата да ти иска втори (пети, десети, петдесет и пети) път информация, която вече си предоставил. Отделно, че не би трябвало да има право да получава никаква информация. Всяко парче данни, което получава, е пряко в ущърб интересите на лицата.

Обаче многократното предоставяне на една и съща информация не помага на никой с нищо, освен едни хора да взимат заплати. А обратното. Батака става по-голям. Така всеки който отказва да прави ГФО наново след ГОД, в действителност извършва родолюбиво дело.

=*=

Налага се сравнително често да се пращат какви ли не документи в pdf на кого ли не. Не е чак всеки ден, но не е пресилено да се каже всяка седмица. Обикновената практика е изобщо да не се преминава през формати за изображения. В днешно време всеки скенер може да сканира директно в pdf и всеки компютър може да отпечатва в pdf. С картинки никой не се занимава.
Активен

В $por4e2 e истината  ;)

***

Aко даваха стипендия за най-глупави, щях да съм човека с най-много Mини Kупъри

***

Reborn since 1998 || 15.09.2007 totally М$ free && conscience clear

ddantgwyn

  • Global Moderator
  • Напреднали
  • *****
  • Публикации: 1262
    • Профил
Обикновената практика е изобщо да не се преминава през формати за изображения. В днешно време всеки скенер може да сканира директно в pdf и всеки компютър може да отпечатва в pdf. С картинки никой не се занимава.

Това ти го бях обяснил в онзи, бастисания отговор, но явно ще трябва поне него да повторя, защото виждам, че нещата не са ти ясни.

Всеки един скенер разбира само от растерен формат. Какво е растерен формат се надявам да знаеш. Опаковането на сканираните изображения е глезотия, предоставяна от софтуера към скенера, така че използването на pdfimages или друга подобна програма в онзи случай, за който говореше в онази тема, е просто наложително.

И да се твърди, че скенерът сканира директно в .pdf формат не е съвсем точно. Не е точно така.

Та при сканирането на разни документи, всъщност всички се „занимават“ с картинки, макар и в неявен вид.

PS Освен pdfimages, за конвертирана на файл в .pdf формат може да използваш и командата mogrify:

Код:
[nick@amasing ~]$ mogrify -format png scanned/books/math/Счётная\ линейка\,\ Д.\ Ю.\ Панов\,\ М.\,\ Наука\,\ 1964.pdf

Ако избереш tiff за изходен формат, имай предвид, че ще получиш един файл с много страници вътре и ще трябва да решиш как да го преозразмеряваш ::).
Активен

the lamer's team honourable member

go_fire

  • Global Moderator
  • Напреднали
  • *****
  • Публикации: 8780
  • Distribution: Дебиан Сид
  • Window Manager: ROX-Desktop / е17
  • кашик с гранатомет в танково поделение
    • Профил
    • WWW
За един лаик най-интересната част от компютърната наука е безспорно графиката. Нищо не може да се сравни с нея. А, ако по-душа не е художник, а математик, то бързо ще установи, че за никакво изкуство не става въпрос и ще е дваж по-доволен.

Първото, което вижда всеки е графиката. Може да е Каратека и E.T.I. Така е с мен. Може да е дори по-назад, ако е още по-дърт пергиш. Но първото неизменно е графиката. Става влюбване.

Това е единствения начин да се превърне в любител. Говоря за онзи един процент от световното население, за който технологиите не са нещо безкрайно чуждо, студено и дори извънземно, каквото и да се опитват да направят от Ред Хат.

След това повечето от този процент ще станат професионалисти. Една част от тях ще са си извратени по душа и ще наричат себе си „визуални кучки“, но целокупното човечество ще ги познава като gamers. А една много малка частичка, може би промил от тоз' процент, ще си останат лаици и мечтатели. Не, че останалите също не могат и да са мечтатели. Звезделин (опа, май беше Златин, sorr'-ка) е повече от нагледен пример.

Та всеки дори любителя се прехласва по графиката. А не може подрапал дори само отгоре да не навлезе много надълбоко в историята на Postscript.

=*=

С този дълъг увод исках да ти кажа, че ме подценяваш (или по-скоро надценяваш???). Аз много добре знам, какво е това подмножество на Postscript оформено като файлов формат в най-добрите майкрософтски традиции. И не ми казвай. Знам, че е на адобци. Всеки кретен го знае. А аз съм от заслужилите.

Прекалено отдавна се знаем с тая неописуема свинщина pdf. И всеки, ама наистина всеки произволен полу- или цял компютърен идиот знае що е това растерна графика, виждал е векторна и дори може да цитира с точност в години и имена авторите на тези неща. Може да каже, кога и защо са се зародили, защо са две и дори, какво налага до днес и завинаги да са две. Поне до Страшния съд.

=*=

А сега бърз и крайно неизчерпателен курс по това що за животно е икономиста.

Икономиста е човека на хартията. Той борави с хартия, гума, молив и елка. Друго на света не съществува. Всичко друго е досадно несъвършенство на света, с чието изкореняване трябва да се бори. На света трябва да съществува единствено хартия, молив и по възможност гумичка. Всичко друго трябва да умре в ада. Добре де. Може да му оставят и елката, ама не е задължително. Просто е удобно.

И да не забравят линията. Най-ценният предмет на света след молива. Че ръката му трепери от толкова кафета, а погледа му е замъглен и изкривен от толкоз цифри. Освен това, за да не фръкне под напора на климатика (или вентилатора) някой лист, най-добрите оръжия са линия, перфоратор и телбод. И елката.

За икономиста печатащото устройство е просто онзи вълшебен предмет, който му доставя така желаната хартия в този отвратителен свят.

А скенера е онова причудливо нещо, което му позволява да транспортира хартия без да му се налага да се разкарва вън, далеч от рая. Непросветените души наричат рая с обидното име „бюро“ и „стол“.

=*=

А ето и извода.

Икономиста опитно е установил, че това jpg и png са някакви много кофти измишльотини, които не позволяват хартията да блесне. Всяко шибано печатащо устройство си го изкарва, ама как си му дойде. Документ е това, а не глупотевина.

Единственото възможно състояние е А4 с плътно съвпадащи краища и нищо друго. В Америка предполагам е letter. Не по-голямо. Не по-малко. Не две, четири, осем на лист. Само А4. Другото да ходи в ада и да не ни трови живота.

Tiff е нещо отвратително. Не става за пощата. Получателя го отхвърля с грозни съобщения. А това значи да го носиш на крак. С други думи далеч от рая. Да гори.

Pdf и нищо освен pdf не съществува. Аз съм пратил хартия и искам същата хартия без микрон разлика да може да си разпечати блажения получател. Не ме занимавайте с глупости!




Активен

В $por4e2 e истината  ;)

***

Aко даваха стипендия за най-глупави, щях да съм човека с най-много Mини Kупъри

***

Reborn since 1998 || 15.09.2007 totally М$ free && conscience clear

getqwerty11

  • Напреднали
  • *****
  • Публикации: 20
    • Профил
Юнак, това HOWTO ако го предложиш на секретарката на предприятието, тя ще те уволни, не собственика. При условие че ВСЕКИ скенер вече има опции за директно сканиране в pdf и изпращнето му по мейл, качване в папка или в облака, ти да хабиш човекочаса в мъдренето на такива неща, не си ползотворен за предприятието. Сега очаквам и да го автоматизираш в скрипт и секретарката да го налива в конзола. В други времена живеете болшенството тук.
Активен

ray

  • Напреднали
  • *****
  • Публикации: 1447
    • Профил
Юнак, това HOWTO ако го предложиш на секретарката на предприятието, тя ще те уволни, не собственика. При условие че ВСЕКИ скенер вече има опции за директно сканиране в pdf и изпращнето му по мейл, качване в папка или в облака, ти да хабиш човекочаса в мъдренето на такива неща, не си ползотворен за предприятието. Сега очаквам и да го автоматизираш в скрипт и секретарката да го налива в конзола. В други времена живеете болшенството тук.

Вярно, живели сме и в други времена, но защо мислиш че не сме извлекли някаква ползва от тези времена, все още живеем и в сегашното време ;-)

Това което предлагаш е някаква автоматизация, при това дори не знаеш как работят нещата зад сцената (класика - цъкаш на телефона/компа и това е всичко).

Не случайно статистиките за функционална неграмотност отчитат все по-високи проценти (няма мислене, само механично запомняне и забравяне след това).

Като ти харесва живей си така, но ако нещо стане (...) не се оплаквай :-)

Само още едно мнение нищо повече !

Поздрави,
Румен
Активен

Naka

  • Напреднали
  • *****
  • Публикации: 3395
    • Профил
//offtopic
Цитат
Той борави с хартия, гума, молив и елка.

Ама каква хубава дума си имахме - елка. Стана нарицателно за калкулатор също като Xerox и Памперс.
Активен

Perl - the only language that looks the same before and after encryption.

Acho

  • Напреднали
  • *****
  • Публикации: 5256
  • Distribution: Slackware, MikroTik - сървърно
  • Window Manager: console only
    • Профил
    • WWW
ЕЛектронен КАлкулатор от Оргтехника Силистра.
Активен

CPU - Intel Quad-Core Q8400, 2.66 GHz; Fan - Intel Box; MB - Intel G41M-T2; RAM - DDR2-800, Kingston HyperX, 2X2048 MB; VC - onboard, Intel G41 Express Chipset; HDD - Toshiba, 500 GB, SATAII; SB - Realtek HD Audio; DVD-RW - TSSTcorp DVD-RW; LAN - Realtek PCI-E GBE Controller; PSU - Fortron 350 Watt.

Naka

  • Напреднали
  • *****
  • Публикации: 3395
    • Профил
Брей те още произвеждали ЕЛКА....Само дето това не е калкулатор :'( ами е касов апарат.  >:(
« Последна редакция: Jul 11, 2018, 13:38 от Naka »
Активен

Perl - the only language that looks the same before and after encryption.

ddantgwyn

  • Global Moderator
  • Напреднали
  • *****
  • Публикации: 1262
    • Профил
Юнак, това HOWTO ако го предложиш на секретарката на предприятието, тя ще те уволни, не собственика. При условие че ВСЕКИ скенер вече има опции за директно сканиране в pdf и изпращнето му по мейл, качване в папка или в облака, ти да хабиш човекочаса в мъдренето на такива неща, не си ползотворен за предприятието. Сега очаквам и да го автоматизираш в скрипт и секретарката да го налива в конзола. В други времена живеете болшенството тук.

Юнак, а вие да четете с разбиране можете ли?!
Активен

the lamer's team honourable member

go_fire

  • Global Moderator
  • Напреднали
  • *****
  • Публикации: 8780
  • Distribution: Дебиан Сид
  • Window Manager: ROX-Desktop / е17
  • кашик с гранатомет в танково поделение
    • Профил
    • WWW
Елка сега се казва Еликом, а софийската е Дейзи технолоджи.

КА не са нищо повече от елки с карти SD, модем със SIM и няколко допълнителни копчета, плюс от нова година и гадните менюта, против които не веднъж сме роптали, че взеха да ги слагат навсякъде. Вече няма кодове, има навигация. Ричард Драйфус, както би се изразил Светльо Хиподила.

=*=

Това е проблема, против, които роптая тук от седмица, ама по принцип половин живот. Хора, за които компютрите са нещо невменяемо, не трябва да минават и на километър околовръст около тях. Замърсяват ги само с присъствието си.

А сега сме в ситуация, когато една шибана секретарка може да навие шефа да те уволни и то без да е той тоя, дето я шиба. И защо? Защото си я накарал да напише една команда. Нейната работа се състои в това да пише, нейната мамка.

Аз моите на работа много обичам да ги шашкам с изказвания против мишките. Колко са гнусни, колко неудобни, колко не мога да работя с тях. Последното е вярно. Отнема ми час да налучкам нещо и да го нащракам. А преди това половин час, какво точно трябваше да щракам.

И обичам да подчертавам, че първата си мишка съм купил през 1994-та. Това ги смущава дори повече, защото част от тях тъкмо са били родени и са пълнили пелените.

Но и тук нещата отиват на зле. В Усхадуя Хващай Пътя почти няма нещо, което да не може да се направи само с клавиатура. Да говорим си за противните му клавишни комбинации. Но ги има. А в КДЕ 5 почти не мога да се сетя нещо, което мога да направя без мишка.

=*=

Много харесвам масовите медии. Най-важната причина е, че посредством тях се насажда нищо-говорене. Това е, когато казваш нещо, но това нещо е лишено от всякакъв смисъл.

Масовите медии ги разбирам. В тях работят журналисти, а журналистите са порода, която е лишена от мозък. Техни гости са предимно политици, футболисти и звезди, чиято житейска роля също е лишена от мислене. Но не мога да разбера, защо по тези моди се хваа иначе интелигентния, български народ?!?

Думи като „четене с разбиране“, „функционална неграмотност“ и други подобни словосъчетания просто не съществуват в природата. Четенето има една единствена функция. Сетихте се! Разбиране. Ако няма разбиране, просто не е четене!!! Няма полу, цяла, функционална, нефункционална, някаква грамотност. Човек или умее да чете, пише, прави аритметични сметки, или не е умее. Или е грамотен, или не е. Няма средно положение.

Активен

В $por4e2 e истината  ;)

***

Aко даваха стипендия за най-глупави, щях да съм човека с най-много Mини Kупъри

***

Reborn since 1998 || 15.09.2007 totally М$ free && conscience clear

jet

  • Напреднали
  • *****
  • Публикации: 3472
  • Distribution: debian
  • Window Manager: kde
    • Профил
Обикновената практика е изобщо да не се преминава през формати за изображения. В днешно време всеки скенер може да сканира директно в pdf и всеки компютър може да отпечатва в pdf. С картинки никой не се занимава.

Това ти го бях обяснил в онзи, бастисания отговор, но явно ще трябва поне него да повторя, защото виждам, че нещата не са ти ясни.

Всеки един скенер разбира само от растерен формат. Какво е растерен формат се надявам да знаеш. Опаковането на сканираните изображения е глезотия, предоставяна от софтуера към скенера, така че използването на pdfimages или друга подобна програма в онзи случай, за който говореше в онази тема, е просто наложително.

И да се твърди, че скенерът сканира директно в .pdf формат не е съвсем точно. Не е точно така.

Та при сканирането на разни документи, всъщност всички се „занимават“ с картинки, макар и в неявен вид.

PS Освен pdfimages, за конвертирана на файл в .pdf формат може да използваш и командата mogrify:

Код:
[nick@amasing ~]$ mogrify -format png scanned/books/math/Счётная\ линейка\,\ Д.\ Ю.\ Панов\,\ М.\,\ Наука\,\ 1964.pdf

Ако избереш tiff за изходен формат, имай предвид, че ще получиш един файл с много страници вътре и ще трябва да решиш как да го преозразмеряваш ::).
Твоя скенер сигурно е от времето на Ботев сватбата.
Сегашните скенери могат да генерират директно .pdf и секретарките си ги получават по имейлa. Ако им подадеш един .tiff - първо няма да могат да го отворят щото ще им крашне дифолтния майромек вюър, ама дори и да го отворят ще го гледат като голям камък. Ако се опитат да го принтнат ша крашнат и принтера (при сегашните резолюции и обеми на файловете).
Активен

..⢀⣴⠾⠻⢶⣦⠀
  ⣾⠁⢠⠒⠀⣿⡁
  ⢿⡄⠘⠷⠚⠋
  ⠈⠳⣄⠀⠀⠀⠀  Debian, the universal operating system.

ddantgwyn

  • Global Moderator
  • Напреднали
  • *****
  • Публикации: 1262
    • Профил
Но и тук нещата отиват на зле. В Усхадуя Хващай Пътя почти няма нещо, което да не може да се направи само с клавиатура. Да говорим си за противните му клавишни комбинации. Но ги има. А в КДЕ 5 почти не мога да се сетя нещо, което мога да направя без мишка.

Common Keyboard Shortcuts
Активен

the lamer's team honourable member

Naka

  • Напреднали
  • *****
  • Публикации: 3395
    • Профил
И (секретарките) няма да могът да си го атачнат pdf-a в мейла ами ще ти го шернат във фейса. В краен случай ще ти пратят по вайбъра.
« Последна редакция: Jul 11, 2018, 20:42 от Naka »
Активен

Perl - the only language that looks the same before and after encryption.