Linux за българи: Форуми

Програмиране => Общ форум => Темата е започната от: mhydra в Aug 03, 2005, 11:00



Титла: Редактиране на PDF документи с Perl
Публикувано от: mhydra в Aug 03, 2005, 11:00
Наскоро ми се наложи да направя програма за редактиране на PDF документи с Perl. В Perl има допълнителни 4 модули 3 от които ги пробвах но те наработят или поне аз неуспях да направя нищо с тях.
Това са модулите PDF::Create , PDF::Reuse , PDF::API2 , CAM::PDF .
От тези модули успях да свърша нещо съществено само с PDF::Reuse.
Но имам проблем с кирилизацията , когато вкарвам текст на кирилица в PDF документа след това символите на кирилицата  излизат на маймуница.Пробвах най-различни кодировки с вградените методи encode(); и decode(); обаче няма резултат .
Някой да може да помогне?
Защо другите модули не работят?

Проблема е решен, използвам PDFLib и LASi.h

PDFLib го има в варианти за много езици включително и за С.
Предупреждение: аз не можах да го пусна с PHP, така че подобре го ползвайте под Perl(изпробвано) и C.

LASi.h го използвам за кирилизация, има много худави функций за обработка на текст, то и самият хедър е само за това.

Вижте по надолу моят последен отговор.


Титла: Редактиране на PDF документи с Perl
Публикувано от: romeo_ninov в Aug 03, 2005, 13:46
Провери каква е версията на документа, защото ако perl ползва ghostscript библиотеки, последния работи само с документи до жерсия 1.3 включително


Титла: Редактиране на PDF документи с Perl
Публикувано от: в Aug 03, 2005, 15:11
Документа го проверих, той е точно 1.3 версия.
Обаче целият ми документ си излиза, само че нещо кирилизацията неиска. Абсолютно всички познати кодировки използвах (cp1251,utf8 и др.).
Дали на самият документ не трябва да му се set-не някакъв encoding.
Аз сега в момента кодирам само текста който ми трябва с cp1251.


Титла: Редактиране на PDF документи с Perl
Публикувано от: kostadinz в Aug 03, 2005, 17:08
мисля, че в документа се залага с какъв шрифт ще е текста- та този шрифт трябва и да е кирилизиран (да укаже да се ползва такъв, който е кирилизиран)


Титла: Редактиране на PDF документи с Perl
Публикувано от: CaBA в Aug 04, 2005, 12:46
Цитат
защото ако perl ползва ghostscript библиотеки, последния работи само с документи до жерсия 1.3 включително


И с 1.4 работи, поне моя (версия 7.07).

Сега по темата - доколкото разбирам, опитваш се да извлечеш текст от pdf файла. Защо не го конвертираш към обикновен текст с pdftotext? После може да направиш обратната конверсия.


Титла: Редактиране на PDF документи с Perl
Публикувано от: в Aug 22, 2005, 08:30
Реших проблема сега в момента ползвам успешно две библиотеки, едната под С, а другата е модул под Perl.
На С е LASi.h ,този хедър изизсква да имате инсталиран glibc,а модулът под perl се казва PDFLib, има го и за PHP обаче нещо имах проблем с инсталацията и го зарязах. Иначе LASi.h и PDFLib работят безупречно,а LASi поддържа всички езици които може да се досетите (арабски,китайски,таджикистански и др.) само че написаното е във вид на графика, докато в PDFLib всичко си е текст.