Автор Тема: Конвертиране на сканирани файлове  (Прочетена 4703 пъти)

Bagatur

  • Напреднали
  • *****
  • Публикации: 267
  • Distribution: Debian Squeeze
  • Window Manager: KDE Development Platform: 4.4.5 , LXDE
    • Профил
Здравейте, някой знае ли програма за конвертиране на сканирани текстови документи към word или odt по добре odt защото използвам опен офис или ако не с програма как точно става
Който ми помогне печели бира  :P ::) [_]3
Благодаря предварително

P.S.
Ако е от значение принтера ми е HP
Дистрото е Debian 6.0.1
Активен

Учим се докато сме живи....

shoshon

  • Напреднали
  • *****
  • Публикации: 497
    • Профил
Re: Конвертиране на сканирани файлове
« Отговор #1 -: Apr 12, 2011, 20:38 »
Здравей,
Освен ако света не се е променил драстично напоследък, това което се опитваш да направиш е почти невъзможно. Google Docs може да конвертира PDF в различни формати, но според мен няма да ти свърши работа.
Активен

pastora

  • Напреднали
  • *****
  • Публикации: 100
  • Distribution: Debian
  • Window Manager: GNOME
  • С нами Бог!
    • Профил
Re: Конвертиране на сканирани файлове
« Отговор #2 -: Apr 12, 2011, 20:38 »
Биричката я засили към братя Стефанови... :)
http://help.learnfree.eu/Applications/YAGF/yagf.html
Активен

...Но някои не обичат да знаят за своя български род, а се обръщат към чужда култура и чужд език и не се грижат за своя български език, но се учат да четат и говорят по гръцки и се срамуват да се нарекат българи. О, неразумни и юроде!...

Случайно да ви звучи актуално?

victim70

  • Напреднали
  • *****
  • Публикации: 454
  • Distribution: Gentoo, Ubuntu
  • Window Manager: Kde Xfce
    • Профил
Re: Конвертиране на сканирани файлове
« Отговор #3 -: Apr 12, 2011, 20:45 »
Здравейте, някой знае ли програма за конвертиране на сканирани текстови документи към word или odt по добре odt защото използвам опен офис или ако не с програма как точно става
Който ми помогне печели бира  :P ::) [_]3
Благодаря предварително

P.S.
Ако е от значение принтера ми е HP
Дистрото е Debian 6.0.1
Търси OCR програми, но всички са доста зле, конвертират към текст. Имаше една руска, която се справяше с кирилица. Ползвал съм само за за да конвертирам числа и да ги сложа в таблица, с това се справят добре.
пробвай с:
gocr
ocrad
clara
cuneiform - Аз я ползвам и е с кирилица
pdfsandwich
tesseract
Виж коя ще ти хареса, има и още ама аз не ги знам

И не збравяй бирата :)
Активен

"Господи, дай ми сила да променя нещата които немога да приема,
дай ми търпение да приема нещата които не мога да променя,
и ми дай мъдрост, да правя разликата между двете"

sstefanov

  • Напреднали
  • *****
  • Публикации: 158
    • Профил
Re: Конвертиране на сканирани файлове
« Отговор #4 -: Apr 12, 2011, 22:12 »
Abby Fine Reader, но е платена.
Активен

lz

  • Напреднали
  • *****
  • Публикации: 172
  • Distribution: Ubuntu
  • Window Manager: Unity
    • Профил
Re: Конвертиране на сканирани файлове
« Отговор #5 -: Apr 12, 2011, 22:40 »
Аз лично пробвах това в Убунту - http://www.webupd8.org/2011/03/gimagereader-tesseract-ocr-gui-gets.html
Мисля, че се справя много добре.
Важно е и качеството на сканирания документ.
« Последна редакция: Apr 12, 2011, 22:47 от lz »
Активен

Bagatur

  • Напреднали
  • *****
  • Публикации: 267
  • Distribution: Debian Squeeze
  • Window Manager: KDE Development Platform: 4.4.5 , LXDE
    • Профил
Re: Конвертиране на сканирани файлове
« Отговор #6 -: Apr 13, 2011, 02:28 »
Явно ще си набирам на ръка тъй като повечето приложения са за гном а аз съм с кде , или пък трябва да компилирам от сорс защото ги няма за дебиан  което ще отнеме два пъти повече време от това да си ги набера а на мен времето ми е ценно
Някой ден ако остане излишно такова и по голям запас от нерви......
Преди четири години ползвах един софт за канон под бозата който работеше много добре и си идваше с драйвърите на скенера.
Мислех че и линукс е на пред в това отношение но уви.
Активен

Учим се докато сме живи....

vstoykov

  • Напреднали
  • *****
  • Публикации: 1286
  • Distribution: Ubuntu
  • Window Manager: Fluxbox
    • Профил
    • WWW
Re: Конвертиране на сканирани файлове
« Отговор #7 -: Apr 13, 2011, 03:43 »
Пробва ли с Google Docs? Забелязах, че Google може да индексира PDF файлове, които съдържат сканирани изображения на текстове. Това значи, че Google извършва OCR на изображенията, които се съдържат във файловете PDF.

Ако този метод работи и файловете са малко на брой ще си спестиш времето за инсталация на софтуера. За по-голям брой файлове ще е по-изгодно да инвестираш време в инсталация на софтуер, който работи от команден ред и да напишеш bash скрипт, който да взима всички файлове от една директория и за всеки файл да извиква програмата за OCR - така няма нужда да цъкаш файловете един по един (ако програмата няма подобна функционалност).

Мисля, че Abby FineReader имаше възможност да работи от команден ред под Линукс. Виж също и във форума на chitanka.info за идеи.

« Последна редакция: Apr 13, 2011, 04:06 от vstoykov »
Активен

pastora

  • Напреднали
  • *****
  • Публикации: 100
  • Distribution: Debian
  • Window Manager: GNOME
  • С нами Бог!
    • Профил
Re: Конвертиране на сканирани файлове
« Отговор #8 -: Apr 14, 2011, 01:02 »
Разгледай това ако искаш.
http://rus-linux.net/nlib.php?name=/MyLDP/office/OCR/OCR_review.html
Активен

...Но някои не обичат да знаят за своя български род, а се обръщат към чужда култура и чужд език и не се грижат за своя български език, но се учат да четат и говорят по гръцки и се срамуват да се нарекат българи. О, неразумни и юроде!...

Случайно да ви звучи актуално?