Автор Тема: OCR и кирилица?  (Прочетена 5659 пъти)

marsislav

  • Напреднали
  • *****
  • Публикации: 50
  • Distribution: Ubuntu
  • Window Manager: LXDE
    • Профил
    • WWW
OCR и кирилица?
« -: Aug 21, 2009, 01:08 »
Здравейте отново!
Налага ми се да използвам Optical Character Recognition програма разпознаваща кирилица. Потърсих в Google  но не пападнах на нищо подходящо. Систамата ми  е "Ubuntu" 9.04.
Прабвах да стартирам и няколко Windows OCR програми /чрез WINE 1.1.27/ , като например  Fine Reader CuneiForm 12, но не работят както трябва.
Благодаря Ви предварително!
Marsislav
Активен

Naka

  • Напреднали
  • *****
  • Публикации: 3467
    • Профил
Re: OCR и кирилица?
« Отговор #1 -: Aug 21, 2009, 03:05 »
И аз преди няколко месаца търсих и не намерих нищо.  Имаше няколко но с изключително лошо качество на разпознаването при малки букви. Имаше и някъкъв свободен проект на гоогле, но беше в много начална фаза и за нищо не ставаше.

Качествени свободни OCR програми все още липсват за линукс. Незнам как е с платените.
Активен

Perl - the only language that looks the same before and after encryption.

foxb

  • Напреднали
  • *****
  • Публикации: 175
    • Профил
    • WWW
Re: OCR и кирилица?
« Отговор #2 -: Aug 21, 2009, 05:29 »
Преди доста време пробвах FineReader - платена
http://www.abbyy.com/

Вършеше сносна работа т.е. ~70-80% разпознаваемост, но за съжаление е само за уиндоус.

Имай напредвид, че качеството на сканиране играе много важна роля.

Пробвал съм доста други, но за текстове на кирилица не намерих по-добра.

lz

  • Напреднали
  • *****
  • Публикации: 172
  • Distribution: Ubuntu
  • Window Manager: Unity
    • Профил
Re: OCR и кирилица?
« Отговор #3 -: Aug 21, 2009, 08:20 »
Определено зависи как сканираш. Препоръчително е файловете да са в TIFF формат, с резолюция не по-малко от 300dpi.
Активен

mimosh

  • Напреднали
  • *****
  • Публикации: 317
  • Distribution: Kubuntu
  • Window Manager: KDE
    • Профил
Re: OCR и кирилица?
« Отговор #4 -: Aug 21, 2009, 09:06 »
Дефинирай но не работят както трябва.

CuneiForm 12 е много добра програма, ползвал съм я под уиндоус (40 стр ми ги разпозна като единствено даде грешки в номерацията на документа, защото беше с римски цифри). Доколкото знам има порт за Линукс - QT-CuneiForm или нещо такова беше. За да работи коректно просто трябва да смениш езика за разпознаване от Руско-Английски на Български. Единствен недостатък на програмата е че не работи с комбинация Български-Английски.

Активен

marsislav

  • Напреднали
  • *****
  • Публикации: 50
  • Distribution: Ubuntu
  • Window Manager: LXDE
    • Профил
    • WWW
Re: OCR и кирилица?
« Отговор #5 -: Aug 23, 2009, 00:41 »
Благодаря за отговорите.
Не знаех, че има версия на Cuneiform за Линукс....
Нищо. Вече я изтеглих и ще се опитам да си я компилирам /вече се опитах но ми извежда съобщение за грешка още в началото на процеса на компилация. Ще се опитвам пак :)/
Поздарави! :)
Активен

mikis

  • Напреднали
  • *****
  • Публикации: 746
  • Distribution: Debian Testing
  • Window Manager: KDE
    • Профил
Re: OCR и кирилица?
« Отговор #6 -: Aug 23, 2009, 14:53 »
Впрочем, някой да е попадал на бинарен пакет за Дебиан на cuneiform-qt?
Активен

go_fire

  • Global Moderator
  • Напреднали
  • *****
  • Публикации: 8911
  • Distribution: Дебиан Сид
  • Window Manager: ROX-Desktop / е17
  • кашик с гранатомет в танково поделение
    • Профил
    • WWW
Re: OCR и кирилица?
« Отговор #7 -: Aug 23, 2009, 19:35 »
Както вече няколко пъти съм писал, че то само за Дебиан има бинарни, за други не. Намират се в хранилището на altlinux.org, които са и авторите на cuneiform-qt. И да Куниформа се справя чудесно с кирилица, и да има опция за български текст. Забравете всякакви файнове, майнове, омнита, комнита и други комерчески истории, които даже и не работят добре с винце.
Активен

В $por4e2 e истината  ;)

***

Aко даваха стипендия за най-глупави, щях да съм човека с най-много Mини Kупъри

***

Reborn since 1998 || 15.09.2007 totally М$ free && conscience clear

mikis

  • Напреднали
  • *****
  • Публикации: 746
  • Distribution: Debian Testing
  • Window Manager: KDE
    • Профил
Re: OCR и кирилица?
« Отговор #8 -: Aug 23, 2009, 22:47 »
Както вече няколко пъти съм писал, че то само за Дебиан има бинарни, за други не. Намират се в хранилището на altlinux.org ...

Добре де, как в хранилището на една RPM базирана дистрибуция ще има пакети за Debian?! ??? Или аз нещо недоглеждам?

За мой късмет и alien не работи както трябва, заради това и не мога да обърна rpm-а в deb пакет. >:(

go_fire,
можеш ли да дадеш директен линк за сваляне?

Също така, ще е добре да се обясни как се компилира програмата от сорс, тъй като й липсват стандартните configure и make скриптове.
Активен

go_fire

  • Global Moderator
  • Напреднали
  • *****
  • Публикации: 8911
  • Distribution: Дебиан Сид
  • Window Manager: ROX-Desktop / е17
  • кашик с гранатомет в танково поделение
    • Профил
    • WWW
Re: OCR и кирилица?
« Отговор #9 -: Aug 24, 2009, 08:51 »
Добре приемам, че може "лекинко" да съм се объркал. Тъй като не бях ползвал Алт-а не знаех, че е някакъв PCLinux OS клонинг. А и Куниформа ползвам винаги бозавата версия, не само защото повече от година нямаше за Линукс и още толкова без графична обвивка, но някак си КДЕ4 ми е извънредно противно, което ме кара последните месеци да съм основно на Гном, което си е постижение.

Иначе официалната страница, както сигурно знаеш е:

http://www.altlinux.org/Cuneiform-Qt

И този ред:
Цитат
apt-get install cuneiform-qt
ме е заблудил, пък то било роднина на ПЦЛинукс. Има git, които инж. Тони Тошев преди няколко месеца пробва и нещо не се справи.

За съжаление не мога да помогна много, защото нямам пряка работа с Qt GUI за Cuneiform-Linux. Но пък бозавата версия си работи страхотно с вино и мезе и не ми се занимава изобщо с Qt4 безумия.

п.п. Сега забелязах, че има връзка към още една обвивка, която до момента бях пропуснал, нищо, че се интересувам живо от темата:

http://symmetrica.net/cuneiform-linux/yagf-ru.html
« Последна редакция: Aug 24, 2009, 08:54 от go_fire »
Активен

В $por4e2 e истината  ;)

***

Aко даваха стипендия за най-глупави, щях да съм човека с най-много Mини Kупъри

***

Reborn since 1998 || 15.09.2007 totally М$ free && conscience clear

marsislav

  • Напреднали
  • *****
  • Публикации: 50
  • Distribution: Ubuntu
  • Window Manager: LXDE
    • Профил
    • WWW
Хранилища на AltLinux?
« Отговор #10 -: Aug 24, 2009, 10:29 »
Някой може ли да ми даде хранилищата на AltLinux, за да мога да си инсталирам Cumeiform чрез Apt-get?
Потърсих в Google, но не ги намирех.
Активен

Kras

  • Напреднали
  • *****
  • Публикации: 155
  • Distribution: Arch
    • Профил
Re: OCR и кирилица?
« Отговор #11 -: Aug 24, 2009, 10:53 »
Ето ти и още едно GUI за Cumeiform:
http://symmetrica.net/cuneiform-linux/yagf-en.html

Има и някакъв скрипт self-installing binary archive: http://symmetrica.net/cuneiform-linux/yagf-0.8.1-i586.sh_

Не съм го пробвал но мисля, че е добро.
Успех и да не забравиш да кажеш какво си подкарал и как под Линукс!
Активен

victim70

  • Напреднали
  • *****
  • Публикации: 454
  • Distribution: Gentoo, Ubuntu
  • Window Manager: Kde Xfce
    • Профил
Re: OCR и кирилица?
« Отговор #12 -: Aug 24, 2009, 18:26 »
А някой да знае как се компилирга cuneiform. На сорс е направено само за Visual studio. Няма ли някакъв чалъм без много пребарване да го подкарам?

Открих го https://launchpad.net/cuneiform-linux/+download
« Последна редакция: Aug 24, 2009, 18:42 от victim70 »
Активен

"Господи, дай ми сила да променя нещата които немога да приема,
дай ми търпение да приема нещата които не мога да променя,
и ми дай мъдрост, да правя разликата между двете"

marsislav

  • Напреднали
  • *****
  • Публикации: 50
  • Distribution: Ubuntu
  • Window Manager: LXDE
    • Профил
    • WWW
Открих DEB пакета...
« Отговор #13 -: Aug 24, 2009, 20:44 »
Здравейте! Открих DEB пакета с Cuneiform / http://narod.ru/disk/7652945000/cuneiform-0.6-bzr387-i386.deb.html / /Intel/
И http://narod.ru/disk/7633394000/cuneiform_0.6.0-1_amd64.deb.html /AMD 64 битови процесори/.
Инсталацията минава безпроблемно, но не успявам да го стартирам.
Когато напиша "Cuneiform" в конзолата ми изкарва следното съобщение - cuneiform: error while loading shared libraries: libMagick++.so.10: cannot open shared object file: No such file or directory

Какво трябва да направя /инсталирам , за да го подкарам?
Активен

stealth01

  • Гост
Re: OCR и кирилица?
« Отговор #14 -: Aug 24, 2009, 21:39 »
http://packages.debian.org/lenny/libmagick%2B%2B10

ако има и други зависимости, ползвай търсачката за файлове/пакети на debian: http://www.debian.org/distrib/packages
Активен