Автор Тема: Osr на картинка ?  (Прочетена 1937 пъти)

hack_man

  • Напреднали
  • *****
  • Публикации: 108
    • Профил
Osr на картинка ?
« -: Sep 12, 2006, 14:53 »
искам да извадя текста на една картинка т.е. цифрите в текст
нещо като в сайта на mtel.bg за смс-ите
някои знае ли програмче, сорс, библиотека или нещо с което да стане '<img'>?
принципно съм се оориентирал да пиша ботчето на perl но мойе и др. език

п.п. знам че темата не е за този раздел моля някои да я премести плс...
Активен

sdr

  • Напреднали
  • *****
  • Публикации: 655
    • Профил
Osr на картинка ?
« Отговор #1 -: Sep 12, 2006, 15:03 »
OSR или OCR? прегледай тази статия от слашдот за да се поориентираш
Активен

gat3way

  • Напреднали
  • *****
  • Публикации: 6050
  • Relentless troll
    • Профил
    • WWW
Osr на картинка ?
« Отговор #2 -: Sep 12, 2006, 15:20 »
Уааа '<img'>

Пробвай да разпознаеш "цифричките" от сайта на мтел с какъвто и да е OCR - надали ще имаш повече от 10% успех, че и тва ми се вижда много.

Имайки предвид от една страна тази успевяемост, от друга страна процесорното време и честотната лента, която се троши за задачата, мога да ти предложа по-успешен подход: bruteforce!!!  

Разбираш ли, шанса да успееш да се лог-неш така е много по-голям!!! Шанса да направиш хахорската поразия на живота си тоже '<img'>

Другият вариант е да подобриш съществено алгоритъма за разпознаване. Апропо, след като го подобриш, напиши и един скрипт дето пуска 200000 анонимни мнения в slashdot, тогава целият свят ще те признае за зъл хахор, хак дъ планет дет се вика...
Активен

"Knowledge is power" - France is Bacon

luda_glawa

  • Напреднали
  • *****
  • Публикации: 652
  • Distribution: Kubuntu
  • Window Manager: KDE
    • Профил
    • WWW
Osr на картинка ?
« Отговор #3 -: Sep 12, 2006, 15:25 »
Цитат (hack_man @ Сеп. 12 2006,15:53)
искам да извадя текста на една картинка т.е. цифрите в текст
нещо като в сайта на mtel.bg за смс-ите
някои знае ли програмче, сорс, библиотека или нещо с което да стане '<img'>?
принципно съм се оориентирал да пиша ботчето на perl но мойе и др. език

п.п. знам че темата не е за този раздел моля някои да я премести плс...

Това не е ли леко невъзможно?
Активен

С Уважение:

Luda Glawa ;-)

hack_man

  • Напреднали
  • *****
  • Публикации: 108
    • Профил
Osr на картинка ?
« Отговор #4 -: Sep 12, 2006, 15:38 »
Цитат (luda_glawa @ Сеп. 12 2006,16:25)
Цитат (hack_man @ Сеп. 12 2006,15:53)
искам да извадя текста на една картинка т.е. цифрите в текст
нещо като в сайта на mtel.bg за смс-ите
някои знае ли програмче, сорс, библиотека или нещо с което да стане '<img'>?
принципно съм се оориентирал да пиша ботчето на perl но мойе и др. език

п.п. знам че темата не е за този раздел моля някои да я премести плс...

Това не е ли леко невъзможно?

да ама не ..
Възможно е точно поради причината че има софт който го прави и се казва FineReader .. скенира, разпознава и обръща в doc, pdf, и много други
на мен не ми трябва тази огромна и 'Джам' базирана програма, а скрипт, библиотека или нещо с чиято помощ да си направя бот

п.п. споко за м-тел има програмчета вече. не ми трябва. + това картинките не са толкова засукани както в м-тел и на мен 50% успеваемост ми е мнооо достатачна '<img'>
Активен

gat3way

  • Напреднали
  • *****
  • Публикации: 6050
  • Relentless troll
    • Профил
    • WWW
Osr на картинка ?
« Отговор #5 -: Sep 12, 2006, 15:56 »
Значи доколкото съм запознат с тези алгоритми, при положение че имаш достатъчно много линийки, петънца и точки, векторизацията ще доведе до някаква грозна ситуация. Оттам нататък е достатъчно част от числото да излиза извън картинката (но така че гледайки го все пак да го разпознаеш - примерно една цифра "6" на която лявата 1/4 е извън картинката) и разпознаването пропада със сигурност. По мои скромни наблюдения почти винаги нарочно част от числото/думата излиза извън картинката, съвсем нарочно е това да знаеш '<img'>

50% успевяемост ако изкараш ехеееее обезсмисляш проверката '<img'>

Трябваше да пробваш да подадеш няколко такива картинки на finereader-a преди това, защо не пробваш да видим от колко картинки ще уцелиш числото поне веднъж...
Активен

"Knowledge is power" - France is Bacon

sdr

  • Напреднали
  • *****
  • Публикации: 655
    • Профил
Osr на картинка ?
« Отговор #6 -: Sep 12, 2006, 15:57 »
Дай да видим семпъл от образите ... винаги ми е било интересно колко сложно е да се направи срещу точно определена система. По принцип е мноого трудно но ако е срещу определена система ..
Активен

hack_man

  • Напреднали
  • *****
  • Публикации: 108
    • Профил
Osr на картинка ?
« Отговор #7 -: Sep 12, 2006, 16:33 »
ето и това което искам да извадя Цък ТУК
Активен

sdr

  • Напреднали
  • *****
  • Публикации: 655
    • Профил
Osr на картинка ?
« Отговор #8 -: Sep 12, 2006, 16:38 »
таковата ... аз на тоя адерс виждам само чертички които са по-скоро завлачени точки .... аз верно съм прост ма хептен не мога да го разпозная тва с мойта простата глава
Активен

sdr

  • Напреднали
  • *****
  • Публикации: 655
    • Профил
Osr на картинка ?
« Отговор #9 -: Sep 12, 2006, 16:45 »
Цитат (gat3way @ Сеп. 12 2006,16:56)
Значи доколкото съм запознат с тези алгоритми, при положение че имаш достатъчно много линийки, петънца и точки, векторизацията ще доведе до някаква грозна ситуация. Оттам нататък е достатъчно част от числото да излиза извън картинката (но така че гледайки го все пак да го разпознаеш - примерно една цифра "6" на която лявата 1/4 е извън картинката) и разпознаването пропада със сигурност. По мои скромни наблюдения почти винаги нарочно част от числото/думата излиза извън картинката, съвсем нарочно е това да знаеш '<img'>

50% успевяемост ако изкараш ехеееее обезсмисляш проверката '<img'>

Трябваше да пробваш да подадеш няколко такива картинки на finereader-a преди това, защо не пробваш да видим от колко картинки ще уцелиш числото поне веднъж...

Петанцата и точиците си има алгоритми за чистенето им дори на база площ ако ги удариш пак си напреде. Ако се разпознават само числа положението става МООООГО лесно  имаш 10 символа да пребориш... може да се ползват и частични начални образи т.е. клипването да не е проблем. Всичко е въпрос на как ще си обучиш невронната мрежа и как ще си направиш сегменитирането което срещу определена система ще е доста лесно споредемен
Активен

sdr

  • Напреднали
  • *****
  • Публикации: 655
    • Профил
Osr на картинка ?
« Отговор #10 -: Sep 12, 2006, 16:52 »
ХАХА това е детска игра ... картинката обаче зависи от сесията ... т.е. от някакво куки ... а иначе:

1. "Шумът" е в лилаво ... колко удобно
2. Само цифри са!
3. Затруднението идва от скалиране

като фанеш петното само по отношението на страните еднозначно определяш някои от числата ... ако има пороблем нормализираш размера .... и сравняваш с еталон - който има най много съвпадения това е твоето число ... тия хора не се вземат на сериозно просто

п.с. докато кукито е едно и също числото остава същотот  сравнявай докато не си сигурен на 100% ... нещастници да бяха драснали един е-маил да им кажа как да вгорчат живота на хакорите



Активен

hack_man

  • Напреднали
  • *****
  • Публикации: 108
    • Профил
Osr на картинка ?
« Отговор #11 -: Sep 12, 2006, 18:26 »
мерси за съветите '<img'> супер си
аз знам че е смотана картинката но какво ада се прави '<img'>
тъпаци са тези от играта но по-добре за хора като мен  '<img'>

п.п. пробвах програмката но за съжаление нямам успех с нея '<img'>
Активен