Автор Тема: Помогнете да оптимизираме една интересна търсачка  (Прочетена 2901 пъти)

krasta

  • Участници
  • ***
  • Публикации: 5
    • Профил
Здравейте. Скоро пуснах една нова търсачка която се базира на принципа на паяците, които сканират интернет пространството и добавят всяка нова страница която намерят.
Искам ако може да си кажете мнението си за търсачката и да ми помогните заедно да я подобрим.
Адреса на търсачката е следния :

http://www.krasta.com

Има опция за добавяне на търсачката и към други сайтове.
Активен

kennedy

  • Напреднали
  • *****
  • Публикации: 2151
  • Николай Колев
    • Профил
здравей,
какво имаш предвид като казваш "да оптимизираме" - дизайн, логика, код ... бъди малко по-конкретен
Активен

"за всичко иде час" Еклесиаст 3:1
всеки пост - отговор на въпрос
-----------------
24.12.2003 "MS Free"

krasta

  • Участници
  • ***
  • Публикации: 5
    • Профил
Здравейте

Смисъла който съм вложил при създаването на търсачката е следния : да се търси информация единствено и само за българия за сега. Предполагам че на всеки много пъти му се е наложило да търси някакъв софт. примерно. Ходи в data.bg - търси. Не намира. Ходи в free.еvrо.nеt. Не намира. Ходи наляво надясно по фрее-тата и търси. Защо да няма едно единствено място където да си търси навсякъде във всички фрее-та и всички бг. страници?

Това е в общи линии самата идея. Предполагам че ще помогне на доста хора и ще им спести време.

Въпроса ми беше като Search engine как се държи? Дали има смисъл да публикувам source кода на самата търсачка с цел доизкосуряване на бъговете които без съмнение има?
Активен

KeuH

  • Напреднали
  • *****
  • Публикации: 68
    • Профил
Такава търсачка вече има:

find.dir.bg

А за твоята търсачка.  Направих няколко примерни търсения.  Първо търсих за "Петканов" и намери доста статии във вестници.  После търсих за Зиновиев и намери сайта на linux-bulgaria.org, което долу-горе очаквах да намеря.  После обаче се разочаровах.  Търсих за "Уиндам Какавидите" и очаквах да ми даде сайта sf.ludost.net, но не стана това.  Даде ми само един резултат, който не беше форматиран добре -- заемаше цялата страница.  А Google намери това, което търсех.  Даде общо три резултата.

Идеята да се търси само на кирилица не е добра, т.к. имената на софтуер са винаги на латиница.

А за публикуването на кода бих те посъветвал да го направиш, защото така ще е по-лесно да се "оптимизира"
Активен

krasta

  • Участници
  • ***
  • Публикации: 5
    • Профил
Здравейте
за мен е добре че самата търсачка е намерила това което си търсил в 2 от 3-те опита. Все пак аз съм я пуснал от има няма 1 месец. Не мога да се сравнявам с google.

Може би не си ме разбрал правилно. Не се търси само на кирилица а само в сайтове които са на кирилица. Това означава че цялата информация която е на даден български сайт без значение дали е на кирилица или не се взима и после се търси в нея.
Активен

sebastianz55

  • Напреднали
  • *****
  • Публикации: 1136
    • Профил
    • WWW
Цитат (krasta @ Авг. 24 2004,14:50)
Здравейте
за мен е добре че самата търсачка е намерила това което си търсил в 2 от 3-те опита. Все пак аз съм я пуснал от има няма 1 месец. Не мога да се сравнявам с google.

Може би не си ме разбрал правилно. Не се търси само на кирилица а само в сайтове които са на кирилица. Това означава че цялата информация която е на даден български сайт без значение дали е на кирилица или не се взима и после се търси в нея.

1. Всеки ще я сравнява първо търкачката с Google
2. Не виждам смисъл да търси само в сайтове на кирициа, така аз не мога и да намеря 20% от това, което може да открия с Google например.
Пок и сайтовате изцяла на кирилица са много малки, все ще се намери някой чужда дума и т.н.

Не мисля, че така развита, идеята ти е полезна.
Активен

С уважения:
Sebastianz55
------------------
http://www.fsa-bg.org
                              
Open Fest Initiative  http://openfest.org
                                              
Моля ви, уважавайте процесорното време на другите - пишете на кирилица и използвайте търсачката на форума!

  • Гост
здравей, търсачката ти ми допадна. поздравления. публикувай сорсовете за да я оптимизираме '<img'>
Активен

  • Гост
find.dir.bg sux, naprawih si edin script s LWP i WWW::Mechanize, koito raboti dosta po-dobre, taka che ako na niakoi mu se zanimawa ne e losha ideia da naprawi niakakaw zamestitel.
Активен

  • Гост
Цитат
оптимизираме


Според мен, не е нужна оптимизация отсега. Трябва да се измислят (иновативни) идеи, как да се извършва търсенето и как да се подреждат резултатите.

Ето, като пример. Търсачките често игнорират символите '-' '(' и други подобни. Не различават, резултатите от форумите (понякога искам да търся само в различни форуми, понякога - извън) и други подобни.

Освен публикуването на сорс кода, трябва да се направи форум (форуми бол, ама...) в който да има тема за идеи при търсенето (за което споменах), идеи за рекламирането на търсачката (bgtop не е достатъчно, въпреки че от там научих), подобрение на сорс кода (т.е. споменатите оптимизиране и изчистване от бъгове) и не на последно място подръжка - едва ли един сървър е в състояние да подържа множество заявки.

Междо другото find.dir.bg изобщо не ми допада. Има тежък (за гледане) интерфейс, а освен това, не притежава една от основните предимства - да може да се вгражда в сайтове.
Активен

krasta

  • Участници
  • ***
  • Публикации: 5
    • Профил
Благодаря ти за мнението : njakoj
Много варианти относно как се извършва търсенето няма. Аз съм се постарал да направя най-опростения и най-бързият вариант за търсене (select edi_kakvo_si,edi_shto_si from table1 where MATCH (neshto) AGAINST ('drugo_neshto' .....)). Според това което четох и други хора ми предложиха това е най-оптималното. Ако някой има по-добра идея моля да я сподели .

Относно показването на резултатите : много болна тема за мен. Хич не ми се иска да ползвам метода на GOOGLE. Иска ми се да измисля алгоритъм който да е по-добър от този на GOOGLE ама не мога. Получих доста предложения като например да се гласува за даден сайт, да се следят посещенията му, да се следи колко линка има към този сайт , ама всички си имат доста недостатъци.

Относно форумите : задъжително ще пусна форум относно проблемите при търсенето и начина на оптимизиране. За момента получавам доста коментари в другите фрее форуми ама не е достатъчно . Ше трябва да пусна и в
http://www.krasta.com .

Относно събирането на информацията : когато започнах писането на тази търсачка и на идея си нямах колко много процесорно време ще ми трябва за да обработвам информацията която се натрупва. В момента работят 4 компютъра за търсачката : 2 за паяците които сабират информацията и 2 за самата търсачка свързани в cluster server , което гарантира че сървара ще издържи на голям брой заявки.

И тъй като пари не се получават никакви от тази търсачка аз и не мога да отделя за реклама и ползвам безплатните источници на такава.

Ако имате някакви идей относно подобряването както на тряфика така и на начина на търсене ще се радвам да ги споделите. '<img'>
Активен

ohubohu

  • Напреднали
  • *****
  • Публикации: 355
    • Профил
Добра е търсачката. Има още доста да се направи по нея, но си тръгнал във вярната посока. Сравнението с find.dir.bg е неуместно, поне за мен.
Давай да помагаме, направеното досега е добро!

ПС. Някой беше казал, че не открива нищо от ludost.net - и на мен не ми намери нещо което е там. Случва се '<img'>

Успех!
Активен

             KISS
(Keep It Simple, Stupid)