Linux за българи: Форуми

Програмиране => Web development => Темата е започната от: krasta в Aug 21, 2004, 14:35



Титла: Помогнете да оптимизираме една интересна търсачка
Публикувано от: krasta в Aug 21, 2004, 14:35
Здравейте. Скоро пуснах една нова търсачка която се базира на принципа на паяците, които сканират интернет пространството и добавят всяка нова страница която намерят.
Искам ако може да си кажете мнението си за търсачката и да ми помогните заедно да я подобрим.
Адреса на търсачката е следния :

http://www.krasta.com

Има опция за добавяне на търсачката и към други сайтове.


Титла: Помогнете да оптимизираме една интересна търсачка
Публикувано от: kennedy в Aug 22, 2004, 12:32
здравей,
какво имаш предвид като казваш "да оптимизираме" - дизайн, логика, код ... бъди малко по-конкретен


Титла: Помогнете да оптимизираме една интересна търсачка
Публикувано от: krasta в Aug 22, 2004, 12:56
Здравейте

Смисъла който съм вложил при създаването на търсачката е следния : да се търси информация единствено и само за българия за сега. Предполагам че на всеки много пъти му се е наложило да търси някакъв софт. примерно. Ходи в data.bg - търси. Не намира. Ходи в free.еvrо.nеt. Не намира. Ходи наляво надясно по фрее-тата и търси. Защо да няма едно единствено място където да си търси навсякъде във всички фрее-та и всички бг. страници?

Това е в общи линии самата идея. Предполагам че ще помогне на доста хора и ще им спести време.

Въпроса ми беше като Search engine как се държи? Дали има смисъл да публикувам source кода на самата търсачка с цел доизкосуряване на бъговете които без съмнение има?


Титла: Помогнете да оптимизираме една интересна търсачка
Публикувано от: KeuH в Aug 22, 2004, 16:10
Такава търсачка вече има:

find.dir.bg

А за твоята търсачка.  Направих няколко примерни търсения.  Първо търсих за "Петканов" и намери доста статии във вестници.  После търсих за Зиновиев и намери сайта на linux-bulgaria.org, което долу-горе очаквах да намеря.  После обаче се разочаровах.  Търсих за "Уиндам Какавидите" и очаквах да ми даде сайта sf.ludost.net, но не стана това.  Даде ми само един резултат, който не беше форматиран добре -- заемаше цялата страница.  А Google намери това, което търсех.  Даде общо три резултата.

Идеята да се търси само на кирилица не е добра, т.к. имената на софтуер са винаги на латиница.

А за публикуването на кода бих те посъветвал да го направиш, защото така ще е по-лесно да се "оптимизира"


Титла: Помогнете да оптимизираме една интересна търсачка
Публикувано от: krasta в Aug 24, 2004, 13:50
Здравейте
за мен е добре че самата търсачка е намерила това което си търсил в 2 от 3-те опита. Все пак аз съм я пуснал от има няма 1 месец. Не мога да се сравнявам с google.

Може би не си ме разбрал правилно. Не се търси само на кирилица а само в сайтове които са на кирилица. Това означава че цялата информация която е на даден български сайт без значение дали е на кирилица или не се взима и после се търси в нея.


Титла: Помогнете да оптимизираме една интересна търсачка
Публикувано от: sebastianz55 в Aug 24, 2004, 13:57
Цитат (krasta @ Авг. 24 2004,14:50)
Здравейте
за мен е добре че самата търсачка е намерила това което си търсил в 2 от 3-те опита. Все пак аз съм я пуснал от има няма 1 месец. Не мога да се сравнявам с google.

Може би не си ме разбрал правилно. Не се търси само на кирилица а само в сайтове които са на кирилица. Това означава че цялата информация която е на даден български сайт без значение дали е на кирилица или не се взима и после се търси в нея.

1. Всеки ще я сравнява първо търкачката с Google
2. Не виждам смисъл да търси само в сайтове на кирициа, така аз не мога и да намеря 20% от това, което може да открия с Google например.
Пок и сайтовате изцяла на кирилица са много малки, все ще се намери някой чужда дума и т.н.

Не мисля, че така развита, идеята ти е полезна.


Титла: Помогнете да оптимизираме една интересна търсачка
Публикувано от: в Aug 24, 2004, 14:42
здравей, търсачката ти ми допадна. поздравления. публикувай сорсовете за да я оптимизираме :)


Титла: Помогнете да оптимизираме една интересна търсачка
Публикувано от: в Aug 31, 2004, 12:24
find.dir.bg sux, naprawih si edin script s LWP i WWW::Mechanize, koito raboti dosta po-dobre, taka che ako na niakoi mu se zanimawa ne e losha ideia da naprawi niakakaw zamestitel.


Титла: Помогнете да оптимизираме една интересна търсачка
Публикувано от: в Oct 14, 2004, 14:11
Цитат
оптимизираме


Според мен, не е нужна оптимизация отсега. Трябва да се измислят (иновативни) идеи, как да се извършва търсенето и как да се подреждат резултатите.

Ето, като пример. Търсачките често игнорират символите '-' '(' и други подобни. Не различават, резултатите от форумите (понякога искам да търся само в различни форуми, понякога - извън) и други подобни.

Освен публикуването на сорс кода, трябва да се направи форум (форуми бол, ама...) в който да има тема за идеи при търсенето (за което споменах), идеи за рекламирането на търсачката (bgtop не е достатъчно, въпреки че от там научих), подобрение на сорс кода (т.е. споменатите оптимизиране и изчистване от бъгове) и не на последно място подръжка - едва ли един сървър е в състояние да подържа множество заявки.

Междо другото find.dir.bg изобщо не ми допада. Има тежък (за гледане) интерфейс, а освен това, не притежава една от основните предимства - да може да се вгражда в сайтове.


Титла: Помогнете да оптимизираме една интересна търсачка
Публикувано от: krasta в Oct 15, 2004, 19:28
Благодаря ти за мнението : njakoj
Много варианти относно как се извършва търсенето няма. Аз съм се постарал да направя най-опростения и най-бързият вариант за търсене (select edi_kakvo_si,edi_shto_si from table1 where MATCH (neshto) AGAINST ('drugo_neshto' .....)). Според това което четох и други хора ми предложиха това е най-оптималното. Ако някой има по-добра идея моля да я сподели .

Относно показването на резултатите : много болна тема за мен. Хич не ми се иска да ползвам метода на GOOGLE. Иска ми се да измисля алгоритъм който да е по-добър от този на GOOGLE ама не мога. Получих доста предложения като например да се гласува за даден сайт, да се следят посещенията му, да се следи колко линка има към този сайт , ама всички си имат доста недостатъци.

Относно форумите : задъжително ще пусна форум относно проблемите при търсенето и начина на оптимизиране. За момента получавам доста коментари в другите фрее форуми ама не е достатъчно . Ше трябва да пусна и в
http://www.krasta.com .

Относно събирането на информацията : когато започнах писането на тази търсачка и на идея си нямах колко много процесорно време ще ми трябва за да обработвам информацията която се натрупва. В момента работят 4 компютъра за търсачката : 2 за паяците които сабират информацията и 2 за самата търсачка свързани в cluster server , което гарантира че сървара ще издържи на голям брой заявки.

И тъй като пари не се получават никакви от тази търсачка аз и не мога да отделя за реклама и ползвам безплатните источници на такава.

Ако имате някакви идей относно подобряването както на тряфика така и на начина на търсене ще се радвам да ги споделите. :D


Титла: Помогнете да оптимизираме една интересна търсачка
Публикувано от: ohubohu в Oct 15, 2004, 21:29
Добра е търсачката. Има още доста да се направи по нея, но си тръгнал във вярната посока. Сравнението с find.dir.bg е неуместно, поне за мен.
Давай да помагаме, направеното досега е добро!

ПС. Някой беше казал, че не открива нищо от ludost.net - и на мен не ми намери нещо което е там. Случва се :)

Успех!