« -: Sep 09, 2014, 01:56 »
Нали започна предизборната кампания и тия дни съм на тема изследване на политически тролове из интернет.
С уговорката че разбира се няма как да следя родния интернет, та се концентрирах върху новинарските сайтове, специално тези на дарик и на икономедия, защото ми се струват сравнително интересни, поради няколко причини.
Сега на първо време трябва да се дефинира понятието "платен трол", защото според мен в него се влагат описанията на доста различни типове персонажи. След размишления по въпроса стигнах до извода че "платените тролове" всъщност би трябвало да се отличават по това че постват неща спуснати им отгоре, в този ред на мисли не влизат в диалози и конфликти с останалите. Сега има много партийни активисти, които не правят така и според мен част от тях са също платени тролове, в смисъл че си клатят топките из партийните клубове и от нямане на друга работа, запълват времето с политпропаганда. Но тия не са интересни, плюс това лесно може да се изолират по един прост признак - извън работно време не се вясват. И остават естествено болните мозъци, които дежурят нон-стоп и според мен на тях не им се плаща за това, тия са си достатъчно луди и бидейки достатъчно луди, нямат навика да си сменят идентичностите и бързо ги научаваш кои са, та в крайна сметка и те не е сложно да се отхвърлят. Така че сравнително лесно могат да се изолират коментарите на въпросните платени тролове.
Интересни са точно тия де, платените тролове, от разни частни агенции като Leadway дето работят по опорни точки на партиите. По-скоро поведението им, защото то отразява виждането на въпросната партия за това как трябва да се промиват мозъците на мат'ряла.
Тъй като имам ограничения във времето, концентрирах се върху най-големите групи платени тролове - тези на БСП и на ГЕРБ. След известни наблюдения, стигнах до извода че стратегията на червените тролове е проста и елементарна - bruteforce с безогледен спам. Това може на първо време да звучи малоумно, но като се замислих всъщност не е толкова малоумно и освен другото гони SEO цели. Ако отидеш да търсиш в google "мутрата", още в първите резултати се споменава Бойко и това е познай защо - заради тролски коментари под някакви свръх актуални за времето си новини.
Герберските платени тролове забелязвам прилагат различна стратегия - на тях идеята им е веднага след излизането на някаква новина да се разпишат с по възможност първите няколко коментара с някакви копи-пейстнати възхвали на Бойко или нареждания на комунистите. В това също има логика, защото четейки новината, обикновено отдолу са и първите няколко коментара и тъй като на никой нормален човек не му се четат няколкостотин малоумни коментара надолу, то той остава с идеята че това е масовата обществена реакция.
Та заради това и подбора на двата сайта - на дарикнюз и на дневник - и двата са популярни, но дарикнюз изглежда значително по-"червен" откъм коментари поради простата причина че ги визуализира в обратен ред, т.е най-отгоре са най-новите. Там няма и регистрация, което допълнително улеснява кутевчетата. Докато при икономедиа, нещата са точно обратните и следователно благодарение на (предполагам) цветанцветановските повели за първите коментари отдолу, настроенията изглеждат значително по-герберски.
След това ми хрумна идеята да си направя социалния експеримент и да видя дали модерирането в двата сайта е политически-мотивирано. Сега при дарикнюз модерация на практика няма, защото аз дори призовавах към колене и щавене и на комунисти и на гербери и файда никаква. Сетиха се да ми изтрият мнението чак когато почнах да обяснявам как ще разпоря гъза на някой с хилти и ще хвърчи вазелин, кръв и изпражнения. Значи подходящо за тролване, в услуга на червените тролове особено.
В дневник.бг изненадващо са доста по-малко толерантни и според мен политически-biased копеленца. Значи умерено можеш да нареждаш и БСП и ГЕРБ, но когато почнеш да псуваш майките на Станишев и на Борисов, обикновено те банват за няколко дни при споменаването на борисовата майка. Значително по-сложно е да те баннат за споменаване на станишевата съответно, но след доста опити успях накрая. Бановете са обикновено за няколко дни и в резултат на системно псуване, така че не е толкова лесно. Модерацията е абсолютно неадекватна и комплексирана обаче, в следващият момент реших да си направя друг експеримент и под статия за това как прокуратурата може да разследва главния редактор на Капитал написах че трябва да разследват по-скоро модератора, защото имам съмнения че е педофил, та директният резултат беше едномесечен бан.
Та да се върнем сега на платеното тролене. Партиите дават сума ти пари (според разни новини) на такива агенции да бълват безсмислен трафик. Аз се замислих не може ли да стане далеч по-евтино и ефективно. В крайна сметка не е толкова сложно да надращиш няколко питонски скрипта с urllib2 дето ходят да правят случайни регистрации и да постват предефинирани мнения (които е много лесно да се съберат с малко усилия, защото платените тролове пишат едно и също и аз също мога да копи-пействам в крайна сметка). Оттам да се мимикрира поведението и на червените и на герберските тролове.
Та захванах се с тази благородна идея и единствената техническа спънка, която имах беше с captcha-ите. И о, изненада, проблемът се реши точно за една вечер кодене. Капчата на дарик се оказа свръх-малоумна и с един imagemagick филтър и подрязване на рамката минава през tesseract-а с близо 50% успех. На икономедиа съответно са се правили на по-умни, но и на тях им хванах цаката - imagemagick не е достатъчно мощно средство за целта, но batch режима на gimp оправя всичко - няколкото филтъра които прилагам там минават за около 2.5 секунди на моята машина и после минавайки го през OCR-а, вероятността за успех клони към 20%. Това означава максимум 10-15 секунди на регистрация. Активационния мейл съответно идва на spambog.com, който лесно се парсва, щото няма много джаваскриптски извращения и си е чист HTML. С не много усилия можеш да ходиш да търсиш и в дарик и в дневник нови новини, съдържащи кодови думички (примерно "БСП" или "Борисов") и да пускаш псевдослучайно избрани коментари от зададен списък с такива.
Това беше потресаващо откритие, защото се оказва че с не много зор всякакви такива пършливи агенции могат да се изхвърлят от бизнеса - просто защото простите питонски скриптове се справят значително по-ефективно и евтино от произволна бройка малоумни копи-пействащи маймунки събрани в някой мизерен офис. Единственото което не може да се автоматизира е цъкането на плюсове и минуси, все пак няма как да знаеш къде да цъкаш. Но пък ако ти си си пуснал коментара, можеш да му слагаш колкото искаш плюсове, ползвайки tor с ниско време на живот на новоизградената верига и на privoxy като HTTP прокси, което на всичкото отгоре рандомизира и user agent-а и съответно съсипва нервите на модерацията.
Та забавлявайки се да си играя на трол дето с един команден ред сътворява онлайн анархия, съзерцавах резултатите от моята активност. Ако наистина такива малоумни изпълнения влияеха на изборния резултат, то аз значи съм повлиял поне малко, хаха.
Сега единственото което ме гложди е какво ще стане ако разменя малко нещата и почна по герберската стратегия да блъскам коментари от списъка с бесепарските и по бесепарски да тръгна с масовия спам, само че с герберски коментари. Би се получило много забавно. Велика идея и мисля да я приложа.