О спаме в комментариях
Недавно заметил у себя в блоге странные комментарии, написанные к довольно старым постам, и состоящие из одного-двух бессмысленных слов. При этом комментарии были отправлены не спам-ботами, а именно людьми, усердно заполняющими код captcha, в попытке рекламировать свои сайты, представляющие собой или дорвеи, или бессмысленные страницы с кучей рекламы. Решается такое просто — очищается поле URI, а сайт заносится в Domain Blacklist — но постоянство таких комментариев уже порядком раздражает.
« Отключение защиты Kaspersky AntiVirusanywhere.fm »





english
russian
Добавлю ещё один новый вид спама: вполне осмысленные комментарии, заполняемые людьми, и ведущие на псевдо-блог на базе Wordpress, в котором каждый пост - реклама чего-либо (рыбных снастей, цемента, курортов и т.п.), причём ип заполняющего явно один и тот же. Подобную фишку я просёк с неделю назад, а сейчас это уже просто наводнение какое-то. Несколько десятков комментов в день! Причём эти с…и научились использовать прокси :) Ну да ничё - блэклист у меня резиновый :)
Comment by
cryonyx — 4 Aug 2007 at 23:50
+0
а у меня просто туевы хучи регистраций, постоянно регяцца, регяцца.. но, то ли карма ловит, то ли не пишут ничего, не понял пока :)
Comment by
shaggoth@livejournal — 5 Aug 2007 at 01:11
+0
Буквально сегодня с другом чистили комментарии на n2nation.ru. Аналогичная фигня. Бессмысленный комментарий типа “а ты уверен” и линка на какой-нибудь сайт. Правда каптчи у нас не стоит. Хотя каптча это не проблема. Насколько я понимаю, форму заполняет программа, а каптчу вводит руками человек. Аналогичный софт давно существует для раскидывания линков по каталогам ссылок.
Все хотят бэклинков, и много … Спамеры чертовы.
Блэк-листы это видимо неплохо, но УРЛки постоянно новые :(
Comment by
Dimonuch — 5 Aug 2007 at 02:00
+0
Я вот думаю убрать активные ссылки в комментах, а просто писать урл обычным текстом. Пока просто прописал этим ссылкам rel=”nofollow”
Comment by
Ivan A-R — 5 Aug 2007 at 03:32
+0
Иммется мнение, что это все-таки боты с функцией распознавания captcha.
Comment by
foboss@livejournal — 5 Aug 2007 at 08:13
+0
Почему бы просто не запретить ссылку с имени автора? Поверьте - мало кто у вас спамиться будет.
Ещё вариант: запретить любую идентификацию кроме OpenID.
В общем-то проблема в том - что ваш блог предоставляте техническую возможность поставить ссылку и люди готовы их ставить. Уберёте возможность - не будет спама.
P.S. Я наверное на хабре напишу про ваш случай если вы не против.
Comment by
Андрей Ильин — 5 Aug 2007 at 08:58
+0
Да, как вариант — вообще убрать возможность оставлять ссылку на сайт, или просто не показывать ее в комментариях, оставив лишь для меня.
А запрещать все и оставлять OpenID тоже не хочу, не у всех он есть к сожалению.
P.S. Я не против, скиньте линк только, посмотрю что там скажут :)
Comment by
Gluek — 5 Aug 2007 at 12:44
+0
Запретить линк в подписи? Почему тогда у ВСЕХ комментаторов подписи с линками? На этот вопрос ответ дан уже давно. Блоггер размещает статьи для того, чтобы их читали и комментировали. Это создает уникальный контент, которого нет на других сайтах. Это выгодно блоггеру. Комментатор статью комментирует (помогая блоггеру), и, благодаря линку, имеет бек-линк с данного блога. Это выгодно комментатору. Вывод: это взаимовыгодное сотрудничество. Уберете линки в подписях, уйдут спамеры, но, вероятно, уменьшится и число действительно грамтных комментариев. Проще отдавать часть своего PR комментаторам, а спам удалять. Это не так уж и сложно. Я думаю, в блог-движках линк в подписи не просто так присутствует, и он оправдан. Это мое личное мнение, если задел чьи-то чувства, извиняюсь.
Comment by
Vadim — 5 Aug 2007 at 13:55
+0
Попробуем по теме ответить на все вопросы :)
“а просто писать урл обычным текстом. Пока просто прописал этим ссылкам rel=”nofollow””
nofollow кажется не понимается Яшкой. И, что хуже, спамеры этого все-равно не видят. Они работают оптом (ну в идеале, конечно). Им плевать на особенности каждого конкретного блога - у них в базе блогов сотни или тысячи. Да, именно на твоем блоге спам не будет иметь эффекта, но спамить имхо будут все-равно. Просто не разбираясь в деталях. Такие фокусы мы уже наблюдали на форумах и т.д. Ссылки делались через редирект, но спамеров это не останавливало - они не интересовались тонкостями.
“Я капчу ставил - бесполезно. Вероятно, это все-таки люди, а не спам- боты.”
Полезно, но не шибко. Опять же опыт с форумов. Частичку отсеешь, но масса работает в полуручном режиме, с участием человека :(
“Смысл создавать сайт, на котором никого не будет.
…
И уникальный контент создать нереально, всегда есть люди умнее тебя.”
Это ты зря все так говоришь. Да, Гугль и за ним Яшка сделали ссылку ценной. И почему-то стадо животных решило, что ссылка - самое простое. И уж тем более самое простое - наспамить их везде и побольше …
Хотя, возвращаясь к твоему примеру, могу сказать что на сайт без ссылок именно с поиска Яши народ неплохо ходит. Особенно в начале (бонус?), а потом сайт уже и линками обрастает.
“Иммется мнение, что это все-таки боты с функцией распознавания captcha.”
полагаю в большинстве случаев такое мнение ошибочным. Разве что каптчу будут какую-либо стандартную использовать, одинаковую везде и всюду.
“В общем-то проблема в том - что ваш блог предоставляте техническую возможность поставить ссылку и люди готовы их ставить. Уберёте возможность - не будет спама.”
бесполезно. Читаем выше. Если из тысячи блогов в базе один не будет давать прямой линки - никто даже не заметит его “закидона”. Спамить будут, хотя возможно и меньше.
“Уберете линки в подписях, уйдут спамеры, но, вероятно, уменьшится и число действительно грамтных комментариев. ”
лично мне всегда фиолетово - будет ссылка или нет. Я не для этого сейчас сижу и пишу этот текст. Ссылку я могу и так попросить поставить :)
Comment by
Dimonuch — 5 Aug 2007 at 14:24
+0
Все описанное можно уместить в одном слове - mysatellites. Такое имя, случайно наверно ;) оставил один из… Остальные как то поизобритательнее были :)
Comment by
Вадим — 5 Aug 2007 at 16:04
+0
прикольно! запретить ссылки и проблема со спамерами кажется решена
или это только на первый взгляд?
ссылка под именем автора она безусловно полезная, но для целей спама абсолютно непригодная, так что не понимаю зачем вообще о ней речь вести (убирать/оставлять)
ещё интересно, почему на blogger.com, nnm так много спама, а в жж я и не сталкивался ни у себя, ни у других о_О
Comment by
zencd@livejournal — 5 Aug 2007 at 22:00
+0
Только на первый взгляд, да и сами бессмысленные комментарии конечно не очень приятны.
А в ЖЖ нету, потому что ЖЖ борется со спамом ;)
Comment by
Gluek — 5 Aug 2007 at 22:06
+0
“запретить любую идентификацию кроме OpenID” - имхо верный путь сократить кол-во комментаторов. Ну лень заводить акк на том же блогспоте, например, только ради комментов.
Про решение проблемы: каптча проламывается и роботами тоже, наблюдал не один раз (увы).
Блеклисты - не 100%-ное решение, но часть нагрузки безусловно снимет.
“коллективный” блеклист - когда инфа собирается с разных источников - эффективность имхо выше, а %% “false positive” зависит от надежности источника.
Написал (сначала для себя) именно такой, теперь вот прошу потестить/поругать/похвалить.
Кол-во проскакиваемого спама сократилось с 80 до 10 сообщений.
http://spamtrap.org.ua/
Comment by
Путник — 6 Aug 2007 at 11:56
+0
А никого не доставали комменты с просьбой прислать чего-нибудь на email? У нас такое регулярно, причем ссылки на веб-страничку нет, ящик на mail.ru, IP совершенно разнообразные. Последнее время такие же посты стали появляться и на форуме, причем пишут явно люди, не боты.
Comment by
Алексей — 6 Aug 2007 at 13:25
+0
Алексей, что просят то прислать? Кряк для gimp? =)
Comment by
Ivan A-R — 6 Aug 2007 at 14:03
+0
Последнее время в топе программы для конвертирования всяческих мультимедийных форматов. Причем убивает то, что выше уже имеется ответ на их вопрос, например, как здесь: http://beta.delta-z.com/index.php/archives/70. Мы просто теряемся в догадках, кому и зачем это надо. Ну не могут же столько пользователей быть однотипно э… глупыми.
Comment by
Алексей — 6 Aug 2007 at 14:10
+0
Алексей, вероятно это тоже вариант отлова приватных емейлов для спамерских баз.
Comment by
Ivan A-R — 6 Aug 2007 at 14:57
+0
Я тоже так думал. Создал левый ящик и послал с него комментаторам письмо, правда, без ответа на их вопрос. Прошло около месяца. Пока ящик пустой.
Может так ловят пользователей нелицензионного софта? :)
Comment by
Алексей — 6 Aug 2007 at 15:01
+0
Говоришь, даже капчу заполняют и все равно спамят? Похоже, мы стали свидетелями рождения нового человеческого вида - биоробота, который готов спамить вручную, даже не догадываясь посчитать, рентабельное ли это для него занятие, и может было бы лучше для здоровья пойти в управдомы…
Кстати, оч. хорошая защита от спама - плагин, закрывающий старые записи, например, все посты старше двух месяцев. После того, как применил у себя на блоге, спам просто практически перестал ходить. А до этого - сотни спам-объектов в день. Не знаю, как этот плагин называется для WP, а для MT это - MTCloseComments. В сочетании с MTBlacklist - просто Цербер.
Comment by
Rostislav Siryk — 6 Aug 2007 at 16:06
+0
“Говоришь, даже капчу заполняют и все равно спамят?”
естественно. Точно так же спамят в форумах, каталогах ссылок и т.д.
“человеческого вида - биоробота, который готов спамить вручную, даже не догадываясь посчитать, рентабельное ли это для него занятие”
1. Многие не считают. Они прочитали у умного дяди “спамьте” и спамят в свое удовольствие …
2. А занятие не такое уж нерентабельное, кстати … Главное - хорошие базы :)
“плагин, закрывающий старые записи”
а вот это уже интересная идея! Спамить выгоднее всего в старых темах. Потому что PR у старых страниц поболее должен быть и шансов запалиться поменьше
Comment by
Dimonuch — 6 Aug 2007 at 16:14
+0
Каптча уже давно распознается ботами.
Не вся конечно, но большинство простых или популярных типов.
Так что вполне возможно, что это все-таки не живые люди, а боты.
Надо попробовать или каптчу усложнить (например шума добавить) или заменить каптчу, например на какие-нибудь задачки - на картинке выводится пример и надо дать на него ответ.
Comment by
Nafania — 6 Aug 2007 at 23:38
+0
Кстати, а где эта каптча при комментировании?
Я что-то не вижу.
Comment by
Nafania — 6 Aug 2007 at 23:39
+0
“Каптча уже давно распознается ботами.”
здрасте приехали. OCR уровня Finereader в ботво пока не встраивают. Под отдельные популярные варианты каптчи делают распознавалки. И то не под все. Обычно основываются на характерных элементах. Как пример - PHPNuke.
“Надо попробовать или каптчу усложнить (например шума добавить) или заменить каптчу, например на какие-нибудь задачки - на картинке выводится пример и надо дать на него ответ.”
Зачем? Ну люди это спамят, люди … Симбиоз такой. При помощи несложной софтины это все превращается в довольно простое и поточное занятие. А человек и 2*2 решит (после окончания начальной школы)
Comment by
Dimonuch — 6 Aug 2007 at 23:50
+0
“здрасте приехали.”
http://en.wikipedia.org/wiki/Captcha#Defeating_CAPTCHAs
“OCR уровня Finereader в ботво пока не встраивают.”
Нет конечно, но использовать его могут.
“Под отдельные популярные варианты каптчи делают распознавалки. И то не под все. Обычно основываются на характерных элементах. Как пример - PHPNuke.”
А я что писал? - “Не вся конечно, но большинство простых или популярных типов.”
“Зачем? Ну люди это спамят, люди …”
Далеко не всегда. В большинстве случаев это грамотно настроенные программы.
Кстати, есть такие программы которые могут использовать FineReader (о чем я выше написал) в случае если сами не могут справиться с каптчей.
Вот примеры каптч, которые может расшифровать одна небезызвестная спамилка http://www.botmaster.ru/pictocod/
Comment by
Nafania — 7 Aug 2007 at 00:37
+0
PS сейчас увидел местную каптчу. Она видимо включается, только когда в сообщении есть ссылка.
Ну не смешите мои копыта - такую каптчу расшифрует любая спамилка.
Лучше сразу текст писать, без картинки, хоть GD2 библиотека трудится не будет, а результат будет тот же :D
Comment by
Nafania — 7 Aug 2007 at 00:39
+0
Алексей: просили. Типа очень понравился движок сайта (стоит вордпресс), спрашивали, где купить :) Сайт комментатора - адалт, емыл - типа lwlwlwlwlwlwlw@….
Comment by
Путник — 7 Aug 2007 at 10:06
+0
2Путник: у нас комменты вообще без ссылок - вот что непонятно…
Comment by
Алексей — 7 Aug 2007 at 13:20
+0
Алексей:так они часто не смотрят. В конце концов, а вдруг ты сам зайдешь.
Comment by
Путник — 7 Aug 2007 at 13:35
+0
А у меня на сайте очень часто оставляют комментарии люди, подписывающиеся как “Строитель”, “Рыболов”, “Флорист” :) Естественно, сайт под именем соответствующей тематики.
Если комментарий стоящий - ссылку оставляю,
если ничего интересного (например, одни эмоции) - удаляю.
ИМХО, за хороший комментарий ссылку можно и НУЖНО оставлять
Ведь все равно ноуфоллоу - pr по новому каналу не передается.
Comment by
Ильдар Абдулин — 8 Aug 2007 at 13:01
+0
Также и сообщения в гостевых книгах оставляют - например пишут, мол, хороший сайт, и даю ссылку на свой.
Comment by
Unrecogn!seD — 9 Aug 2007 at 11:21
+0
господа, это спаммерство линковое - это от сео оптимизации корни. каждый линк имеет вес. чем больше линков тем лучше. откуда они идут - никто не смотрит. считаю, если люди строят дома, а вам завидно, что глина на кирпич берется из вашего двора (при этом вы эту глину все равно пользовать не собираетесь даже), то нечего эти кирпичи у людей забирать. образно? но правда.
Comment by
Хаммам — 9 Aug 2007 at 16:48
+0
Хаммам: Если бы эти люди писали нормальные комментарии — мне не жалко, пусть Хаммам рекламирует свой сайт www.aquazona.ru. Но когда пишут бред, лишь бы оставить ссылку — такой комментарий я удалю целиком.
Comment by
Gluek — 9 Aug 2007 at 16:53
+0
Хаммам, ты ошибаешься насчет того, что “при этом вы эту глину все равно пользовать не собираетесь даже”.
Каждый линк cо страницы A с ненулевым PR повышает PR линкуемому сайту B. При этом, чем больше на странице А линков, тем меньше коэффициент повышения такого PR - они “делятся” между залинкованными страницами B1, B2 и так далее. Теперь представь, что ты решил с такой страницы А раскрутить сайт своего друга - повысить ему PR. Так в случае, если на странице уже куча линков, эта затея проходит очень слабо - PR страницы уже разворован спамерами.
Поправьте меня, если ошибаюсь.
Comment by
Rostislav Siryk — 9 Aug 2007 at 19:30
+0
ошибаешься. гугл и яндекс имеют разный алгоритм работы. и ты говоришь и пейджренке гугла, а в русскоязычных сайтах пока более популярен тематический индекс цитирования яндекса. а то, что он “делится” еще никем не проверено и не доказано. имхо все это чушь по поводу “деления” рейтинга ссылок. новостные ресурсы на рсс-ленте тогда не имели бы вообще веса с ссылками т.к. каждая новость ведет на чужой сайт. а они имеют. п.с. благодарю за возможность попиариться :)
Comment by
Хаммам — 12 Aug 2007 at 21:31
+0