О спаме в комментариях
Недавно заметил у себя в блоге странные комментарии, написанные к довольно старым постам, и состоящие из одного-двух бессмысленных слов. При этом комментарии были отправлены не спам-ботами, а именно людьми, усердно заполняющими код captcha, в попытке рекламировать свои сайты, представляющие собой или дорвеи, или бессмысленные страницы с кучей рекламы. Решается такое просто — очищается поле URI, а сайт заносится в Domain Blacklist — но постоянство таких комментариев уже порядком раздражает.





Добавлю ещё один новый вид спама: вполне осмысленные комментарии, заполняемые людьми, и ведущие на псевдо-блог на базе Wordpress, в котором каждый пост - реклама чего-либо (рыбных снастей, цемента, курортов и т.п.), причём ип заполняющего явно один и тот же. Подобную фишку я просёк с неделю назад, а сейчас это уже просто наводнение какое-то. Несколько десятков комментов в день! Причём эти с…и научились использовать прокси :) Ну да ничё - блэклист у меня резиновый :)
Комментарий отправил автор cryonyx 4 августа 2007 поздним вечером, оцените его:
+0
а у меня просто туевы хучи регистраций, постоянно регяцца, регяцца.. но, то ли карма ловит, то ли не пишут ничего, не понял пока :)
Комментарий отправил автор shaggoth@livejournal 5 августа 2007 ночью, оцените его:
+0
Буквально сегодня с другом чистили комментарии на n2nation.ru. Аналогичная фигня. Бессмысленный комментарий типа “а ты уверен” и линка на какой-нибудь сайт. Правда каптчи у нас не стоит. Хотя каптча это не проблема. Насколько я понимаю, форму заполняет программа, а каптчу вводит руками человек. Аналогичный софт давно существует для раскидывания линков по каталогам ссылок.
Все хотят бэклинков, и много … Спамеры чертовы.
Блэк-листы это видимо неплохо, но УРЛки постоянно новые :(
Комментарий отправил автор Dimonuch 5 августа 2007 ночью, оцените его:
+0
Я вот думаю убрать активные ссылки в комментах, а просто писать урл обычным текстом. Пока просто прописал этим ссылкам rel=”nofollow”
Комментарий отправил автор Ivan A-R 5 августа 2007 ночью, оцените его:
+0
Иммется мнение, что это все-таки боты с функцией распознавания captcha.
Комментарий отправил автор foboss@livejournal 5 августа 2007 ранним утром, оцените его:
+0
Почему бы просто не запретить ссылку с имени автора? Поверьте - мало кто у вас спамиться будет.
Ещё вариант: запретить любую идентификацию кроме OpenID.
В общем-то проблема в том - что ваш блог предоставляте техническую возможность поставить ссылку и люди готовы их ставить. Уберёте возможность - не будет спама.
P.S. Я наверное на хабре напишу про ваш случай если вы не против.
Комментарий отправил автор Андрей Ильин 5 августа 2007 ранним утром, оцените его:
+0
Да, как вариант — вообще убрать возможность оставлять ссылку на сайт, или просто не показывать ее в комментариях, оставив лишь для меня.
А запрещать все и оставлять OpenID тоже не хочу, не у всех он есть к сожалению.
P.S. Я не против, скиньте линк только, посмотрю что там скажут :)
Комментарий отправил автор Gluek 5 августа 2007 утром, оцените его:
+0
Попробуем по теме ответить на все вопросы :)
“а просто писать урл обычным текстом. Пока просто прописал этим ссылкам rel=”nofollow””
nofollow кажется не понимается Яшкой. И, что хуже, спамеры этого все-равно не видят. Они работают оптом (ну в идеале, конечно). Им плевать на особенности каждого конкретного блога - у них в базе блогов сотни или тысячи. Да, именно на твоем блоге спам не будет иметь эффекта, но спамить имхо будут все-равно. Просто не разбираясь в деталях. Такие фокусы мы уже наблюдали на форумах и т.д. Ссылки делались через редирект, но спамеров это не останавливало - они не интересовались тонкостями.
“Я капчу ставил - бесполезно. Вероятно, это все-таки люди, а не спам- боты.”
Полезно, но не шибко. Опять же опыт с форумов. Частичку отсеешь, но масса работает в полуручном режиме, с участием человека :(
“Смысл создавать сайт, на котором никого не будет.
…
И уникальный контент создать нереально, всегда есть люди умнее тебя.”
Это ты зря все так говоришь. Да, Гугль и за ним Яшка сделали ссылку ценной. И почему-то стадо животных решило, что ссылка - самое простое. И уж тем более самое простое - наспамить их везде и побольше …
Хотя, возвращаясь к твоему примеру, могу сказать что на сайт без ссылок именно с поиска Яши народ неплохо ходит. Особенно в начале (бонус?), а потом сайт уже и линками обрастает.
“Иммется мнение, что это все-таки боты с функцией распознавания captcha.”
полагаю в большинстве случаев такое мнение ошибочным. Разве что каптчу будут какую-либо стандартную использовать, одинаковую везде и всюду.
“В общем-то проблема в том - что ваш блог предоставляте техническую возможность поставить ссылку и люди готовы их ставить. Уберёте возможность - не будет спама.”
бесполезно. Читаем выше. Если из тысячи блогов в базе один не будет давать прямой линки - никто даже не заметит его “закидона”. Спамить будут, хотя возможно и меньше.
“Уберете линки в подписях, уйдут спамеры, но, вероятно, уменьшится и число действительно грамтных комментариев. ”
лично мне всегда фиолетово - будет ссылка или нет. Я не для этого сейчас сижу и пишу этот текст. Ссылку я могу и так попросить поставить :)
Комментарий отправил автор Dimonuch 5 августа 2007 в обед, оцените его:
+0
Все описанное можно уместить в одном слове - mysatellites. Такое имя, случайно наверно ;) оставил один из… Остальные как то поизобритательнее были :)
Комментарий отправил автор Вадим 5 августа 2007 днем, оцените его:
+0
прикольно! запретить ссылки и проблема со спамерами кажется решена
или это только на первый взгляд?
ссылка под именем автора она безусловно полезная, но для целей спама абсолютно непригодная, так что не понимаю зачем вообще о ней речь вести (убирать/оставлять)
ещё интересно, почему на blogger.com, nnm так много спама, а в жж я и не сталкивался ни у себя, ни у других о_О
Комментарий отправил автор zencd@livejournal 5 августа 2007 поздним вечером, оцените его:
+0
Только на первый взгляд, да и сами бессмысленные комментарии конечно не очень приятны.
А в ЖЖ нету, потому что ЖЖ борется со спамом ;)
Комментарий отправил автор Gluek 5 августа 2007 поздним вечером, оцените его:
+0
“запретить любую идентификацию кроме OpenID” - имхо верный путь сократить кол-во комментаторов. Ну лень заводить акк на том же блогспоте, например, только ради комментов.
Про решение проблемы: каптча проламывается и роботами тоже, наблюдал не один раз (увы).
Блеклисты - не 100%-ное решение, но часть нагрузки безусловно снимет.
“коллективный” блеклист - когда инфа собирается с разных источников - эффективность имхо выше, а %% “false positive” зависит от надежности источника.
Написал (сначала для себя) именно такой, теперь вот прошу потестить/поругать/похвалить.
Кол-во проскакиваемого спама сократилось с 80 до 10 сообщений.
http://spamtrap.org.ua/
Комментарий отправил автор Путник 6 августа 2007 утром, оцените его:
+0
А никого не доставали комменты с просьбой прислать чего-нибудь на email? У нас такое регулярно, причем ссылки на веб-страничку нет, ящик на mail.ru, IP совершенно разнообразные. Последнее время такие же посты стали появляться и на форуме, причем пишут явно люди, не боты.
Комментарий отправил автор Алексей 6 августа 2007 перед обедом, оцените его:
+0
Алексей, что просят то прислать? Кряк для gimp? =)
Комментарий отправил автор Ivan A-R 6 августа 2007 в обед, оцените его:
+0
Последнее время в топе программы для конвертирования всяческих мультимедийных форматов. Причем убивает то, что выше уже имеется ответ на их вопрос, например, как здесь: http://beta.delta-z.com/index.php/archives/70. Мы просто теряемся в догадках, кому и зачем это надо. Ну не могут же столько пользователей быть однотипно э… глупыми.
Комментарий отправил автор Алексей 6 августа 2007 в обед, оцените его:
+0
Алексей, вероятно это тоже вариант отлова приватных емейлов для спамерских баз.
Комментарий отправил автор Ivan A-R 6 августа 2007 в обед, оцените его:
+0
Я тоже так думал. Создал левый ящик и послал с него комментаторам письмо, правда, без ответа на их вопрос. Прошло около месяца. Пока ящик пустой.
Может так ловят пользователей нелицензионного софта? :)
Комментарий отправил автор Алексей 6 августа 2007 в обед, оцените его:
+0
Говоришь, даже капчу заполняют и все равно спамят? Похоже, мы стали свидетелями рождения нового человеческого вида - биоробота, который готов спамить вручную, даже не догадываясь посчитать, рентабельное ли это для него занятие, и может было бы лучше для здоровья пойти в управдомы…
Кстати, оч. хорошая защита от спама - плагин, закрывающий старые записи, например, все посты старше двух месяцев. После того, как применил у себя на блоге, спам просто практически перестал ходить. А до этого - сотни спам-объектов в день. Не знаю, как этот плагин называется для WP, а для MT это - MTCloseComments. В сочетании с MTBlacklist - просто Цербер.
Комментарий отправил автор Rostislav Siryk 6 августа 2007 днем, оцените его:
+0
“Говоришь, даже капчу заполняют и все равно спамят?”
естественно. Точно так же спамят в форумах, каталогах ссылок и т.д.
“человеческого вида - биоробота, который готов спамить вручную, даже не догадываясь посчитать, рентабельное ли это для него занятие”
1. Многие не считают. Они прочитали у умного дяди “спамьте” и спамят в свое удовольствие …
2. А занятие не такое уж нерентабельное, кстати … Главное - хорошие базы :)
“плагин, закрывающий старые записи”
а вот это уже интересная идея! Спамить выгоднее всего в старых темах. Потому что PR у старых страниц поболее должен быть и шансов запалиться поменьше
Комментарий отправил автор Dimonuch 6 августа 2007 днем, оцените его:
+0
Каптча уже давно распознается ботами.
Не вся конечно, но большинство простых или популярных типов.
Так что вполне возможно, что это все-таки не живые люди, а боты.
Надо попробовать или каптчу усложнить (например шума добавить) или заменить каптчу, например на какие-нибудь задачки - на картинке выводится пример и надо дать на него ответ.
Комментарий отправил автор Nafania 6 августа 2007 поздним вечером, оцените его:
+0
Кстати, а где эта каптча при комментировании?
Я что-то не вижу.
Комментарий отправил автор Nafania 6 августа 2007 поздним вечером, оцените его:
+0
“Каптча уже давно распознается ботами.”
здрасте приехали. OCR уровня Finereader в ботво пока не встраивают. Под отдельные популярные варианты каптчи делают распознавалки. И то не под все. Обычно основываются на характерных элементах. Как пример - PHPNuke.
“Надо попробовать или каптчу усложнить (например шума добавить) или заменить каптчу, например на какие-нибудь задачки - на картинке выводится пример и надо дать на него ответ.”
Зачем? Ну люди это спамят, люди … Симбиоз такой. При помощи несложной софтины это все превращается в довольно простое и поточное занятие. А человек и 2*2 решит (после окончания начальной школы)
Комментарий отправил автор Dimonuch 6 августа 2007 поздним вечером, оцените его:
+0
“здрасте приехали.”
http://en.wikipedia.org/wiki/Captcha#Defeating_CAPTCHAs
“OCR уровня Finereader в ботво пока не встраивают.”
Нет конечно, но использовать его могут.
“Под отдельные популярные варианты каптчи делают распознавалки. И то не под все. Обычно основываются на характерных элементах. Как пример - PHPNuke.”
А я что писал? - “Не вся конечно, но большинство простых или популярных типов.”
“Зачем? Ну люди это спамят, люди …”
Далеко не всегда. В большинстве случаев это грамотно настроенные программы.
Кстати, есть такие программы которые могут использовать FineReader (о чем я выше написал) в случае если сами не могут справиться с каптчей.
Вот примеры каптч, которые может расшифровать одна небезызвестная спамилка http://www.botmaster.ru/pictocod/
Комментарий отправил автор Nafania 7 августа 2007 ночью, оцените его:
+0
PS сейчас увидел местную каптчу. Она видимо включается, только когда в сообщении есть ссылка.
Ну не смешите мои копыта - такую каптчу расшифрует любая спамилка.
Лучше сразу текст писать, без картинки, хоть GD2 библиотека трудится не будет, а результат будет тот же :D
Комментарий отправил автор Nafania 7 августа 2007 ночью, оцените его:
+0
Алексей: просили. Типа очень понравился движок сайта (стоит вордпресс), спрашивали, где купить :) Сайт комментатора - адалт, емыл - типа lwlwlwlwlwlwlw@….
Комментарий отправил автор Путник 7 августа 2007 утром, оцените его:
+0
2Путник: у нас комменты вообще без ссылок - вот что непонятно…
Комментарий отправил автор Алексей 7 августа 2007 перед обедом, оцените его:
+0
Алексей:так они часто не смотрят. В конце концов, а вдруг ты сам зайдешь.
Комментарий отправил автор Путник 7 августа 2007 перед обедом, оцените его:
+0
А у меня на сайте очень часто оставляют комментарии люди, подписывающиеся как “Строитель”, “Рыболов”, “Флорист” :) Естественно, сайт под именем соответствующей тематики.
Если комментарий стоящий - ссылку оставляю,
если ничего интересного (например, одни эмоции) - удаляю.
ИМХО, за хороший комментарий ссылку можно и НУЖНО оставлять
Ведь все равно ноуфоллоу - pr по новому каналу не передается.
Комментарий отправил автор Ильдар Абдулин 8 августа 2007 перед обедом, оцените его:
+0
Также и сообщения в гостевых книгах оставляют - например пишут, мол, хороший сайт, и даю ссылку на свой.
Комментарий отправил автор Unrecogn!seD 9 августа 2007 утром, оцените его:
+0
Хаммам, ты ошибаешься насчет того, что “при этом вы эту глину все равно пользовать не собираетесь даже”.
Каждый линк cо страницы A с ненулевым PR повышает PR линкуемому сайту B. При этом, чем больше на странице А линков, тем меньше коэффициент повышения такого PR - они “делятся” между залинкованными страницами B1, B2 и так далее. Теперь представь, что ты решил с такой страницы А раскрутить сайт своего друга - повысить ему PR. Так в случае, если на странице уже куча линков, эта затея проходит очень слабо - PR страницы уже разворован спамерами.
Поправьте меня, если ошибаюсь.
Комментарий отправил автор Rostislav Siryk 9 августа 2007 вечером, оцените его:
+0