:: urbansheep ([info]urbansheep) wrote,
@ 2008-02-19 09:42:00
Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Оптимизаторы против людей: «я как бы вас прокомментирую, а взамен с вас как бы ссылка»

Раньше оптимизаторы-владельцы спам-блогов устраивали ковровые бомбардировки обычных блогов своими комментариями, которые рассылали роботы. Антиспам-фильтры научились банить их на лету, поэтому теперь оптимизаторы ходят по блогам с более-менее высоким рейтингом, и пишут комментарии ни о чём, со ссылкой на рекламируемые ими сайты.

Я наблюдаю за развитием и изменениями в подходах на небольшом урбаншипском блоге, и мне было даже интересно, что из этого всего выйдет. Гипотеза была такая — я смирюсь с рекламной ссылкой в обмен на более-менее внятный комментарий. Так как я почему-то люблю комментарии, которые интересно читать. Но провести черту «это нормально, а это уже мусор» сложно. Поэтому оставалось просто наблюдать. И вот что выходит.

* * *

Большинство таких «комментаторов» — челоботы, которые вставляют стандартные тексты и ставят ссылку на стандартный сайт. Они никому не нужны, и их успешно уносит с собой в пучину акисметовский спам-фильтр. Копи-пейст ничем не отличается от прежнего спама.

Дальше идут челоботы, умеющие писать слова, но не умеющие думать. Эти делают вид, что живые — набирают стандартный ответ на написанный пост, со смайликами и опечатками. Примеры хорошо видны в комментариях к анонсу The Bat 4.0 на lifehacker.ru: все комментарии, где говорят «устраивает гмайл» в разных вариациях, можно сразу отправлять в топку. Это не потому, что гмайл плохой — просто челоботам стало лень придумывать более сложный комментарий. Тех, кто пишет односложные комментарии («автору респект», «выглядит красиво!» и «интерфейс страшен») — туда же.

Забавно, что они все стараются прикинуться живыми людьми, но почтовые адреса, которые они вбивают в форму комментария, через один в названии имеют SEO. Да, среди оптимизаторов тоже есть, наверное, неплохие люди (ни одного не видел, но саму возможность не исключаю), но здесь это очевидный маркер спамера.

Выше всех — челоботы, которые пишут что-то, похожее на осмысленный комментарий. То есть, они и правда подумали над написанным! К сожалению, оказалось, что даже в этом случае оставлять их ссылки — себя не уважать. Так что все, что похоже на спам-ссылки, просто исчезает из комментария.

* * *

Результат: в комментариях остаются только ссылки на тех, кого ты неплохо знаешь, или кто мало похож на спамера. Пример: многострадальный пост про скрининг через гугл на границе. Там примерно дюжина удаленных комментариев, и осталось пять, с которых убраны рекламные ссылки.

Ясно, что большинство блогеров на эту тему не переживает (пример с лайфхакера выше — именно об этом), и что таких спамеров остановить сложнее. Но акисмет научился забрасывать в карантин и их. Так что надежда есть. Альтернатива — регистрация комментаторов и OpenID, но для Вордпресса пока нормальную поддержку OpenID так и не сделали.

 
 
 



(Post a new comment)


[info]frolin
2008-02-19 07:00 am UTC (link)
А я оставляю комменты с сылками только, если они ведут на блог комментатора.

(Reply to this) (Thread)


[info]urbansheep
2008-02-19 07:10 am UTC (link)
Та же фигня.

(Reply to this) (Parent)


[info]denbl
2008-02-19 02:32 pm UTC (link)
А если скажем нужно что-то порекомендовать из коммерческого или увиденного на других сайтах/блогах?

Если имеет смысл поставить ссылку, то ее нужно ставить. Там, где ссылка не нужна — ей там действительно не место. Вроде бы очень простое правило, а пока не подводило.

(Reply to this) (Parent)(Thread)


[info]frolin
2008-02-19 03:43 pm UTC (link)
Речь не про то. Спамеры-оптимизаторы пишут в поле "ваш урл" адреса сайтов, которые они раскручивают.

(Reply to this) (Parent)(Thread)


[info]denbl
2008-02-19 03:57 pm UTC (link)
Да я понимаю, как они действуют. Кстати, к оптимизаторам они имеют весьма отдаленное отношение, если вообще имеют.

Я уже высказал предположение, как нужно поступать с адреса «домашних» страниц комментаторов. Если это личный блог комментатора (или, возможна, сайт его компании), то оставить ссылку, скорее всего, можно. Если это реклама, то, конечно, просто удалять урл.

(Reply to this) (Parent)


[info]lsp
2008-02-19 07:02 am UTC (link)
При добавлении комментария надо парсить ссылки, добавлять к ним атрибут rel="nofollow" и обрамлять в тег <noindex>.
В результате у оптимизаторов пропадает желание "нагадить в коментах", так как исчезает смысл.

(Reply to this) (Thread)


[info]urbansheep
2008-02-19 07:06 am UTC (link)
Судя по поведению, и яндекс, и гугл по ссылкам nofollow просто не передают PR/ТИЦ, но индексировать идут все равно. А зачем нам это нужно? Так что лучше ссылки вообще убивать, во избежание.

(Reply to this) (Parent)(Thread)


[info]lsp
2008-02-19 07:26 am UTC (link)
Так оптимизаторы и размещают такие ссылки для поднятия PR/ТИЦ, в основном.
Просто попросить поисковик проиндексировать сайт можно и более простыми способами.

В любом случае сильно падает мотивация -- вокруг тысячи блогов и лучше потратить усилия на размещение ссылок там, где они реально будут иметь вес. Особенно, если это делается в ручном или полу-автоматическом режиме.

Полностью вырезать ссылки тоже выход, но если это делать совсем автоматически, то можно что-нибудь нужное случайно под нож пустить.

(Reply to this) (Parent)(Thread)


[info]urbansheep
2008-02-19 09:57 am UTC (link)
Судя по всему, не только ради этого — все блоги на вордпрессе по умолчанию все ссылки в комментариях маркируют как nofollow. Оптимизаторы это знают, как никто другой. Но это не уменьшает количество спама, ага.

(Reply to this) (Parent)(Thread)


[info]denbl
2008-02-19 02:36 pm UTC (link)
Ибо есть Яндекс, которому атрибут nofollow вообще не знаком :)

Решение очень простое, как мне кажется — резать все то, что не ведет на личные блоги комментаторов или на сайты, ссылка на которые стоит из самого комментария, являясь при этом действительно ценной рекомендацией.

(Reply to this) (Parent)(Thread)


[info]urbansheep
2008-02-19 03:11 pm UTC (link)
Ага, и это всё исключает возможность полноценного автоматического решения.

(Reply to this) (Parent)(Thread)


[info]denbl
2008-02-19 03:17 pm UTC (link)
Похоже, на данном этапе автоматическая сортировка невозможна. По крайней мере теми средставами, что мы имеем.

(Reply to this) (Parent)


[info]solovo
2008-02-19 07:30 am UTC (link)
OpenID мне нравится всё больше и больше

хттп://мойблог.ру

(Reply to this) (Thread)


[info]denbl
2008-02-19 02:38 pm UTC (link)
Проблема в том, что и OpenID может быть использован для ссылочного спама.

К тому же далеко не все блогхостинги и сайты корректно работают с OpenID.

(Reply to this) (Parent)


[info]_kleptos_
2008-02-19 08:51 am UTC (link)
но для Вордпресса пока нормальную поддержку OpenID так и не сделали.
Так в чём проблема? Это опенсорс, если тебе чего-то не нравится, всегда можно сделать самому ну или на крайняк нанять вменяемого человека для доработки.

(Reply to this) (Thread)


[info]urbansheep
2008-02-19 09:51 am UTC (link)
Давно уже не вижу смысла переписывать продукт, который разрабатывается большой толпой. Потому что:
1) после апдейта мне придется проверять на совместимость написанный код и разруливать конфликты, если придется в ходе реализации залезать достаточно глубоко.
2) даже если делать в виде штепселя, то не факт, что оно останется совместимо в будущем.
3) судя по тому, что в МТ4 авторизация через опенид уже давно есть, то в вордпрессе её можно ждать в дефолтном наборе в ближайшие полгода. Зачем делать чужую работу самому?

То есть, если бы я был владельцем блог-издания, или сети блогов, то мне имело бы, может, смысл задуматься о решении своими силами (и тогда проблемы в дописывании существующих плагинов для авторизации не было бы). Но я-то, всё же, пользователь. Мне переписывать долго, дорого и неэффективно.

В этом проблема. И её опенсорс никак не решает. Типа, я могу попробовать менять всю проводку дома и сам, но лучше уж вызову бригаду электриков с перфоратором и болгаркой, или, если не горит (в буквальном смысле) дождусь капремонта в доме.

(Reply to this) (Parent)(Thread)


[info]_kleptos_
2008-02-19 10:23 am UTC (link)
Сиё есть не переписывание, а патч.
При нормальном раскладе (адекватный вендор, код писали не в бреду) 1 и 2 если и возникают, то с патчами таких размеров разруливаются минут за 10, при выкате на тестовую площадку. release-notes, changelog, diff, unittests, etc.

Алсо, решение своими силами занимает от силы час-два трудозатрат (нуднику например хватило минут двадцати), так как весь код уже давно написан, осталось склеить.

хм, незнаю, в целом - я-бы пропатчил, если-бы использовал wp.

(Reply to this) (Parent)(Thread)


[info]urbansheep
2008-02-19 10:33 am UTC (link)
Нуднику могло хватить и пяти, Смирнов писал регистровский движок сам, и поддерживает сам, и дописывает сам. Так что все закономерно.

Про весь код — чистая правда, но есть два основных штепселя к вп, и в одном авторизация сделана через хак, а в другом нет сервера. Мёрджить и женить их между собой — далеко не на час-два.

(Reply to this) (Parent)(Thread)


[info]_kleptos_
2008-02-19 01:51 pm UTC (link)
А зачем вам сервер? когда для авторизации нужен только консьюмер?

(Reply to this) (Parent)(Thread)


[info]urbansheep
2008-02-19 02:00 pm UTC (link)
Я обычно использую в качестве опенид-урла свой блог, как это ни странно. Можно настроить и делегирование, конечно, но это значит, что снова нужно будет фиксить то, что сейчас работает.

(Reply to this) (Parent)(Thread)


[info]_kleptos_
2008-02-19 04:36 pm UTC (link)
Вообще связи не понял.
Как штепсель реализующий приём openid вообще может повлиять на провайдинг?

(Reply to this) (Parent)(Thread)


[info]urbansheep
2008-02-19 05:11 pm UTC (link)
0) Есть вордпресс на урле.
1) Есть известный штепсель OpenID Comments, обеспечивающий подписывание (неполноценную авторизацию) через опенид. Он же обеспечивает провайдинг (вписывает нужные линки в заголовок страницы, обрабатывает запросы).
2) Есть альтернативный штепсель, WP-OpenID, который, предполагается, обеспечивает правильно приём (то есть натурально авторизует пользователя, а не просто удостоверяется в том, что в том, что на том конце подтвердили личность и затем вставляет урл в поле, как это делает штепсель 1).

При этом оба почему-то норовят жить по одному пути (типа, кто-то из них имеет его захардкоженным), и вместе довольно странно работают.

3) К этому добавляется штепсель Brian's Threaded Comments, который требует существенного допиливания файлов оформления, и потому редко кем по-настоящему переписывается и переоформляется (так что комментарии — единственная часть интерфейса на urbansheep.ru, которая мне активно не нравится).

Учитывая, что туда нужно ещё и встроить вызовы OpenID, то всё становится совсем не casual-friendly.

Такие дела. Всё это, в принципе, разруливается, но ровно до того момента пока что-то не обновится, пока не выйдет новый релиз Вордпресса и пр.

Там выше про юниттесты, диффы, тестовую площадку — вот от меня, как от пользователя, это всё настолько же далеко, насколько сборочный конвейер в Калининграде далёк от гаража.

(Reply to this) (Parent)(Thread)


[info]_kleptos_
2008-02-20 08:01 am UTC (link)
oshi~
прозреваю, что если там такой бардак даже с такими простыми шуками, то что-то там внутри они делают неправильно.

И, что? всё на самом деле так плохо с доступным массами блогдвижком?

(Reply to this) (Parent)(Thread)


[info]urbansheep
2008-02-20 10:39 am UTC (link)
C блогдвижком-то хорошо, с фичерсетом и интеграцией плохо. :(

(Reply to this) (Parent)(Thread)


[info]_kleptos_
2008-02-20 10:41 am UTC (link)
А давайте насчёт фичерсета.
Чего вам от него надо?

(Reply to this) (Parent)(Thread)


[info]urbansheep
2008-02-20 11:40 am UTC (link)
Есть некий дефолтный набор возможностей, которые должны делаться под надзором команды разработчиков, «джентльменский набор» блога.

- гигиена (спам-фильтр — решается поставляемым в комплекте штепселем, слава Аллаху);
- обратная связь (подписка на комментарии — делается внешним штепселем, но результат неидеален);
- выдача (мобильные версии — пара разных плагинов, рсс — практически единственный вариант в виде фидбернера, реблоггинг);
- авторизация (OpenID);
- социальные связи (в самом вордпрессе для этого есть довольно бесполезный блогролл и ссылки, которые никакой пользы не приносят, зато нет ни FOAF, ни какого-то иного удобного социального функционала, хотя ВП позиционируется в первую очередь как средство для людей, не для компаний).

Кроме этого есть новое направление типизации постов (tumblr/nanograbbr, яру), которое сокращает время на оформление за счёт нескольких основных «форматов», когда автору остается только заполнить форму из двух полей, без дополнительного кода и обработки.

Это в вордпрессе пока тоже системно не рассматривается, хотя такой режим (как дополнение к существующим code only/WYSIWYG) мог бы упростить жизнь пользователя, и увеличить пользовательскую базу, отъев её у тамблера и прочих.

(Reply to this) (Parent)(Thread)


[info]_kleptos_
2008-02-20 11:49 am UTC (link)
А wysiwyg это принципиальня фича для неказульного блоггера?
markdow/wiki/reStructured text разве не удобнее?

Алсо, временами порывает написать что-то нормальное, видя весь этот ужас.
Вы-бы например как консультант/подопытный кролик в такой проект вписались-бы?

(Reply to this) (Parent)(Thread)


[info]urbansheep
2008-02-20 12:33 pm UTC (link)
WYSIWYG я как раз не использую, но он популярен наравне с дефолтным режимом ввода (не нужно думать про форматирование). Счастье в том, что его можно выключить. В этом достоинство режимов.

Судя по истории этого ужаса, любой проект «написать нормальное» приходит к этому же: либо затея умирает под фичеритисом, либо так и остается маргинальным проектом, ограничившись набором возможностей, которые автор реализует для себя, так как хорошо понимает, что ему нужно (см. регистр и е2), и каким оно должно быть.

Поэтому любой массовый проект (МТ/ВП) — это в первую очередь правильное ядро (а там очень много всяких деталей, связанных с различиями хостингов, удобным администрированием, которые нужны для нормальной удобной работы, но жутко нудные для обычного разработчика), которое уже расширяется штепселями. И потому почти в каждом крупном релизе ВП добавляются новые хуки для подключения штепселей почти для каждого действия. А масса кода за счет этого разрастается.

Получается, что можно ещё урезать и оптимизировать, но тогда сразу на двух третях платформ движок перестанет запускаться. Собственно, штепсели — это уже такой компромисс, когда какие-то неоднозначные вещи набираются под себя, в дополнение к массовому функционалу) хотя вот зачем там в базовом блогролл или, скажем, по умолчанию встроен рсс-клиент — для меня загадка, если только не решить, что это такой СЕО-ход).

Как консультант я бы ещё мог что-то сказать, как подопытный кролик — вряд ли. Я даже nanograbbr не хочу смотреть, пока они хоть какую-то публичную бету не выпустят.

(Reply to this) (Parent)(Thread)


[info]_kleptos_
2008-02-20 12:51 pm UTC (link)
Да, всё примерно так и есть.

Пойнт в том, что вы знаете как люди используют блогософт и чего им от него надо. Я-же понятия не имею, какие им штепсели и где могут понадобиться. Если и напишу что-то, то именно маргинальное, идеально работающее именно так, как мне надо.
С другой стороны я умею (по крайней мере я так думаю) делать правильные внутри приложения, да и таск в общем-то _может_ быть интересным, то только если снабдить пониманием чего и куда там нужно обычным людям.

(Reply to this) (Parent)(Thread)


[info]urbansheep
2008-02-20 01:58 pm UTC (link)
Я довольно долго подходил также, пока не надоело переписывать с нуля базу, а потом выдыхаться как раз перед тем, когда начинается самое интересное и вкусное (те самые вещи, ради которых задумывалось переписывание).

Поэтому теперь я как-то стараюсь больше брать существующее, и на его основе что-то перестраивать. В случае с ВП/МТ, кажется, конструктивнее брать движок, считать его фреймворком, со всеми достоинствами-недостатками, и надстраивать нужное через темы/штепсели. Поэтому и страдание из-за того, что то, что нужно, никак не реализуется по-человечески.

Наш вот разговор навел меня на мысль о том, что я могу от чего-то отказаться и что-то выключить ради того, чтобы остальное работало лучше прежнего.

(Reply to this) (Parent)(Thread)


[info]_kleptos_
2008-02-20 03:03 pm UTC (link)
Ну я такую штуку думаю делать на питоне (vds нынче крайне дешевы), а там батарейки (готовые модули) есть практически для всего (а для чего нет, оно пишетсо), поэтому функциональность "как дефолтный wp, тока без системы плагинов" с нуля делаеться за дня два, может быть три, если не спешить.

Рисовать это всё с нуля на php -- это убиццо.


я могу от чего-то отказаться и что-то выключить ради того, чтобы остальное работало лучше прежнего.
ну конечно - лучше чтоб хоть что-то работало чем всё не очень.

(Reply to this) (Parent)


[info]urbansheep
2008-02-20 10:54 am UTC (link)
Так что я не столько жалуюсь, сколько рассказываю о неудобствах, которые возникают из-за отсутствия реализации базовой вещи в исходном продукте.

(Reply to this) (Parent)


[info]Nazar Ch. [com.ua]
2008-02-19 09:43 am UTC (link)
Убрать поле для ссылки на сайт из комментария и жить станет еще лучше.

(Reply to this) (Thread)


[info]urbansheep
2008-02-19 09:52 am UTC (link)
Вариант.

(Reply to this) (Parent)(Thread)


[info]Gluek [gluek.info]
2008-02-26 10:42 pm UTC (link)
Или можно пойти от обратного: разрешать показывать URL лишь определенных авторов, я даже думал такой плагин сделать :)

(Reply to this) (Parent)(Thread)


[info]Gluek [gluek.info]
2008-02-26 10:43 pm UTC (link)
Как вариант использовать плагин голосования за комментарии, и показывать или нет в зависимотри от рейтинга.

(Reply to this) (Parent)


[info]urbansheep
2008-03-18 12:39 pm UTC (link)
Посмотрим, что там у микромаркетинга с этим плагином получится.

А для авторизации не хватает вещицы, которая бы упрощала опенид до простого поля, как у Болка и Смирнова. Тогда, если добавить туда немного SRE (для подписки на комментарии), ничего кроме Openid уже больше и не нужно будет.

(Reply to this) (Parent)


[info]netklon
2008-02-19 12:13 pm UTC (link)
OpenID да поможет, тем более, что с ним можно делать много прекрасных вещей - например разрешить добавление ссылок в комментарии только френдам из ЖЖ и контактам из МойКруг.

(Reply to this)


Create an Account
Forgot your login or password?
Login w/ OpenID
English • Español • Deutsch • Русский…