Спам-блоги заселяют блогосферу

Существует большое количество разных спам-блогов, но всех их объединяет одно: на странице множество раз повторяются одни и то же ключевые слова, которые просто «разбавляются» другим контентом.

Спам-блоги — это фальшивые блоги, которые создаются специально под поисковые машины исключительно с целью получить высокий PageRank («индекс цитирования»).

Посетителей обычно направляют на другой сайт — с помощью контекстной рекламы, партнерских ссылок или даже автоматическим редиректом. Главное — получить оплату за переход, ради чего, собственно, и создаются спам-блоги.

Как и почтовый спам, создание спам-блогов не требует особых усилий. Существует специальный софт, который позволяет генерировать оптимизированные страницы и автоматически размещать их на популярных блоггерских сервисах, таких как Blogspot, Moveable Type, Wordpress или Blogger.com. Проблема сейчас выросла до поистине катастрофических масштабов. Спам-блоги превращаются в серьезный бизнес. Например, известно, что в Великобритании действует компания, которой принадлежит как минимум 15 тыс. спам-блогов в интернете. Другой пример: только на сайте Blogspot размещено около 10 тыс. спам-блогов о лошадиных бегах. О «новом фронтире онлайновой войны» пишет Дж. Скотт Джонсон (J. Scott Johnson), сооснователь и ведущий разработчик компании Feedster.

Чтобы поддерживать впечатление популярного и часто обновляемого ресурса, спам-блог постоянно скачивает новый контент через интернет-директории, поисковые системы, RSS-фиды и другие информационные каналы. Новые постинги добавляются автоматически, создавая впечатление присутствия живого блоггера. Во многих случаях спам-блоги просто-напросто воруют постинги из настоящих блогов, без уведомления авторов, без получения разрешения и даже не указывая ссылку на оригинал.

Существует большое количество разных спам-блогов, но всех их объединяет одно: на странице множество раз повторяются одни и то же ключевые слова, которые просто «разбавляются» другим контентом. Ключевые слова могут повторяться десятки и даже сотни раз на странице. Во время исследований по ключевому запросу «обучение танцам» был найден блог, где слово «танцы» повторялось 948 раз на странице, тогда как общее количество слов составляло 2048. То есть каждое второе слово было — «танцы».

Владельцы спам-блогов получают такую же оплату за переход по рекламным ссылкам, что и владельцы нормальных сайтов. Они защищают свой бизнес — мол, для рекламодателя нет разницы, откуда к нему пришел посетитель, где он нажал рекламную ссылку. Но на самом деле большинство рекламодателей очень внимательно относится к тому, где именно размещается их реклама. Для большинства из них стало бы большим сюрпризом и огорчением, если бы они узнали правду.

Судя по масштабам распространения спам-блогов, их количество скоро может превысить (если уже не превысило) количество нормальных блогов. Таким образом, блогосфера постепенно засоряется спамом, превращаясь в некое подобие публичного телевидения, где качественный контент теряется в нескончаемом потоке рекламы.

Кто должен бороться со спам-блогами? В первую очередь, это проблема поисковых систем, которые должны совершенствовать инструменты для фильтрации. Многие техники идентификации аналогичны тем, что применяются для фильтрации почтового спама, но здесь все намного сложнее.

Для начала можно создать «черный список» спам-блогов, включив туда все блоги, которые ссылаются на них для повышения PageRank. Кроме того, нужно изучать способы создания спам-блогов. Например, можно с высокой степень вероятности предположить, что в доменной зоне .INFO нет ни одного реального блога на платформе WordPress, где крутится реклама Google AdSense. Все это — спам.

Можно ли выиграть войну со спам-блогами? Нет — всегда найдутся те, кто пытается обмануть поисковые системы. Но, как и в случае с почтовым спамом, можно найти некий баланс, при котором обеспечивается выдача практически чистых от спама результатов поиска, пусть и за счет исключения некоторого количества нормального контента.

Источник: webplanet.ru


или введите имя

CAPTCHA