Развод сайтовладельцев от kursktop100plus.ru

Столкнулся с очень интересным и забавным разводом в интернете. Все началось достаточно внезапно. Трафик возрос, структура изменилась.

Посещаемость:

посещаемость

посещаемость

 

Источники трафика:
До:

Источники трафика ДО

После:

Источники трафика ПОСЛЕ

Резонно было бы узнать: откуда такая популярность? Пришлось обратиться к аналитике источников трафика.

И сразу достаточно ясно, кто же этот «благодетель», кто приносит трафику чертовски важные посещения. Это замечательный региональный каталог сайтов. На нем представлена та же информация, что и на главной странице, заполнялась скорее всего вручную. Эту гипотезу подтверждает и факт крайне небольшого для регионального каталога количества сайтов – всего 100.

Резонно было бы узнать, что посетители (на самом деле это боты), делают на сайте. В этом помог webvisor. Боты неторопливо и беспорядочно водят мышкой по сайту и переходят на случайные внутренние страницы, на которых также залипают на 1-1,5 мин.
Кроме этих посетителей, есть куча посещений, где в качестве referer указываются группы в соцсетях и региональные сайты на которых нет и никогда не было упоминаний целевого ресурса.
Второй вопрос – откуда весь этот трафик? Учитывая, что трафик точно нецелевой, логично было бы предположить, что и источник один. Но владельцы сайта kursktop100plus.ru вложились не только в программирование ботов, но и в прокси.
Раскладка по регионам до (учтены только переходы по ссылкам с сайтов):

Раскладка по регионам (учтены только переходы по ссылкам с сайтов):


То, что используются именно прокси легко понять по отчету по скорости загрузки в Google Analytics:

При этом для реальных посетителей сайт «летал», так как находится в отличном датацентре на сервере с избыточными ресурсами. А вот прокси тупят естественно. Ну и генерация страницы как была в среднем 0,4 сек. так и осталась.

С вопросом «что это?» разобрались, остается вопрос «зачем?». На сайте все подробно написано на их же сайте: http://kursktop100plus.ru/about-project . Если они вдруг удалят/изменят описание, вот скриншот этой страницы на момент написания статьи.
Владельцы сайта предлагают наивным сайтовладельцам «продвижение» по их супер-алгоритму всего за 4850р./мес.

Через некоторое время замечательные предприимчивые владельцы сайта kursktop100plus.ru предприняли попытку продать всю эту историю с помощью e-mail маркетинга. На общий корпоративный ящик пришло письмо:

Что особенно умиляет: они внаглую накручивают пользовательские факторы, что в случае раскрытия ничего хорошего сайту не принесет, приводят на сайт ботов и при этом хотят, чтобы им еще и платили.

Последний вопрос: кто за этим стоит?
На него в полной мере мне ответить не удалось. Whois показывает, что стартап совсем свежий, но тем не менее уже сделали свой ns-сервер:

Также беглый анализ показал, что Private Limited Company Innovative Agency of Information Technologies «Runet Holding» оно же ЗАО Инновационное Агентство Информационных Технологий «Рунет Холдинг» владеет кучей доменов, в котором устраивают всевозможные top100. Не гнушаются и adult-тематикой. Я попробовал сгенерировать счет через сервис сайта. Так получилось узнать, на какой счет и по каким реквизитам собираются они получать деньги. Компания ЗАО Инновационное Агентство Информационных Технологий «Рунет Холдинг» оказалась всего лишь посредником и реальных владельцев этих замечательных ресурсов выяснить видимо не удастся.
У самой же компании бизнес выглядит крайне странно – выручка 0, убытки – миллионы. Подробно можно посмотреть тут.

Что особенно не нравится, помимо того, что это мягко говоря «не работает» и «крайне сомнительно». Разработать такого рода сервис не так уж и просто. Могли бы потратить те же ресурсы и сделать что-то реально полезное, сервис, приносящий пользу людям. Но они выбрали другой путь.

UPD: Из каталога сайт таки убрали, но ботов так и не выключили. Скорость загрузки страниц уже приблизительно 11 секунд для ботов.

  • andrei

    Вижу эти рефереры в логах на сервере и метрике. Вижу изменение скорости в аналитике. Причем здесь прокси-то (и что это за прокси)?

    • Mikhail Gordeev

      Это способ обеспечить вот такую картинку. Есть дорогой — много серверов сделать, а есть кустарно-дешевый: использовать прокси-серверы. Но прокси-серверы имею ограничения по скорости, вот и кажется, что сайт тормозит.

      • andrei

        В моем случае в логах сервера клиентские ip-адреса из пулов местных операторов (разных). Т.е. география как бы соответствует ожидаемой для посещаемого сайта. Я думаю, тут как минимум ботнет, который — возможно! — действует как прокси.

        • Ханс Гаус

          самое интересное, что все этим пользуются и молчат.
          накручивают подписчиков вконтакте, и молчат;
          накручивают подписчиков в инстаграме и молчат; (такими проектами вообще так скажем, правительственные организации пользуются, а сайты не гнушаются вовсе их лого у себя размещать для рекламы вот пример pr-gramm. ru ЭТО НЕ В КОЕМ СЛУЧАЕ НЕ РЕКЛАМА, скорее дичь:) )
          но за все эти дела с соц.сетями есть реальные баны, да и подписчики-боты отписываются.
          а top100plus — какая бы там технология не была, под санкции не попадает, на вопросы яндексу — ответов нет или «всё предусмотрено». Ну раз предусмотрено, значит не запрещено. Похоже что это кто-то родной свалил из гугла и замутил свой проект, и работает по-тихому чтобы не появились конкуренты! У нас в России так всегда — с одной стороны очередь и цены высокие, с другой — мало народа и скидки))

          • Вопрос «попадает под санкции или нет» очень дискуссионный. Яндекс жестко карает за накрутку пользовательских факторов, а это по сути оно и есть.

  • Вадим Тунилов

    Я мало, что понял про прокси в этой статье, но понял сразу, как только увидел трафик с этого ресурса на свой сайт — что-то не чисто. Не надо быть программистом, чтобы увидеть разводку. 3 сайта в каталоге в одной тематике, причём открываются по разным ключевикам, на мой идёт бешеный трафик. За шёл на их сайт, а там знаете какой метод используется ?? WTF цитирую : «Метод
    Мы применяем алгоритмы искусственных нейронных сетей для решения многопараметрических задач нелинейной оптимизации. Построение модели искусственного интеллекта на основе эффективного параллелизма в части оптимизации структурирования контента сайтов в сети интернет.»