Учитывая, что я сам совсем недавно столкнулся в очередной раз с этой проблемой, я решил все же опубликовать статью по данному вопросу. Потому как я думаю, что проблема довольно актуальна, но информации по ней не так уж и много… Ну, касательно моего случая там все нормально и благополучно решилось, мои материалы владельцы того сайта уже убрали, поэтому конкретно про них ничего плохого писать не буду, думаю все же одумаются и будут в будущем работать другими способами.

Вобщем, я постараюсь комплексно описать данную проблему как можно детальнее, поэтому статья будет большая…

Ну, начну с того, почему данная проблема вообще возникает и какие категории людей имеют обычно к этому отношение. Занимаются этим три категории людей:

1. Это люди ворующие контент неосознанно, т.е. это интернет-новички. Дело в том, что новички придя в интернет думают, что в интернете все бесплатно. Что можно просто взять с другого сайта информацию и разместить на своем. Словом они просто не задумываются даже о существовании данной проблемы. Эту группу людей просто нужно правильным образом информировать и объяснять почему это плохо.

2. Вторая категория людей – не удивляйтесь, но могут быть вебстудии. Причем, даже довольно известные вебстудии могут этим грешить. А заказчик он обычно тоже может быть не в курсе проблемы, и при этом сами работники вебстудий могут эту информацию от клиента просто умалчивать. Не все так делают, но это происходит. У нас в Новосибирске был инцидент с порталом “Гид подарков”, там занималась им довольно известная вебстудия и вобщем ситуация такова – контент копипастный (от английских слов Copy – копировать и Paste – вставить, отсюда пошло выражение копипаст) в основном, плюс они продавали ссылки с этого портала через ссылочные биржи типа Sape. Так вот в результате всего этого сайт влетел под фильтры яндекса и там в индексе оставалось на тот момент 8 страниц всего. Я узнал про эту ситуацию пообщавщись с руководителем уже другой новосибирской студии вебдизайна, в которую потом обратились после этого инцидента владельцы портала “Гид Подарков”. Вот про этот инцидент есть топик на mastertalk… Там про 16 страниц упоминается, ну видимо я раньше ситуацию эту смотрел, чем топик этот появился…

3. Третья Категория людей – это люди, делающие сателлиты под ссылочные биржи. Т.е. эти люди занимаются этим вполне осознанно.
 
В основном, конечно же страдают блоггеры, потому как с блога контент можно через RSS тянуть на автомате. Чем вся эта ситуация плоха – дело в том, что поисковым системам нужен уникальный контент. Если поисковики не будут бороться с дублированным контентом, то им придется просто прирастать целыми дата-центрами, потому как мусорного и дублированного контента производится в разы больше, чем нормального, потому как многие партнерки дают аффилиатам готовые интернет-магазины, но на всех таких магазинах контент один и тот же, под биржи и под Adsens тоже делаются кучи сайтов и частенько контент воруют для этого. Тут принцип прост, ведь никто из вас дома не стал бы хранить много одинаковых книг или много одинаковых DVD дисков? Вот и они также не хотят хранить сайты с одинаковым содержимым.

В настоящее время, конечно, алгоритмы поисковиков уже довольно неплохо определяют первоисточник, но тем не менее инциденты бывали, когда из-за дублирования контента вылетали из индекса нормальные сайты, вот этим проблема и опасна. Стопроцентной вероятности определения алгоритмы до сих пор не дают, но тем не менее их постоянно улучшают, например в декабре 2009 года были нововведения в яндексе, об этом можно почитать тут. Гугл естественно тоже не стоит на месте, вот уже в этом году вышла новая технология определения первоисточника, это протокол PubSubHubbub.

Ну, а теперь перейдем к вопросу о том, что же можно сделать для защиты контента и как действовать если вы вдруг заметили, что его у вас украли? Ну, например для статического сайта, где содержимое постоянное можно например заверить контент у нотариуса, в этом случае вы железно отстоите свои права на авторство. Но, например с блогами это уже сделать сложно, потому как на блогах контент периодически обновляется. И кстати сервис copyscape.com и подобные они не гарантируют защиту – вы лишь получите уведомление при появлении дубликата, а баннером от copyscape это так – новичков пугать :)

Второй вариант – это написать хостеру, который хостит сайт, ворующий у вас контент. Узнать где хостится можно, например, через whois-сервис.  Он показывает NS-сервера, обычно они совпадают с доменом хостера, вот на этот сайт что в NS-серверах указан и идем, а там ищем е-маил службы поддержки. Регистратору домена писать бесполезно, он вас к хостеру отправит… Хотя скажу честно, что не все хостеры могут прореагировать. Если же на домене, что в NS-серверах нет сайта хостера, словом заходите, а там пусто и хостингом не пахнет даже – в этом случае можно попытаться выяснить кому принадлежит ip-адрес, возможно так выйдите на хостера. Найти такие сервисы можно по запросу “whois ip”.

Также можете попробовать связаться с владельцем того веб-ресурса, по е-майлу найденному в данных whois-сервиса. Но как правила большинство владельцев таких сайтов на ваши просьбы реагировать не будут и не станут убирать контент. В этом случае можете написать абузы в поисковые системы, я думаю в такой ситуации нет ничего зазорного если напишите. Писать лучше не анонимно, а из вебмастерской панели, такие обращения рассматриваются быстрее, например в яндексе это примерно сутки. Но для большего успеха ваш абуз должен быть еще и грамотно составлен, потому как в службы поддержки приходит много заявок и также идет много абузов, поэтому вы должны максимально описать проблему, для того, чтобы человек, обрабатывающий вашу заявку мог быстро и без труда понять суть. Словом все свои доводы и доказательства проблемы надо включить в текст вашего обращения.

Кстати, хотите немного посмеяться? Знаете ли вы, что некоторые создатели ГСов бывает пишут абузы на дорвеи, если они в выдаче ранжируются выше ихнего ГС :) Да, есть и такие, в одном топике на серче я на это натыкался…

Хотя, если честно, вот я не понимаю копипастеров, сейчас есть довольно неплохие програмные комплексы, которые автоматически пропускают получаемый контент через синонимайзер и рерайтер, в этом случае дублирования контента не будет, таким образом они хотя бы могли не подвергать риску нормальные сайты, они не будут наживать себе врагов в инете. Да и сами сателлиты их жили бы дольше. Примером такого комлекса является Блогбот, ну я во всяком случае лучше пока ничего не встречал и отзываются о нем хорошо в инете. Решил на всякий случай это тоже упомянуть, вдруг эту статью когда-либо будут читать люди, которые этим занимаются, поэтому решил и для них выложить тоже вариант решения проблемы. А еще лучше, это конечно же белые проекты делать, потому как они жить могут фактически вечно, а это значит стабильный доход :)

Марш против Ctrl+C, Ctrl+V

Комментарии (3) на “Защита контента в интернете – актуальная проблема рунета.”

  • Leo Craft пишет:

    Статья неплохая, но читать ее сложно. Шрифт мелкий, текста много. Подумайте над оформлением текста. Уверен, это увеличит его читабельность.

  • Алексей Пальчун пишет:

    Leo Craft, спасибо. Рад, что понравилась статья. Согласен – текста много получилось :) Я думал над оформлением, где-то курсивом выделил, да на абзацы поразбивал небольшие, но чего еще можно сделать в этом плане мне как-то в голову больше просто ничего не приходит… Единственное, возможно надо было на два поста разделить…

  • Ничего подобного, мне наоброт нравится размер шрифта и такие разрывы строк. А то бывает разбросаны по всей странице, что скука все читать. А тут все компактно. Отличный блог.

Оставить комментарий

Get Adobe Flash playerPlugin by wpburn.com wordpress themes