Учитывая, что я сам совсем недавно столкнулся в очередной раз с этой проблемой, я решил все же опубликовать статью по данному вопросу. Потому как я думаю, что проблема довольно актуальна, но информации по ней не так уж и много… Ну, касательно моего случая там все нормально и благополучно решилось, мои материалы владельцы того сайта уже убрали, поэтому конкретно про них ничего плохого писать не буду, думаю все же одумаются и будут в будущем работать другими способами.
Вобщем, я постараюсь комплексно описать данную проблему как можно детальнее, поэтому статья будет большая…
Ну, начну с того, почему данная проблема вообще возникает и какие категории людей имеют обычно к этому отношение. Занимаются этим три категории людей:
2. Вторая категория людей — не удивляйтесь, но могут быть вебстудии. Причем, даже довольно известные вебстудии могут этим грешить. А заказчик он обычно тоже может быть не в курсе проблемы, и при этом сами работники вебстудий могут эту информацию от клиента просто умалчивать. Не все так делают, но это происходит. У нас в Новосибирске был инцидент с порталом «Гид подарков», там занималась им довольно известная вебстудия и вобщем ситуация такова — контент копипастный (от английских слов Copy — копировать и Paste — вставить, отсюда пошло выражение копипаст) в основном, плюс они продавали ссылки с этого портала через ссылочные биржи типа Sape. Так вот в результате всего этого сайт влетел под фильтры яндекса и там в индексе оставалось на тот момент 8 страниц всего. Я узнал про эту ситуацию пообщавщись с руководителем уже другой новосибирской студии вебдизайна, в которую потом обратились после этого инцидента владельцы портала «Гид Подарков». Вот про этот инцидент есть топик на mastertalk… Там про 16 страниц упоминается, ну видимо я раньше ситуацию эту смотрел, чем топик этот появился…
В настоящее время, конечно, алгоритмы поисковиков уже довольно неплохо определяют первоисточник, но тем не менее инциденты бывали, когда из-за дублирования контента вылетали из индекса нормальные сайты, вот этим проблема и опасна. Стопроцентной вероятности определения алгоритмы до сих пор не дают, но тем не менее их постоянно улучшают, например в декабре 2009 года были нововведения в яндексе, об этом можно почитать тут. Гугл естественно тоже не стоит на месте, вот уже в этом году вышла новая технология определения первоисточника, это протокол PubSubHubbub.
Ну, а теперь перейдем к вопросу о том, что же можно сделать для защиты контента и как действовать если вы вдруг заметили, что его у вас украли? Ну, например для статического сайта, где содержимое постоянное можно например заверить контент у нотариуса, в этом случае вы железно отстоите свои права на авторство. Но, например с блогами это уже сделать сложно, потому как на блогах контент периодически обновляется. И кстати сервис copyscape.com и подобные они не гарантируют защиту — вы лишь получите уведомление при появлении дубликата, а баннером от copyscape это так — новичков пугать 🙂
Второй вариант — это написать хостеру, который хостит сайт, ворующий у вас контент. Узнать где хостится можно, например, через whois-сервис. Он показывает NS-сервера, обычно они совпадают с доменом хостера, вот на этот сайт что в NS-серверах указан и идем, а там ищем е-маил службы поддержки. Регистратору домена писать бесполезно, он вас к хостеру отправит… Хотя скажу честно, что не все хостеры могут прореагировать. Если же на домене, что в NS-серверах нет сайта хостера, словом заходите, а там пусто и хостингом не пахнет даже — в этом случае можно попытаться выяснить кому принадлежит ip-адрес, возможно так выйдите на хостера. Найти такие сервисы можно по запросу «whois ip».
Также можете попробовать связаться с владельцем того веб-ресурса, по е-майлу найденному в данных whois-сервиса. Но как правила большинство владельцев таких сайтов на ваши просьбы реагировать не будут и не станут убирать контент. В этом случае можете написать абузы в поисковые системы, я думаю в такой ситуации нет ничего зазорного если напишите. Писать лучше не анонимно, а из вебмастерской панели, такие обращения рассматриваются быстрее, например в яндексе это примерно сутки. Но для большего успеха ваш абуз должен быть еще и грамотно составлен, потому как в службы поддержки приходит много заявок и также идет много абузов, поэтому вы должны максимально описать проблему, для того, чтобы человек, обрабатывающий вашу заявку мог быстро и без труда понять суть. Словом все свои доводы и доказательства проблемы надо включить в текст вашего обращения.
Кстати, хотите немного посмеяться? Знаете ли вы, что некоторые создатели ГСов бывает пишут абузы на дорвеи, если они в выдаче ранжируются выше ихнего ГС 🙂 Да, есть и такие, в одном топике на серче я на это натыкался…
Хотя, если честно, вот я не понимаю копипастеров, сейчас есть довольно неплохие програмные комплексы, которые автоматически пропускают получаемый контент через синонимайзер и рерайтер, в этом случае дублирования контента не будет, таким образом они хотя бы могли не подвергать риску нормальные сайты, они не будут наживать себе врагов в инете. Да и сами сателлиты их жили бы дольше. Примером такого комлекса является Блогбот, ну я во всяком случае лучше пока ничего не встречал и отзываются о нем хорошо в инете. Решил на всякий случай это тоже упомянуть, вдруг эту статью когда-либо будут читать люди, которые этим занимаются, поэтому решил и для них выложить тоже вариант решения проблемы. А еще лучше, это конечно же белые проекты делать, потому как они жить могут фактически вечно, а это значит стабильный доход 🙂

Статья неплохая, но читать ее сложно. Шрифт мелкий, текста много. Подумайте над оформлением текста. Уверен, это увеличит его читабельность.
Leo Craft, спасибо. Рад, что понравилась статья. Согласен — текста много получилось 🙂 Я думал над оформлением, где-то курсивом выделил, да на абзацы поразбивал небольшие, но чего еще можно сделать в этом плане мне как-то в голову больше просто ничего не приходит… Единственное, возможно надо было на два поста разделить…
Ничего подобного, мне наоброт нравится размер шрифта и такие разрывы строк. А то бывает разбросаны по всей странице, что скука все читать. А тут все компактно. Отличный блог.