Учитывая, что я сам совсем недавно столкнулся в очередной раз с этой проблемой, я решил все же опубликовать статью по данному вопросу. Потому как я думаю, что проблема довольно актуальна, но информации по ней не так уж и много… Ну, касательно моего случая там все нормально и благополучно решилось, мои материалы владельцы того сайта уже убрали, поэтому конкретно про них ничего плохого писать не буду, думаю все же одумаются и будут в будущем работать другими способами.
Вобщем, я постараюсь комплексно описать данную проблему как можно детальнее, поэтому статья будет большая…
Ну, начну с того, почему данная проблема вообще возникает и какие категории людей имеют обычно к этому отношение. Занимаются этим три категории людей:
2. Вторая категория людей – не удивляйтесь, но могут быть вебстудии. Причем, даже довольно известные вебстудии могут этим грешить. А заказчик он обычно тоже может быть не в курсе проблемы, и при этом сами работники вебстудий могут эту информацию от клиента просто умалчивать. Не все так делают, но это происходит. У нас в Новосибирске был инцидент с порталом “Гид подарков”, там занималась им довольно известная вебстудия и вобщем ситуация такова – контент копипастный (от английских слов Copy – копировать и Paste – вставить, отсюда пошло выражение копипаст) в основном, плюс они продавали ссылки с этого портала через ссылочные биржи типа Sape. Так вот в результате всего этого сайт влетел под фильтры яндекса и там в индексе оставалось на тот момент 8 страниц всего. Я узнал про эту ситуацию пообщавщись с руководителем уже другой новосибирской студии вебдизайна, в которую потом обратились после этого инцидента владельцы портала “Гид Подарков”. Вот про этот инцидент есть топик на mastertalk… Там про 16 страниц упоминается, ну видимо я раньше ситуацию эту смотрел, чем топик этот появился…
В настоящее время, конечно, алгоритмы поисковиков уже довольно неплохо определяют первоисточник, но тем не менее инциденты бывали, когда из-за дублирования контента вылетали из индекса нормальные сайты, вот этим проблема и опасна. Стопроцентной вероятности определения алгоритмы до сих пор не дают, но тем не менее их постоянно улучшают, например в декабре 2009 года были нововведения в яндексе, об этом можно почитать тут. Гугл естественно тоже не стоит на месте, вот уже в этом году вышла новая технология определения первоисточника, это протокол PubSubHubbub.
Ну, а теперь перейдем к вопросу о том, что же можно сделать для защиты контента и как действовать если вы вдруг заметили, что его у вас украли? Ну, например для статического сайта, где содержимое постоянное можно например заверить контент у нотариуса, в этом случае вы железно отстоите свои права на авторство. Но, например с блогами это уже сделать сложно, потому как на блогах контент периодически обновляется. И кстати сервис copyscape.com и подобные они не гарантируют защиту – вы лишь получите уведомление при появлении дубликата, а баннером от copyscape это так – новичков пугать
Второй вариант – это написать хостеру, который хостит сайт, ворующий у вас контент. Узнать где хостится можно, например, через whois-сервис. Он показывает NS-сервера, обычно они совпадают с доменом хостера, вот на этот сайт что в NS-серверах указан и идем, а там ищем е-маил службы поддержки. Регистратору домена писать бесполезно, он вас к хостеру отправит… Хотя скажу честно, что не все хостеры могут прореагировать. Если же на домене, что в NS-серверах нет сайта хостера, словом заходите, а там пусто и хостингом не пахнет даже – в этом случае можно попытаться выяснить кому принадлежит ip-адрес, возможно так выйдите на хостера. Найти такие сервисы можно по запросу “whois ip”.
Также можете попробовать связаться с владельцем того веб-ресурса, по е-майлу найденному в данных whois-сервиса. Но как правила большинство владельцев таких сайтов на ваши просьбы реагировать не будут и не станут убирать контент. В этом случае можете написать абузы в поисковые системы, я думаю в такой ситуации нет ничего зазорного если напишите. Писать лучше не анонимно, а из вебмастерской панели, такие обращения рассматриваются быстрее, например в яндексе это примерно сутки. Но для большего успеха ваш абуз должен быть еще и грамотно составлен, потому как в службы поддержки приходит много заявок и также идет много абузов, поэтому вы должны максимально описать проблему, для того, чтобы человек, обрабатывающий вашу заявку мог быстро и без труда понять суть. Словом все свои доводы и доказательства проблемы надо включить в текст вашего обращения.
Кстати, хотите немного посмеяться? Знаете ли вы, что некоторые создатели ГСов бывает пишут абузы на дорвеи, если они в выдаче ранжируются выше ихнего ГС
Да, есть и такие, в одном топике на серче я на это натыкался…
Хотя, если честно, вот я не понимаю копипастеров, сейчас есть довольно неплохие програмные комплексы, которые автоматически пропускают получаемый контент через синонимайзер и рерайтер, в этом случае дублирования контента не будет, таким образом они хотя бы могли не подвергать риску нормальные сайты, они не будут наживать себе врагов в инете. Да и сами сателлиты их жили бы дольше. Примером такого комлекса является Блогбот, ну я во всяком случае лучше пока ничего не встречал и отзываются о нем хорошо в инете. Решил на всякий случай это тоже упомянуть, вдруг эту статью когда-либо будут читать люди, которые этим занимаются, поэтому решил и для них выложить тоже вариант решения проблемы. А еще лучше, это конечно же белые проекты делать, потому как они жить могут фактически вечно, а это значит стабильный доход


Статья неплохая, но читать ее сложно. Шрифт мелкий, текста много. Подумайте над оформлением текста. Уверен, это увеличит его читабельность.
Leo Craft, спасибо. Рад, что понравилась статья. Согласен – текста много получилось
Я думал над оформлением, где-то курсивом выделил, да на абзацы поразбивал небольшие, но чего еще можно сделать в этом плане мне как-то в голову больше просто ничего не приходит… Единственное, возможно надо было на два поста разделить…
Ничего подобного, мне наоброт нравится размер шрифта и такие разрывы строк. А то бывает разбросаны по всей странице, что скука все читать. А тут все компактно. Отличный блог.