Защита контента в интернете — актуальная проблема рунета.

Учитывая, что я сам совсем недавно столкнулся в очередной раз с этой проблемой, я решил все же опубликовать статью по данному вопросу. Потому как я думаю, что проблема довольно актуальна, но информации по ней не так уж и много… Ну, касательно моего случая там все нормально и благополучно решилось, мои материалы владельцы того сайта уже убрали, поэтому конкретно про них ничего плохого писать не буду, думаю все же одумаются и будут в будущем работать другими способами.

Вобщем, я постараюсь комплексно описать данную проблему как можно детальнее, поэтому статья будет большая…

Ну, начну с того, почему данная проблема вообще возникает и какие категории людей имеют обычно к этому отношение. Занимаются этим три категории людей:

1. Это люди ворующие контент неосознанно, т.е. это интернет-новички. Дело в том, что новички придя в интернет думают, что в интернете все бесплатно. Что можно просто взять с другого сайта информацию и разместить на своем. Словом они просто не задумываются даже о существовании данной проблемы. Эту группу людей просто нужно правильным образом информировать и объяснять почему это плохо.

2. Вторая категория людей — не удивляйтесь, но могут быть вебстудии. Причем, даже довольно известные вебстудии могут этим грешить. А заказчик он обычно тоже может быть не в курсе проблемы, и при этом сами работники вебстудий могут эту информацию от клиента просто умалчивать. Не все так делают, но это происходит. У нас в Новосибирске был инцидент с порталом «Гид подарков», там занималась им довольно известная вебстудия и вобщем ситуация такова — контент копипастный (от английских слов Copy — копировать и Paste — вставить, отсюда пошло выражение копипаст) в основном, плюс они продавали ссылки с этого портала через ссылочные биржи типа Sape. Так вот в результате всего этого сайт влетел под фильтры яндекса и там в индексе оставалось на тот момент 8 страниц всего. Я узнал про эту ситуацию пообщавщись с руководителем уже другой новосибирской студии вебдизайна, в которую потом обратились после этого инцидента владельцы портала «Гид Подарков». Вот про этот инцидент есть топик на mastertalk… Там про 16 страниц упоминается, ну видимо я раньше ситуацию эту смотрел, чем топик этот появился…

3. Третья Категория людей — это люди, делающие сателлиты под ссылочные биржи. Т.е. эти люди занимаются этим вполне осознанно.
 
В основном, конечно же страдают блоггеры, потому как с блога контент можно через RSS тянуть на автомате. Чем вся эта ситуация плоха — дело в том, что поисковым системам нужен уникальный контент. Если поисковики не будут бороться с дублированным контентом, то им придется просто прирастать целыми дата-центрами, потому как мусорного и дублированного контента производится в разы больше, чем нормального, потому как многие партнерки дают аффилиатам готовые интернет-магазины, но на всех таких магазинах контент один и тот же, под биржи и под Adsens тоже делаются кучи сайтов и частенько контент воруют для этого. Тут принцип прост, ведь никто из вас дома не стал бы хранить много одинаковых книг или много одинаковых DVD дисков? Вот и они также не хотят хранить сайты с одинаковым содержимым.

В настоящее время, конечно, алгоритмы поисковиков уже довольно неплохо определяют первоисточник, но тем не менее инциденты бывали, когда из-за дублирования контента вылетали из индекса нормальные сайты, вот этим проблема и опасна. Стопроцентной вероятности определения алгоритмы до сих пор не дают, но тем не менее их постоянно улучшают, например в декабре 2009 года были нововведения в яндексе, об этом можно почитать тут. Гугл естественно тоже не стоит на месте, вот уже в этом году вышла новая технология определения первоисточника, это протокол PubSubHubbub.

Ну, а теперь перейдем к вопросу о том, что же можно сделать для защиты контента и как действовать если вы вдруг заметили, что его у вас украли? Ну, например для статического сайта, где содержимое постоянное можно например заверить контент у нотариуса, в этом случае вы железно отстоите свои права на авторство. Но, например с блогами это уже сделать сложно, потому как на блогах контент периодически обновляется. И кстати сервис copyscape.com и подобные они не гарантируют защиту — вы лишь получите уведомление при появлении дубликата, а баннером от copyscape это так — новичков пугать 🙂

Второй вариант — это написать хостеру, который хостит сайт, ворующий у вас контент. Узнать где хостится можно, например, через whois-сервис.  Он показывает NS-сервера, обычно они совпадают с доменом хостера, вот на этот сайт что в NS-серверах указан и идем, а там ищем е-маил службы поддержки. Регистратору домена писать бесполезно, он вас к хостеру отправит… Хотя скажу честно, что не все хостеры могут прореагировать. Если же на домене, что в NS-серверах нет сайта хостера, словом заходите, а там пусто и хостингом не пахнет даже — в этом случае можно попытаться выяснить кому принадлежит ip-адрес, возможно так выйдите на хостера. Найти такие сервисы можно по запросу «whois ip».

Также можете попробовать связаться с владельцем того веб-ресурса, по е-майлу найденному в данных whois-сервиса. Но как правила большинство владельцев таких сайтов на ваши просьбы реагировать не будут и не станут убирать контент. В этом случае можете написать абузы в поисковые системы, я думаю в такой ситуации нет ничего зазорного если напишите. Писать лучше не анонимно, а из вебмастерской панели, такие обращения рассматриваются быстрее, например в яндексе это примерно сутки. Но для большего успеха ваш абуз должен быть еще и грамотно составлен, потому как в службы поддержки приходит много заявок и также идет много абузов, поэтому вы должны максимально описать проблему, для того, чтобы человек, обрабатывающий вашу заявку мог быстро и без труда понять суть. Словом все свои доводы и доказательства проблемы надо включить в текст вашего обращения.

Кстати, хотите немного посмеяться? Знаете ли вы, что некоторые создатели ГСов бывает пишут абузы на дорвеи, если они в выдаче ранжируются выше ихнего ГС 🙂 Да, есть и такие, в одном топике на серче я на это натыкался…

Хотя, если честно, вот я не понимаю копипастеров, сейчас есть довольно неплохие програмные комплексы, которые автоматически пропускают получаемый контент через синонимайзер и рерайтер, в этом случае дублирования контента не будет, таким образом они хотя бы могли не подвергать риску нормальные сайты, они не будут наживать себе врагов в инете. Да и сами сателлиты их жили бы дольше. Примером такого комлекса является Блогбот, ну я во всяком случае лучше пока ничего не встречал и отзываются о нем хорошо в инете. Решил на всякий случай это тоже упомянуть, вдруг эту статью когда-либо будут читать люди, которые этим занимаются, поэтому решил и для них выложить тоже вариант решения проблемы. А еще лучше, это конечно же белые проекты делать, потому как они жить могут фактически вечно, а это значит стабильный доход 🙂

Марш против Ctrl+C, Ctrl+V


Комментарии 3

  • Статья неплохая, но читать ее сложно. Шрифт мелкий, текста много. Подумайте над оформлением текста. Уверен, это увеличит его читабельность.

    • Leo Craft, спасибо. Рад, что понравилась статья. Согласен — текста много получилось 🙂 Я думал над оформлением, где-то курсивом выделил, да на абзацы поразбивал небольшие, но чего еще можно сделать в этом плане мне как-то в голову больше просто ничего не приходит… Единственное, возможно надо было на два поста разделить…

  • Ничего подобного, мне наоброт нравится размер шрифта и такие разрывы строк. А то бывает разбросаны по всей странице, что скука все читать. А тут все компактно. Отличный блог.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *