Крадуть контент сайту – що робити, кому скаржитися і як захищатися

Джерело зображення: SEOblog.com

Питання користувача

Хтось навмисне копіює весь наш сайт, зі всім контентом і контактами та розміщує на найдешевшому домену та хостингу. На сьогоднішній день відомо дві копії таких сайту. Хостинг, техпідтримка та ін. сервіси допомогти нам не можуть або не хочуть.

Питання: які наслідки загрожують нашому сайту-оригіналу? І чи є якісь способи захисту або боротьби з крадіжками сайту і контенту?

Наша відповідь

Сайт-оригінал може втратити пошуковий трафік, якщо його вміст частково або повністю крадуть інші сайти.

Погана новина – немає таких коштів, які стовідсотково захистять сайт від копіювання вмісту (хоча є методи ускладнити цей процес – про них піде мова нижче).

Хороша новина – ризик втрати трафіку значно знижується, якщо:

Тому є підстави вважати, що повні копії вашого сайту на найдешевшому домену та хостингу навряд чи завдадуть шкоди ресурсу-оригіналу.

По-іншому йдуть справи з молодими сайтів, контент яких розтягують більш сильні і старі конкуренти. В таких випадках часто буває, що скопійована стаття на сайті плагіатора потрапляє в ТОП-3 навіть раніше, ніж вона встигає проиндексироваться на сайті-оригіналі.

Давайте розглянемо, що можна зробити, щоб уникнути втрати трафіку через копіювання вашого контент іншими сайтами.

Ваш сайт повинен індексуватися швидше, ніж плагіатор

Отже, перше, що необхідно зробити, подивитися – чий контент з'являється раніше в індексі пошукових систем. У разі якщо ваші сторінки індексується пізніше, необхідно вжити заходів до прискорення індексації.

Індексацію можна покращити такими шляхами:

  1. Автоматично додавати створені сторінки в Sitemap .
  2. Вивести на сайті наскрізні блоки з посиланнями на нові статті.
  3. Відправляти нові статті на індексацію.

Зверніть увагу, що таким чином можна прискорити індексацію до 20 сторінок в 24 години.

  1. Налаштувати заголовки Last -Modified .

В першу чергу актуально для сайтів з великою кількістю сторінок. Проіндексовані сторінки, на яких не змінюється контент, повинні віддавати відповідь сервера 304 Not Modified. Це «рекомендація» для ботів не переобходить ці сторінки заново і не витрачати на них краулинговый бюджет. Таким чином, квота повинна витрачатися на нові сторінки або на ті, на яких були зміни.

На жаль, боти не завжди слухаються рекомендацій. Але в більшості випадків цей метод працює і в будь-якому разі сайту він не зашкодить.

  1. Налаштувати автоматичне додавання посилань з соціальних мереж або хабів з посиланням на нові сторінки.

Це приверне бота, він перейде по посиланню і обійде сторінку. Але щоб вирішити завдання, таких посилань потрібно ставити по кілька на кожну нову сторінку.

  1. Закрити від індексації сторінки пагинации, які ведуть на старі сторінки.

Ще один метод економії краулингово бюджету. Залишити відкритою пагінацію, яка веде на нові сторінки, додані протягом 4-5 днів.

  1. Пінговать нові сторінки

Тобто повідомляти пошуковикам напряму, що з'явилася нова сторінка. У більшості готових движків є готові модулі і плагіни, які вирішують цю задачу.

Інструкції по темі прискорення індексації:
Як привернути на сайт быстробота
Як прискорити індексацію сайту

Закріплення авторства

Яндекс дає можливість закріпити за своїм сайтом авторство контенту за допомогою інструменту «Оригінальні тексти», який знаходиться в Я. Вебмастере:

На жаль, очікування від роботи цього інструменту майже не виправдовуються. Багато текстів, які «захищені» таким чином, ранжуються гірше, ніж їх копіпаст на сайтах-плагіаторів з більш сильними хостовими факторами. Але для власного спокою цим методом краще не нехтувати.

У Google інструменту для закріплення авторства контенту, на жаль, немає.

Кому скаржитися на вкрадений контент?

Обидві пошукові системи дають можливість поскаржитися на плагіат:

Форма Яндекса для скарги на порушення авторських прав.

Форма Google для видалення матеріалів, що порушують авторські права.

Після розгляду та підтвердження авторського права сторінки з скопійованим контентом повинні бути видалені з індексу ПС Google – пруфлінк .

Але проблема в тому, що сам факт звернення в службу підтримки ПС не є доказом порушення ваших авторських прав. Якщо контент крадуть частково, не варто очікувати, що після вашої скарги порушник буде гарантовано видалено з видачі (хоча такі випадки в моєму досвіді було).

У ситуації, описаній автором питання, зловмисники скопіювали весь сайт повністю. У такому разі сайти-плагіатори, швидше за все, після скарги будуть видалені.

Технічні прийоми захисту від копіювання текстів

Можна ускладнити процес крадіжки контенту наступними способами:

  1. Програмний заборона від копіювання

Налаштувати заборона на копіювання тексту зі сторінок за допомогою спеціальних скриптів, щоб користувач не зміг задіяти комбінації клавіш для копіювання тексту з сайту.

Альтернатива – автоматичне додавання посилання на сайт-джерело під скопійований текст (але, як показує досвід, в більшості випадків такі посилання видаляють).

  1. Бан по IP

Якщо сайт регулярно парсят, можна відстежити IP зловмисників по логам і забанити їх (або замість контенту сайту видавати заглушку).

Це не гарантує, що вміст перестануть копіювати, але ускладнить сам процес.

  1. Вшивання посилання в малопомітні елементи тексту.

Наприклад, в точку, тире чи кома. Їх помічають і видаляють набагато рідше, ніж посилання на джерело під скопійованим текстом, про яких йшла мова у першому пункті. Якщо ваші статті розтягнуть конкуренти, то хоча б з посиланнями на ваш сайт.

Замість висновків

Існуючі на даний момент способи захисту контенту сайту від злодійства не вирішують проблему повністю:

Доводиться визнати, що авторство контенту на даний момент не є для ПС вагомим фактором ранжирування. Боротися з проблемою слід з іншого боку – працювати над прискоренням індексації свого контенту і прокачувати хостовые фактори.


Автор відповіді – Віктор Кислий , SEO-спеціаліст SiteClinic

Поставити своє запитання

Опубліковано: 26/03/19 @ 06:00
Розділ Різне

Рекомендуємо:

Дружні ІТ-шники. Як спільнота «Котані» безоплатно навчає собі подібних
Technical Writing дайджест #2: курси з техрайтингу для новачків і профі, поглиблюємо знання CSS, конференція у Львові
10 причин опанувати Intelligent Automation
DOU Labs: Infopulse створили Standards Compliance Manager – додаток для дотримання стандартів
Програмування без негативу: як виконувати поточну роботу й зберігати спокій