Крадуть контент сайту – що робити, кому скаржитися і як захищатися
Джерело зображення: SEOblog.com
Питання користувача
Хтось навмисне копіює весь наш сайт, зі всім контентом і контактами та розміщує на найдешевшому домену та хостингу. На сьогоднішній день відомо дві копії таких сайту. Хостинг, техпідтримка та ін. сервіси допомогти нам не можуть або не хочуть.
Питання: які наслідки загрожують нашому сайту-оригіналу? І чи є якісь способи захисту або боротьби з крадіжками сайту і контенту?
Наша відповідь
Сайт-оригінал може втратити пошуковий трафік, якщо його вміст частково або повністю крадуть інші сайти.
Погана новина – немає таких коштів, які стовідсотково захистять сайт від копіювання вмісту (хоча є методи ускладнити цей процес – про них піде мова нижче).
Хороша новина – ризик втрати трафіку значно знижується, якщо:
- хостовые фактори у сайту-оригіналу прокачані краще, ніж у плагіаторів;
- контент сайту-оригіналу потрапляє в індекс швидше, ніж у ресурсів, скопировавших контент.
Тому є підстави вважати, що повні копії вашого сайту на найдешевшому домену та хостингу навряд чи завдадуть шкоди ресурсу-оригіналу.
По-іншому йдуть справи з молодими сайтів, контент яких розтягують більш сильні і старі конкуренти. В таких випадках часто буває, що скопійована стаття на сайті плагіатора потрапляє в ТОП-3 навіть раніше, ніж вона встигає проиндексироваться на сайті-оригіналі.
Давайте розглянемо, що можна зробити, щоб уникнути втрати трафіку через копіювання вашого контент іншими сайтами.
Ваш сайт повинен індексуватися швидше, ніж плагіатор
Отже, перше, що необхідно зробити, подивитися – чий контент з'являється раніше в індексі пошукових систем. У разі якщо ваші сторінки індексується пізніше, необхідно вжити заходів до прискорення індексації.
Індексацію можна покращити такими шляхами:
- Автоматично додавати створені сторінки в Sitemap .
- Вивести на сайті наскрізні блоки з посиланнями на нові статті.
- Відправляти нові статті на індексацію.
- В Я. Вебмастере це можна зробити за допомогою інструменту «Переобход сторінок», який знаходиться в розділі «Індексування»
Зверніть увагу, що таким чином можна прискорити індексацію до 20 сторінок в 24 години.
- У Google Search Console потрібно спочатку натиснути на посилання «Перевірити URL» – вводимо туди адресу сторінки, отримуємо відповідь, що вона не проіндексована і натискаємо на кнопку «Запросити індексування»:
- Налаштувати заголовки Last -Modified .
В першу чергу актуально для сайтів з великою кількістю сторінок. Проіндексовані сторінки, на яких не змінюється контент, повинні віддавати відповідь сервера 304 Not Modified. Це «рекомендація» для ботів не переобходить ці сторінки заново і не витрачати на них краулинговый бюджет. Таким чином, квота повинна витрачатися на нові сторінки або на ті, на яких були зміни.
На жаль, боти не завжди слухаються рекомендацій. Але в більшості випадків цей метод працює і в будь-якому разі сайту він не зашкодить.
- Налаштувати автоматичне додавання посилань з соціальних мереж або хабів з посиланням на нові сторінки.
Це приверне бота, він перейде по посиланню і обійде сторінку. Але щоб вирішити завдання, таких посилань потрібно ставити по кілька на кожну нову сторінку.
- Закрити від індексації сторінки пагинации, які ведуть на старі сторінки.
Ще один метод економії краулингово бюджету. Залишити відкритою пагінацію, яка веде на нові сторінки, додані протягом 4-5 днів.
- Пінговать нові сторінки
Тобто повідомляти пошуковикам напряму, що з'явилася нова сторінка. У більшості готових движків є готові модулі і плагіни, які вирішують цю задачу.
Інструкції по темі прискорення індексації:
Як привернути на сайт быстробота
Як прискорити індексацію сайту
Закріплення авторства
Яндекс дає можливість закріпити за своїм сайтом авторство контенту за допомогою інструменту «Оригінальні тексти», який знаходиться в Я. Вебмастере:
На жаль, очікування від роботи цього інструменту майже не виправдовуються. Багато текстів, які «захищені» таким чином, ранжуються гірше, ніж їх копіпаст на сайтах-плагіаторів з більш сильними хостовими факторами. Але для власного спокою цим методом краще не нехтувати.
У Google інструменту для закріплення авторства контенту, на жаль, немає.
Кому скаржитися на вкрадений контент?
Обидві пошукові системи дають можливість поскаржитися на плагіат:
Форма Яндекса для скарги на порушення авторських прав.
Форма Google для видалення матеріалів, що порушують авторські права.
Після розгляду та підтвердження авторського права сторінки з скопійованим контентом повинні бути видалені з індексу ПС Google – пруфлінк .
Але проблема в тому, що сам факт звернення в службу підтримки ПС не є доказом порушення ваших авторських прав. Якщо контент крадуть частково, не варто очікувати, що після вашої скарги порушник буде гарантовано видалено з видачі (хоча такі випадки в моєму досвіді було).
У ситуації, описаній автором питання, зловмисники скопіювали весь сайт повністю. У такому разі сайти-плагіатори, швидше за все, після скарги будуть видалені.
Технічні прийоми захисту від копіювання текстів
Можна ускладнити процес крадіжки контенту наступними способами:
- Програмний заборона від копіювання
Налаштувати заборона на копіювання тексту зі сторінок за допомогою спеціальних скриптів, щоб користувач не зміг задіяти комбінації клавіш для копіювання тексту з сайту.
Альтернатива – автоматичне додавання посилання на сайт-джерело під скопійований текст (але, як показує досвід, в більшості випадків такі посилання видаляють).
- Бан по IP
Якщо сайт регулярно парсят, можна відстежити IP зловмисників по логам і забанити їх (або замість контенту сайту видавати заглушку).
Це не гарантує, що вміст перестануть копіювати, але ускладнить сам процес.
- Вшивання посилання в малопомітні елементи тексту.
Наприклад, в точку, тире чи кома. Їх помічають і видаляють набагато рідше, ніж посилання на джерело під скопійованим текстом, про яких йшла мова у першому пункті. Якщо ваші статті розтягнуть конкуренти, то хоча б з посиланнями на ваш сайт.
Замість висновків
Існуючі на даний момент способи захисту контенту сайту від злодійства не вирішують проблему повністю:
- «Оригінальні тексти» в Яндексі не дають гарантій, що ваша сторінка буде ранжируватися вище плагитора;
- скарги на порушення авторських прав в Яндексі і Google не гарантують, що порушник буде покараний;
- технічні прийоми можуть тільки ускладнити процес копіювання тексту, але не можуть заборонити його повністю.
Доводиться визнати, що авторство контенту на даний момент не є для ПС вагомим фактором ранжирування. Боротися з проблемою слід з іншого боку – працювати над прискоренням індексації свого контенту і прокачувати хостовые фактори.
Автор відповіді – Віктор Кислий , SEO-спеціаліст SiteClinic
Опубліковано: 26/03/19 @ 06:00
Розділ Різне
Рекомендуємо:
Дружні ІТ-шники. Як спільнота «Котані» безоплатно навчає собі подібних
Technical Writing дайджест #2: курси з техрайтингу для новачків і профі, поглиблюємо знання CSS, конференція у Львові
10 причин опанувати Intelligent Automation
DOU Labs: Infopulse створили Standards Compliance Manager – додаток для дотримання стандартів
Програмування без негативу: як виконувати поточну роботу й зберігати спокій