Перенесення сайту на новий домен з мінімальними втратами

Автор Олександр aka Alek $, блог http://nevkontakte.org.ru , один із переможців Конкурсу Круті блогери II

Актуально + людина навіть скрипт написав!

*****

Питання про те, як правильно перенести сайт на новий домен завжди був актуальним, а в світлі нещодавнього рішення Координаційної Ценрт про необхідність обов'язкового підтвердження паспортних даних для реєстрації та продовження доменів в зоні RU питання постає з ще більшою гостротою - адже далеко не всі хочуть жорстко пов'язувати своє ім'я зі своїми сайтами.

Я хочу поділитися методом перенесення сайту на новий домен, який допоможе якомога менше втратити на такому переїзді.

Умови завдання:

Для визначеності і простоти викладу будемо виходити з таких умов:
• Ми хочемо переїхати з домену example.ru на example.com
• Наш сайт доступний за обом цим доменів, тобто вони обидва припарковані на один і той самий сервер і папку.
• Розглядаємо тільки Яндекс і Гугль як дві основні ПС, example.ru проіндексовані ними, а example.com - ні.

Вирішуємо задачу

Головна складність полягає в тому, що Яндекс впритул не розуміє 30x редиректів і якщо просто поставити цей редирект, то старий сайт з індексу вилетить, а ось проиндексируется чи новий - незрозуміло; Гугль, у свою чергу, ігнорує директиву Host з robots . txt, на яку орієнтується Яндекс.
Тому міграція буде здійснюватися в два етапи: для Яндекса і для Google.

Етап перший. У robots.txt для обох доменів прописуємо директиву
Host: example.com
і для нового домену додаємо також:
User-agent: Googlebot
Disallow: /

Це дозволить нам протягом першого періоду уникнути санкцій від гугля за дубльований контент.
Єдина складність полягає в тому, що у нас robots.txt фізично один і той же для обох доменів. Тим не менш, це легко подолати, або розрулюючи запити на різні файли за допомогою. Htaccess і mod_rewrite, або за допомогою допоміжного скрипта, який ви знайдете в кінці поста.

Після того, як robots.txt наведено в належний вигляд, нам потрібно дочекатися, поки Яндекс не виявить дзеркало і не зробить його основним. Після цього можна зайнятися Гуглем.

Етап другий. Для перевизначення основного домену для Гугля потрібно встановити 301-й редірект зі старого домену на новий, при чому обов'язково зі збереженням сторінок. Т. е. адресу http://example.ru/page1.html повинен перенаправлятися на http://example.com/page1.html.

Це робиться за допомогою такого коду в. htaccess:
RewriteEngine On
RewriteBase/
RewriteCond% {HTTP_HOST}! Example.com
RewriteRule (.*)
http://example.com/$ 1 [R = 301, L]

При цьому, важливо не забути прибрати з robots.txt заборону Гуглю індексувати example.com

Тепер залишилося дочекатися переіндексації гуглом і радіти новому домену! Якщо все зробити акуратно і правильно, то новий домен не тільки успішно замінить старий, але і напевно перейме його пузомірки, що теж приємно серце вебмастера.

Використання допоміжного скрипта

Сам по собі, скрипт вкрай простий - він зчитує ваш robots.txt, додає до нього потрібні інструкції і віддає в браузер/пошуковому боту. Встановлення і налаштування:

1. Знаходимо в коді скрипта рядок
define ('NEW_DOMAIN', 'example.com');// Новий домен
і замінюємо в ній example.com на ваш новий домен.
2. Розміщуємо скрипт в кореневу папку сайту під ім'ям robots.php
3. В. Htaccess додаємо код:
RewriteEngine On
RewriteRule robots.txt robots.php
4. Відкриваємо в браузері http://example.com/robots.txt і http://example.ru/robots.txt і переконуємося, що скрипт працює і віддає різний код в залежності від домену.

По завершенні переіндексації Яндексом ви просто видаляєте додані рядки з. htaccess і сам скрипт.

Завантажити скрипт

розрулювання robots.txt через. htaccess

Якщо ви з якихось причин не хочете використовувати скрипт, то можна того ж ефекту добитися і за допомогою mod_rewrite, хоч і більш клопітно.

1. Створіть дві копії вашого robots.txt: robots-old.txt і robots-new.txt. Відредагуйте їх так, як потрібно для нового і старого домену відповідно.
2. В. Htaccess додайте такий код:
RewriteEngine On
RewriteBase/
RewriteCond% {HTTP_HOST}! Example.com
RewriteRule robots.txt robots-old.txt [L]
RewriteRule robots.txt robots-new.txt

Знову ж таки, не забудьте замінити example.com на ваш новий домен.

Після закінчення першого етапу зазначені рядки з. htaccess приберіть і самі файли robots-new.txt і robots-old.txt - теж.

P. S. Описана вище методика є компіляцією багатьох опублікованих в мережі рад, забезпеченою конкретними технічними рішеннями.

Alek $, блог http://nevkontakte.org.ru - блог антисоціального програміста

*****

Post from: Prodvinem vmeste


 Мітки: Поради

Схожі статті

 

Опубліковано: 02/03/11 @ 01:31
Розділ Блоги Домени

Рекомендуємо:

Конкурс не іспит, а урок. Думки вголос
. Htaccess: Поради та основні помилки.
Щасливий фермер. Злом щасливого фермера
Ненавиджу IE! Ненавиджу Joomla! Ненавиджу Virtuemart!
AJAX - upload файлів.