Перенос сайта на новый домен с минимальными потерями

Автор Олександр aka Alek $, блог http://nevkontakte.org.ru , один із переможців Конкурсу Круті блогери II

Актуально + людина навіть скрипт написав!

*****

Питання про те, як правильно перенести сайт на новий домен завжди був актуальним, а в світлі нещодавнього рішення Координаційної ценрт про необхідність обов'язкового підтвердження паспортних даних для реєстрації і продовження доменів в зоні RU питання постає з ще більшою гостротою - адже далеко не всі хочуть жорстко пов'язувати своє ім'я зі своїми сайтами.

Я хочу поділитися методом перенесення сайту на новий домен, який допоможе якомога менше втратити на такому переїзді.

Умови завдання:

Для визначеності і простоти викладу будемо виходити з наступного умов:
• Ми хочемо переїхати з домена example.ru на example.com
• Наш сайт доступний за обом цим доменам, тобто вони обидва припарковані на один і той же сервер і папку.
• Розглядаємо тільки Яндекс і Гугль як дві основні ПС, example.ru проіндексований ними, а example.com - ні.

Вирішуємо задачу

Головна складність полягає в тому, що Яндекс в упор не розуміє 30x редиректів і якщо просто поставити це редирект, то старий сайт з індексу вилетить, а ось проиндексируется чи новий - незрозуміло; Гугль, в свою чергу, ігнорує директиву Host з robots . txt, на яку орієнтується Яндекс.
Тому міграція буде здійснюватися в два етапи: для Яндекса і для Google.

Етап перший. В robots.txt для обох доменів прописуємо директиву
Host: example.com
і для нового домену додаємо також:
User-agent: Googlebot
Disallow: /

Це дозволить нам протягом першого періоду уникнути санкцій від гугля за дубльований контент.
Єдина складність полягає в тому, що у нас robots.txt фізично один і той же для обох доменів. Тим не менш, це легко подолати, або разрулівая запити на різні файли за допомогою. Htaccess і mod_rewrite, або за допомогою допоміжного скрипта, який ви знайдете в кінці посту.

Після того, як robots.txt приведений в належний вигляд, нам потрібно дочекатися, поки Яндекс не виявить дзеркало і не зробить його основним. Після цього можна зайнятися Гуглі.

Етап другий. Для перевизначення основного домену для Гугля потрібно встановити 301-й редірект зі старого домену на новий, при чому обов'язково із збереженням сторінок. Т. е. адресу http://example.ru/page1.html повинен перенаправлятися на http://example.com/page1.html.

Це робиться за допомогою такого коду в. htaccess:
RewriteEngine On
RewriteBase/
RewriteCond% {HTTP_HOST}! Example.com
RewriteRule (.*)
http://example.com/$ 1 [R = 301, L]

При цьому, важливо не забути прибрати з robots.txt заборону Гуглю індексувати example.com

Тепер залишилося дочекатися переиндексацией гуглом і радіти новому домену! Якщо все зробити акуратно і правильно, то новий домен не тільки успішно замінить старий, але і напевно перейме його пузомірки, що теж приємно серце вебмастера.

Використання допоміжного скрипта

Сам по собі, скрипт вкрай простий - він зчитує ваш robots.txt, додає до нього потрібні інструкції і віддає в браузер/пошуковому боту. Установка і настройка:

1. Знаходимо в коді скрипта рядок
define ('NEW_DOMAIN', 'example.com');// Новий домен
і замінюємо в ній example.com на ваш новий домен.
2. Розміщуємо скрипт в кореневу папку сайту під ім'ям robots.php
3. В. Htaccess додаємо код:
RewriteEngine On
RewriteRule robots.txt robots.php
4. Відкриваємо в браузері http://example.com/robots.txt і http://example.ru/robots.txt і переконуємося, що скрипт працює і віддає різний код залежно від домену.

По завершенні переіндексації Яндексом ви просто видаляєте додані рядки з. htaccess і сам скрипт.

Завантажити скрипт

розрулювання robots.txt через. htaccess

Якщо ви з якихось причин не хочете використовувати скрипт, то можна того ж ефекту домогтися і за допомогою mod_rewrite, хоч і більш клопітно.

1. Створіть дві копії вашого robots.txt: robots-old.txt і robots-new.txt. Відредагуйте їх так, як потрібно для нового і старого домену відповідно.
2. В. Htaccess додайте такий код:
RewriteEngine On
RewriteBase/
RewriteCond% {HTTP_HOST}! Example.com
RewriteRule robots.txt robots-old.txt [L]
RewriteRule robots.txt robots-new.txt

Знову ж, не забудьте замінити example.com на ваш новий домен.

Після закінчення першого етапу зазначені рядки з. htaccess приберіть і самі файли robots-new.txt і robots-old.txt - теж.

P. S. Описана вище методика є компіляцією багатьох опублікованих в мережі рад, забезпеченою конкретними технічними рішеннями.

Alek $, блог - блог антисоціального програміста

*****

Опубліковано: 02/09/09 @ 07:21
Розділ Блоги Домени

Рекомендуємо:

Сателлитостроение, как способ заработка.
Конкурс “Крутые блоггеры II” - Итоги
Liex для лентяев или биржа для тех, кто хочет …
Каким браузером Вы пользуетесь?
Клип “Оптимизатор”