Подготовка HTML-документов и их оптимизация для поисковых систем
Каждый, кто хоть раз занимался продвижением ресурса в сети интернет, сталкивался с задачей подготовки HTML-документов и их оптимизацией для поисковых механизмов. Как, вы ещё не столкнулись с подобной задачей и хотите спросить зачем это нужно? Не секрет, что наиболее популярный механизм поиска той или иной информации, который доступен каждому посетителю бескрайней паутины - это поисковая система. И именно она оценивает релевантность (соответствие) вашего ресурса запросу пользователя. Поисковый механизм - это робот, который пробегается по ресурсам и ищет нужные пользователю документы. И чтобы этот механизм, лишенный какой бы то ни было предвзятости, решил, что именно Ваш HTML-документ наиболее подходит пользователю, Вам необходимо оптимизировать его для удобства работы робота. И как это сделать мы хотим рассказать Вам в этой статье. В своё время мы тоже столкнулись с подобной задачей. Много бессонных ночей было проведено перед монитором в поиске материала на эту тему, и мы с уверенностью можем сказать, что материла на данную тематику Вы сможете найти очень много. Но сможет ли весь этот материал ответить на все ваши вопросы? Скажем с уверенностью - НЕТ! Как и не ответил на наши. Именно поэтому мы решили подготовить для Вас эту статью, которая смогла бы охватить большую часть вопросов, на многие из которых нам пришлось искать ответы самим. Вернее, это даже не статья, а FAQ или руководство. Итак, начнем. На сегодняшний день самыми популярными поисковыми системами в РуНете являются Yandex.ru, Rambler.ru, Aport.ru, Google.com.ru и Altavista.ru. И каждая из этих систем использует свои собственные механизмы поиска. Соответственно, нам необходимо сформировать некий стандарт документа, который бы в полной мере гарантировал высокую оценку релевантности каждой из них.
Оценка релевантности документа поисковым механизмом
Множество экспертов берутся описывать факторы, влияющие на оценку релевантности HTML-документов поисковыми машинами. Но верны ли их домыслы? Именно домыслы, а не утверждения, ибо чтобы ответить на все эти вопросы нужно иметь прямое отношение к разработке данных механизмов. Ну а сами разработчики никогда не станут описывать алгоритм работы своего детища. Так как, кто в точности знает принцип работы поискового робота, тот сможет его и обмануть, а разработчики вынуждены будут корпеть над созданием более совершенной системы. Поэтому скажем откровенно, все знания, которые накопились у нас, да и у всех других экспертов по оценке работы поисковых машин и их анализу HTML-документов имеют исключительно гипотетический характер. Но есть факторы, влияние которых на оценку релевантности страницы бесспорны. С них мы и начнем наш обзор!
- Тег <Title> - название (заголовок) HTML-документа. Оно должно быть ёмким, лаконичным и давать общее представление о содержании данного документа. Рекомендуемый объем 60-80 символов.
- МЕТА тег <Keywords> - ключевые слова. Сейчас очень часто говорят о снижении влияния данного мета-тега, но так или иначе, он влияет на оценку релевантности документа поисковым механизмом. И робот оценивает соответствие содержания документа и прописанных в нём ключевых слов. Рекомендуемый объем 800-1000 символов. Необходимо отметить, что больший приоритет робот отдает первым 50 словам.
- META тег <Description> - описание документа. Этот мета-тег можно назвать самым важным. На него всегда обращает своё внимание поисковик. Описание документа должно быть емким и кратким, так как его объем очень ограничен и не должен превышать 200 символов.
- Количество ключевых слов в HTML-документе тоже является немаловажным фактором. Но, как правило, оно должно составлять 5% от всего объема документа. Робот также оценивает удаленность ключевых слов от начала документа и их кучность.
- Теги выделения текста <B> и <STRONG> - придают большую значимость заключенным в них словам. Нередко их используют для выделения ключевых слов в основном тексте документа, что тоже сказывается на релевантности документа.
- Теги заголовков <H1> - <H6> - имеют схожий характер с предыдущими тегами выделения текста, и учитываются поисковым роботом. Здесь необходимо заметить, что некоторые, особенно начинающие, web-мастера нередко злоупотребляют этими тегами и заключают в них весь текст страницы. Предварительно прописав в библиотеку стилей изменение их стандартных параметров. Но не следует забывать о том, что некоторые web-серферы просматривают HTML-документы не только с отключенными картинками, но и с отключенной библиотекой стилей. И в этом случае ваша страница будет смотреться просто чудовищно.
- Тег <IMG> всегда должен содержать описание в атрибуте ALT и всплывающую подсказку (это скорее касается организации мэппинга на одной картинке). Они тоже могут содержать ключевые слова, но нельзя забывать о том, чтобы они были читабельны и вписывались в общую концепцию данного изображения или привязанной к ним ссылке. Рекомендуемый объем составляет 40 символов.
- Тег <A> служит для создания гипертекста (ссылок) и его атрибут TITLE может содержать описание данной ссылки и создает всплывающую подсказку. Он также может быть снабжен ключевыми словами.
- Немаловажную роль для поисковых механизмов играет также организация ссылок на вашем сервере и количество HTML-документов, то есть объем предоставляемого вами материала. Некоторые поисковые роботы отслеживают только ограниченное количество переходов, поэтому, занимаясь разработкой структуры сервера, необходимо учитывать так называемый "принцип четырех кликов".
- Поисковые машины также оценивают и внешние ссылки, ведущие на Ваш сервер, их количество и качество. А также рейтинг и соответствие тематике этих ресурсов. На этих данных и базируется подсчет взвешенного индекса цитирования Вашего сайта.
- Не стоит также засорять свой сервер всевозможнейшим "мусором". А если Ваш документ содержит блоки с текстовыми ссылками, не имеющими отношения к Вашему ресурсу (рекламные блоки), то необходимо помещать их в тег <noindex>. И тогда робот их проигнорирует. Это играет достаточно важную роль, особенно если эти блоки находятся в верхней части документа.
- Ну и конечно же популярность Вашего сервера имеет далеко не последнее значение, и здесь вся ситуация находится в Ваших руках. Не забывайте, что самое важное - это содержание, а интернет-страницы создаются в первую очередь для посетителей, а не для поисковых роботов.: -)
Алгоритм подготовки и оптимизации документа
В этом разделе мы хотим познакомить Вас со своим алгоритмом подготовки и оптимизации HTML-документов, который мы разработали для внутреннего пользования наших специалистов. Возможно, он поможет Вам повысить эффективность работы и сократит время на её выполнение. Он предельно прост и представляет собой поэтапное выполнение следующих мероприятий:
- Подготовка основного текста страницы.
- Подбор ключевых слов для данного документа (тег <Keywords>).
- Составление заголовка страницы (Тег <Title>).
- Подготовка описания документа (тег <Description>).
- Подготовка текстовых блоков для подписей и всплывающих подсказок картинок и ссылок.
Некоторая информация о запрещённых методах повышения релевантности
Очень часто web-мастера идут на всевозможные уловки, чтобы обмануть поисковый механизм и получить более высокую оценку HTML-документов. И в этом разделе мы затронем как раз эту тему.
Уловка №1 Однажды, это было года два-три назад, я наткнулся на сайт одного рекламного агентства (не буду уточнять какого, дабы не прогневать Небеса). Тег <title> которого содержал более 10 тысяч символов, состоящих из повторяющихся ключевых слов. Трудно сказать прочитал ли их поисковый робот, но рейтинг это сайта был внушителен. За несколько месяцев перед написанием данного материала я снова заглянул на этот ресурс и снова оценил его популярность. "Мусор" из заголовка был вычищен, счетчик посещений этого ресурса был обнулен и в рейтингах он волочился где-то в хвосте. По-видимому, специалистами из поисковых систем были приняты суровые меры. История сайта ещё не окончена, и сейчас он сменил адрес и раскручивается по старой, налаженной схеме.
Уловка №2 Не секрет, что с помощью библиотеки стилей можно задать такие параметры текста, которые позволят ему стать микроскопическим и совершенно незаметным для глаза пользователя, но читаемым для робота. Так Вы сможете уместить где-нибудь на своей странице небольшой блок, содержащий огромное количество ключевых слов и выражений. Наверное, это самая популярная методика, но у неё тоже есть свои недостатки. Такой способ повышения релевантности также не приветствуется поисковиками, и робот уже научился воспринимать как мусор текст, цвет которого совпадает с основным цветом страницы или заливкой блока, в котором находиться "мусор". Это, конечно, тоже можно обойти, если залить блок или страницу однотонной картиной соответствующей цвету "мусора", а основной фон страницы задать другим. Можно даже вписать в дизайн эти маленькие точечки и подготовить не банальное перечисление ключевых слов, а немного корявый, но литературный текст, содержащий максимальное их количество. И тогда поисковый робот не сможет заподозрить в нем "мусор". Но пользователь с отключенными в браузере настройками библиотеки стилей всё равно увидит этот текст.
Уловка №3 Не меньшую популярность имеет создание дорвеев. Дорвей (doorway) - это HTML-документ, составленный из ключевых слов. Как правило, на главной странице сайта прописывается скрытая от глаз пользователя ссылка на этот документ. А если посетитель по какой-то случайности активирует эту ссылку или попадет на неё через запрос в поисковой машине, то программный скрипт тут же пересылает его на основную страницу ресурса. Зато поисковый робот воспринимает дорвей как одну из страниц ресурса, что также увеличивает его релевантность.
В заключение, могу только сказать, что эти три вышеуказанных способа являются обманом поисковых роботов и их использование влечет за собой штрафные санкции в виде обнуления счетчика посещаемости, исключения из рейтинга или даже удаление из поисковых баз с невозможностью восстановления. Хотите ли вы попасть в черный список поисковиков и постоянно скакать с одного доменного имени на другое? Хорошенько подумайте над этим перед использованием этих приемов. И знайте, что если Ваш ресурс интересен, оригинален и не лишен вкуса, всегда можно достигнуть успеха, если уделять работе над ним должное внимание!
Желаю Вам творческих успехов!
Соколов Дмитрий Валерьевич Art2k Creative Group
Соколов Дмитрий Валерьевич viewstuff@pochtamt.ru http://www.art2k.narod.ru
|