Слово о словах
Именно так – "Слово о словах" был озаглавлен труд Льва Успенского, широкой публикой,
пожалуй, незамеченный, но ставший настольный книгой для нескольких поколений начинающих
литераторов. Что такое слово, что оно делает с человеком, как взять его под контроль –
именно об этом писал полвека назад автор, широко известный в профессиональных кругах.
К чему всё это? К тому, что мы собираемся повторить фундаментальное исследование Успенского
– только, разумеется, применительно к кибермаркетингу. И эта статья, написанная экспертами
"Лаборатории Контента" в тесном сотрудничестве с компанией NetPromoter, является своего
рода "пробным шаром", подготовкой почвы для глубокой аналитической работы.
Обратимся к корням. Рассмотрим задачи, стоящие перед поисковой системой и оптимизаторами.
Казалось бы, они прямо противоположны: поисковая система должна найти текстовый контент,
максимально соответствующий запросу, а не какое-нибудь коммерческое предложение.
Исключением, пожалуй, может быть поиск графического контента или конкретного коммерческого
предложения. Задача оптимизатора зачастую напротив, заключается в том, чтобы подсунуть
пользователю поисковой машины свое коммерческое предложение, выдав его за релевантный
контент. Правильно? Неправильно. На самом деле никакого противоречия здесь нет, поисковая
система и грамотный оптимизатор делают одно дело, развиваются (и, что самое важное,
развивают свою среду обитания) в одном и том же направлении.
Ключ – в ненужности самого противопоставления "полезной информации", которую ищет человек,
и "коммерческого предложения", которое человеку якобы подсовывают против его воли. Разве
коммерческое предложение не может являться той самой полезной информацией, которую ищет
пользователь "Яндекса" или "Рамблера"? Опыт показывает, что – может. Таким образом, задача
прогрессивного оптимизатора сводится к тому, чтобы сделать коммерческое предложение своего
клиента интересным для пользователя поисковых систем, а также, что немаловажно, понятным
для поисковых роботов. Задача же разработчиков поисковых систем остается неизменной: учить
поисковики как можно лучше распознавать контент, релевантный запросу. Тут стоит помнить,
что привести пользователя с поисковика мало, нужно его как минимум удержать, как максимум
стимулировать принятие решения о покупке.
Текст как орудие
Следует понимать, что поисковые алгоритмы неуклонно совершенствуются. Свою задачу –
отыскивать и сортировать текстовый контент, максимально соответствующий запросу, они решают
всё лучше. А значит, уже в обозримом будущем процесс поискового продвижения сайта будет
заключаться в написании и публикации на сайте интересных статей на соответствующую тему и
размещении ссылок на тематических ресурсах с тематическим содержимым. Рафинированное
искусство, безо всяких технологических примесей. К сожалению, до этого пока далековато,
хотя общие подвижки налицо. Для продвижения действительно необходим хороший, интересный
читателю текст – но при этом он должен быть выстроен и заверстан согласно определенным
принципам.
Распространено мнение, что главный критерий SEO-текста – это определенная плотность
ключевых слов (словосочетаний). (Для расчета плотности необходимо разделить объем текста в
знаках на длину ключевого словосочетания, а затем взять от результата необходимое число
процентов.) Процентное содержание ключевиков в тексте – лишь одно из требований, отличающих
сегодня SEO-текст от текста "обычного". Оптимальный процент определяет "рынок" сайтов по
этому запросу в индексе поисковой системы.
Распределение ключевых слов в тексте также играет немалую роль. В частности, по последним
данным, первое "попадание" главного ключевика должно приходиться на первые же 256 знаков
текста. Плотность также должна существенно варьироваться в зависимости от расположения в
тексте: первая треть, равно как и последняя, пользуется у поисковых роботов наибольшим
успехом.
Кроме того, поисковые машины явно обладают уже некоторыми зачатками искусственного
интеллекта. В частности, выражается это в том, что поисковики небезуспешно "отлавливают" и
"взвешивают" контекст, в котором употребляется ключевое слово. Достигается это, в
частности, при помощи так называемых "семантических кластеров" – совокупности запросов,
имеющих прямое отношение друг к другу. Например, в тексте про пластиковые окна уместно
появление словосочетания "окна ПВХ" – и его присутствие существенно повышает релевантность
материала запросу "пластиковые окна". И в этом нет ничего удивительного: хороший текст про
пластиковые окна наверняка не оставит без внимания окна ПВХ. Хороший текст – значит,
оптимизированный текст.
Таковы, вкратце, азы SEO-копирайтинга. Точнее – технической его стороны. Но если вы
считаете, что этого уже достаточно для успешной работы, то вы глубоко заблуждаетесь.
Разумеется, игнорировать эти знания, добытые нелегким путем проб и находок, не следует – но
еще большим заблуждением была бы слепая вера в подобные "частности". Но если есть четкое
понимание того, зачем нужны эти 256 знаков и две трети, первая и последняя, то всё
становится на свои места.
Именно так поисковые машины отличают релевантный текст от нерелевантного, нужный от
ненужного. В чем-то искусственно, в чем-то – вообще смешно. Тем не менее, если
проанализировать каждый по-настоящему хороший текст для интернета (подчеркиваем – именно
для интернета), то становится ясно: по всем своим параметрам он вплотную приближается к
описанному выше "идеалу". В сущности, откуда бы еще взяться этим требованиям вроде 256
знаков, если не из текстов, признанных действительно хорошими?
Скажем совсем просто. Любой текст, который действительно хорош для интернета (просто на
взгляд пользователя), является SEO-текстом, способным существенно повысить поисковые
результаты вашего сайта. И чем лучше поисковые машины выполняют свою работу, тем ярче
проявляется SEO-составляющая вашего текста. Ну а пока поисковики далеки от идеала, на
помощь им должна прийти оптимизационная верстка – тема второй части нашей статьи.
Оптимизационная верстка
Оптимизационная верстка – полная противоположность SEO-копирайтингу. Это – прежде всего
схема, набор четких однозначных правил, которые просто необходимо правильно применить в
конкретной ситуации. Разумеется, слово "просто" носит здесь достаточно условный характер.
Просто, конечно, только в теории.
Итак, что является объектом оптимизационной верстки? В первую очередь, это теги. Итак,
открываем редактор тегов от NetPromoter, являющийся частью программы Page Promoter, и...
Не пугайтесь терминов вроде "Дублинское Ядро", а также количества тегов, подлежащих
редактированию. Если помнить, что на самом деле HTML-теги – это в первую очередь инструкция
браузеру об определенном отображении текстовых и графических данных, а для поисковых
роботов – это просто подсказки, всё становится очень просто. И, разумеется, все 40 тегов,
которые позволяет редактировать программа, нам сейчас не нужны: постараемся обойтись
основными.
Первый тег, который мы с вами сейчас показательно заполним – это тег "Title". Заголовок
страницы. Вот какие применяются к нему требования:
- Заголовок должен содержать "семантический кластер", содержащий не менее двух ключевых
словосочетаний.
- Словосочетание, основное для страниц, должно стоять в начале и прописываться большими
буквами; его длина относительно "тела тега" должна составлять не менее 20%.
Пример: ”ПЛАСТИКОВЫЕ ОКНА, большой выбор пластиковых окон ПВХ”
Максимальная длина тега "Title" составляет 50 знаков.
Второй тег – это "Keywords", ключевые слова, значимость которого в последнее время
минимальна. Они проставляются так:
- Тег должен содержать семантический кластер, содержащий не менее двух ключевых
словосочетаний.
- Словосочетание, основное для страниц, должно стоять в начале и прописываться большими
буквами; его длина относительно "тела тега" должна составлять не менее 20%.
Пример: ”ПЛАСТИКОВЫЕ ОКНА, Пластиковые окна ПВХ, Цены на пластиковые окна”
Максимальная длина тега "Keywords" составляет 200 знаков. Обратите внимание: повторения
ключевого словосочетания недопустимы!
Далее идет тег "Description", призванный, по идее, описывать содержание страницы для
поисковых роботов (именно содержание тега "Description" нередко отображается на странице
выдачи поисковых результатов, одним из примеров может быть поисковая выдача Гугла).
- Тег должен содержать семантический кластер, содержащий не менее двух ключевых
словосочетаний.
- Словосочетание, основное для страниц, должно стоять в начале и прописываться большими
буквами.
Пример: ”ПЛАСТИКОВЫЕ ОКНА, Пластиковые окна ПВХ, Цены на пластиковые окна. Лучшие цены,
широкий ассортимент, бесплатные консультации по телефону 095-739-13-33”
Максимальная длина этого тега так же составляет 200 знаков; несмотря на то, что значение
тегов "Keywords" и "Description" в последнее время снижается, пренебрегать ими не следует.
А вот роль тега "H1" остается достаточно высокой и по сей день. Фактически, именно этот тег
подтверждает, что данная страница действительно содержит ту информацию, о которой "подумал"
поисковый робот. Кроме того – что, наверное, даже важнее, - тег "H1" (совместно с другими
тегами "Нx") отвечает за структуризацию текста. В том, что хороший текст для интернета
должен быть структурирован, сомнений ни у кого не возникает. А следовательно, текст, в
котором правильно расставлены теги H (особенно "H1"), поисковые роботы рассматривают как
хороший. Применительно к тегу "H1", очень важно, чтобы его тело располагалось как можно
ближе к тегу "body".
Как и все теги, рассмотренные ранее, "H1" должен содержать семантический кластер,
включающий не менее двух ключевых словосочетаний, а длина основного ключевого сочетания
должна составлять не менее 20% от тела тега. Разумеется, "H1" может использоваться на одной
странице только раз.
Пример: ”На этой странице все о пластиковых окнах и про окна ПВХ ”
Теги "H2" - "H6" также показывают "меру структуризации текста". Возможно, они менее важны,
чем "H1", но пренебрегать ими в любом случае не следует. Правила заполнения этих тегов
просты: тег должен содержать ключевые словосочетания, при этом длина основного ключевика
должна составлять всё те же 20%. Каждый из этих тегов, естественно, может быть использован
на странице лишь один раз и самое главное, стоит следовать порядку размещения этих тегов.
Пример: ”Вы искали: пластиковые окна, пластиковые окна ПВХ или цены на пластиковые окна? Вы
их нашли.”
Кроме того, на поисковые результаты очень положительно влияет общая "причесанность"
контента: так, ключевые слова желательно выделять тегами "В" или "Strong". По мнению
поисковика, это добавляет тексту "структурности": читатель получает возможность быстро
найти на странице нужную ему информацию. Не следует забывать и о подписях к картинкам: тег
"Alt" предназначен для просмотра страниц с отключенной графикой; отображаемый в рамке текст
помогает человеку понять, что изображено на картинке, которую он не видит, и выбрать –
просматривать ее, или нет. Так что все подписи к картинкам также должны содержать ключевые
слова.
В общем, как вы уже поняли, в базовой HTML-оптимизации ничего сложного нет. Для того, чтобы
убедиться в этом на практике, достаточно попробовать сверстать по приведенным выше
принципам одну или несколько страничек своего сайта, а потом проверить правильность
выполненных действий при помощи утилиты "Анализатор страниц" от компании NetPromoter. Эта
программа, кстати, полезна не только начинающим оптимизаторам: фактически, "Анализатор
страниц", также, как и редактор тегов, входящий в комплекс NetPromoter – чуть ли не
единственный механизм, позволяющий оценить проделанную работу сразу же, не дожидаясь
индексации поисковыми системами, и внести необходимые коррективы. Немаловажно и то, что
"Анализатор страниц" позволяет немедленно выявить "фатальные ошибки", которые вполне могут
привести к тому, что сайт будет "забанен" поисковыми системами – например, неоднократное
включение тега "H1" и прочие недозволенные приемы. Прогнать собственноручно сверстанные
страницы через "Анализатор" - минутное дело, способное, между тем, не только существенно
повысить эффективность всех оптимизационных процессов, но и ликвидировать в зародыше многие
серьезные проблемы.
Как делать нельзя. Нелегальные способы раскрутки.
Что такое нелегальный способ раскрутки сайта? Точного ответа дать нельзя, т.к. для одного
поисковика, одно действие над сайтом (второй title, например) уже повод для внесения сайта
в серый список, а для другого — ровным счётом ничего, или даже наоборот — вывод данного
сайта на более высокую позицию в результатах поиска. Определённо сказать, что такое
нелегальный способ раскрутки — нельзя.
Поэтому, чтобы полностью разобраться в ситуации, мы будем понимать под нелегальным способом
— любые действия над сайтом для обмана поисковой машини (и значит пользователя, который
ищет), и следовательно, для вывода страницы на более высокой позиции в результатах поиска.
Внимание! Все нижеприведённые методы нелегальной раскрутки даются лишь для ознакомления,
т.к. при применении их на своём сайте, вы можете потерять всю имеющуюся у вас аудиторию и
можете навеки быть забытыми всеми поисковиками. Данный сайт и в частности я, Evis (автор),
не несу никакой ответственности по поводу использования этих методов раскрутки
веб-мастерами для увеличения посещаемости их сайтов.
Способы, использование которых нежелательно:
Doorway — создание страниц (дорвеев), содержание которых подготовлено специально для
поисковых роботов (много ключевых слов, использование других нелегальных приёмчиков и пр.)
Двойной <title> — пример:
<title>Лучший варез</title>
<title> Софт Варез Нелегальный софт</title>
Поисковик выдаёт оба заголовка как один.
Двойные мета теги — пример:
<meta name="keywords" content="Варез, софт, нелегальный софт">
<meta http-equiv="keywords" content="Варез, софт, нелегальный софт">
<meta name="description" content="Лучшие программы">
<meta http-equiv="description" content="Лучшие программы">
Использование заголовка в комментариях— пример:
<!--<h1>Варез, софт, нелегальный софт</h1>//-->
Все популярные поисковые системы заявляют, что содержимое комментариев они не индексируют.
Можете зря не стараться — славы это Вам не принесёт и посетителей тоже.
Прозрачный текст — несколько способов.
Слои, для IE:
<div style="visibility: hidden"> <h1>Программы, варез, софт, программа</h1> </div>
Слои, для Netscape:
<layer visibility="hide"><h 1>Программы, варез, софт, программа</h1></layer>
Простой текст:
<font color="color"><h1>Ва рез программа</h1></font>
Но тем не менее поисковые системы отлавливают сайты, пользующиеся таким методом (прозрачный
текст), и соответсвенно наказывают.
Прозрачные картинки — пример:
<img src="gif.gif" width="1" height="1" border="0" alt="Варез, софт, нелегальный софт">
Параметр alt может сыграть на руку.
И многие другие нелегальные способы раскрутки...
Добавлено:
Аккуратный HTML.
Любая работа должна быть выполнена аккуратно и красиво. Особенно если ее могут увидеть
много людей. А это напрямую касается разработки сайтов, и в частности некоторых технологий,
используемых при этом — HTML и CSS.
Просматривая страницы в Интернете мы, как правило, не смотрим в код HTML. Да и зачем это
нужно обычному пользователю? Но часто бывает важно взглянуть на код, чтобы составить
некоторое впечатление о создателях этого веб-сайта. Код HTML, это как зеркало умений,
возможностей и желаний разработчика сайта.
Заглянув туда можно с легкостью узнать о том, как сделана страничка —
«программой-клепалкой» или человеком, его умом и знаниями. Чтобы вам легче было понять мою
мысль, я проведу отличную параллель. Возьмите музыку. Есть композиции, написанные одним
человеком за компьютером, с помощью несложной программки. На всех инструментах он «играет»
сам. Ему не нужен ударник с чувством ритма, ему не нужен гитарист с виртуозной техникой,
басист тоже ни к чему, и клавишник лишний... Он нажимает кнопку и программа сама все
играет. И получается наводнившая радио и клубы бессмысленная «туцкатня». Искусство и
творчества нет. Так и в написании кода. Программа ведь глупая — засоряет все комментариями,
ненужными тегами и конструкциями. А пользователю до этого нет дела - в его IE все смотрится
хорошо. А про Oper'у и NN он даже не знает, которые предъявляют особые требования к
оформлению кода страницы.
Создание эффективного и аккуратного кода HTML — это своеобразное, но искусство, где надо
думать. Особенно это почувствуется, когда будете создавать сайт не для себя, а для кого-то.
Причем встречаются сайты с очень сложной структурой, где труд верстальщика занимает
половину времени работы над всем сайтом. Вложенные по нескольку раз таблицы, нестандартное
позиционирование и оформление теста... Без личного опыта написания HTML именно ручками
здесь никак не обойтись. Тем более одну и ту же задачу можно решить разными путями, среди
которых нужно выбрать самый оптимальный.
Чтобы ваш код страницы выглядел достойно, аккуратно и «неискусственно», вам было легко в
нем ориентироваться, то внимательно изучите нижеперечисленные пункты и придерживайтесь их
при написании HTML:
Старайтесь не писать тэги прописными буквами (TABLE, BODY, IMG) — это первый признак
неручной работы и в таком коде тяжело ориентироваться, так как большинство кода в Интернете
все-таки написано строчными буквами (table, body, img).
Атрибуты всегда записывайте в кавычки (напр., align="right"), что придаст вашему коду
аккуратность и совместимость с языком XML.
Присваивая какое-либо значение (ширины, высоты) в пикселях, не забывайте это указать, т.е.
width="5px".
Есть тэги (напр., <li>, <p>), для которых необязательно ставить тэг закрывающий. Но я
рекомендую все-таки ставить их в любом случае. Во-первых, так легче ориентироваться в коде,
а во-вторых, для полной совместимости со всеми браузерами и их версиями (смотрели свой сайт
под Netscape 1.0?).
Недопустимы ненужные комментарии, которые часто оставляют «программы-клепалки». А вот свои
собственные всегда пишите, они вам облегчат нахождение нужного фрагмента кода страницы.
Старайтесь не оставлять стили в страничке. Выводите их в отдельный файл — так проще
что-либо поменять и код страницы уменьшится (иногда очень заметно).
У каждого символа есть своя так называемая подстановка. Например, для тире это —, а
для кавычек « (левая) и » (правая). В любом справочнике по HTML вы найдете
список таких символов и их подстановок. Всегда используйте их, иначе могут возникнуть
проблемы с их корректным отображением.
Напоследок скажу, что «программами-клепалками» лучше не пользоваться, потому что они
замусоривают код и в конце концов это отупляет. Используйте многофункциональные блокноты,
где вы пишите все сами, но этот процесс ускоряется за счет дополнительных возможностей.
Часто при разработке сайта много времени уделяется на визуальный дизайн — ведь его видят
посетители. А то, что скрыто (код HTML), то можно сделать и по-быстрому. Из-за такого
отношения в нашем Рунете множество сайтов с замечательным внешним дизайном имеют
отвратительный код, сделанный на скорую руку в «клепалке». Не повторяйте ошибок таких
сайтостроителей, верстайте аккуратно и красиво, выделяйте структуру кода, и всегда помните,
что язык HTML — основа сайта.
Добавлено:
Как правильно составить заголовок страницы.
Эту небольшую статью меня заставило написать чувство неудобства при просмотре множества
страниц в Рунете, да и вообще в сети.
О чём я говорю? О заголовках страниц. Дело в том, что когда посетитель попадает на любой
сайт и просматривает одновременно его и ещё другие сайты, то ему становится неудобно быстро
отыскать ту закладку, которая ему в данный момент ему необходима.
А всё из-за чего? Из-за того, что подавляющее большинство вебмастеров составляют заголовки
своих страниц по такому принципу:
Адрес сайта >> Раздел >> Заголовок страницы.
Как пример, могу привести такой заголовок:
Wmate© Раскрутка сайта >> Дорвеи и поисковые системы
И что в итоге получает посетитель, ища в закладках нужную ему страницу, на которой
находится нужная ему информация (статья, например)? А если пользователь открыл несколько
страниц сайта и первая часть заголовка каждой одинакова? Приходится пройтись по всем
закладкам (окнам), чтобы отыскать нужное.
Проблема ещё острее, если в основе сайта используется движок (cms), там шансов у вебмастера
исправить ситуацию ещё меньше.
Как же решить эту проблему?
Мы пойдём от обратного. Так, например, сделано у нас на сайте. Схема заголовка такова:
Заголовок страницы >> Раздел >> Адрес сайта.
Т.е. мы поднимаемся от низшего к высшему. Ну и соответственно заголовок каждой страницы
должен быть уникальным. Вот и весь секрет.
Даже если пользователь не найдёт нужной информации на Вашем сайте, ему будет удобно по нему
перемещаться. Авось и зайдёт снова?
Добавлено:
Файл robots.txt. Тонкости в работе и типичные ошибки.
Как правильно: «User-Agent» или «User-agent». Я рекомендую Вам придерживаться второго
варианта, согласно спецификации файла robots.txt
Если записать просто:
User-agent: Yandex
Disallow: /admin
То это будет означать, что к запрету для бота Яндекса причисляются все файлы и папки,
которые начинаются с данного слова.
Файл должен находиться, только в корневом каталоге, и нигде больше.
Имя файла может быть только таким: robots.txt
Такие имена как: Robots.txt, ROBOTS.TXT и проч. являются ошибочными…
Файл может быть только текстовым, с расширением *.txt
Нельзя в тексте допускать лишних пустых строк. Пустая строка означает, что следующая за ней
строка будет иметь параметры для другого поискового робота. Ошибочный пример.
User-agent: *
Disallow: /1/
Disallow: /free.html
Disallow: /cgi/
В строках с полем Disallow записываются не абсолютные, а относительные префиксы.
Неправильным будет: «Disallow: www.sitec.ru/free.html»
Что касается директивы Host. Вот несколько наглядных примеров как делать нельзя:
Host: www.myhost-.ru
Host: www.-myhost.ru
Host: www.myhost.ru:0
Host: www.my_host.ru
Host: .my-host.ru:8000
Host: my-host.ru.
Host: my..host.ru
Host: www.myhost.ru/
Host: www.myhost.ru:8080/
Host:
http://www.myhost.ru Host: www.mysi.te
Host: 213.180.194.129
Host: www.firsthost.ru,www .secondhost.ru
Host: www.firsthost.ru www.secondhost.ru
Пауки.
Имена поисковых ботов не всегда соответствуют названия поисковых машин.
Вот самые распространённые в Рунете поисковые боты.
Рамблер - StackRambler
Яндекс - Yandex
Google - Googlebot
MSN – msnbot
Если Вы имеете доступ к логам сервера (например: последние посетители), то сможете узнать
какие боты обходят Ваш сайт. Но чаще всего названия их бывают такими: Googlebot/2.1
(+http://www.google.com/bot.html); Yandex/1.01.001; msnbot/1.0
(+http://search.msn.com/msnbot.htm) и т.д.
Но не стоит это имя сразу загонять в robots.txt
Всё что пишется в имени бота после слэша – нам не нужно. В файл robots.txt вносится только
первая часть.
Если Вы хотите увидеть более полный список имён поисковых ботов, Вам следует прочитать
следующую статью - Список имён поисковых роботов.
Альтернативные методы.
Файл robots.txt позволяет скрыть от глаз разных поисковых роботов разные файлы, а то и
вообще все. Но есть и другие альтернативные способы, правда не всегда такие удобные, т.к.
robots.txt позволяет делать это лишь изменением своего содержимого.
Мета тег robots.
<meta name="robots" content="index, follow"> - индексируется данная страница, робот идёт по
ссылкам с этой страницы.
<meta name="robots" content="noindex, follow"> - страница не индексируется, но робот идет
дальше по ссылкам.
<meta name="robots" content="index, nofollow"> - страница индексируется, но робот не идёт
по ссылкам на другие страницы, т.е. он их не индексирует.
<meta name="robots" content="noindex, nofollow"> - страница не индексируется, робот по
ссылкам не идёт. Если поместить такой код на все страницы сайта – он не проиндексируется.
<meta name="robots" content="none"> - идентичное последнему. Сайт не индексируется.
Тег <noindex>, который позволяет не индексировать лишь определённый кусок кода страницы.
Например: «хтмл-код хтмл-код <noindex>привет любимая )</noindex> хтмл-код хтмл-код»
Заключение.
Вот и наконец-то я расправился с этой темой. Было интересно. А Вам? Кстати, во время
написания статьи я иногда открывал для себя новые вещи, хоть и мелочи, но приятно.
За более полной информацией обращайтесь на официальный сайт файла robotstxt.org