Введение в алгоритмы индексации поисковых машин
Нужно понимать и соблюдать
О чем подумать перед оптимизацией ресурса
Прежде чем начать оптимизацию сайта, т. е. поднять его на топовые позиции в поиске, следует понять что такое поисковые машины, что они содержат и как их готовить.
Поисковые машины проходят огромнейший путь, чтобы найти информацию по нужному запросу. Они исследует не весь Интернет, а в пределах собственной базы данных, которая постоянно обновляет информацию. В Интернет сети находится несчитанное множество информации, где кол-во веб страниц превышает кол-во данных о них.
Поисковые алгоритмы имеют индивидуальную структуру данных. К примеру: один и тот же запрос в Google и Яндекс выдаст абсолютно разные результаты. Стоит отметить, что некоторые из поисковых машин используют алгоритмы успешных конкурентов. mail.ru тоже не исключение. Доволен базой данных от Google, добавляя свои изменения и корректировки.
Таким образом, поисковые машины основываются на построение индивидуальной структуры базы, которая выдает результаты максимально соответствующие заданному запросу.
Значимость Google как поискового движка
Теперь чуть подробнее о значимости Google. На сегодняшней день это самая успешная и популярная поисковая машина и по кол-ву пользователей и по собственной базе данных, хранящей нескольких миллиардов файлов. В 2000 году стало известно, что в день добавляется около 7,6 млн страниц. Задача поисковиков постоянно ползать по сети и индексировать страницы, содержащие огромное кол-во документов. К тому же, базы данных поисковых машин постоянно меняются.
Процесс поиска
Процесс поиска происходит следующим образом: пользователь вбивает запрос в строку поиска, индекс дробит его по словам, далее их склеивает в соответствии с запросом и выдает результат, т.е релевантность, иными словами, соотвествие ключевому запросу. Обнаружение релевантности страниц в сети для индексации- важнейшая часть работы поисковых машин. При низком качестве результатов поискового запроса Яндекс привлекает асессоры для выработки более совершенных алгоритмов оценки релевантности страниц. Асессоры- это люди, которые вручную оценивают соответствие выданных поисковой машиной страниц к запросу, введенному пользователем. Вначале они ищут эталонный сайт, который по их мнению должен соответствовать данному запросу. Субъективно выявляет характеристики, которые позволили стать ему актуальным и данные результаты передают инженерам для совершенствования алгоритмов. Такая проверка асессоров осуществляется регулярно для постоянного улучшения качества поиска.
Обновление базы данных
Для того, чтобы поисковик находил необходимые результаты, база данных должна постоянно обновлять как новые, так и старые страницы. Было выяснено, что из кол-ва в 500 страниц 23% всех веб- страниц обновляются ежедневно, половина же из них каждые 10 дней, а остальные перемещаются на новый доменный адрес.
Спайдеры поисковиков ежедневно находят миллионы страниц, но частоту изменений определить крайне сложно, в связи с постоянными обновлениями. Существует бесконечное множество новостных сайтов, а так же интернет- магазинов, где информация обновляется постоянно и по несколько раз в день.
Важно знать
Сайт должен работать в момент его посещения поисковой машиной. В противном случае он может просто исчезнуть из индекса до следующего обновления. У поисковика появляются сомнения по поводу существования сайта и его благополучно удалят из списков. Вся информация, находящаяся на сайте, записывается в индексе поисковой машиной только в момент посещения сайта. Остальные изменения вносятся только после следующего посещения страницы. Для просмотра последней версии страницы в индексе поисковой системы, нужно открыть результаты поиска по ссылке “копия”.
Три класса поиска
Чтобы определить точность ответа на запрос следует различать 3 обобщенных класса поиска в сети:
- Информационный. Запрос от пользователей, которые ищут необходимую информацию в сети: термины, определения, пояснения.
- Навигационный. Поиск определенного веб сайта, где необходимая информация должна находиться на сайте компании: новости, корпоративные сайты. Составляет 20% от всех запросов.
- Деловой. Означает осуществление действий пользователя через сеть: интернет- магазин, услуги.
Итак, после введения 3-х классов следует понимать, что некоторые одинаковые деловые запросы для разных городов могут являться не актуальными. Контекст играет большую роль, в случае определения лучшего результата. Иногда более эффективные результаты получаем из других источников, которые сами не собираем.
Поисковая машина с трудом может постичь природу запроса пользователя. Она может найти сайт на подходящую тему, ссылку или цитату, но не понять интуитивно цель запроса.
Поиск в сети и поиск по книжной библиотеке
Поисковые машины стараются найти результаты с помощью информационного поиска. Принцип их работы во многом подражает книжной библиотеке. Тут и название, имя автора, ключевые слова, порядковый номер идентификации, заголовок, номер индекса. Поиск в книжной библиотеке может осуществляться по автору и по категории.
Поисковые машины не всегда могут точно определить сферу запроса, но стараются выдавать страницы, связанные с запросом благодаря «топологии сети».
Поисковые машины выводят тысячи вариантов, некоторая часть которых может быть релевантной. Показатель релевантности снижается после двух первых страниц выведенных результатов.
Заключение. Соблюдение правил для топовых позиций в поиске
Итак, чтобы оставаться на лучших позициях в поиске, следует соблюдать ряд факторов, влияющих на индексацию сайта.
Из этого следует, что для того, чтобы оставаться на лучших позициях в поиске:
- требуется постоянно следить за качеством своего ресурса и изменениями алгоритмов поисковой машины.
- Помимо этого необходимо, чтобы база данных постоянно обновляла новые и старые страницы. Сайт должен всегда находиться в рабочем состоянии в момент его посещения поисковой машиной, чтобы не исчезнуть в индексе.
- Для того, чтобы получить целевую аудиторию, необходимо верно составить структуру сайта, опираясь на один из 3-х классов поиска, с соблюдением географического положения.
По мотивам книги Яковлева “Раскрутка сайтов: основы, секреты, трюки” 4 издание.
Читайте так же статьи по теме: