Поисковые системы, терминология.
Часто встречаемое понятие документ, документ с точки зрение SEO это страница сайта, имеющая уникальный адрес и содержащая контент. Контент это любое содержание страницы сайта, неважно, что это:
всё это контент и контент должен быть уникальный (где взять уникальный контент) если вы собираетесь продвигать свой сайт, то есть его желательно писать самому или же контент (а именно статьи) можно покупать на биржах статей.
Произошёл несчастный случай с домашним питомцем и требуется профессиональная ветеринарная помощь? Не отчаивайтесь, обратитесь к ветеринарной клинике юао — вызов на дом врача, определение диагноза, диагностические исследования и скорая медицинская помощь передовыми технологиями лечения для вашего любимца.
Принцип работы поисковых систем
.
Теперь давайте разберем, что такое поисковые системы и как они индексируют документы. Для продвижения сайта в первую очередь нам хочется что-бы все наши документы, страница сайта были проиндексированы поисковой системой. Рассмотрим
варианты индексации, как поисковые системы индексируют документы.
Первый тип индексации это » Прямой индекс «, то есть, это поиск по документам, путём последовательного перебора всех имеющихся в базе данных (сохраненных) страниц. Что это такое? Представьте себе, что вы регулярно выписываете журнал, допустим для садоводов и
вдруг вам захотелось найти что-то, что было, в каком то прошлом номере, например про то, как вырастить морковку на балконе, то есть вы хотите найти ту статью из прошлого журнала.
Как вы её будете искать?! Вы откроете первый журнал, пролистаете его и там окажется, что нету той статьи, вроде как есть про выращивание на балконе, но не морковки.
Потом вы откроете другой, третий, четвёртый, пятый и так пока вы не дойдёте до нужной вам статьи.
То есть прямой индекс это поиск путём последовательного перебора, то есть вы открыли документ — все документы и начинаете во всех документах последовательно искать нужную информацию. Это конечно более-менее точный поиск но, поисковые системы по нему работали, скажем, так, в эпоху динозавров, эпоху зарождения интернета.
Теперь поисковые системы работают немного по-другому принципу, они используют инвертирование индексов, как обычно называют- обратный индекс.
То есть поисковая система скачивает вашу страницу с сайта, после этого из этой страницы извлекаются все слова.
Для примера слово » SEO «- стр.: 2,6,17 … 1324
И поисковая система в каком то своём индексном файле заносит координаты это этого слова- сайт, страница, строка, позиция и т.д. Это для примера, но на самом деле у поисковиков более точная система координат, навороченные алгоритмы индекса, эти алгоритмы поисковая система естественно никогда не выдаст, так как если бы сеошник знал алгоритмы поисковой системы используемые в данный момент то естественно сайт был бы на первых позициях без различных внешних факторов ранжирования и т.д.
Теперь давайте рассмотрим, что учитывает поисковая система при обратном индексе. Возьмем, к примеру, слово » чемодан «, вы хотим создать
сайт, где мы продаём чемоданы и по логике если мы 100 или 200 раз разместим на странице слово чемодан, то сайт должен быть на первых позициях в выдаче. Но в действительности поисковые системы на данный момент, скажем так, интеллектуальные и подобным ссылочным спамом сейчас
ранжирования не добиться. Потому что поисковые системы учитывают многие другие факторы.
для примера возьмём слово » Подарок «, то поисковая система у себя в индексе это может занести синонимы » дар «, » гостинец » и прочие.
То есть синонимы как я считаю, на самом деле это много обсуждаются, но синонимы поисковыми системами всё-таки учитываются. И необязательно заносить слово подарок можно его менять синонимом и поисковая система это поймёт.
Морфология учитывается, несомненно, это можно проверить, введя любой поисковой запрос, например » чемодан » и вы увидите много ещё всего.
Жаргон также учитывается поисковыми системами, хотя возможно на ранжирование это влияет не так как морфология но, жаргон тоже нужно учитывать при написание текстов для своего сайта.
тут думаю всё понятно, если слова пишут с опечатками, различными ошибками то как вы сами заметили наверно поисковики сами исправляют ошибки и происходит поиск уже с нормальной орфографией.
Введя, например в Яндекс слово travel вы увидите что в выдаче буду выводиться различные туристические сайты то есть такой же тематике.
Ну, практически то же самое, что и перевод происходит трансляция урла, имена картинок, архивов и прочее, всё это также учитывается.
Например, веб сайт, web сайт, веб-сайт, web-сайт, тоесть по сути одно и то же но это тоже нужно учитывать при составлении кейвордов и прочего.