Телефон: +7 (495) 649-0526

Как устроена поисковая система

Картинка к странице

Следующая статья:

Содержание

Основные компоненты поисковых систем

Из пяти отдельных программных компонент состоят поисковые системы, а именно:

  • Паук (spider): его задача – скачивать web страницы; программа, которая подобна web браузеру.
  • Crawler: паук, которого называют «путешествующим»; он автоматически переходит по всем ссылкам, которые были найдены на странице.
  • Индексатор (indexer): программа, которую называют «слепой»; её задача анализировать web страницы, которые были скачены пауками.
  • База данных (database): она является хранилищем страниц, которые были сначала скачены, а потом подвергнуты обработке.
  • Система выдачи результатов (search engine results engine): данная система помогает извлекать результаты поиска из базы данных.

Подробнее о каждом из компоненте поисковых систем

Паук: Spider – его задача проста - скачивать web страницы. Принцип его работы ничуть не отличается от вашего браузера, в том случае, если вы просто соединяетесь с сайтом и начинаете загружать страницу. Визуализация у Паука отсутствует. Похожую ситуацию (скачивание) можно увидеть, когда вы начинаете просматривать какую-то страницу и выбираете в вашем web браузере «просмотреть HTML-код».

Crawler: Подобно Пауку он тоже скачивает страницы, также в его функциях есть «раздевание» страницы и нахождение всех ссылок. Это и является его задачей – определить, куда же Паук должен двигаться дальше, он основывается только на ссылках или при помощи заранее заданного списка адресов.

Индексатор: Indexer помогает разобрать страницу на разные ее части и проанализировать их. Вычленяются и анализируются заголовки, элементы любых заголовков страниц, текст, ссылки, элементы BOLD, ITALIC, структурные элементы, а также другие стилевые части страницы.

База данных: Database является хранилищем любых данных, которые поисковая система собирается скачать и проанализировать. В большинстве случаев для этого требуются огромные ресурсы.

Система выдачи результатов: Search Engine Results Engine является сердцем поисковой системы. Именно данная система будет решать, какие же страницы будут удовлетворять каждому запросу обычного пользователя. При помощи данной части поисковой системы и осуществляется поиск.

В случае если пользователь ввёл ключевое слово и начал поиск, поисковая система начинает отбирать результаты, опираясь на постоянно меняющиеся критерии. Метод, по которому поисковая система принимает любые свои решения, называется алгоритмом. «Algos» - данный термин иногда используют профессиональные seo оптимизаторы - это и есть то, о чем мы разговариваем.

Схема работы поисковой системы

Схема работы поисковой системы

Критерии поиска при формировании выдачи поисковыми системами

Даже из-за того, что поисковые системы очень изменились, большинство из них в наше время отбирает результаты поиска, опираясь на данные критерии:

  • Заголовок (Title): Есть ли в заголовке ключевое слово?
  • Домен/адрес (Domain/URL): Есть ли в адресе страницы или в имени домена ключевое слово?
  • Стиль (Style): Заголовки HEAD, Курсивный (I или EM), Жирный (B или STRONG): есть ли на странице место, где ключевое слово используют в курсивных, жирных, или Hx (H1, H2, …) текстовых заголовках?
  • Плотность (Density): Насколько часто ключевое слово употребляется на странице? Плотность ключевого слова - количество ключевых слов относительно текста страницы.
  • Мета данные (MetaInformation): Хоть и многие отрицают, но некоторые поисковые системы в наши дни всё ещё читают мета описания (meta description) и мета ключевые слова (meta keywords).
  • Ссылки наружу (Outbound Links): Куда ведут ссылки на странице, и имеется ли в тексте ссылки ключевое слово?
  • Внешние ссылки (Inbound Links): У кого еще в Интернете имеется ссылка на этот сайт? Что в тексте ссылки? Автор страницы не в каждом случае может контролировать этот критерий, поэтому он называется «внестраничным».
  • Ссылки внутри страницы (Insite Links): Содержит ли страница ссылки на еще какие-нибудь страницы этого сайта?

В результате видим, что, поисковая система должна уметь и делать многие уточняющие запросы, используя при этом скаченную страницу целиком.

Данная статья является лишь сокращенным описанием функционирования поисковых систем.

Видео: «Это не то, о чем вы подумали»

Невыдуманные ситуации, иногда случающиеся с каждым из нас

Это не то, о чем вы подумали
Интересное в интернете: Новая коллекция окрашивания - курсы парикмахера Москва. Парикмахер-стилист.

Статья: Как устроена поисковая система

Раздел: Раскрутка и SEO оптимизация сайтов

Сайт: SD Company » Все разделы статей

Последнее изменение: 2011.12.27 в 22:03

Теги: поисковая система, устройство, правила работы, seo оптимизация, раскрутка сайта

Следующая статья:

История поисковых систем
История поисковых систем
Описание истории, как создавались поисковые системы на западе и на российской сегмента интернет пространства
Что такое поисковые системы
Что такое поисковые системы
Статья о принципах работы современной поисковой системы и ранжировании сайтов в поисковой выдаче
Как устроена оперативная память
Как устроена оперативная память
Описание основных принципов на которых базируется создание и управление оперативной памятью
Как повысить CTR с поисковой системы Google
Как повысить CTR с поисковой системы Google
Описание одного нового способа повышения количества переходов из выдачи поисковой системы Google
Как устроен персональный компьютер
Как устроен персональный компьютер
Описание строения стационарного компьютера (базовый набор), а так же почему важно это знать
Как устроены компьютерные сети
Как устроены компьютерные сети
Описание различных видов компьютерных сетей, как они устроены и рассматриваются плюсы и минусы той или иной конфигурации сети
Как узнать ID пользователя?
Как узнать ID пользователя?
Оказывается, получить ID пользователя совсем не сложно, а это значит, что наши данные открыты для всех