Принципы работы поисковых систем

11 декабря 2017 - ADMIN
Принципы работы поисковых систем

Работая с интернет-ресурсами не обязательно знать все технические особенности работы той или иной системы. Достаточно ориентироваться в некоторых базовых принципах работы поисковых машин.

Если разобрать все до подробностей, то становится очевидным, что поисковая система состоит из нескольких тысяч разных серверов. На этих серверах хранятся все копии существующих сайтов во всемирно известной сети Интернет.

Как это работает?

Практически всю работу выполняет поисковый робот, который является ключевым моментом в индексации страницы. Роботы бывают двух типов: индексирующие и поисковые. В свою очередь робот-машина состоит из нескольких составляющих, которые тесно взаимосвязаны между собой и каждый выполняет свою роль в общей работе.

Что делает индексирующий робот?

Индексирующий робот осуществляет скачивание любой необходимой страницы из сети, на подобие браузера. После того, как страница загрузилась, робот производит первичный анализ, который заключается в определении содержимого страницы. Таким образом, машина определяет: необходимо ли страницу размещать в базе данных поисковой системе. По сути, это и есть индексация сайта.

Если страница, которую нашел робот является полезной, то ее дополнительно проанализируют и разберут на составляющие, то есть, из нее извлекут все имеющиеся картинки, ссылки, контент и код html.

Учимся понимать, что такое индексация поисковой системы.

Для того, чтобы лучше понять работу поисковой системы, можно привести очень простой и всем понятный пример из жизни. Например, мы берем познавательную научную литературу, это может быть любой справочник или энциклопедия. Пользоваться одним только оглавлением не всегда бывает удобно, особенно если необходимо найти информацию по какому-то конкретному событию или слову. В таких случаях, мы обращаемся к индексному указателю, который находится в конце книги. Там мы быстро и эффективно находим номера страниц, на которых находится необходимая нам информация по тому или иному слову.

Поисковая система индексирует сайты по такому же принципу. То есть у каждого слова есть перечень документов, в которых оно находится. Поисковый робот содержит в себе информацию не только о документе, в котором содержится то или иное слово, а также множество дополнительной информации. Например, он знает сколько раз слово встречается в тексте, было ли оно выделено или нет, имеет ли перелинковку и так далее.

погода в БеларусиДля каждой страны поисковые системы подбирают ответы, соответственные стране поиска. Если вы будите искать "аптеки в Минске" или "погоду в Белоруссии", то в поисковой выдаче увидите в основном белорусские сайты, относящиеся к зоне by и даже сайты на белорусском языке.

Если в поисковую систему Гугл или Яндекс поступил конкретный запрос (например, «планета Земля»), робот начинает поиск по всему интернету, где только встречается  подобная формулировка.  После этого пользователь получает список сайтов, которые содержат данное словосочетание.

Каждый пользователь интернета знает, то он получает необходимый запрос через доли секунд. Это происходит благодаря тому, что поисковик уже содержит базу данных со всей информацией. Поэтому робот очень быстро и качественно находит необходимую информацию .Уже после первичного анализа информации поисковый робот производит несколько следующих операций: ранжирование и финишную обработку данных.

Похожие статьи:

НовостиКонсультация врача по «Скайпу»

ПсихологияСтиль электронной переписки рассказывает о личности человека

Новые статьиИнвалиды и интернет

Работа для инвалидовРабота для инвалидов в Интернете

Работа для инвалидовРабота для инвалида

Комментарии (0)

Нет комментариев. Ваш будет первым!