суббота, 18 августа 2012 г.

Компоненты поисковых систем

Поисковая система представляет собой комплекс компонентов, включающих в себя Spider, Crawler, Indexer, Database, Search Engine Results Engine, Webserver. Это - основа, каждый поисковик имеет свои особенности. Расскажу коротко о представленных компонентах поисковых систем.


 Spider - программа, скачивающая страницы. Принцип ее работы похож на принцип работы браузера, но в отличие от последнего Паук отображает лишь html-код найденной страницы. Чтобы увидеть результат, нужно кликнуть правой кнопкой мыши и выбрать в выпавшем меню пункт "просмотр кода страницы" (в разных браузерах пишется по-разному, но суть вы поняли, надеюсь).

 Crawler - определитель ссылок на странице. Он указывает Пауку его дальнейший путь и осуществляет поиск новых страниц.

 Indexer - система, разбивающая страницу на блоки и анализирующая их. Именно Индексатор определяет теги, текст, заголовки, различные особенности страницы и пр.

 Database - хранилище базы данных. Здесь собирается информация обо всех страницах, проиндексированных поисковой системой.

 Search Engine Results Engine - система, осуществляющая ранжирование страниц. Именно SERE определяет, какую страничку вывести в топ, а какую забанить или убрать подальше как неинтересную пользователям.

 Webserver отвечает за выдачу результатов и на нем размещается страница с полем ввода запроса.

 Вас лишили водительских прав и вы потеряли важную работу? Загляните на http://ruprava.info/ - ответы на самые популярные вопросы по теме восстановления прав находятся именно там! Еще не все потеряно!

Комментариев нет:

Отправить комментарий