Главная Карта Обратная связь

Введение в тему: поисковые системы и каталоги

Интернет – хаос

Но найти в нем кое-что можно!

Интернет - гигантское хранилище информации. Множество страниц, ценных и не очень, существуют безо всякого порядка и связанны между собой только случайными ссылками, зависящими от квалификации и личных пристрастий авторов сайтов.

И, тем не менее, в сети Интернет вполне можно ориентироваться, находить за минуты нужные документы.

Для поиска информации в сети Интернет сейчас существует два основных инструмента - поисковые системы и каталоги. Это мощные средства, благодаря которым, все богатство накопленных человечеством знаний уже у Вас в руках!

Осталось разобраться как они работают. Начнем.

Каталоги сайтов (обзор)

Путеводители по сети, создаваемые людьми.

каталоги сайтов Каталоги - традиционное средство организации информации. Наверное всем нам приходилось встречаться с библиотечными каталогами, каталогами товаров. Каталоги используются во множестве систем. Практически везде, где необходимо хранить и организовывать информацию.

Одна из основных задач, с которой сталкиваются составители каталогов - создать естественную, интуитивно понятную рядовому пользователю рубрикацию. К сожалению, данную задачу можно решить только с той или иной степенью приближения. Мир непрерывен, строгих границ в нем не существует. Один и тот же сайт можно рассматривать под разными углами зрения и видеть разные его функции.

Например, куда бы вы отнесли сайт интернет-магазина, торгующий детскими игрушками? В торговлю? В сайты, посвященные детям? А если на этом сайте расположены еще и статьи о пользе развивающих игр? В раздел педагогики?

Совсем не факт, что логика пользователя будет такой же, как логика редактора. Пользователь не обязательно будет искать ссылку на сайт в том разделе, куда он помещен редактором.

Неоднозначность структуры - это явный минус каталожной организации информации (хотя он и несколько сглаживается тем, что в каждом крупном каталоге реализован поиск по каталогу).

Второй недостаток каталогов заключается в том, что их делают люди. Их полнота и качество зависят от количества и квалификации людей, занятых работой в каталоге, их личных вкусов и пристрастий. Неровность наполнения рубрик - характерная черта всех каталогов.

Трудоемкость ручной рубрикации ограничивает объем каталогизируемой информации. Для сравнения - самый большой каталог Рунета, организуемый "вручную" (Рунет - сокращенно русскоязычный Интернет), расположенный на популярном портале http://mail.ru, содержит около 120 тысяч сайтов, тогда как Яндекс (крупнейшая русская поисковая система) автоматически проиндексировал и занес в свою базу данных около миллиона сайтов (данные на апрель 2004 года).

Главный плюс каталога в том, что информация в нем хранится упорядоченно, в соответствии с элементарной человеческой логикой.

Релевантность (степень соответствия результатов поиска запросу пользователя) найденных страниц при поиске в каталоге обычно на порядок выше, чем при поиске поисковыми системами.

Поисковые системы (обзор)

Поисковая система – комплекс специальных программ для поиска в сети.

поисоквая системаПоисковым системам (поисковикам) не было аналога в докомпьютерном мире.

Их существование стало возможно только благодаря вычислительным мощностям компьютерных систем.

Поисковики, как и каталоги, организуют информацию, сортируют ее и упорядочивают. Но организуют ее не в строгом, раз определенном и закостеневшем порядке, а каждый раз в разном. В том порядке, который максимально соответствует запросу пользователя.

Алгоритм определения релевантности у каждой поисковой системы свой и постоянно совершенствуется. Но, если посмотреть результаты поиска на любой наш запрос в любой системе, наряду с полезными нам ссылками мы всегда увидим немало ненужной информации, мусора. Или соответствие между тем, что мы ищем и тем, что находим – оставляет желать лучшего.

Несмотря на это, поисковые системы по популярности в десятки раз превосходят каталоги. Быстрота поиска, широчайшая база, по которой проводится поиск, способствуют вытеснению каталогов.

Развитие поисковых систем

Семантический каталог + поисковая система – наиболее вероятное средство поиска будущего.

World Wide Web W3C10 февраля 2004 года консорциум World Wide Web (W3C), который определяет стандарты технологий, используемых в сети, официально рекомендовал использовать при построении сайтов семантические структуры. Семантические структуры для сайта – это некое техническое описание страниц, скрытое от пользователя. Семантические структуры будут содержать стандартизованную информацию о странице – географическое положение, отрасль, тип страницы (магазин, информационный ресурс, форум).

Применение семантических структур приведет к тому, что для поиска будет использоваться некий гибрид каталогов и поисковых систем. Другими словами - поисковые системы получат разумную рубрикацию каталогов, объединятся с каталогами. Семантическое описание будет определять раздел, рубрику, к которой сайт будет принадлежать в виртуальном огромном каталоге, и поиск будет вестись уже внутри выбранного пользователем раздела.

<< назад | оглавление | вперед >>

Проект Linkclub. Информация, отзывы о каталоге скрипта по обмену ссылками.