Существуют два различных типов серверов, хранящих информацию о сторонних интернет-ресурсах:
Аналогом каталогов являются справочники, которые издаются в бумажном виде. По внутреннему рубрикатору располагаются интернет-ресурсы, как правило, аннотированные. Поиск в таких ресурсах осуществляется самыми различными способами, зависящими от конкретной машины.
Как правило, поиск осуществляется по имени, описанию, введенным ключевым словам. Но это совершенно не однозначный факт, зависящий только от конкретной системы. Публичных прописанных алгоритмов поиска по каждой из машин, как правило, не существует.
Поисковые машины аналогов вне интернета не имеют в силу своей технологической особенности. Поисковые машины полностью выкачивают, высасывают содержимое сайта (вернее, разрешенные к общественному доступу части) и индексируют: составляют таблицы повтора тех или иных слов, а также их значимость внутри документа. Поисковые машины не могут проиндексировать сообщения, которые генерируются FLASH, JAVA или находятся в виде графического изображения.
Существует понятие релевантности- соответствие поисковой фразы хранящейся в тексте. Как правило, поисковые машины выдают результаты поиска именно в порядке убывания релевантности. Однако, есть и исключения, например, зарубежная система GO.com или наша, российская EPRST.RU (Прим. на 2005 год — обе системы уже закрылись). они показывают сайты в соответствии с оплаченными позициями. Каждая позиция при этом имеет свою цену, предлагаемую путем публичной оферты. Несмотря на кажущуюся неестественность на первый взгляд, такой подход не лишен целесообразности. Потому что раз человек оплачивает такую позицию, значит, ему действительно необходимо, чтобы его нашли, следовательно, ресурс может и должен содержать информацию, адекватную поисковой фразе. Правда и минусов в таком подходе тоже масса: сюда не попадут некоммерческие ресурсы, а также те, кто принципиально не пожелает оплачивать рекламу