Автор статьи:
Cтатья подготовлена на основе исследования, проведенного автором октябре 1999
Словосочетание «высокие технологии» в сознании подавляющего большинства людей устойчиво связано с понятиями «развитие» и «перспектива». Породив новую область человеческих знаний и коммуникаций — информационные технологии и интернет как их составляющую, — хайтек сам занял важное положение во Всемирной Cети. Сложившись исторически, эта тенденция сохраняется и поныне. Но каково точное число представленных на российском рынке high-tech-компаний? Как они распределены по русскоязычной части интернета? Попытаемся в рамках этой статьи найти ответы. Поиск же будем вести по нескольким направлениям: задействуем наиболее компетентный отраслевой каталог, посмотрим, что нам предлагают многочисленные интернет-рубрикатары, задействуем поисковые системы и службы обмена баннерной рекламой.
Каталог «Компьютерная Россия» (http://www.catalog.ru/) оценивает объем российского хайтека в 6747 компаний, работающих как на родном рынке, так и в странах ближнего и дальнего зарубежья. Распределение по регионам закономерное: Москва — 33% (2220 компаний), Санкт-Петербург — 14% (940 компаний), Свердловская и Нижегородская области вместе — 12% (820 фирм), другие области и края набирают оставшиеся 41% (2767 компаний). Для нас более интересен тот факт, что на момент проведения опроса (январь 1998 года) только 17% представленных компаний имели свои страницы в интернете (1124 корпоративных сайта).
On-line-рубрикаторы выдают иную картину. Каталог Яndex&List.RU в разделе «Компьютеры» насчитывает 3510 информационных ресурсов. Из них только 256 посвящены «железу» и сетям в чистом виде, «софту» и разработке программного обеспечения — 1457. Интересно, что в разделе «интернет» зарегистрировано 5159 сайтов. Таким образом, «отпочковавшееся» направление перевесило «родителя» в 1,5 раза. Об этом же свидетельствует прошлогодний отчет РОЦШТ. Анализ движения посетителей каталога ресурсов «Ау!» показывает, что интернет занимает вторую строчку по обращениям против четвертой позиции раздела «Компьютеры». Отсюда напрашивается еще один вывод: многие компании, работающие на рынке информационных технологий, ведут собственные интернет-проекты, выросшие в самостоятельные направления, которые тоже развиваются и множатся. Это усложняет нашу задачу оценить количество компаний, а не отдельных проектов.
интернет-каталог @Rus, в который переродился «Ау!», выдает сходную цифру в 6112 ресурсов на тему «Компьютеры и интернет».
Каталог Rambler делит хайтек на категории «Железо» (235 сайтов), «игры» (500), «Компьютеры» (500), «Провайдеры» (422), «Программы» (500), «Связь» (395) и «Технологии» (331). Как мы и предполагали, далеко не за каждой позицией в каталоге стоит организация или компания. Например, первая десятка в разделе «Программы» ссылается исключительно на списки бесплатных программ и крэков. В связи с этим не так давно ряд производителей программных продуктов объявили бойкот Rambler и удалили свои записи из этого каталога ресурсов, подтверждая тезис о том, что рубрикаторы плохо отражают положение дел в отрасли.
Каталоги и рубрикаторы представляют собой пересекающиеся, но не совпадающие множества. Из десяти IT-компаний, взятых случайным образом из разных списков Rambler, только восемь обнаружили себя в других on-line-листах. «Попадание» корпоративного сайта сразу в несколько рубрикаторов прежде всего зависит от активности его создателей. К этому вопросу мы еще вернемся.
|
||||
Система поиска | Количество найденных документов (из них уникальных) | |||
компьютер | computer | программное обеспечение | software | |
|
||||
Rambler.ru | 122502 | 209590 | 89180 | 240943 |
(83045) | (132970) | (60867) | (158409) | |
Yandex.ru | 1777603 | 1196425 | 984982 | 1181439 |
(687 472) | (381101) | (1403373) | (336418) | |
Altavista.com | 1129 | 35895920 | 628 | 39883441 |
Другой способ оценки количества представленных во Всемирной Сети высокотехнологичных компаний заключается в использовании поисковых служб. Сравним результаты запросов по разным ключевым словам.
Приведенных в таблице цифр достаточно, чтобы увидеть разницу на порядок в результатах поиска по одному и тому же ключевому слову в разных поисковых механизмах. Кроме того, здесь хорошо отражены языковые пристрастия разных систем: Altavista едва набирает один процент доступных для индексирования документов на русском языке. Видно, что пропорция при поиске по ключу «software» и «computer» сохраняется, что, по всей видимости, соответствует соотношению между отраслями. Но документ — это еще не часть сайта. Задаваемые слова могут встречаться в самых разных текстах: от личных страниц до сайтов других отраслей. большую же часть находок составляют статьи электронных изданий, как эхо повторяющие информацию крупных новостных агентств. От лишних ссылок можно избавиться, если составлять сложные запросы, фильтрующие шумы.
Как известно, в хорошем вопросе содержится половина ответа. Попробуем сформулировать запрос так, чтобы найти фразу «О компании» в заголовках тех документов, в теле которых встречается «компьютер» или «программное обеспечение». Зададим поиск по серверам, чтобы избежать повторения страниц. Яndex выдает ответный список из 2304 страниц. Одного взгляда достаточно, чтобы заметить отсутствие «мусора» в результатах поисковой операции. Естественно и то, что мы не увидели тех фирм, в заголовках которых не было слова «компания». Оценить размер потерянной полезной информации сложно, хотя можно предположить, что их доля не так уж и велика: логика подсказывает, что сайт, представляющий компанию, должен иметь страницу с названием «О компании». Эта цифра в два раза больше числа интересующих нас сайтов по данным «Компьютерной России». С момента этого опроса прошло полтора года. Можно предположить, что за это время количество компаний сильно не изменилось (учитывая кризис августа прошлого года), а вот количество представленных из них во Всемирной Сети неизбежно должно было вырасти. Этот рост составил как минимум 100%.
из «выуженных» данных попробуем извлечь еще пару крупиц полезной информации. Задаем поиск по ключевому слову «Москва» в результатах предыдущей итерации. Круг сузился до 698 уникальных страниц (30% от общего числа). Теперь повторим поиск по ключу «Петербург»: 273 и 12% соответственно. Цифры почти совпадают со статистикой каталога российской компьютерной индустрии.
Надо сказать, что результаты поиска того или иного документа так же не в последнюю очередь зависят от предпринимаемых шагов по ее продвижению. Далеко не все веб-мастера используют метатеги с кратким описанием контента при создании страниц, не всегда и не везде регистрируют свои сайты или их отдельные части. Попробуем оценить активность в продвижении IT-сайтов на основе данных, представляемых службами баннерного обмена. Три крупнейшие системы: InterReklama (www.bizlink.ru/ir), Russian Link Exchange (http://www.linkexchange.ru/) и Reklama.Ru (http://www.reklama.ru/) — объединяют порядка 8 тысяч сайтов, участвующих в баннерообмене. Доля корпоративных сайтов интересующего нас профиля не превышает 5%. Хотя веб-мастера иногда ставят на свои страницы баннеры нескольких систем, в принципе, это не приветствуется, а иногда и воспрещается. Считая множества клиентов отдельных служб непересекающимися, мы видим, что за пятью процентами стоят максимум 400 сайтов. Это порядка 20% от общего их числа.
?Итак, подведем итоги. Наиболее ценным источником, отражающим полноту картины на рынке, является каталог, составленный на основе анкетирования компаний. интернет-рубрикаторы искажают истинное положение дел. Популярность оказала им плохую услугу: модераторы не успевают справляться с запросами о регистрации проектов, чья маркетинговая задача идет вразрез с реальными данными. Предъявляемые к регистрации требования должны быть ужесточены в пользу «честных игроков». Поисковые системы дали нам цифры, коррелируемые с данными отраслевого каталога. Суммируя их, можно предположить, что количество корпоративных хайтек-сайтов сейчас находится на уровне двух с половиной тысяч, общее же количество компаний, работающих на рынке, — порядка семи тысяч. Соотношение городов и регионов в этом списке со временем меняется слабо, центр явным образом доминирует над провинцией. Число же компаний, активно занимающихся продвижением своих сайтов, совсем невелико, что выглядит для данной отрасли парадоксом.
Впервые опубликовано в журнале Мир интернет