того, что применяет компания Marks amp; Spenser), меняет саму природу их деятельности. Это
настолько мощный инструментарий, что некоторые из сотрудников Marks amp; Spenser поначалу даже опасались, не вытеснит ли компьютер их совсем. В них говорило естественное
нежелание человека отказываться от какой-либо доли участия в принятии решений и тем более
передавать эту функцию машине. Однако когда массив данных достигает определенных
размеров и уровня сложности, выполнение начального поиска и сортировки компьютером
оказывается гораздо эффективнее. Люди просто не способны замечать закономерности в
больших объемах данных. А объемы эти — не только в базах данных, но и в файловых
системах, в системах передачи сообщений и на веб-сайтах — растут сегодня экспоненциально.
Единственная возможность реализовать их потенциал в полной мере — это использовать для
выделения полезной информации компьютерные средства.
Применение программных алгоритмов для поиска полезных закономерностей в больших
объемах данных называется интеллектуальным анализом данных. Первым серьезным шагом в
этом направлении стало создание систем оперативной аналитической обработки (OLAP), которые существенно повышают эффективность обслуживания многих видов запросов.
Благодаря им данные, собиравшиеся ранее только в целях бухгалтерского и финансового учета, стало возможным использовать в моделировании, прогнозировании и принятии решений. Для
удовлетворения этих новых потребностей компании начали создавать корпоративные
хранилищаданных. Подмножество такого хранилища, отражающее какой-либо один аспект
функционирования предприятия или охватывающее деятельность одного из его подразделений,
Билл Гейтс: «Бизнес со скоростью мысли»
121
часто называют киоском данных.
Издательская компания HarperCollins использует OLAP-систему на базе ПК для контроля
за ходом книжной торговли в реальном масштабе времени. Это позволяет ей печатать ровно
столько экземпляров, сколько требуется дистрибьюторам. Таким образом удается избежать
образования в канале сбыта больших товарных остатков, которые пришлось бы потом
принимать обратно. После всего лишь года эксплуатации новой системы возврат непроданных
экземпляров наиболее популярных изданий HarperCollins сократился с более чем 30%
приблизительно до 10%, а за каждым из этих процентов стоят миллионы долларов экономии.
Кроме того, OLAP-система HarperCollins позволяет специалистам компании получать
ответы на вопросы типа: какова была прибыльность сбыта такого-то издания за такую-то
неделю через такого-то дистрибьютора? Обратите внимание, что даже в этом случае
невозможно обойтись без человека, который бы задавал вопросы; а кроме того, ни
традиционная база данных, ни OLAP-система не способны находить ответы на такие более
расплывчатые, но от этого не менее важные для бизнеса вопросы, как: «Какой из клиентов, вероятно, предпочтет продукт А продукту Б? Что отличает клиентов, которых наши продукты и
услуги удовлетворяют, от клиентов, которых они не удовлетворяют? Какие из клиентов в моей
базе данных „сходны“ друг с другом?» При попытке обработать подобный неконкретный
запрос на пользователя OLAP-системы обрушилась бы лавина данных, которые ему бы вряд ли
для чего-нибудь пригодились. Для сложных видов интеллектуального анализа данных
требуется особое ПО, предназначенное для ориентирования в богатых информацией средах. И
оно должно быть способно помочь своим пользователям в поиске ответов на вопросы, не
требуя от них глубоких познаний в таких специальных областях, как статистика, анализ или
работа с базами данных.
В числе сложных задач, справляться с которыми помогает интеллектуальный анализ
данных, — прогнозирование вероятности покупки клиентом определенного товара на
основании его возраста, пола, демографических характеристик и других признаков; выделение
групп клиентов, характеризующихся сходным поведением при просмотре информации в сети; выявление
предпочтений
конкретного
клиента
с