СТАТЬЯ | 13.02.03 |
© Статья была опубликована на сайте “Управление – 3000”
Мы живем в веке информации. Трудно переоценить значение данных, которые мы непрерывно собираем в процессе нашей деятельности, в управлении бизнесом или производством, в банковском деле, в решении научных, инженерных и медицинских задач. Мощные компьютерные системы, хранящие и управляющие огромными базами данных, стали неотъемлемым атрибутом жизнедеятельности как крупных корпораций, так и небольших компаний. Тем не менее, наличия данных самого по себе еще недостаточно для улучшения показателей работы. Нужно уметь трансформировать "сырые" данные в полезную для принятия важных бизнес-решений информацию. В этом и состоит основное предназначение технологий data mining.
Ответы на эти и многие другие вопросы, возможно, содержаться в мегабайтах ваших баз данных. Нахождение скрытых закономерностей в данных, взаимосвязей между различными переменными в базах данных, моделирование и изучение сложных систем на основе истории их поведения - вот предмет и задачи data mining. Результаты data mining - эмпирические модели, классификационные правила, выделенные кластеры и т.д. - можно затем инкорпорировать в существующие системы поддержки принятия решений и использовать их для прогноза будущих ситуаций.
Существует множество определений data mining, но в целом они совпадают в выделении 4-х основных признаков. Вот определение, которое дал Григорий Пиатецкий-Шапиро (G. Piatetsky-Shapiro, GTE Labs), один из ведущих мировых экспертов в области data mining: "
Data mining - это процесс обнаружения в сырых данных
Дополнительная информация
INTERFACE Ltd. |
|