Андреев В.В., Волхонцев Д.В., Ивкушкин К.В., Карягин Д.В., Минаков И.А., Ржевский Г.А., Скобелев П.О. Мультиагентная система извлечения знаний.

Источник: Сайт НПК «Генезис знаний»
Полный текст: HTML (открывается в новом окне) Проблема приобретения и использования новых знаний является весьма актуальной и значимой для многих современных предприятий, стремящихся повысить свою эффективность. Один из путей решения этой проблемы связан с созданием прикладных программных систем [1], реализующим разнообразные математические и эмпирические методы анализа данных (статистический и спектральный анализ, распознавание образов и т.д.).
Однако, несмотря на значительные достижения в этой области, решение этой задачи для рядовых пользователей по-прежнему представляет собой сложную проблему. Дело в том, что большие объемы данных, разнообразие возникающих на практике задач, отсутствие формализованных моделей исследуемых объектов и необходимость получения априорных знаний о поступающих данных, ограничения существующих оптимальных математических алгоритмов, а также высокая разнородность и противоречивость данных, их недоопределенность и наличие ошибок – все это существенно затрудняет процесс анализа данных и приобретения новых знаний.
В этой связи в рассматриваемой области в последнее время стали развиваться методы «неклассического» интеллектуального анализа данных, получивших название Data Mining и Knowledge Discovery (DM&KD). Как отмечается в [2], DM&KD представляет собой «процесс управляемого данными (data-driven) извлечения зависимостей из больших баз данных. В этом процессе центральное место занимает порождение характеризующих анализируемые данные моделей, правил или функциональных зависимостей, которые затем представляются пользователю для оценки их интересности, релевантности и полезности». При этом под «зависимостями» понимается не только традиционные аналитические соотношения, но и выделение кластеров (групп) или каких-либо шаблонов в данных, построение классификаций и порождение ассоциаций, установление причинных отношений и т.д. При этом применяются методы порождения деревьев решений, рассуждения на основе правил, генетические алгоритмы, нейронные сети, когнитивная графика. Как следствие, в существующих системах DM&KD (IBM Intelligent Miner, SAS Enterprise Miner и т.д.) пользователю предлагаются приближенные, «не точные» и «не оптимальные» решения, которые, тем не менее, позволяют получать важные результаты, правила и обобщения.
Вместе с тем, рассматриваемые системы на практике оказываются закрытыми, слишком сложными и жестко устроенными программами, узко специализированными и не позволяющими расширять, скрещивать или модифицировать используемые алгоритмы, работать в режиме непрерывного поступления данных (что особенно характерно, например, для систем е-коммерции в сети Интернет) и т.д. Можно утверждать, что в настоящее время отсутствуют универсальные и технологичные программные системы, пригодные для решения широкого спектра подобных задач (в диапазоне от задач кластеризации и исследования структурных зависимостей – до анализа временных рядов или распознавания образов), которые были бы достаточно мощными, гибкими, удобными и простыми в применении для неподготовленных пользователей.
В этой связи в настоящей работе предлагается новый подход к решению задач DM&KD, основанный на принципах построения открытых мультиагентных систем [3]. В этом подходе свое воплощение впервые находят идеи самоорганизации и эволюции данных, противопоставляющие традиционным централизованным, жестким и последовательным алгоритмам решения задач динамичное и гибкое взаимодействие относительно простых программных агентов, представляющих «интересы» любых записей, образов, кластеров, формул и т.д. Очевидно, что на основе подобных принципов может быть создан качественно новый инструмент интеллектуального анализа данных, открытый и гибко адаптируемый к решаемой задаче, глубоко интегрируемый с другими системами, легко распараллеливаемый и т.п.
Разработке предлагаемого подхода и созданию мультиагентной системы для его реализации и посвящена настоящая работа.

Список литературы
[1] Н.Г. Загоруйко. Прикладные методы анализа данных и знаний. – Новосибирск: Изд-во Института математики, 1999 — 270 стр.
[2] М.И.Забежайло. Data Mining & Knowledge Discovery in Data Bases: Предметная область, задачи, методы и инструменты // Шестая Национальная конференция по искусственному интеллекту с международным участием, Пущино, 5-11 октября 1998 – Пущино, том 2, стр. 592 – 600.
[3] Скобелев П.О. Холистический подход к созданию открытых мультиагентных систем. // Материалы настоящей конференции.
[4] K.Ivkushkin, I.Minakov, G.Rzevski, P.Skobelev. МАDАЕ: Multi-Agent Engine for Desktop Applications // 3-rd International Workshop on Computer Science and Information Technologies (in publ.).