Федеральное агентство связи
Государственное образовательное учреждение высшего профессионального образования
«Поволжский государственный университет телекоммуникаций и информатики»
Кафедра ИСТ
КОНСПЕКТ ЛЕКЦИЙ
ПО УЧЕБНОЙ ДИСЦИПЛИНЕ
ИНФОРМАЦИОННЫЕ СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ
По специальности 230201 (для студентов 3у курса — заочное отделение)
Самара - 2011
УДК 621.391
Крупина Е.Е.
Информационные системы поддержки принятия управленческих решений. Конспект лекций. - Самара.:ГОУВПО ПГУТИ , 2011 — 100 с.
Государственное образовательное учреждение высшего профессионального образования
«Поволжский государственный университет телекоммуникаций и информатики»
Крупина Е.Е., 2011
ТЕМА 1. Понятие Информационной системы поддержки принятия решений (ИСППР). История создания ИСППР.
Краткое содержание.
- Понятие информационной системы (ИС)
- Понятие экономической информационной системы (ЭИС)
- Процесс принятия решений
- Понятие информационной системы поддержки принятия решений (ИСППР)
- Определения ИСППР
- История ИСППР
|
Под системой понимают любой объект, который одновременно рассматривается и как единое целое, и как объединенная в интересах достижения поставленных целей совокупность разнородных элементов. |
В информатике понятие «система» широко распространено и имеет множество смысловых значений. Чаще всего оно используется применительно к набору технических средств и программ. Системой может называться аппаратная часть компьютера. Системой может также считаться множество программ для решения конкретных прикладных задач, дополненных процедурами ведения документации и управления расчетами.
Добавление к понятию «система» слова «информационная» отражает цель ее создания и функционирования. Информационные системы обеспечивают сбор, хранение, обработку, поиск, выдачу информации, необходимой в процессе принятия решений задач из любой области. Они помогают анализировать проблемы и создавать новые продукты.
|
Информационная система (ИС) — взаимосвязанная совокупность средств, методов и персонала, используемых для хранения, обработки и выдачи информации в интересах достижения поставленной цели. |
Современное понимание информационной системы предполагает использование персонального компьютера в качестве основного технического средства переработки информации. В крупных организациях наряду с персональным компьютером в состав технической базы информационной системы может входить мэйнфрейм или суперЭВМ.
Кроме того, техническое воплощение информационной системы само по себе ничего не будет значить, если не учтена роль человека, для которого предназначена производимая информация и без которого невозможно ее получение и представление.
Перед тем, как рассмотреть понятие информационных систем поддержки принятия решений, рассмотрим непосредственно сам процесс принятия решений.
Искусство принятия наилучших решений, основанное на опыте и интуиции, является сущностью любой сферы человеческой деятельности. Наука о выборе приемлемого варианта решения сложилась сравнительно недавно, а математической теории принятия решений - около 50 лет.
В общем случае процесс принятия решений включает в себя два этапа: подготовительный и деловой. На первом этапе формализуется и решается задача, а на втором результат предьявляется ЛПР - Лицу Принимающему Решение, который одобряет его или отвергает. Таким образом процесс принятия решений может быть циклическим, поэтому важно, чтобы сам ЛПР владел методом и мог сам поставить задачу, либо аналитик, который работает с задачей, был "в команде" и понимал суть решаемой проблемы. Обычно активные субьекты, которые участвуют в процессе - ЛПР и его контрагенты, имеют различные интересы и стремятся воздействовать на процесс принятия решений (ППР) в своих целях. Это может выражаться в сокрытии истинного мнения и намерений при принятии решения, искажении информации и т.п. Такое поведение участников может привести к решению, далекому от оптимального или справедливого. Участники ППР должны в общем случае обладать: памятью (способностью накапливать информацию), способностью к прогнозу (могут использовать информацию для предвидения результатов решения), индивидуальными предпочтениями (различные результаты оценивают поразному), могут быть благожелательны (из двух равных для себя решений субьект может выбрать тот, который устроит противника).
|
Принятие решения — это процесс рационального или иррационального выбора альтернатив, имеющий целью достижение осознаваемого результата |
Теория принятия решений - дисциплина, изучающая процессы принятия решений и методы, которые используют управленцы, чтобы делать оптимальный выбор в ситуациях с высоким уровнем неопределенности и риска. Она занимается, с одной стороны, описанием того, как на практике решаются проблемные ситуации, а с другой - разработкой стратегий, использование которых обеспечит принятие наилучших решений в будущем.
Теория принятия решений сформировалась на базе научного менеджмента. В области принятия руководящих решений традиционно существовало своеобразное разделение труда, при котором одни - академические ученые - изучали, как следует управлять, а другие - администраторы - осуществляли управление на практике. Теория принятия решений вышла на первый план в 1960-х гг., благодаря развитию менеджмента, исследований операций, вычислительной техники и системного анализа. Именно эта дисциплина, изучающая создание математических моделей реальности, оказала основное влияние на развитие компьютерного моделирования социальных процессов. Основы теории принятия решений разработаны Джоном фон Нейманом и Отто Моргенштерном. По мере усложнения задач появилось много различных направлений этой науки, которые имеют дело с одной и той же проблемой анализа возможных способов действия с целью нахождения оптимального в данных условиях решения проблемы. Как самостоятельная дисциплина общая теория принятия решений (ТПР) сформировалась в начале 60-х годов, тогда же была сформулирована основная цель этой теории - рационализировать процесс принятия решений.
|
Теория принятия решений — область исследования, вовлекающая понятия и методы математики, статистики, экономики, менеджмента и психологии; изучает закономерности выбора людьми путей решения разного рода задач, а также исследует способы поиска наиболее выгодных из возможных решений. |
Теория принятия решений опирается на модель рационального выбора, возникшую в микроэкономике.
Решение считается рациональным, если оно увеличивает благосостояние того, кто его принял, в большей степени, чем любой другой возможный вариант. Под "благосостоянием" здесь подразумевается все, что имеет ценность, например, чувство удовлетворения или радость от достижения цели. Однако чаще всего оно связывается с получением доходов и измеряется в денежных единицах.
Рациональный выбор альтернатив состоит из следующих этапов:
- Ситуационный анализ
- Идентификация проблемы и постановка цели
- Поиск необходимой информации
- Формирование альтернатив
- Формирование критериев для оценки альтернатив
- Проведение оценки
- Выбор наилучшей альтернативы
- Внедрение (исполнение)
- Разработка критериев (индикаторов) для мониторинга
- Мониторинг исполнения
- Оценка результата
Иррациональный выбор альтернатив включает все те же составляющие, но в таком «сжатом» виде, что трассирование (пошаговый анализ) причинно-следственных связей становится невозможным.
Существует две категории условий, в которых принимаются решения - условия определенности, или условиях неопределенности.
- Условия определенности подразумевают, что все последствия любого варианта действия известны заранее, и поэтому не составляет труда сказать, какое решение оптимально.
- Условия неопределенности, напротив, характеризуются тем, что в них нельзя с абсолютной уверенностью предсказывать последствия своих поступков. Следовательно, оказавшись в них, принимающий решение человек вынужден учитывать вероятности событий и идти на риск.
Вероятность - это оценка шансов того, что данное событие произойдет. Ее можно оценить, как правило, лишь приблизительно на основании изучения какого-то числа примеров того, как в прошлом складывалась похожая ситуация. Часто шансы в пользу того, что определенные события произойдут, вычисляются с помощью экспертного опроса.
Риск - это вероятность неблагоприятного развития событий. Чем выше риск, связанный с данным вариантом решения, тем больше шансов того, что оно обернется нежелательными последствиями. С другой стороны, каждый знает, что обычно именно самые рискованные предприятия сулят и самые большие прибыли в случае успеха.
Выбор одного из вариантов действия зависит от того, насколько принимающий решение склонен к риску, и того, какова для него или нее субъективная полезность каждого исхода. Субъективная полезность - это значение, которое данный человек придает определенному аспекту возможных исходов. Если каждый из возможных результатов имеет свои плюсы и минусы, то выбор конкретного человека зависит от того, насколько для него важны те свойства, по которым эти результаты различаются между собой. Если один руководитель предпочитает аккуратных, но безынициативных подчиненных, а другой - творческих, но небрежных, то это объясняется тем, что для первого субъективная полезность аккуратности выше оригинальности и самостоятельности, а для второго - наоборот.
Математическое выражение предпочтительности некоторого варианта решения называется его "ожидаемой ценностью". Она вычисляется путем перемножения субъективных полезностей всех возможных исходов на вероятность этих исходов и сложением результатов этих вычислений. Сравнивая ожидаемые ценности всех вариантов действия, можно выбрать предпочтительный - или наиболее выигрышный, или наименее проигрышный
В теории принятия решений выделяют несколько видов неопределенности -
- стохастическая - имеется информация о распределении вероятности на множестве результатов;
- поведенческая - имеется информация о влиянии на результаты поведения участников;
- природная - имеется информация только о возможных результатах и отсутствует о связи между решениями и результатами;
- априорная - нет информации и о возможных результатах
Задача обоснования решений в условиях неопределенности всех типов, кроме априорной, сводится к сужению исходного множества альтернатив на основе информации, которой располагает ЛПР. Качество рекомендаций для принятия решений в условиях стохастической неопределенности повышается при учете таких характеристик личности ЛПР, как отношение к своим выигрышам и проигрышам, склонность к риску. Обоснование решений в условиях априорной неопределенности возможно построением алгоритмов адаптивного управления.
В последующие годы была создана и прикладная теория статистических решений, позволяющая анализировать и решать широкий класс управленческих задач, связанных с ограниченным риском - проблемы выбора, размещения, распределения и т.п.
В настоящее время теория принятия решений применяется преимущественно для анализа тех деловых проблем, которые можно легко и одназначно формализовать, а результаты исследования адекватно интерпретировать. Так, например, методы ТПР используют в самых различных областях управления - при проектировании сложных технических и организационных систем, планировании развития городов, выборе программ развития экономики и энергетики регионов, организации новых экономических зон и т.п.
Необходимость использования подходов и методов ТПР в управлении очевидна: быстрое развитие и усложнение экономических связей, выявление зависимости между отдельными сложными процессами и явлениями, которые раньше казались не связанными друг с другом, приводят к резкому возрастанию трудностей принятия обоснованных решений. Затраты на их осуществление непрерывно увеличиваются, последствия ошибок становятся все серьезнее, а обращение к професиональному опыту и интуиции не всегда приводит к выбору наилучшей стратегии. Использование методов ТПР позволяет решить эту проблему, причем быстро и с достаточной степенью точности.
Современные системы поддержки принятия решения (СППР) представляют собой системы, максимально приспособленные к решению задач повседневной управленческой деятельности, являются инструментом, призванным оказать помощь лицам, принимающим решения. С помощью СППР может производиться выбор решений некоторых неструктурированных и слабоструктурированных задач, в том числе и многокритериальных.
СППР, как правило, являются результатом мультидисциплинарного исследования, включающего теории баз данных, искусственного интеллекта, интерактивных компьютерных систем, методов имитационного моделирования.
Существует достаточно большое количество определений СППР.
Ранние определения СППР (в начале 70-х годов прошлого века) отражали следующие три признака СППР:
- возможность оперировать с неструктурированными или слабоструктурированными задачами, в отличие от задач, с которыми имеет дело исследование операций;
- интерактивные автоматизированные (то есть реализованные на базе компьютера) системы
- разделение данных и моделей.
Рассмотрим несколько определений СППР.
|
СППР — совокупность процедур по обработке данных и суждений, помогающих руководителю в принятии решений, основанная на использовании моделей.
СППР — это интерактивные автоматизированные системы, помогающие лицу, принимающему решения, использовать данные и модели для решения слабоструктуризированных проблем.
СППР — это система, которая обеспечивает пользователям доступ к данным и/или моделям, так что они могут принимать лучшие решения. |
В настоящее время нет общепринятого определения СППР, поскольку конструкция СППР существенно зависит от вида задач, для решения которых она разрабатывается, от доступных данных, информации и знаний, а также от пользователей системы. Можно выделить, тем не менее, некоторые элементы и характеристики, общепризнанные, как части СППР.
СППР — в большинстве случаев — это интерактивная автоматизированная система, которая помогает пользователю (ЛПР) использовать данные и модели для идентификации и решения задач и принятия решений. Система должна обладать возможностью работать с интерактивными запросами с достаточно простым для изучения языком запросов.
СППР обладает следующими четырьмя основными характеристиками:
- СППР использует и данные, и модели;
- СППР предназначены для помощи менеджерам в принятии решений для слабоструктурированных и неструктурированных задач;
- Они поддерживают, а не заменяют, выработку решений менеджерами;
- Цель СППР — улучшение эффективности решений.
Все вышесказанное можно систематизировать в следующее определение.
|
Систе́ма подде́ржки приня́тия реше́ний (СППР) (англ.Decision Support System, DSS) — компьютерная автоматизированная система, целью которой является помощь людям, принимающим решение в сложных условиях для полного и объективного анализа предметной деятельности. |
Рассмотрим кратко историю создания СППР.
Интересно отметить создание предтечи СППР коллежским советником С. Н. Корсаковым, опубликовавшим еще в 1832 году описание механических устройств, так называемых «интеллектуальных машин», которые "могли быть использованы при решении различных задач в повседневной жизни, для того, чтобы сделать какой бы то ни было вывод", например помочь принять решение о наиболее подходящих лекарствах по наблюдаемым у пациента симптомам заболевания.
После появления в начале 1940-х гг. и полного освоения в практической деятельности первых электронно-вычислительных машин общего назначения методы обработки данных существенно продвинулись. В конце 1950-х гг. многие организации начали использовать системы обработки транзакций (СОТ) (TPS) или системы электронной обработки данных (ЭОД) (electronic data processing, EDP), чтобы автоматизировать решение текущих задач, например составление платежных ведомостей, переучет товара и оформление счетов.
До середины 60-х годов прошлого века создание больших информационных систем (ИС) было чрезвычайно дорогостоящим, поэтому первые ИС менеджмента (так называемые Management Information Systems — MIS) или ИУС — информационно — управляющие системы были созданы в эти годы лишь в достаточно больших компаниях. Эти системы были разработаны в целях извлечения нужной для управления информации, при этом обрабатывались огромные массивы данных о транзакциях, были возможны пользовательские интерактивные запросы, объединение данных и подведение итогов. Включение в ИУС простых моделей и статистических методов позволяло автоматизированным системам предлагать всевозможные варианты структурированных решений MIS предназначались для подготовки периодических структурированных отчетов для менеджеров.
В конце 60-х годов два новатора, Питер Кин и Чарльз Стобель, проведшие исследования при Технологическом институте Карнеги (1950 — 1960) и Массачусетском технологическом институте (конец 60-х) дали основу модельно-ориентированным системам поддержки принятия решений. Таким образом, в конце 60-х годов появляется новый тип ИС — модель-ориентированные СППР (Model-oriented Decision Support Systems — DSS) или системы управленческих решений (Management Decision Systems — MDS).
В 1970-х гг. ученые, занимающиеся АИС, начали осознавать важную роль автоматизированных информационных систем в поддержке управляющего персонала в его полуструктурированной и неструктурированной деятельности по принятию решений Начиная с 1970-х гг. разработка СППР составила значительную часть АИС.
С начала 70-х годов пошел буквально вал публикаций по системам поддержки принятия решений. Например, известна работа Фергюсона и Джоунса, опубликованная в 1969 году, в которой обсуждаются аспекты компьютерных решений проблемы. В 1971 году была опубликована монография Майкла Скотта Мортона «Системы принятия решений: компьютерная поддержка».
В 1975 году была опубликована докторская диссертация исследователя из МИТ Стивена Ольтера, озаглавленная «Системы поддержки принятия решений: современная практика и грядущие проблемы» , которая позволила раздвинуть границы понимания предмета DSS. Кроме того, в этой работе были выведены существенные дескриптивные, то есть эмпирические признаки систем DSS.
Авторитет «первооткрывателей» DSS Питера Кина и Майкла Скотта Мортона, был почти непререкаемым. Изданная ими в 1978 году монография послужила ориентиром в последующих изысканиях в области анализа, проектирования, оценок и разработок систем класса DSS.
Нужно сказать, что именно конец 70-х был ознаменован созданием интерактивных компьютерных систем, способных решать слабоструктурированные информационные вопросы. И все это называлось DSS, хотя, по серьезному разбору, эти системы представляли обширное видовое многообразие.
Немаловажным событием стала публикация в 1982 году книги Ральфа Спрейга и Эрика Карлсона «Построение эффективных систем поддержки принятия решений» . Она просто конкретно ответила на вопросы: что такое эти системы, зачем и когда они нужны, как их строить.
В 1980-х гг. мы стали свидетелями новой волны информационных технологий — появились системы (ЭС), один из видов систем искусственного интеллекта, предназначенные для замены лиц, принимающих решения, или подражания им в построении итерационных (периодически повторяющихся) решений в узких областях знаний
Начиная с 1990-х, разрабатываются так называемые Data Warehouses — хранилища данных.
В 1993 г Е. Коддом для СППР специального вида был предложен термин OLAP (Online Analytical Processing)- оперативный анализ данных, онлайновая аналитическая обработка данных для поддержки принятия важных решений. Исходные данные для анализа представлены в виде многомерного куба, по которому можно получать нужные разрезы— отчёты. Выполнение операций над данными осуществляется OLAP-машиной. По способу хранения данных различают MOLAP, ROLAP и HOLAP. По месту размещения OLAP-машины различаются OLAP-клиенты и OLAP-серверы. OLAP-клиент производит построение многомерного куба и вычисления на клиентском ПК, а OLAP-сервер получает запрос, вычисляет и хранит агрегатные данные на сервере, выдавая только результаты.
В начале нового тысячелетия была создана СППР на основе Web. 27 октября 2005 года в Москве на Международной конференции «Информационные и телемедицинские технологии в охране здоровья» (ITTHC 2005), А. ПАстухов (Россия) представил СППР нового класса — PSTM (Personal Information Systems of Top Managers). Основным отличием PSTM от существующих СППР является построение системы для конкретного лица, принимающее решение, с предварительной логико-аналитической обработкой информации в автоматическом режиме и выводом информации на один экран.
Последним пополнением АИС стали искусственные нейронные сети (ИНС). Нейронные сети — это системы искусственного интеллекта, имитирующие функции человеческого мозга.
ТЕМА 2. Классификация ИСППР
Краткое содержание.
- КлассификацияИСППР
- Задачи, решаемые ИСППР
Для СППР отсутствует не только единое общепринятое определение, но и исчерпывающая классификация. Разные авторы предлагают разные классификации.
На уровне пользователя СППР делят на пассивные, активные и кооперативные СППР.
- Пассивной СППР называется система, которая помогает процессу принятия решения, но не может вынести предложение, какое решение принять.
- Активная СППР может сделать предложение, какое решение следует выбрать.
- Кооперативная СППР позволяет ЛПР изменять, пополнять или улучшать решения, предлагаемые системой, посылая затем эти изменения в систему для проверки. Система изменяет, пополняет или улучшает эти решения и посылает их опять пользователю. Процесс продолжается до получения согласованного решения.
На концептуальном уровне различают следующий классы СППР.
- СППР, уравляемая сообщениями (Communication-Driven DSS) (ранее групповая СППР — GDSS) - поддерживает группу пользователей, работающих над выполнением общей задачи.
- СППР, управляемые данными (Data-Driven DSS) или СППР, ориентированные на работу с данными (Data-oriented DSS) в основном ориентируются на доступ и манипуляции с данными.
- СППР, управляемые документами (Document-Driven DSS), управляют, осуществляют поиск и манипулируют неструктурированной информацией, заданной в различных форматах.
- СППР, управляемые знаниями (Knowledge-Driven DSS) обеспечивают решение задач в виде фактов, правил, процедур.
- СППР, управляемые моделями (Model-Driven DSS) характеризуются в основном доступом и манипуляциями с математическими моделями (статистическими, финансовыми, оптимизационными, имитационными).
Отметим, что некоторые OLAP-системы, позволяющие осуществлять сложный анализ данных, могут быть отнесены к гибридным СППР, которые обеспечивают моделирование, поиск и обработку данных.
На техническом уровне различают СППР всего предприятия и настольную СППР.
- СППР всего предприятия подключена к большим хранилищам информации и обслуживает многих менеджеров предприятия.
- Настольная СППР — это малая система, обслуживающая лишь один компьютер пользователя.
Рассмотрим далее классификацию информационных систем по признаку структурированности задач
При создании или при классификации информационных систем неизбежно возникают проблемы, связанные с формальным — математическим и алгоритмическим — описанием решаемых задач. От степени формализации во многом зависит эффективность работы всей системы, а также уровень автоматизации, определяемый степенью участия человека при принятии решения на основе получаемой информации.
Чем точнее математическое описание задачи, тем выше возможности компьютерной обработки данных и тем меньше степень участия человека в процессе ее решения. Это и определяет степень автоматизации задачи.
Различают три типа задач, для которых создаются информационные системы: структурированные (формализуемые), неструктурированные (неформализуемые) и частично структурированные.
|
Структурированная (формализуемая) задача — задача, где известны все ее элементы и взаимосвязи между ними.
Неструктурированная (неформализуемая) задача — задача, в которой невозможно выделить элементы и установить между ними связи. |
В структурированной задаче удается выразить ее содержание в форме математической модели, имеющей точный алгоритм решения Подобные задачи обычно приходится решать многократно, и они носят рутинный характер. Целью использования ИС для решения структурированных задач является полная автоматизация их решения, т.е. сведение роли человека к нулю.
ПРИМЕР |
|
В ИС необходимо реализовать задачу расчета заработной платы. Это структурированная задача, где полностью известен алгоритм решения. Рутинный характер этой задачи определяется тем, что расчеты всех начислений и отчислений просты, объем их очень велик, так как они должны многократно повторяться ежемесячно для всех категорий работающих |
Решение неструктурированных задач из-за невозможности создания математического описания и разработки алгоритма связано с большими трудностями. Возможности использования здесь информационной системы невелики решение в таких случаях принимается человеком из эвристических соображений на основе своего опыта и, косвенной информации из разных источников.
В практике работы любой организации существует сравнительно немного полностью структурированных или совершенно неструктурированных задач. О большинстве задач можно сказать, что известна лишь часть их элементов и связей между ними. Такие задачи называются частично структурированными. В этих условиях можно создать ИС, при этом получаемая в ней информация анализируется человеком, который будет играть определяющую роль. Такие информационные системы являются автоматизированными, так как в их функционировании принимает участие человек.
ПРИМЕР |
|
Например, требуется принять решение по устранению ситуации, когда потребность в трудовых ресурсах для выполнения в срок одной из работ комплекса превышает их наличие. Пути решения этой задачи могут быть разными, например:
- выделение дополнительного финансирования на увеличение численности работающих;
- отнесение срока окончания работы на более позднюю дату и т.д.
|
Как видно, в данной ситуации информационная система может помочь человеку принять то или иное решение, если снабдит его информацией о ходе выполнения работ по всем необходимым параметрам.
СППР, используемые для решения частично структурированных задач, подразделяются на два вида - оперативные и стратегические.
Оперативные СППР предназначены для немедленного реагирования на изменения текущей ситуации в управлении финансово-хозяйственными процессами компании.
Стратегические СППР ориентированы на анализ значительных объемов разнородной информации, собираемых из различных источников. Важнейшей целью этих СППР является поиск наиболее рациональных вариантов развития бизнеса компании с учетом влияния различных факторов, таких как конъюнктура целевых для компании рынков, изменения финансовых рынков и рынков капиталов, изменения в законодательстве и др.
Оперативные СППР получили название Информационных Систем Руководства (Executive Information Systems, ИСР). По сути, они представляют собой конечные наборы отчетов, построенные на основании данных из транзакционной информационной системы предприятия, в идеале адекватно отражающей в режиме реального времени основные аспекты производственной и финансовой деятельности. Для ИСР характерны следующие основные черты:
- отчеты, как правило, базируются на стандартных для организации запросах; число последних относительно невелико;
- ИСР представляет отчеты в максимально удобном виде, включающем, наряду с таблицами, деловую графику, мультимедийные возможности и т. п.;
- как правило, ИСР ориентированы на конкретный вертикальный рынок, например финансы, маркетинг, управление ресурсами.
Таким образом, ИСР создают управленческие отчеты и ориентированы главным образом на обработку данных (поиск, сортировку, агрегирование, фильтрацию). Используя сведения, содержащиеся в этих отчетах, управляющий принимает решение.
Информационные системы, создающие управленческие отчеты, обеспечивают информационную поддержку пользователя, т.е. предоставляют доступ к информации в базе данных и ее частичную обработку. Процедуры манипулирования данными в информационной системе должны обеспечивать следующие возможности:
- составление комбинаций данных, получаемых из различных источников;
- быстрое добавление или исключение того или иного источника данных и автоматическое переключение источников при поиске данных;
- управление данными с использованием возможностей систем управления базами данных;
- логическую независимость данных этого типа от других баз данных, входящих в подсистему информационного обеспечения;
- автоматическое отслеживание потока информации для наполнения баз данных.
Стратегические СППР предполагают достаточно глубокую проработку данных, специально преобразованных так, чтобы их было удобно использовать в ходе процесса принятия решений. Неотъемлемым компонентом СППР этого уровня являются правила принятия решений, которые на основе агрегированных данных дают возможность менеджерам компании обосновывать свои решения, использовать факторы устойчивого роста бизнеса компании и снижать риски. СППР второго типа в последнее время активно развиваются. Технологии этого типа строятся на принципах многомерного представления и анализа данных (OLAP). Цель стратегических СППР - разработать возможные альтернативы решения. Принятие решения при этом сводится к выбору одной из предложенных альтернатив.
Информационные системы, разрабатывающие альтернативы решений, могут быть модельными или экспертными.
Модельные информационные системы предоставляют пользователю математические, статистические, финансовые и другие модели, использование которых облегчает выработку и оценку альтернатив решения. Пользователь может получить информацию, недостающую ему для принятия решения, путем установления диалога с моделью в процессе ее исследования.
Основными функциями модельной информационной системы являются:
- возможность работы в среде типовых математических моделей, включая решение основных задач моделирования типа «как сделать, чтобы?», «что будет, если?», анализ чувствительности и др.;
- достаточно быстрая и адекватная интерпретация результатов моделирования;
- оперативная подготовка и корректировка входных параметров и ограничений модели;
- возможность графического отображения динамики модели; возможность объяснения пользователю необходимых шагов формирования и работы модели.
Экспертные информационные системы обеспечивают выработку и оценку возможных альтернатив пользователем за счет создания экспертных систем, связанных с обработкой знаний. Архитектура экспертной системы включает в себя два основных компонента: базу знаний (хранилище единиц знаний) и программный инструмент доступа и обработки знаний, состоящий из механизмов, выводов, заключений (решения), для приобретения знаний, объяснения получаемых результатов и интеллектуального интерфейса. Причем центральным компонентом экспертной системы является база знаний, которая выступает по отношению к другим компонентам как содержательная подсистема, составляющая основную ценность.
ТЕМА 3. Экспертные системы
Краткое содержание.
- Понятие экспертной системы (ЭС)
- История развития ЭС
- Классификация ЭС
- Структура ЭС
В начале восьмидесятых годов в исследованиях по СППР сформировалось самостоятельное направление, получившее название «экспертные системы» (ЭС). Цель исследований по ЭС состоит в разработке программ, которые при решении задач, трудных для эксперта-человека, получают результаты, не уступающие по качеству и эффективности решениям, получаемым экспертом.
Экспертные системы – это вычислительные информационные системы, в которые включены знания специалистов о некоторой конкретной области и которые в пределах этой области способны принимать экспертные решения.
ЭС ориентирована на решение задач, обычно требующих проведения экспертизы человеком-специалистом. В отличие от машинных программ, использующих процедуральный анализ, ЭС решают задачи в узкой предметной области на основе дедуктивных рассуждений. Такие системы часто оказываются способными найти решение задач, которые неструктурированны и плохо определены. Они справляются с отсутствием структурированности путем привлечения эвристик, т.е. выдуманных правил, что может быть полезным в тех ситуациях, когда недостаток необходимых знаний или времени исключает возможность проведения полного анализа.
Важность ЭС состоит в следующем:
- – технология ЭС существенно расширяет круг практически значимых задач, решаемых на компьютерах, решение которых приносит значительный экономический эффект;
- – технология ЭС является важнейшим средством в решении глобальных проблем традиционного программирования: длительность и, следовательно, высокая стоимость разработки сложных приложений; высокая стоимость сопровождения сложных систем, которая часто в несколько раз превосходит стоимость их разработки; низкий уровень повторной используемости программ и т.п.;
- – объединение технологии ЭС с технологией традиционного программирования добавляет новые качества к программным продуктам за счет: обеспечения динамичной модификации приложений пользователем, а не программистом; большей "прозрачности" приложения; лучшей графики; интерфейса и взаимодействия.
За период с середины 60-х годов в области ИИ достигнуты значительные успехи в создании и совершенствовании ЭС. Основные усилия здесь были сосредоточены на создании высокоэффективных программ для специализированных, профессиональных предметных областей, что, с одной стороны, привело к особому вниманию к знаниям, лежащим в основе экспертной деятельности человека, но одновременно снизило интерес к проблемно-независимой теории решения задач.
На Международной объединенной конференции по ИИ в 1977 году Э. Фейгенбаум в заказанном ему пленарном докладе высказал основополагающие соображения об ЭС, смысл которых состоит в следующем. Большие возможности ЭС определяются теми знаниями, которыми она располагает, а не конкретными формализмами и схемами вывода, которые она использует. Это новое понимание отражает существенное изменение во взглядах ученых, работающих в области ИИ. В результате многие исследователи, ощутив ограниченность слишком универсальных стратегий, начали работать над узко очерченными прикладными задачами.
К середине 70-х годов появляются первые ЭС. Несколько ученых, осознавших, что знания в этих системах занимают центральное место, предприняли попытку построить исчерпывающие теории представления знаний и создать соответствующие универсальные системы. Всего несколько лет спустя стало ясно, что эти системы многого не достигли.
В 1965 году в Стэнфордском университете был начат проект DENDRAL. Его возглавяли Брюс Бучанан (Bruce Buchanan), Эдвард Фейгенбаум (Edward Feigenbaum) и нобелевский лауреат Джошуа Ледерберг (Joshua Lederberg). В рамках проекта были созданы две системы, DENDRAL и META-DENDRAL. Система DENDRAL анализирует данные ядерного магнитного резонанса, масс-спектрографические и другие химические экспериментальные данные с целью вывода вероятных структур неизвестного химического соединения. В процессе решения в ней используется эффективный вариант метода порождения и проверки. Генератор системы в состоянии породить каждую возможную органическую структуру, удовлетворяющую содержащимся в данных ограничениям, путем систематической генерации частичных молекулярных структур, согласующихся с этими данными, и последующего уточнения их соответствия данным всеми возможными способами. Быстрое отбрасывание неоправданных структур позволяет системе обойтись без неизбежного в отсутствие такого отбрасывания экспоненциального поиска. Благодаря систематическому порождению всех вероятных структур система создает даже такие возможные решения, которые специалисты могут и упустить из виду.
Система META-DENDRAL позволяет системе DENDRAL анализировать знания, обеспечивая генерацию и последующий отбор правил фрагментации для органических структур. Она порождает и проверяет возможные разбиения структуры, исследуя экспериментальные данные и оставляя при этом те из гипотетических правил фрагментации, которые оказались достаточно полезными. Правило считается полезным, если оно применяется часто, но предлагает ошибочные разбиения очень редко. Система DENDRAL при решении своих задач превосходит всех людей, что привело к пересмотру вопроса об относительной роли человека и машины в химических исследованиях.
Программа CASNET (Causal Associational Network — причинно-ассоциативная сеть) была создана в середине 70-х годов в Рутгерском университете (США). Первоначально она использовалась при решении задачи диагностики и лечения глаукомы, и офтальмологи нашли, что она работает на уровне, близком уровню специалиста в этой области. Эта программа не просто моделирует глаукому, а содержит некоторую универсальную структуру для моделирования заболеваний. Она была одной из первых попыток создания универсальной структуры для построения ЭС. Это привело к созданию системы EXPERT, универсального инструмента, который был применен не только к глаукоме, но и к ревматизму и заболеваниям эндокринной системы.
Для моделирования заболеваний здесь используются не статические правила, как в системах MYCIN и DENDRAL, а причинная сеть, на которой программа проводит рассуждения относительно развития заболевания и последствий его лечения. Таким образом, заболевание в системе представляется как некоторый динамический процесс, о котором система может рассуждать и о котором она может сообщать пользователю. В этой программе используются также вероятностные правила, и, кроме того, она способна учесть противоречивые мнения экспертов и использовать их для выдачи нескольких возможных диагнозов.
Система MYCIN, созданная под руководством медика Шортлиффа, предназначена для консультаций по диагностике и лечению инфекционных заболеваний, и, как показали специальные исследования, даваемые ею советы, не уступают по компетентности рекомендациям врачей-профессионалов. Эта программа была создана примерно в тот же период, как и программа CASNET. Медицинские знания в системе MYCIN представлены в виде совокупности порождающих правил, снабженных коэффициентами уверенности, которые позволили реализовать вероятностное рассуждение. Правила в ней вызываются в соответствии со стратегией обратной цепочки рассуждения, благодаря чему работа системы MYCIN направляется гипотезами, поскольку система действует, отталкиваясь от своих заключений. В системе MYCIN получила также развитие идея использования одной базы данных для нескольких целей. Используя правила в соответствии с обратной цепочкой рассуждений, система MYCIN может объяснить причины выбираемых ею решений на языке своих правил и может проводить диалог, запрашивая у пользователя информацию, необходимую для продолжения такой обратной цепочки рассуждений. Эти правила, кроме того, образуют структуру, которая нашла применение в системе TEIRESIAS, используемой при получении, корректировке и применении новых знаний. Как и в случае CASNET, ясная структура системы привела к разработке более универсальной схемы ЭС (воплощенной в системе EMYCIN) и к приложениям в других областях, например к исследованию функции легких и к управлению аппаратом «искусственное легкое».
В 70-х годах было построено несколько систем понимания речи, и хотя ни одна из них не достигла того уровня работы, который ожидается от ЭС, некоторые из них, и в особенности система HEARSAY-II, разработанная в американском университете Карнеги-Меллона, существенно повлияли на дальнейшие работы в области ЭС. В HEARSAY-II использовалась глобальная рабочая память (доска объявлений), которая позволяла в некоторой однородной структуре хранить различные виды и различные уровни информации. Благодаря этому исключалась необходимость дублирующих вычислений, облегчалась модификация и упрощалась задача получения общего представления о текущем состоянии решаемой системой проблемы, что необходимо при выборе стратегии управления. Доска объявления использовалась различными источниками знаний, каждый из которых соответствовал различным типам знаний, прилагаемых к решаемой проблеме. В системе HEARSAY-II предусматривался определенный механизм концентрации внимания, так что система была в состоянии удобным образом переходить от одной интерпретации проблемы к другой. Этот подход с использованием независимых модулей знаний часто применялся в ЭС, облегчая решение задачи модификации и усвоения новых знаний.
Система PROSPECTOR, по структуре близкая к системе MYCIN, разрабатывалась SRI International с 1974 по 1983 год. Эта система выступает в качестве опытного советчика по обнаружению полезных ископаемых на основании геологических данных. Для выражения знаний в системе PROSPECTOR используются сети. В этом виде хранятся как разнообразные суждения, записанные в форме правил, так и статические знания об объектах рассматриваемой предметной области. В программе содержится система приобретения знаний KAS (knowledge acqusition system), облегчающая усвоение всех видов знаний, необходимых системе PROSPECTOR. Система KAS непрерывно запрашивает пользователя, пока не будут заполнены все отсутствующие компоненты новой структуры. Этот процесс направляется с помощью некоторой внешней грамматики, которую нетрудно видоизменить, модифицируя тем самым систему KAS по мере развития системы PROSPECTOR. Ядро системы KAS составляет сетевой редактор, «понимающий» различные механизмы, используемые в системе PROSPECTOR. Этот редактор предоставляет пользователю некоторую возможность отредактировать новые знания не в смысле их формы, а в смысле их содержания.
В настоящее время разработано достаточно большое количество ЭС, которые можно классифицировать, т. е. разбить на ряд классов по следующим признакам (рис.1):
- назначение;
- предметная область;
- сложность;
- связь с реальным временем;
- тип ЭВМ;
- степень интеграции.
Рис.1 Виды экспертных систем
По назначению классификацию ЭС можно провести следующим образом:
– диагностика состояния систем, в том числе мониторинг (непрерывное отслеживание текущего состояния);
– прогнозирование развития систем на основе моделирования прошлого и настоящего;
– планирование и разработка мероприятий в организационном и технологическом управлении;
– проектирование или выработка четких предписаний по построению объектов, удовлетворяющих поставленным требованиям;
– автоматическое управление (регулирование);
– обучение пользователей и др.
По предметной области наибольшее количество ЭС используется в военном деле, геологии, инженерном деле, информатике, экономике, космической технике, математике, медицине, метеорологии, промышленности, сельском хозяйстве, управлении процессами, физике, филологии, химии, электронике, юриспруденции.
По степени сложности ЭС делят на поверхностные и глубинные. Поверхностные ЭС представляют знания в виде правил «ЕСЛИ-ТО». Условием выводимости решения является безобрывность цепочки правил. Глубинные ЭС обладают способностью при обрыве цепочки правил определять (на основе метазнаний) какие действия следует предпринять для продолжения решения задачи. Кроме того, к сложным относятся предметные области в которых текст записи одного правила на естественном языке занимает более 1/3 страницы.
По связи с реальным временем ЭС делятся на статические и динамические. Предметная область называется статической, если описывающие ее исходные данные не изменяются во времени. Статичность области означает неизменность описывающих ее исходных данных. При этом производные данные (выводимые из исходных) могут и появляться заново, и изменяться (не изменяя, однако, исходных данных).
Если исходные данные, описывающие предметную область, изменяются за время решения задачи, то предметную область называют динамической. В архитектуру динамической ЭС, по сравнению со статической, вводятся два компонента:
- – подсистема моделирования внешнего мира;
- – подсистема связи с внешним окружением.
Последняя осуществляет связи с внешним миром через систему датчиков и контроллеров. Кроме того, традиционные компоненты статической ЭС (база знаний и механизм логического вывода) претерпевают существенные изменения, чтобы отразить временную логику происходящих в реальном мире событий.
По типу ЭВМ ЭС подразделяются на суперЭВМ, мощные ЭВМ, средней производительности, символьный процессор, рабочие станции.
По степени интеграции различают автономные, полуавтономные и гибридные ЭС. Автономные работают в режиме консультации с пользователем и не требуют привлечения традиционных методов обработки данных и расчетов. Полуавтономные требуют методов обработки данных. Гибридные ЭС – это программные комплексы, сочетающие как автономные, так и полуавтономные ЭС.
Совокупность рассматриваемых выше характеристик позволяет определить особенности конкретной ЭС. Однако пользователи зачастую стремятся охарактеризовать ЭС каким-либо одним обобщенным параметром. В этой связи говорят о поколениях ЭС. В настоящее время выделяют ЭС первого и второго поколения, но целесообразнее говорить о трех поколениях ЭС. К первому поколению следует относить статические поверхностные ЭС, ко второму— статические глубинные ЭС, а к третьему — динамические ЭС.
ЭС, прежде всего, является программным продуктом, и ее назначение- автоматизация деятельности человека. Однако принципиальным отличием ЭС от других программ является то, что она выступает не в роли ассистента, выполняющего за человека часть работы, а в роли компетентного партнера - эксперта-консультанта в какой-либо конкретной предметной области. ЭС аккумулируют в себе и тиражируют опыт и знания высококвалифицированных специалистов, позволяют пользоваться этими знаниями пользователям неспециалистам в данной предметной области. То есть, ЭС не призваны заменить собою эксперта в его непосредственной деятельности, а, напротив, расширяют возможную сферу применения знаний авторитетных специалистов. Кроме того, способности ЭС решать поставленные перед ними задачи не ослабевают со временем и не забываются при отсутствии практики, легко распространяются, так как являются компьютерной программой, прекрасно документированы, а значит и аргументированы. При многократном решении одной и той же задачи ЭС выдают одно и тоже решение в отличие от человека, который подвержен эмоциональным факторам.
Хотя указанные преимущества и очевидны, следует отметить, что ЭС не обладают интуицией и общими знаниями о мире, их ход и метод решения проблемы не может выйти за рамки тех знаний, что в них заложены. ЭС также будут бессильны при решении проблемы в изменяющихся условиях, например, при смене методики решения или появлении нового оборудования. Эксперты могут непосредственно воспринимать весь комплекс входной сенсорной информации, будь то визуальная, звуковая, осязательная или обонятельная. ЭС воспринимает только символы, которыми представлены знания. Поэтому сенсорную информацию необходимо проанализировать и преобразовать в символьную форму, пригодную для машинной обработки. При преобразовании человеком сенсорной информации неизбежно возникают искажения и потери, но классифицировать весь поток информации на значимое и второстепенное способен только человек. Так, например, любой человек сразу же выразит свое недоумение, если его попросят найти номер телефона Аристотеля, но едва ли найдется программа, которая скажет, что древнегреческие философы не пользовались телефонами.
Таким образом, назначением ЭС является консультирование по узкоспециальным вопросам при принятии решений человеком. То есть ЭС используются для усиления и расширения профессиональных возможностей их пользователей.
Обобщенная структура ЭС представлена на рис.2. Реальные ЭС могут иметь более сложную структуру, однако блоки, изображенные на рисунке, непременно присутствуют в любой действительно ЭС.
Рис.2 Структура ЭС
В целом процесс функционирования ЭС можно представить следующим образом: пользователь, желающий получить необходимую информацию, через пользовательский интерфейс посылает запрос к ЭС; решатель, пользуясь базой знаний, генерирует и выдает пользователю подходящую рекомендацию, объясняя ход своих рассуждений при помощи подсистемы объяснений.
Так как терминология в области разработки ЭС постоянно модифицируется, определим основные термины:
- пользователь - специалист предметной области, для которого преднаначена система. Обычно его квалификация недостаточно высока и поэтому он нуждается в помощи и поддержке своей деятельности со стороны ЭС.
- инженер по знаниям - специалист в области ИИ, выступающий в роли промежуточного буфера между экспертом и базой знаний.
- интерфейс пользователя - комплекс программ, реализующих диалог пользователя с ЭС как на стадии ввода информации, так и при получении результатов.
- база знаний (БЗ) - ядро ЭС, совокупность знаний предметной области, записанная на машинный носитель в форме, понятной эксперту и пользователю (обычно на некотором языке, приближенном к естественному).
- решатель - программа, моделирующая ход рассуждений эксперта на основании знаний, имеющихся в БЗ.
- подсистема объяснений -программа, позволяющая пользователю получить ответы на вопросы: «Как была получена та или иная рекомендация?» и «Почему система приняла такое решение?» Ответ на вопрос «как» - это трассировка всего процесса получения решения с указанием использованных фрагментов БЗ, т.е. всех шагов цепи умозаключений. Ответ на вопрос «почему» - ссылка на умозаключение, непосредственно предшествовавшее полученному решению, т.е. отход на один шаг назад. Развитые подсистемы объяснений поддерживают и другие типы вопросов.
- интеллектуальный редактор БЗ - программа, представляющая инженеру по знаниям возможность создавать БЗ в диалоговом режиме. Включает в себя систему вложенных меню, шаблонов языка представления знаний, подсказок («help» - режим) и других сервисных средств, облегчающих работу с базой.
ТЕМА 4. Базы знаний
Краткое содержание.
- Понятие баз знаний
- Классификация баз знаний
- Признаки баз знаний
- Особенности проектирования баз знаний
База знаний - семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом интеллектуальных и экспертных систем.
|
База знаний – это особого рода база данных, разработанная для оперирования знаниями. Полноценные базы знаний содержат в себе не только фактическую информацию, но и правила вывода, допускающие автоматические умозаключения о вновь вводимых фактах и, как следствие, осмысленную обработку информации |
Современные базы знаний обычно работают совместно с продвинутыми системами поиска информации и имеют тщательно продуманную структуру и формат представления знаний.
Наиболее важными требованиями к информации, хранящейся в базе знаний интеллектуальной системы, являются:
- достоверность конкретных и обобщённых сведений, имеющихся в базе данных
- релевантность информации, получаемой с помощью правил вывода базы знаний
- качество содержащихся знаний. Лучшие БЗ содержат самую свежую информацию, имеют совершенные системы поиска и тщательно продуманную структуру и формат знаний.
Существует несколько видов баз знаний, которые классифицируют:
По содержимому:
- географические;
- исторические;
- научные;
- мультимедийные.
В зависимости от уровня сложности систем, в которых применяются базы знаний:
- БЗ всемирного масштаба
- национальные
- отраслевые
- БЗ организаций
- БЗ экспертных систем
- БЗ специалистов
По предназначению:
- Персонифицированные Базы Знаний (ПБЗ). ПБЗ предназначены для многофункциональной обработкой больших объемов индивидуализированной, многосвязной, постоянно меняющейся информации о людях.
- Аналитические Базы Знаний (АБЗ). Принятие сложных управленческих решений возможно только на основе всестороннего и многовариантного анализа хранящейся в системе информации. Анализ созданной базы знаний производят компьютерные программы, кроме того с ней работают люди, благодарю чему аналитическая база имеет удобный интерфейс. Правильная организация созданной базы знаний позволит в считанные секунды производить огромные выборки и исчисления без значительной нагрузки системы. АБЗ обеспечивает создание хранилища информации с «универсальной» структурой, инвариантной относительно разных видов анализа, разных видов прикладных задач и предметных областей с возможностью гибкой и быстрой настройки системы на проведение любого вида анализа. На основе АБЗ возможно построение системы поддержки процесса принятия решения.
- Активная система управления сбором и анализом информации. При принятии управленческих решений, как правило, необходимо осуществлять обработку больших объемов информации в ограниченное время. В этом случае критической становится проблема направленного выбора и обработки на каждом из этапов решения задачи из всей имеющейся информации только отдельных ее фрагментов, существенных именно в данное время и в данном месте. Активная система обеспечивает управление сбором информации, самостоятельно (автоматически) решает, какая информация в текущий момент времени является наиболее важной, где она находится, какие процедуры должны быть осуществлены для ее получения и т. д. Система обеспечивает выполнение следующих функций:
- Управление регулярным сбором информации по заранее определенной схеме с автоматическим формированием соответствующих запросов;
- Контроль своевременности поступления регулярной информации и ее соответствия запросам;
- Выявление и прогнозирование возможности возникновения экстраординарных ситуаций;
- Определение потенциальных источников, предположительно содержащих нужную информацию, и формирование к ним разовых запросов.
Что касается технологии баз данных, существует 5 особенностей, определяющих ту грань, за которой данные превращаются в знания, а БД – в базы знаний.
- Интерпертация. Данные, хранимые в памяти ЭВМ, могут интерпретироваться только соответствующей программой. Данные без программы не несут никакой информации, в то время как знания имеют интерпретацию, поскольку они содержат одновременно и данные, и соответствующие им имена, описания
- Структурированность. Данные должны обладать гибкой структурой. Каждая информационная единица может быть включена в состав любой другой, и из каждой такой единицы можно выделить составляющие ее элементы. Между определенными единицами знаний можно установить такие отношения, как “элемент - множество”, “тип - подтип”, “ситуация - подситуация”. Это позволяет в одном экземпляре хранить информацию, одинаковую для элементов множества.
- Связность. В БД между информационными единицами устанавливаются связи различного типа, характеризующие отношения между объектами, явлениями и т. п.
- Активность. Разделение информационных единиц на данные и программы (команды) привело к тому, что данные пассивны. Для ИИС знания инициируют действия. Появление в информационной базе новых фактов, установление связей может стать источником активности системы.
- Семантическая метрика. На множестве информационных единиц в некоторых случаях полезно задавать отношения, характеризующую ситуационную близость этих единиц. Это отношение релевантности информационных единиц, которое позволяет находить знания, близкие к имеющимся. Различают 2 формы представления знаний: декларативную и процедурную. Декларативные знания не содержат в явной форме процедур, которые нужно выполнить. Такие знания содержат в явном виде описание некоторых процедур. Состояние объекта представляется в виде набора процедур, с помощью которых обрабатывается определенный участок Б3. Процедурные знания обеспечивают более быстрый поиск решения по сравнению с декларативным, однако, уступают им в возможности накопления и актуализации знаний.
Рассмотрим этапы проектирования базы знаний.
Этап 1.
- Идентификация решаемых задач и текстовое описание их предметной области
- Выделение и графическое представление понятий и их связей.
- Синтез однородной или расширенной семантической сети.
- Представление знаний о предметной области и решаемых задачах.
Важным является определение типа задачи. Специфика применения баз знаний обуславливает деление задач на 2 типа.
Первый тип характеризуется трудностями в формализации, неизвестностью последовательности шагов решения, отсутствием алгоритма, применением эвристических методов, большим объемом операции вычислительного и информационно-поискового характера.
Второй тип отличается от первого наличием хорошо формализованных алгоритмов, использованием операций поискового и информационно-справочного характера, ориентацией на вычислительные процедуры, большим объемом обрабатываемых данных.
Тип задачи, как правило, зависит от целей ее решения. Цели и подцели могут формулироваться с помощью методов получения информации в процессе общения со специалистом.
Этап 2.
Здесь происходит первичная формализация знаний, полученных на предыдущем этапе. Предусматривается выполнение следующих подэтапов:
- Выделение из предложений текста описание понятий, отражающих объекты, процессы и состояния.
- Определение направления связей между понятиями.
- Графическое определение понятий и связей, присутствующих в отдельных предложениях текста.
Этап 3.
Предназначен для синтеза разрозненных графических представлений в единую семантическую сеть. Достигается это выполнением таких подэтапов:
- Выделение, если это целесообразно, на основании анализа количества значений аргументов предикатов, частоты и объектов корректировки предикатов-файлов.
- Выполнение синтеза семантической сети с помощью правил конъюнкции и интеграции.
- Преобразование, если этого требуют условия, унарных и тарных предикатов в бинарные.
- Дополнение семантической сети, если этого требуют условия, иерархическими, ассоциативными, симметричными, антирефлексивными и транзитивными связями.
Этап 4.
На последнем этапе осуществляется трансформация графического изображения базы знаний в формальное. Этап делится на 2 подэтапа:
- Формульно-предикатное представление базы фактов.
- Формульное представление базы правил.
Применение БЗ
Базы знаний могут использоваться для создания экспертных систем и хранения данных об организации: документации, руководств, статей технического обеспечения. Главная цель создания таких баз — помочь менее опытным людям найти существующее описание способа решения какой-либо проблемы предметной области.
ТЕМА 5. Хранилища данных
Краткое содержание.
- Предпосылки появления концепции хранилищ данных
- Определение и принципы построения хранилищ данных
- Преимущества хранилищ данных
Идею хранилищ данных предвосхищали в своих работах многие исследователи. Первой публикацией, посвященной именно хранилищам данных была статья Девлина и Мэрфи, вышедшая в 1988 году. В 1992 году Уильям Г. Имон написал монументальную монографию «Построение хранилищ данных» в которой определил хранилища данных как «предметно — ориентированную, интегрированную вариантную по времени, не разрушаемую совокупность данных, предназначенную для поддержки принятия управленческих решений.
При появлении первых информационных систем поддержки принятия решений — информационных систем менеджмента (см. тему 1) потребители корпоративных данных из разных функциональных подразделений компании разрабатывали собственную неупорядоченную среду принятия решений. Служащие разных подразделений создавали собственные базы со своей структурой; определения данных и способы вычисления значений полей разнились от одного пользователя к другому. Для поддержки данных в актуальном состоянии пользователи тратили много времени на сопровождение собственных баз данных. Если локальные данные не обновлялись вовремя, то из неверны данных делались неправильный выводы.
Корпоративные пользователи, пытающиеся работать с неструктурированной унаследованной информационной средой, сразу же столкнулись с проблемой ания взаимосвязи между различными бункерами данных. Отсутствие общего взгляда на то, какие элементы данных в разных бункерах считать одинаковыми, приводили в замешательство как корпоративных пользователей, так и представителей ИТ-подразделений. Специалисты функциональных подразделений обвиняли во всем специалистов ИТ-подразделений, так как два разных отчета, которые должны были вырабатывать одинаковые значения для одинаковых показателей представляли совершенно разные цифры. Это приводило к тому, что лица, принимающие или готовящие решения в организации, докладывали на совещаниях о совершенно разных значениях, относящихся к одним и тем же показателям.
И хотя в данной ситуации напрашивались на первый взгляд очевидные выводы о том, что либо ИТ-подразделение недостаточно компетентно, либо коллеги по бизнесу не вполне откровенны, обычно ни один из них не соответствовал действительности. Основная причина возникновения такой парадоксальной ситуации в следующем - числовые значения показателей в отчетах вычислялись с использованием различных данных, взятых из разных подсистем — источников, в которых они могли, во-первых, определяться по-разному, а во-вторых — различаться по временному признаку. Таким образом, основной причиной недоразумений была хаотичная, неструктурированная среда поддержки принятия решений.
Главная задача построения хранилищ данных - это задача построения единой согласовано функционирующей информационной системы, на основе неоднородных программных средств и решений. И уже сам выбор средств реализации хранилища данных становится чрезвычайно сложной задачей. Здесь должно учитываться множество факторов, включая, взаимную совместимость различных программных компонент, легкость их освоения и использования, эффективность функционирования, стабильность и даже формы, уровень и потенциальную перспективность взаимоотношений различных фирм производителей
|
Хранилище данных (англ. Data Warehouse) — предметно-ориентированная информационная корпоративная база данных, специально разработанная и предназначенная для подготовки отчётов, анализа бизнес — процессов с целью поддержки принятия решений в организации. |
Хранилище данных по сути представляет собой центр, в который собирается вся необходимая информация из различных подразделений предприятия. Прежде чем попасть в хранилище, данные должны быть соответствующим образом обработаны. БД, в которых происходит накопление, обработка первичных данных, на основании которых строится хранилище, будем далее называть транзакционными. Разные отделы могут использовать неодинаковые системы обработки со своими транзакционными БД. Соответственно, прежде чем использовать эти разрозненные данные, их нужно проанализировать. Этот процесс занимает весьма длительный период в процессе подготовки к созданию хранилища (см. рисунок 1).
Рисунок 1. Основные принципы организации хранилища данных -
- Проблемно-предметная ориентация. Данные объединяются в категории и хранятся в соответствии с областями, которые они описывают, а не с приложениями, которые они используют.
- Интегрированность. Данные объединены так, чтобы они удовлетворяли всем требованиям предприятия в целом, а не единственной функции бизнеса. При перенесении данных из оперативной системы в хранилище они преобразуются. Различного рода несоответствия в кодировании, типах данных и других свойствах, присущих исходной системе, устраняются.
- Некорректируемость. Данные в хранилище данных не создаются: т.е. поступают из внешних источников, не корректируются и не удаляются. В то время как опертивная система выполняет над хранимыми данными операции обновления, удаления и другие, в хранилище помещается большой объем данных, которые будучи раз загруженными, уже никогда не подвергаются каким — либо изменениям, вследствие чего два разных корпоративных пользователя, выполняющих один и тот же запрос к хранилищу данных в рзное время получат один и тот же результат.
- Независимость от времени. Если оперативная система содержит только текущие данные, то системы хранилищ данных содержат как исторические данные, так и данные которые имели статус текущих при последней загрузке хранилища.
Хранилища данных строятся на базе клиент — серверной архитектуры, реляционной СУБД и утилит поддержки принятия решений.
Рисунок 2
На рисунке 2 показана концептуальная модель хранилища данных, которая показывает его основные свойства. Данные извлекаются из оперативной системы и внешних источников и помещаются в хранилище. Оперативные и внешние источники поставляют также данные о данных, или метаданные, в репозиторий хранилища. В дополнение к обычным данным из хранилища в репозиторий пересылаются метаданные, сгенерированные с использованием модели данных хранилища. Пользователь деловой информации, или потребитель информации, формирует запрос на данные к средствам представления информации, которые, в свою очередь, генерируют запрос, направляемый хранилищу данных. Если потребитель информации обладает необходимыми правами доступа к ней, как это определено метаданными, хранилище возвращает данные средствам представления информации и информация передается потребителю. Потребитель информации может также посмотреть, как данные хранятся в репозитории метаданных.
Основой хранилища данных являются не внутренние, как в большинстве традиционных СОД, а внешние источники данных.
- различного рода ИС,
- электронные архивы,
- общедоступные и коммерческие электронные каталоги,
- справочники,
- статистические сборники.
Совершенно очевидно, что потребитель информации из того или иного подразделения организации должен иметь доступ к данным в хранилище. Причем способ доступа должен быть осмысленным, эффективным и естественным. Такой способ предполагает наличие специальных средств доступа к данным. Большинство программных средств предоставления информации рассчитаны на использование определенных типов рабочих станций. Подобные средства обладают широчайшими функциональными возможностями. К основным типам средств работы с информацией относятся перечисленные ниже категории приложений и средств программирования -
- географические информационные системы (ГИС)
- средства интеллектуального анализа данных (data minig)
- системы аналитической обработки в реальном времени (on-line analytical processing systems – OLAP – системы)
- реляционные OLAP – системы (Relational OLAP – ROLAP)
- многомерные OLAP – системы (Multidimensional OLAP – MOLAP)
- средства визуализации данных
- информационные системы руководителей (Executive Information System – EIS)
- средства обработки статистики
- браузеры Интернет
- языки программирования четвертого поколения
- средства разработки графического интерфейса пользователя
- электронные таблицы
- генераторы отчетов
- средства доступа к данным
Хотя каждое из этих средств отличается своими преимуществами и недостатками, функциональными возможностями и соотношением цена — эффективность. Несмотря на свое разнообразие, все без исключения функции, присущие OLAP- и EIS - системам помогают пользователям формировать сложные запросы к данным и генерировать отчеты, графики и диаграммы. Эти средства имеют, как правило, стандартный меню — ориентированный интерфейс. Программные средства называются средствами аналитической обработки в реальном времени, поскольку потребитель информации выполняет анализ данных непосредственно в процессе подключения к хранилищу данных, а не читает заранее подготовленный отчет.
Средства добычи данных и статистики используются для поиска в данных закономерностей и трендов, или аномальных данных, которые нарушают общие закономерности.
Геоинформационные системы связывают данные с географическим понятиями. Пользуясь средствами эти систем можно определить интересные в географическом аспекте факты, например, связанные с территориальной диверсификацией продукции или услуг компании.
Все программные инструменты — языки программирования четвертого поколения, средства визуального проектирования графического пользовательского интерфейса, генераторы отчетов обеспечивают возможности создания специализированных средств доступа и отчетов, отвечающих специфическим требованиям организации или функциональных подразделений.
Типичная архитектура хранилища данных представлена представлена на рисунке 3.
Рисунок 3.
Менеджер загрузки ( load manager ) выполняет операции, связанные с извлечением и загрузкой данных в ХД.
Менеджер хранилища ( warehouse manager ) выполняет операции, связанные с управлением информацией, помещенной в ХД:
- анализ непротиворечивости данных;
- создание индексов и представлений для базовых таблиц;
- денормализация данных (при необходимости);
- обобщение данных (при необходимости);
- резервное хранение и архивирование
Менеджер запросов ( query manager ) выполняет операции, связанные с управлением пользовательскими запросами.
Перечислим главные преимущества хранилищ данных:
- Единый источник информации: компания получает выверенную единую информационную среду, на которой будут строиться все справочно-аналитические приложения в той предметной области, по которой построено хранилище. Эта среда будет обладать единым интерфейсом, унифицированными структурами хранения, общими справочниками и другими корпоративными стандартами, что облегчает создание и поддержку аналитических систем. Также, при проектировании информационного хранилища данных особое внимание уделяют достоверности информации, которая попадает в хранилище.
- Производительность: физические структуры хранилища данных специальным образом оптимизированы для выполнения абсолютно произвольных выборок, что позволяет строить действительно быстрые системы запросов.
- Быстрота разработки: специфическая логическая организация хранилища и существующее специализированное ПО позволяют создавать аналитические системы с минимальными затратами на программирование.
- Интегрированность: интеграция данных из разных источников уже сделана, поэтому не надо каждый раз производить соединение данных для запросов требующих информацию из нескольких источников. Под интеграцией понимается не только совместное физическое хранение данных, но и их предметное, согласованное объединение; очистку и выверку при их формировании; соблюдение технологических особенностей и т.д.
- Историчность и стабильность: OLTP-системы оперируют с актуальными данными, срок применения и хранения которых обычно не превышает величины текущего бизнес-периода (полугода-год), в то время как информационное хранилище данных нацелено на долговременное хранение информации в течении 10-15 лет. Стабильность означает, что фактическая информация в хранилище данных не обновляется и не удаляется, а только специальным образом адаптируется к изменениям бизнес-атрибутов. Таким образом, появляется возможность осуществлять исторический анализ информации.
- Независимость: выделенность информационного хранилища существенно снижает нагрузку на OLTP-системы со стороны аналитических приложений, тем самым производительность существующих систем не ухудшается, а на практике происходит уменьшение времени отклика и улучшение доступности систем.
|