Конспект лекцій 2004 Загальна теорія систем. Конспект лекцій Для студентів денної І заочної форм навчання спеціальності 080200 "Інформатика"/Укл.

Вид материалаКонспект

Содержание


6.1 Требования к исходной экспериментальной информации
6.3 Оптимизация мозаичной модели.
6.4 Решение с помощью ММП главной задачи искусственного интеллекта – “получение новых знаний из экспериментальных данных”.
6.5 Область применения метода мозаичного портрета
6.6 Использование мозаичной модели для компьютерного эксперимента.
Подобный материал:
1   2   3   4   5
Тема 6. РЕДУКЦИЯ К СИСТЕМНЫМ СВОЙСТВАМ ИЗУЧАЕМОЙ СИСТЕМЫ, ПРЕДСТАВЛЕННОЙ В ВИДЕ “ЧЁРНОГО ЯЩИКА”. МЕТОД МОЗАИЧНОГО ПОРТРЕТА (ММП) – НОВЫЙ МЕТОД ИЗУЧЕНИЯ “БОЛЬШИХ СИСТЕМ”

Известно, что с помощью известных математических методов континуальной (непрерывной, численной) математики невозможно построить адекватную модель реальной сложной («большой») системы.

В сравнительно несложных задачах непрерывная математика позволяет получать аналитическим путем явные решения и обеспечивает наглядное представление закономерностей, связывающих значения входных параметров и выходных показателей. Для решения сложных задач – построения математических моделей «больших систем» по экспериментальным данным корректные математические методы не известны.

«Описанием закономерностей в механике, физике и астрономии исчер-пываются конструктивные достижения непрерывной математики. В терми-нах непрерывной математики ставятся и исследуются относительно "хоро-шие" задачи. В терминах дискретной математики требования к фор-мали-зации задачи менее жесткие». (Юдин Д.Б., Юдин А.Д. Число и мысль. Вып.8 (Математики измеряют сложность). - М: Знание, 1985.-192 с.)

При переходе к измерению входных параметров и выходных показателей изучаемой системы в дискретных шкалах задача построения математической модели существенно упрощается. Уходят проблемы структурной и параметрической идентификации модели, появляется возможность корректной формальной свёртки вектора выходных показателей в обобщённый критерий.

«С некоторых пор не только физики и представители других естествен-ных наук, но и математики начинают склоняться к целесообразности опи-сания реальных явлений не на языке математики бесконечного и непрерыв-ного, а на языке математики конечного и дискретного». (Юдин Д.Б., Юдин А.Д. Математики измеряют сложность).

Но, так же как и в методах континуальной математики, в дискретной математике остаётся нерешённой проблема размерности задачи (количества входных параметров).

Поэтому задачи дискретной идентификации и оптимизации являются наиболее трудными, так как для них до настоящего времени, за исключением частных случаев, не найдены общие методы решения, кроме полного перебора всех возможных вариантов. Поскольку полный перебор характеризуется экс


поненциальным ростом времени от размерности задачи, то задачи изучения «больших систем» являются практически неразрешимыми.

Задача состоит в том, чтобы найти общий алгоритм, позволяющий для си-стем с практическими любыми размерностями векторов входных параметров и выходных показателей на основании исходных экспериментальных данных с помощью формальных процедур получать новые, нетривиальные, непротиво-речивые на данном экспериментальном материале знания, сформулиованные в виде гипотез, описывающих полученные зависимости на языке соответствую-щей предметной области)

Для решения задач построения математических моделей изучаемых систем по экспериментальным данным разработан, математически обоснован и прошел успешную экспериментальную проверку новый метод математического моделирования - метод мозаичного портрета (ММП).

ММП является единственным из методов дискретной математики, который позволяет за приемлемое время строить математические модели сложных сис-тем с практически неограниченной размерностью векторов входных парамет-ров и выходных показателей.

Следует отметить, что задача дискретной идентификации «больших систем» до разработки ММП считались NP-полной, т.е. практически неразрешимой за приемлемое время.

Например, с помощью ММП задача идентификации системы (решалась задача поиска различий между врожденной и приобретённой шизофренией) по экспериментальным данным с 98 входными параметрами была решена за 11 минут. По тем же данным усечённая задача (10 параметров) методом перебора была решена за 21 сек. Расчётное время на решение полной задачи перебором составило бы 21*3(98-10) сек или 7.4*1035 лет (здесь 3 - число поддиапазонов, на который делились диапазоны вариаций значений каждого параметра при переходе к дискретным шкалам).


6.1 Требования к исходной экспериментальной информации

Исходной информацией для построения мозаичной модели служит таблица экспериментальных данных (см. таблица 1, тема 5), каждая строка которой содержит значения входных параметров и выходных показателей в одной реализации изучаемой системы.

Например, при идентификации технологических процессов под реализацией системы понимается:

- в периодических производствах - операция (в малотоннажной химии), плавка (в конвертерном, мартеновском и электропечном производстве стали) и т.п.;

- в непрерывных производствах - средние значения входных параметров и выходных показателей за фиксируемый промежуток времени, превышающий время пребывания обрабатываемой среды в технологической схеме (например,


среднесуточные значения в доменном процессе или среднесменные значения в некоторых непрерывных химических производствах).

При количестве входных параметров до 30 число строк таблицы исходного экспериментального материала должно быть не менее 50. При количестве строк порядка 100 адекватность модели может быть гарантирована практически для любых, имеющей практическое значение, систем.


6.2 Алгоритм построения математической (мозаичной) модели Y=F(X1, X2….Xn) с помощью ММП.

Сущность метода мозаичного портрета заключается в:

1. Свертке множества выходных показателей в обобщенный критерий Yоб, измеряемый в дискретных шкалах наименований и принимающий два значения: 1-"хорошо", если все частные выходные показатели в данной реализации процесса удовлетворяет заданным ограничениям, и 0 -"плохо", если хотя бы один из этих показателей не удовлетворяет заданным ограничениям.

2. Формализованном переходе к измерению входных параметров в дискретных шкалах.

Диапазон вариаций параметра Х1 делится на 3 поддиапазона из условия попадания в каждый поддиапазон одинакового количества опытов (примерно одинакового - если число опытов в таблице экспериментального материала не кратно 3 или по разные стороны границы между двумя поддиапазонами находятся одинаковые значения). Границы поддиапазонов определяются как средние между значениями в последнем опыте предыдущего и первом опыте последующего поддиапазонов. Каждому поддиапазону присваивается порядковый номер (код). Каждое значение входного параметра Xi кодируется - вместо численного значения записывается код поддиапазона, в который попадает это значение.

3. Переходе от исходной таблице экспериментальных данных к новой таблице, в которой все значения входных параметров и выходных показателей приведены в дискретных шкалах в соответствии с пп. 1 и 2.

4. Организации полиномиальной по трудозатратам формализованной процедуры, позволяющей в таблице (см.п.3) находить сочетания кодов поддиапазонов входных параметров, которые встречаются только в опытах с обобщенным критерием (Yоб), имеющим значение 1, и отсутствуют во всех опытах с Yоб=0 (строится модель «хорошего» класса). Затем процедуру повторяют - ищут сочетания кодов поддиапазонов входных параметров, которые встречаются только в опытах с Yоб =0) и отсутствуют во всех опытах с Yоб=1 (строится модель «плохого» класса).

Полученное при реализации п.4 множество сочетаний (высказываний) сос-тавляет мозаичную модель изучаемого процесса.


6.3 Оптимизация мозаичной модели.

Мозаичная модель содержит очень большое количество конъюнкций (выс- казываний). Высказывания мозаичной модели неравноценны по силе. Одни из них встречаются во множестве строк исходной таблицы, другие в 1-ой – 2-ух строках.

Оптимизация мозаичной модели заключается в выборе из множества высказываний минимально необходимого их подмножества, достаточного для надёжного решения задач диагностики состояния, прогноза поведения и оптимизации изучаемой системы.

Алгоритм оптимизации мозаичной модели.

1.Выбирают высказывание, которое чаще всего встречается в строках таб-лицы исходного экспериментального материала, и переносят его в перечень высказываний опмизированой модели.

2. Из таблицы экспериментального материала удаляют все строки, в кото-рых встречалось сочетание кодов поддиапазонов, соответствующее высказы-ванию, выделенному по п.1.

3 Находят высказывание, которое чаще всего встречается в таблице, остав-шейся после выполнения п.2 и переносят его в перечень высказываний опти-мизированой модели.

4. Повторяют пп.2,3 до тех пор, пока из таблицы исходного экспериментального материала не будут удалены все строки.


6.4 Решение с помощью ММП главной задачи искусственного интеллекта – “получение новых знаний из экспериментальных данных”.

Каждое из полученных высказываний мозаичной модели интерпретирует-ся как формальная, непротиворечивая на данном экспериментальном матери-але гипотеза, описывающая зависимость выходного показателя (комплекса выходных показателей) от взаимного влияния различных сочетаний входных параметров изучаемой системы (объекта, процесса, явления).

При количестве выходных показателей более 1-го практически все полу-ченные гипотезы являются новыми, нетривиальными, неизвестными ранее эк-пертам. Аналогично, при одном выходном показателе нетривиальными явля-тся практически все полученные гипотезы, включающие более 2-ух входных параметров.

В случае необходимости выходной показатель может принимать более двух дискретных значений. Например, при дифференциальной диагностике более чем двух близких по проявлениям заболеваний.

Таким образом, с помощью метода ММП решается одна из важнейших задач искусственного интеллекта - формализованное конструирование гипотез по матрице экспериментальных данных. (Получение знаний из данных). Причём новые знания выделяются в виде системных гипотез, описывающих взаимное влияние входных параметров системы на её выходной показатель (ком


плекс выходных показателей) на языке той предметной области, в которой строится математическая модель.

Обычно при обсуждении со специалистами в соответствующей предметной области формальные гипотезы делятся на 3 группы:

- тривиальные: - "это всё давно уже известно из литературы, (патентных данных, личного опыта и т.п.)";

- не сформулированные ранее, но не вызывающие особых возражений, поскольку соответствуют имеющейся априорной информации и сложившимся представлениям;

- вызывающие резко отрицательное отношение типа: "этого не бывает потому, что этого не может быть никогда".

Поскольку построение мозаичной модели осуществляется с помощью фор-мализованной процедуры, трииальные гипотезы подтверждают эффективность метода мозаичного портрета и служат дополнительным доказательством того, что гипотезы 3-ей группы корректны.

Содержательная интерпретация нетривиальных гипотез специалистами в соответствующей предметной области позволяет им осознать новые систем-ные закономерности, «прорваться» в недосягаемую для них ранее область системных знаний об изучаемой системе и существенно уменьшить её энтропию.

При идентификации изучаемых систем с помощью ММП не формализован-ым остаётся только этап выбора перечня входных параметров и выходных пока-ателей. Однако и на этом этапе во многих случаях не возникает особых труд-остей, т.к. априорная информация, которой располагают специалисты по этим вопросам, достаточно велика, а в некоторых случаях (например, при изучении технологических процессов) перечни входных параметров и выходных показа-елей заданы в технологическом регламенте. То есть информация о них является уже не априорной, а директивной).


6.5 Область применения метода мозаичного портрета

Метод мозаичного портрета (ММП) может быть использован для идентификации систем (объектов, процессов, явлений) любой физической природы, с практически любым количеством входных параметров и выходных показателей, которые могут быть представлены в виде «чёрного» ящика с n входами и k выходами.

Исходными данными для построения математической модели является таблица экспериментального материала, полученного в режиме наблюдения за изучаемой системой. Каждая строка такой таблицы должна содержать зна-чения входных параметров и выходных показателей в одной реализации системы.

С помощью ММП могут быть получены общие закономерности каких-либо процессов, освобождённые от влияния индивидуальных особенностей объек


тов, на которых собиралась исходная экспериментальная информация. Например:

- По экспериментальной информации, характеризующей процесс доменной плавки, полученной с различных домен, можно выявить общие закономерности доменного процесса, освобождённые от влияния индивидуальных особенностей каждой из них.

- По экспериментальной информации, собранной для построения модели дифференциальной диагностики внутри группы близких по проявлениям заболеваний, можно найти дифференциальные синдромы, специфичные для каждой болезни, независимо от показателей, характеризующих индивидуальность больного.


6.6 Использование мозаичной модели для компьютерного эксперимента.

Для решения задач диагностики состояния и прогноза поведения сложных систем используется один и тот же алгоритм построения математической модели. Разница заключается только в используемом исходном экспериментальном материале:

- Для построения модели диагностики используется информация о значениях входных параметров и выходных показателей, фиксируемых в одной реализации изучаемой системы.

- Для построения модели прогноза используется информация о значениях входных параметров в заданный начальный период, а выходных показателей – после реализации последствия, осложнения и т.п.


6.6.1 Диагностика состояния “больших систем”

Сущность компьютерного эксперимента при диагностике состояния “боль-ших систем” заключается в следующем.

Дано: Мозаичная модель изучаемой системы;

Необходимо: По экспериментальном данным, характеризующим новые ре-ализации изучаемой системы, не использованные при построении мозаичной модели, определить к какому классу относятся эти реализации.

Например:

В медицине, при дифференциальной диагностике близких по проявлениям заболеваний, необходимо определить какая именно болезнь у данного больно-го.

В технологии необходимо определить причины, которые приводят к сни-жению качества работы процесса по интересующим специалиста выходным показателям

Алгоритм диагностики состояния системы

1. Строка значений всех входных параметров реализации системы коди-руется кодом, принятым при построении мозаичной модели.

2. Сопоставление строки по п.1 с высказываниями мозаичной модели позволяет выделить в ней сочетания кодов поддиапазонов полностью совпадающие с какими-либо высказываниями (формальными гипотезами) мозаичной модели.

3 Если в анализируемой строке встречаются высказывания:

- только одного класса - принимается решение о принадлежности этой строки к соответствующему классу;

- разных классов - вопрос о принадлежности строки к определённому клас-су принимается с помощью голосования - по большинству высказываний од-ного из классов

В некоторых случаях (жесткие требования к выходному показателя в тех-нических системах) к “плохому” классу относят строку, в которой встречает-ся хотя бы одно высказывание “плохого” класса.

В медицинской диагностике, в случае, если одна болезнь может переходить в другую, более тяжёлую (например, при дифференциальной диагностике “яз-венная болезнь желудка – раковая болезнь желудка”) наличие у больного хотя бы одного симптом – комплекса (дифференциального синдрома) раковой бо-лезни при множестве синдромов язвенной болезни желудка может быть интер-претировано как ранняя стадия рака.

С помощью мозаичной модели изучаемой системы можно осуществить имитационное моделирование (компьютерный эксперимент). Суть этого экс-перимента заключается том, что для любой гипотетически заданной строки, отражающей поведение изучаемой системы, с помощью модели может быть получена оценка значения её выходного показателя (комплекса выходных показателей).


6.6.2 Прогнозирование поведения “больших систем”

Сущность компьютерного эксперимента при прогнозировании поведения “больших систем” заключается в следующем.

Дано: Мозаичная модель изучаемый системы, построенная по эксперимен-тальному материалу, в котором входные параметры фиксировались во время наблюдения за изучаемой системой, а выходные показатели – после того, ког-да становились известными их значения.

Необходимо: По экспериментальном данным, характеризующим новые ре-ализации изучаемый системы, не использованные при построении мозаичной модели, прогнозировать к какому классу будут относиться эти реализации че-рез промежуток времени, по прошествии которого проявится значение выход-ных показателей.

Например:

В медицине, при прогнозе осложнений (или последствий) болезни необхо-димо определить какое именно осложнение или последствие болезни будет у данного больного через определённый промежуток времени.


В технологии, в случае, когда для оценки качества полученного продукта требуется длительное время (например, в производстве красителей полу-ченный продукт необходимо выделить, приготовить из него выпускную фор-му, окрасить последней соответствующий вид ткани, окрашенный образец поместить в ксенотест и только через некоторое время получить показатели качества испытываемого образца)

В медицине, например, при инфаркте миокарда в остром периоде возника-ет задача прогноза одного из его возможных осложнений (кардиогенный шок, недостаточность кровообращения, отёк лёгких, фибрилляция желудочков или осложнение не наступает). Сложность задачи состоит в том, что осложнение наступает через 3 - 40 суток после возникновения инфаркта, а соответствую-щую каждому осложнению специфическую терапию необходимо назначать в первые сутки проявления инфаркта.

Алгоритм прогноза поведения системы полностью совпадает с приведен-ным выше алгоритмом диагностики состояния системы.

С помощью мозаичной модели изучаемой системы можно осуществить имитационное моделирование (компьютерный эксперимент). Суть этого экс-перимента заключается том, что для любой гипотетически заданной строки, отражающей состояние изучаемой системы в данный момент времени модели может быть получена оценка значения её выходного показателя через опреде-лённый интервал времени.

Выводы

1. С помощью метода мозаичного портрета решается основная задача ис-кусственного интеллекта – получение с помощью формализованных процедур новых, нетривиальных, не известных ранее специалистам системных знаний об изучаемом объекте (процессе, явлении, системе).

2. На основании этих знаний можно формализовать методы решения ос-новных задач, возникающих при изучении больших систем: диагностики сос - тояния, прогноза поведения и оптимизации по заданным критериям и комп-лексам этих критериев.


ЛИТЕРАТУРА

1. Катренко А.В. Системний аналiз об’єктiв та процесiв комп’ютерiзацiї. – - Львів: «Новий свiт – 2000», 2003. – 424 с.

2. Войлов Ю.Г. Элементы теории систем и системного анализа. – Луганск: изд-во ВГУ им. В. Даля, 2002. – 310 с.

3. Кухтенко А.И. Кибернетика и фундаментальные науки. - К.: Наукова думка, 1987. - 144 с.

4. Кафаров В.В., Дорохов И.Н. Системный анализ процессов химической технологии. - М.: Наука, 1976. - 500 с.


5. Р.Шенон. Имитационное моделирование систем - искусство и наука. - М.: "Мир", 1987. – 418 с.

6. Моисеев Н.Н.. Математические задачи системного анализа. - М.: Наука, 1981. - 488 с.

7. Юдин Д.Б., Юдин А.Д. Математики измеряют сложность. - М.: Знание, 1985. -192 с.)

8. Расстригин Л.А. Современные принципы управления сложными объек-тами.- М.: Советское Радио, 1980. - 232 с.

9. Ивахненко А.Г., В.С. Степашко В.С. Помехоустойчивость моделирова-ния. – Киев: Наукова думка, 1985. -216 с.

10. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. - М.: "Ста-тистика", 1973. –392 с.).