Роль алгоритмов самоорганизации в ИТ обработки сигналов. Рассмотрим три объекты разной физической природы - расплав железоуглеродистого металла, сердце человека и биологическую жидкость (кровь, слюна и т.п.). Несмотря на различие физической природы этих объектов, для них правомерна общая рабочая гипотеза (1): объекты порождают сигналы, несущие ценную информацию об их состоянии (рис. 5).
Рис.5. Примеры практических задач
Остановимся вначале на первом примере. Известно [10], что всякое кристаллическое тело данного химического состава имеет вполне определенную температуру плавления (затвердевания). Именно этот закономерный факт и был положен нами в основу ИТ “ТЕРМОГРАФ” для косвенного контроля химического состава и прогнозирования механических свойств литейных чугунов [11]. Естественно, что при реализации такой технологии нам пришлось заниматься идентификацией моделей, связывающих выходные параметры с признаками термограммы.
Принимая во внимание цель данной статьи, именно об этой стороне задачи стоит поговорить более подробно, поскольку именно на этом примере можно продемонстрировать “вульгаризацию” идей МГУА, при которой необоснованный оптимизм может привести к неоправданному пессимизму.
Для этого предельно упростим задачу, предположив, что конечного пользователя ИТ (металлурга) интересует только один технологический параметр – процентное содержание углерода в металле
.Обратимся к рис. 6, в левой части которого в координатах температура T (температура) – C (содержание углерода) показан фрагмент известной диаграммы состояния Fe-C сплава. На диаграмме имеется две линии - ликвидуса и солидуса. Выше линии ликвидуса металл находится в жидком состоянии (область L), ниже линии солидуса - в твердом состоянии (область S), а между этими линиями - в переходном состоянии (область L+S).
Как видно из рисунка, линия ликвидуса не параллельна оси температур, а значит при изменении содержания углерода изменяется температура начала кристаллизации металла (температура ликвидуса TL) - чем выше содержание углерода, тем при более низкой температуре начинается процесс кристаллизации расплава. Поэтому неизвестное содержание углерода C можно определить по температуре ликвидуса TL
Однако сталь является сложным по химическому составу сплавом и, помимо углерода, в ней имеется еще и целый ряд других примесей, таких как марганец, кремний, фосфор, сера и др., также влияющих на температуру ликвидуса. Поэтому зависимость между содержанием углерода и температурой ликвидуса, вообще говоря, отличается от теоретической зависимости, вытекающей из диаграммы состояния Fe-C сплава.
Рис.6. Иллюстрация идеи косвенного контроля С
В то же время оказалось, что если воспользоваться простейшей моделью в виде линейного уравнения регрессии
, (4)построенной для условий конкретного предприятия, то неизвестное содержание углерода можно косвенно оценить по температуре ликвидуса с достаточно высокой точность (порядка 0.02 абс. % С).
Разумеется, такая сравнительно высокая точность может быть достигнута только в той случае, когда будет правильно определена сама температура ликвидуса
. Однако возникает вопрос: каким образом определить температуру ликвидуса?Природа пошла навстречу в разрешении этой проблемы. Дело в том, что в момент начала кристаллизации происходит экзотермическая реакция - выделения скрытой теплоты кристаллизации. Поэтому, если зарегистрировать процесс охлаждения расплава (см. правую часть рис. 6), то на графике процесса
(термограмме) при достижении температуры ликвидуса появляется своеобразный фрагмент в виде температурной остановки (площадки). Обнаружив такой информативный фрагмент термограммы можно определить температуру , а затем и процентное содержание углерода по модели (4).Предположим теперь, что нам известна лишь первая часть описанных выше закономерностей, т.е. только гипотеза о том, что термограмма несет информацию об интересующем нас параметре
, но неизвестно каким образом. Можно ли в этих условиях воспользоваться идеями самоорганизации для восстановления зависимости (4) по экспериментальным данным ?На первый взгляд может показаться, что такую задачу имеет простое решение в классе алгоритмов самоорганизации, но в этом как раз и состоит “вульгаризация” идеи МГУА!
Пусть в нашем распоряжении имеется выборка термограмм, зарегистрированных для W проб металла, и для каждой такой пробы на основании результатов химического анализа известно точное значение содержания углерода C1,…,CW . Будем считать, что каждая из W термограмм представлена своими дискретными значениями
.Поскольку в векторах
содержится вся доступная нам информация о термограмме, то можно считать значения потенциальными регрессорами, для которых известно точное значение отклика . Другими словами считать, что в нашем распоряжении имеется выборка, содержащая W точек наблюдений, образующих матрицу регрессоров и W-мерный вектор отклика (см. таблицу 1).Казалось бы, имея такую выборку, легко можно восстановить закономерность (4), задав класс базисных функций в виде всевозможными линейных структур
Таблица 1. Гипотетическая выборка наблюдений
№ | Регрессоры(аргументы модели) | Отклик(выход) | ||||
T1 | T2 | T3 | … | TK | ||
1 | T1[1] | T2 [1] | T3 [1] | … | TK [1] | C1 |
2 | T1[2] | T2 [2] | T3 [2] | … | TK [2] | C2 |
… | … | … | … | … | … | … |
W | T1[W] | T2 [W] | T3 [W] | … | TK [W] | CW |
На самом же деле это не так! Дело в том, что момент начала кристаллизации, определяется множеством внешних факторов (начальной температурой расплава, условиями теплообмена и т.п.). А это значит, что для различных наблюдений в выборке, температуре ликвидуса TL будут соответствовать различные номера дискретных значений
. Поэтому совершенно очевидно, что без привлечения дополнительной информации при сколь угодно большом объеме W выборки невозможно восстановить истинную зависимость (4) в классе структур (5), поскольку для различных наблюдений аргумент истинной зависимости (4) – температура TL – будет соответствовать различным аргументам моделей (5).К тому же при больших значениях
возникают непреодолимые вычислительные проблемы в использовании известных алгоритмов МГУА, но это уже другие проблемы.Отсюда следует, что важным этапом синтеза ИТ обработки сигналов, предшествующим структурно-параметрической идентификации, является переход от пространства наблюдений
к пространству потенциально полезных признаков меньшей размерности ( ), а затем уже этап использования этих признаков в качестве аргументов моделей косвенного контроля и диагностики, селектируемых тем или иным алгоритмом самоорганизации на основе обучающей и контрольной выборок.Именно такой взгляд на роль алгоритмов МГУА при синтезе прикладных ИТ обработки сигналов в условиях ограниченной априорной информации представляется автору наиболее реалистичным. Структура инструментальной системы “СИДИГРАФ”, реализующая такой подход, обсуждалась в работах [5,12].
Практические результаты. Как уже отмечалось, рассмотренный в предыдущем разделе пример оценки только одного содержания углерода является упрощенной схемой задачи, которая была положена в основу синтеза ИТ “ТЕРМОГРАФ”. Оказалось, что используя всего лишь информацию о дискретных значениях температуры
в процессе охлаждения пробы удается оценить с приемлемой точностью целый ряд других химических элементов расплава (содержание кремния , хрома , фосфора , марганца , и др.), а также прогнозировать механические свойства металла, в частности прочность на растяжение и твердость .