(Реферат)
Введение. 3
Глава 1. Общие сведения о сингулярном разложении и сингулярных матрицах 4
1.1. Ортогональное разложение посредством сингулярного разложения. 4
1.2. Вычисление сингулярного разложения. 5
Глава 2. Применение сингулярных матриц при многомерном анализе химических данных факторными методами. 7
2.1. Общие сведения о факторных методах. 7
2.2. Операции с матрицами и многомерный анализ данных. 9
2.3. Свойства сингулярной матрицы.. 10
Заключение. 12
Список используемой литературы.. 16
Как известно, химия часто оказывается на перекрестке разных дисциплин. Для химика всегда есть большой соблазн в том, чтобы заняться какой-то чрезвычайно узкой областью, где он останется защищенным от всех превратностей, наслаждаясь удобством положения единственного в своем роде специалиста. Чтобы постоянно быть в курсе дела и в готовности встретить любую новую ситуацию, химику требуется быть знакомым с огромным объемом информации, необходимой не только для движения вперед, но и просто для сохранения своего положения.
При написании данного реферата была использована следующая литература, содержащая информацию о сингулярных матрицах и применении их в химии:
· книга «ЭВМ помогает химии» (пер. с англ) под ред. Г. Вернена, М. Шанона, в которой рассмотрено применение ЭВМ в различных областях химии: синтез органических соединений, кристаллография, масс-спектрометрия и т. д.
· книга Ч.Лоусона и Р.Хенсона «Численное решение задач метода наименьших квадратов» (пер. с англ), посвященная изложению численных решений линейных задач метода наименьших квадратов.
В этом пункте данного реферата будет описано одно практически полезное ортогональное разложение тxn - матрицы А. Мы покажем здесь, что невырожденную подматрицу R матрицы Aможно еще более упростить так, чтобы она стала невырожденной диагональной матрицей. Получаемое в результате разложение особенно полезно при анализе влияния ошибок входной информации на решение задачи НК.
Это разложение тесно связано со спектральным разложением симметричных неотрицательно определенных матриц ATAиAAT.
Теорема (сингулярное разложение). Пусть А - mxn -матрица ранга k. Тогда существуют ортогональная mxm матрица U, ортогональная nxn -матрица V и диагональная mxn -матрица S) такие, что
Матрицу S можно выбрать так, чтобы ее диагональные элементы составляли невозрастающую последовательность; все эти элементы неотрицательны и ровно k из них строго положительны.
Диагональные элементы S называются сингулярными числами А.
Доказательства данной теоремы приводить не имеет смысла во избежание нагромождения множества сложных математических выкладок, прямого отношения к теме, рассматриваемой в данном реферате, не имеющих. Ограничимся следующим численным примером, в котором дано сингулярное разложение матрицы А вида:
Рассмотрим теперь построение сингулярного разложения т Х n- матрицы в предположении, что т > п. Сингулярное разложение будет вычислено в два этапа.
На первом этапе А преобразуется к верхней двухдиагональной матрице
посредством последовательности (не более чем из n — 1) преобразований Хаусхолдерагде
Трансформирующая матрица выбирается так, чтобы аннулировать элементы i + 1, ..., т столбца i; матрица Hi — так, чтобы аннулировав элементы i+ 1,.... п строки / - 1.
Заметим, что Qn - это попросту единичная матрица. Она включена, чтобы упростить обозначения; Qn также будет единичной матрицей при от = я, но при т > п она, вообще говоря, отличается от единичной.
Второй этап процесса состоит в применении специальным образом адаптированного QR-алгоритма к вычислению сингулярного разложения матрицы
Здесь
- ортогональные матрицы, aS диагональная.Можно получить сингулярное разложение А:
Сингулярное разложение матрицы В будет получено посредством следующего итерационного процесса:
Здесь
- ортогональные матрицы, а Bk- верхняя двухдиагональная матрица для всех k.Заметим, что диагональные элементы матрицы
полученной непосредственно из этой итерационной процедуры, не являются в общем случае ни положительными, ни упорядоченными. Эти свойства обеспечиваются специальной последующей обработкой.Сама итерационная процедура представляет собой (QR-алгоритм Фрэнсиса, адаптированный Голубом и Райншем к задаче вычисления сингулярных чисел.
Многомерный анализ данных играет все возрастающую роль во многих научных дисциплинах, включая науки о земле, жизнеобеспечении, в социологии, а также менеджменте. Однако в химии эти методы развивались не так быстро. Хотя основы методов были созданы в начале века, а области их применения были определены в тридцатых годах , первые случаи их использования отмечены только в шестидесятых годах. Действительно, наиболее часто применяемыми в хемометрике методами стали факторный анализ (ФА), анализ (метод) главных компонент (МГК) и факторный дискриминантный анализ (ФДА).
Хемометрика преследует две цели :
· извлечение максимума информации за счет анализа химических данных;
· оптимальное планирование измерительных процедур и экспериментов.
Первая цель может быть подразделена на две:
1) описание, классификация и интерпретация химических данных;
2) моделирование химических экспериментов, процессов и их последующая оптимизация.
Из всего многообразия видов обработки наборов химических данных можно выделить некоторые наиболее характерные области применения:
· многокомпонентный анализ спектрометрических или хромато-графических данных различных смесей. Цель анализа — определение числа компонентов и иногда также их идентификация. Для решения задач, связанных с равновесиями в растворе и сложной кинетикой, используется факторный анализ;
· поиск неизмеряемых факторов, отражающих те физико-химические свойства, которые оказываются слишком сложными для точного моделирования, например, таких, как:
а) времена задержки для хроматографии;
б) данные по химическому сдвигу;
в) константы равновесия и кинетические константы;
г) данные по степени превращения и селективности.
Интерпретация этих факторов может высветить новые явления или подчеркнуть те физические свойства, которые помогут объяснить исходные наблюдения:
· сведение наборов химических данных с большим числом переменных (которые часто коррелируют, а иногда и избыточны) к наборам с меньшим числом независимых переменных. Каждая точка будет характеризоваться меньшим числом новых переменных, которые затем могут быть использованы для модельных исследований. Этот метод можно применять для многокомпонентных природных продуктов со сложными физико-химическими свойствами (эфирные масла, продукты из сырой нефти и т. д.), а также для замеренных в ходе процесса наборов данных;
· анализ многомерных наборов химических данных посредством графического представления объектов и переменных в векторном подпространстве с меньшим числом измерений. Подобное представление позволяет осуществить обзор всего набора данных для классификации объектов и объяснения их положения.
Цель данного пункта моего реферата — введение в методы факторного анализа с рассмотрением его теоретических основ и практических приложений.
Факторный анализ (ФА), анализ главных компонент (МГК) и факторный дискриминантный анализ (ФДА) будут представлены на различных специально подобранных примерах, иллюстрирующих множество областей их применения.
Применение линейной алгебры в анализе данных будет проиллюстрировано на примере УФ-спектроскопии сложной смеси. В соответствии с законом Ламберта — Бера при данной частоте v полное поглощение образца, состоящего из l поглощающих компонентов, определяется как
, где – молярный коэффициент поглощения компонента j, а – молярная концентрация компонента j.Если измерение проводится при п различных частотах, тогда единственное уравнение заменяется системой линейных уравнений