Состояние теории матричного дифференцирования
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

 

Впервые систематические методы расчета матричных производных были предложены в работе [111], хотя примеры матричных производных встречались и ранее. Так, в работе [112] получена производная квадратичной формы  с симметричной матрицей  по вектору-столбцу , которая равна . В работе [111] даны определения производной матричной функции  по скалярной переменной ,

                                      (3.1.1)

и производной скалярной функции  по матрице ,

.                                               (3.1.2)

Как видно из определений (3.1.1), (3.1.2), указанные производные являются матрицами, причем  – матрица тех же размеров, что и , а  – матрица тех же размеров, что и . Для дифференцирования матрицы  по матрице  авторы вводят два вида производных:  и . Производная

                                            (3.1.3)

при фиксированных значениях индексов  представляет собой производную типа (3.1.1), т. е. матрицу тех же размеров, что и . Производная

                                              (3.1.4)

при фиксированных значениях индексов  есть производная типа (3.1.2), т.е. матрица тех же размеров, что и . На основе этих определений в [111] получены производные некоторых матричных функций. Так, для функций ,  матричного аргумента  получены производные

,                                     (3.1.5)

,                                     (3.1.6)

,                                (3.1.7)

.            (3.1.8)

В формулах (3.1.5) – (3.1.8)  – матрица тех же размеров, что и , все элементы которой равны нулю, кроме единицы на пересечении -й строки и -го столбца. Матрица  имеет те же размеры, что и матрица , и все нулевые элементы, кроме единицы на пересечении -й строки и -го столбца.

Заметим, что формулы (3.1.5), (3.1.7) определяют столько матриц, сколько элементов содержит матрица , а формулы (3.1.6), (3.1.8) – столько матриц, сколько элементов содержит матрица . Этот факт, а также наличие двух видов производных для одной и той же функции и вспомогательных матриц  и  делают изложенный подход мало привлекательным.

Иной подход изложен в работе [124]. Если  – ( )-матрица,  – -матрица, то производная  определяется как ( )-матрица следующим образом:

.                             (3.1.9)

Например, если  – -матрица, а  – вектор-столбец с  элементами, то

.         (3.1.10)

На основе определения (3.1.9) в [124] получены правила дифференцирования произведения, сложной функции и транспонированной матрицы.

Производная произведения двух матриц определяется в [124] выражением

,                       (3.1.11)

где  – -матрица,  – -матрица,  – -матрица, ,  – кронекеровы произведения единичной матрицы  на матрицы  и  соответственно, причем в произведении  матрица  имеет размеры , а в произведении  – размеры .

Правило нахождения производной сложной матричной функции записывается в виде

.                     (3.1.12)

Здесь  – -матрица,  – -матрица,  – -матрица. Единичная матрица  в левом декартовом произведении в (3.1.13) имеет размеры , в правом – размеры . Символы  означают матрицу-строку размера , полученную из строк  матрицы С:

.

Производная транспонированной матрицы определяется равенcтвом

.                                           (3.1.13)

Из изложенного видно, что при матричном дифференцировании в [124] используется дополнительное понятие кронекерова произведения, которое является плохо формализованной операцией. При этом основные правила дифференцирования (3.1.11), (3.1.12) оказываются достаточно сложными и неудобными. Кроме того, авторы этой теории не выходят за рамки обычных (двухмерных) матриц.

Дальнейшее развитие теория матричного дифференцирования получила в работе Амосова В.В. и Колпакова А.А. [2]. Здесь для производной скалярной функции  по матрице  принято то же определение (3.1.2), что и в [111]. Получены производные некоторых новых функций по сравнению с [111] (следа, определителя матрицы и др.). Производные (3.1.2) названы в [2] скалярно-матричными.

Для дифференцирования матричной функции по матричному аргументу (матрично-матричное дифференцирование) в работе [2] введено понятие дифференциала матрицы: если , , – матричная функция от матрицы , то дифференциал  определяется как -матрица

,                                    (3.1.14)

где

,                            (3.1.15)

и  – след матрицы . Необходимо отметить, что нахождение дифференциала не всегда оказывается достаточным. Часто нужно иметь производную. В этом состоит ограничение подхода работы [2]. Кроме того, эта теория относится лишь к обычным (двухмерным) матрицам.

Теория скалярно-матричного дифференцирования позволяет записать три члена ряда Тейлора для скалярной функции  векторной переменной :

,

где – вектор-столбец аргументов функции , , , – первая производная функции  в точке , , – вторая производная функции  в точке . Записать последующие члены ряда Тейлора с помощью векторно-матричного подхода и теории скалярно-матричного дифференцирования не представляется возможным.

Различные определения матрично-матричных производных можно найти в работе [23]. Их особенностью является то, что они не выходят за рамки теории обычных (двухмерных) матриц. Для достижения этой цели в обсуждаемых определениях и правилах дифференцирования используются кронекеровские произведения или векторные упорядочивания. Поскольку указанные операции относятся к плохо формализованным, то рассматриваемые в работе [23] подходы также следует считать плохо формализованными.

К многомерным матрицам относятся работы Милова Л.Т. [39,40]. В [40] дано определение многомерно-матричной производной и рассмотрены некоторые ее свойства. Многомерно-матричная производная определена на основе понятия многомерной матрицы. Многомерная матрица  определяется как совокупность многоиндексных элементов . Все индексы предлагается делить на строчные и столбцовые и обозначать многомерную матрицу символами , где  и  указывают количество столбцовых и строчных индексов соответственно, а размерность матрицы равна . Числа  и  в пределах равенства  можно выбирать произвольными, а для отнесения индекса к строчному или столбцовому предложены правила помечивания индексов. Строчный индекс помечивается символом “-”, столбцовый – символом “+”. Помечивание начинается с последнего индекса, который, если , принимается строчным. Следующий индекс принимается столбцовым, если . Далее строчные и столбцовые индексы чередуются до тех пор, пока не исчерпаются либо строчные, либо столбцовые индексы. В первом случае все оставшиеся индексы принимаются столбцовыми, а во втором – строчными [39]. Многомерно-матричная производная

определяется в [40] как -мерная матрица, состоящая из частных производных от элементов  матрицы  по элементам  матрицы , причем принимается, что в матрице  столбцовые и строчные индексы матрицы  следуют за столбцовыми и строчными индексами матрицы  соответственно и соблюдаются правила помечивания индексов. Так, если , , то производная  имеет элементы

.

На основе приведенного определения в [40] рассмотрены различные случаи многомерно-матричного дифференцирования. Например, получено, что

,                        (3.1.16)

где

,

 – символ транспонирования, – знак кронекеровского произведения двух сомножителей,  – знак кронекеровского произведения  сомножителей,  – единичный столбец, имеющий все нулевые элементы, за исключением равного единице элемента, стоящего в позиции .

Обсуждаемая теория многомерно-матричного дифференцирования базируется на понятии многомерной матрицы строчно-столбцовой структуры. Это существенно ослабляет связь теории дифференцирования с теорией многомерных матриц Соколова Н.П., в которой такая структура многомерной матрицы не предполагается. При этом изменяется определение транспонированной матрицы, не используются такие важные понятия, как -свернутое произведение матриц, -единичная матрица и т.д. Кроме того, результаты теории дифференцирования представляются достаточно громоздкими и плохо формализованными. Это можно видеть хотя бы на примере производной (3.1.16), в которой используется плохо формализованная операция кронекеровского произведения.

В последующих разделах разрабатывается теория многомерно-матричного дифференцирования, полностью базирующаяся на теории многомерных матриц Соколова Н.П.

 

Дата: 2019-02-02, просмотров: 673.