Впервые систематические методы расчета матричных производных были предложены в работе [111], хотя примеры матричных производных встречались и ранее. Так, в работе [112] получена производная квадратичной формы с симметричной матрицей
по вектору-столбцу
, которая равна
. В работе [111] даны определения производной матричной функции
по скалярной переменной
,
(3.1.1)
и производной скалярной функции по матрице
,
. (3.1.2)
Как видно из определений (3.1.1), (3.1.2), указанные производные являются матрицами, причем – матрица тех же размеров, что и
, а
– матрица тех же размеров, что и
. Для дифференцирования матрицы
по матрице
авторы вводят два вида производных:
и
. Производная
(3.1.3)
при фиксированных значениях индексов представляет собой производную типа (3.1.1), т. е. матрицу тех же размеров, что и
. Производная
(3.1.4)
при фиксированных значениях индексов есть производная типа (3.1.2), т.е. матрица тех же размеров, что и
. На основе этих определений в [111] получены производные некоторых матричных функций. Так, для функций
,
матричного аргумента
получены производные
, (3.1.5)
, (3.1.6)
, (3.1.7)
. (3.1.8)
В формулах (3.1.5) – (3.1.8) – матрица тех же размеров, что и
, все элементы которой равны нулю, кроме единицы на пересечении
-й строки и
-го столбца. Матрица
имеет те же размеры, что и матрица
, и все нулевые элементы, кроме единицы на пересечении
-й строки и
-го столбца.
Заметим, что формулы (3.1.5), (3.1.7) определяют столько матриц, сколько элементов содержит матрица , а формулы (3.1.6), (3.1.8) – столько матриц, сколько элементов содержит матрица
. Этот факт, а также наличие двух видов производных для одной и той же функции и вспомогательных матриц
и
делают изложенный подход мало привлекательным.
Иной подход изложен в работе [124]. Если – (
)-матрица,
–
-матрица, то производная
определяется как (
)-матрица следующим образом:
. (3.1.9)
Например, если –
-матрица, а
– вектор-столбец с
элементами, то
. (3.1.10)
На основе определения (3.1.9) в [124] получены правила дифференцирования произведения, сложной функции и транспонированной матрицы.
Производная произведения двух матриц определяется в [124] выражением
, (3.1.11)
где –
-матрица,
–
-матрица,
–
-матрица,
,
– кронекеровы произведения единичной матрицы
на матрицы
и
соответственно, причем в произведении
матрица
имеет размеры
, а в произведении
– размеры
.
Правило нахождения производной сложной матричной функции записывается в виде
. (3.1.12)
Здесь –
-матрица,
–
-матрица,
–
-матрица. Единичная матрица
в левом декартовом произведении в (3.1.13) имеет размеры
, в правом – размеры
. Символы
означают матрицу-строку размера
, полученную из строк
матрицы С:
.
Производная транспонированной матрицы определяется равенcтвом
. (3.1.13)
Из изложенного видно, что при матричном дифференцировании в [124] используется дополнительное понятие кронекерова произведения, которое является плохо формализованной операцией. При этом основные правила дифференцирования (3.1.11), (3.1.12) оказываются достаточно сложными и неудобными. Кроме того, авторы этой теории не выходят за рамки обычных (двухмерных) матриц.
Дальнейшее развитие теория матричного дифференцирования получила в работе Амосова В.В. и Колпакова А.А. [2]. Здесь для производной скалярной функции по матрице
принято то же определение (3.1.2), что и в [111]. Получены производные некоторых новых функций по сравнению с [111] (следа, определителя матрицы и др.). Производные (3.1.2) названы в [2] скалярно-матричными.
Для дифференцирования матричной функции по матричному аргументу (матрично-матричное дифференцирование) в работе [2] введено понятие дифференциала матрицы: если
,
, – матричная функция от матрицы
, то дифференциал
определяется как
-матрица
, (3.1.14)
где
, (3.1.15)
и – след матрицы
. Необходимо отметить, что нахождение дифференциала не всегда оказывается достаточным. Часто нужно иметь производную. В этом состоит ограничение подхода работы [2]. Кроме того, эта теория относится лишь к обычным (двухмерным) матрицам.
Теория скалярно-матричного дифференцирования позволяет записать три члена ряда Тейлора для скалярной функции векторной переменной
:
,
где – вектор-столбец аргументов функции
,
,
, – первая производная функции
в точке
,
, – вторая производная функции
в точке
. Записать последующие члены ряда Тейлора с помощью векторно-матричного подхода и теории скалярно-матричного дифференцирования не представляется возможным.
Различные определения матрично-матричных производных можно найти в работе [23]. Их особенностью является то, что они не выходят за рамки теории обычных (двухмерных) матриц. Для достижения этой цели в обсуждаемых определениях и правилах дифференцирования используются кронекеровские произведения или векторные упорядочивания. Поскольку указанные операции относятся к плохо формализованным, то рассматриваемые в работе [23] подходы также следует считать плохо формализованными.
К многомерным матрицам относятся работы Милова Л.Т. [39,40]. В [40] дано определение многомерно-матричной производной и рассмотрены некоторые ее свойства. Многомерно-матричная производная определена на основе понятия многомерной матрицы. Многомерная матрица определяется как совокупность многоиндексных элементов
. Все индексы предлагается делить на строчные и столбцовые и обозначать многомерную матрицу символами
, где
и
указывают количество столбцовых и строчных индексов соответственно, а размерность матрицы равна
. Числа
и
в пределах равенства
можно выбирать произвольными, а для отнесения индекса к строчному или столбцовому предложены правила помечивания индексов. Строчный индекс помечивается символом “-”, столбцовый – символом “+”. Помечивание начинается с последнего индекса, который, если
, принимается строчным. Следующий индекс принимается столбцовым, если
. Далее строчные и столбцовые индексы чередуются до тех пор, пока не исчерпаются либо строчные, либо столбцовые индексы. В первом случае все оставшиеся индексы принимаются столбцовыми, а во втором – строчными [39]. Многомерно-матричная производная
определяется в [40] как -мерная матрица, состоящая из частных производных от элементов
матрицы
по элементам
матрицы
, причем принимается, что в матрице
столбцовые и строчные индексы матрицы
следуют за столбцовыми и строчными индексами матрицы
соответственно и соблюдаются правила помечивания индексов. Так, если
,
, то производная
имеет элементы
.
На основе приведенного определения в [40] рассмотрены различные случаи многомерно-матричного дифференцирования. Например, получено, что
, (3.1.16)
где
,
– символ транспонирования,
– знак кронекеровского произведения двух сомножителей,
– знак кронекеровского произведения
сомножителей,
– единичный столбец, имеющий все нулевые элементы, за исключением равного единице элемента, стоящего в позиции
.
Обсуждаемая теория многомерно-матричного дифференцирования базируется на понятии многомерной матрицы строчно-столбцовой структуры. Это существенно ослабляет связь теории дифференцирования с теорией многомерных матриц Соколова Н.П., в которой такая структура многомерной матрицы не предполагается. При этом изменяется определение транспонированной матрицы, не используются такие важные понятия, как -свернутое произведение матриц,
-единичная матрица и т.д. Кроме того, результаты теории дифференцирования представляются достаточно громоздкими и плохо формализованными. Это можно видеть хотя бы на примере производной (3.1.16), в которой используется плохо формализованная операция кронекеровского произведения.
В последующих разделах разрабатывается теория многомерно-матричного дифференцирования, полностью базирующаяся на теории многомерных матриц Соколова Н.П.
Дата: 2019-02-02, просмотров: 737.