Разрабатываемая в данном разделе теория многомерно-матричного дифференцирования базируется на определении многомерной матрицы (2.1.1).
Определение многомерно-матричной производной
Прежде всего дадим определение многомерно-матричной производной [46]. Пусть –
-мерная гиперпрямоугольная матрица
(3.2.1)
зависящая некоторым образом от -мерной гиперпрямоугольная матрицы
,
(3.2.2)
где и
– мультииндексы. Производной матрицы
по матрице
назовем
-мерную матрицу
, определяемую выражением
(3.2.3)
Из определения (3.2.3) видно, что элемент матрицы
определяется как частная производная
,
и в матрице индексы матрицы
следуют за индексами матрацы
(соблюдается естественный порядок следования индексов). В отличие от работы [40] здесь индексы матриц
и
не делятся на строчные и столбцовые, и не нарушается естественный порядок следования индексов в производной.
Производные высших порядков определяются последовательным дифференцированием:
,
или
.
Известную скалярно-матричную производную (3.1.2) получаем как частный случай многомерно-матричной производной (3.2.3) при ,
.
Докажем основные правила многомерно-матричного дифференцирования.
Производная сложной функции
Пусть – многомерно-матричная функция (
-мерная матрица)
–
-мерная матрица,
–
-мерная матрица с различными (несовпадающими) элементами,
Тогда производная определяется как следующее
-свернутое произведение:
(3.2.4)
Докажем формулу (3.2.4). По определению (3.2.3) производная является
-мерной матрицей
Так как для каждого элемента этой матрицы имеем формулу [30]
,
то это означает справедливость формулы (3.2.4).
Более общим является случай функции , где
–
-мерная матрица,
–
-мерные матрицы,
,
–
-мерная матрица. Тогда
. (3.2.5)
Эта формула следует из того, что для каждого элемента справедливо равенство [30]
.
Если дифференцируемая сложная функция ,
, явно зависит от аргумента
, т. е. имеет вид
, то
.
Эта формула вытекает из существующей для этого случая формулы дифференцирования для отдельного элемента матрицы [30]
.
Производная произведения
Пусть –
-мерная матрица,
–
-мерная матрица,
–
-мерная матрица,
причем
,
Справедлива следующая формула дифференцирования
-свернутого произведения матриц
и
:
. (3.2.6)
Здесь символами и
обозначены подстановки типа «вперед» и «назад» (2.8.11), (2.8.12) соответственно. Количество индексов подстановок
и
равно размерности транспонируемых матриц.
Для доказательства формулы (3.2.6) введем обозначения
.
По определению -свернутого произведения (2.2.17) для матриц
и
будем иметь выражения
,
. (3.2.7)
Второе слагаемое в правой части выражения (3.2.7) дает второе слагаемое в формуле (3.2.6), т.е.
. (3.2.8)
Первое слагаемое в правой части выражения (3.2.7) есть -свернутое произведение матриц
и
, однако свертывание производится не по внутренним индексам, как это принято в определении (2.2.17). Обозначим такое произведение как
-свернутое,
.
Выразим -свернутое произведение через
-свернутое произведение со свертыванием по внутренним индексам. Для этого введем матрицу
, (3.2.9)
где символом обозначена подстановка типа «вперед». Из формулы (3.2.9) следует, что
. (3.2.10)
Найдем -свернутое произведение матриц
и
. (3.2.11)
Подставив в формулу (3.2.11) выражение (3.2.10), получим
.
Из последнего равенства видно, что матрицы и
связаны соотношениями транспонирования
,
. (3.2.12)
В результате первое слагаемое в выражении (3.2.7) приведено к виду
. (3.2.13)
Однако порядок следования индексов в матрице (3.2.13) отличается от порядка следования индексов в производной (3.2.7). Поэтому от матрицы Z необходимо перейти к матрице
так, чтобы выполнялось условие
. (3.2.14)
Подставляя выражение (3.2.12) в равенство (3.2.14), получаем
,
или
, (3.2.15)
Учитывая формулу (3.2.11), запишем матрицу (3.2.15) в виде
. (3.2.16)
Теперь первое слагаемое в выражении (3.2.7) записано в форме (3.2.16), а второе слагаемое – в форме (3.2.8), что и доказывает формулу (3.2.6).
Производная неявной функции
Пусть функция задана неявно равенством
, (3.2.17)
где –
-мерная матрица,
,
–
-мерная матрица,
,
–
-мерная матрица,
.
Тогда производная есть
-мерная матрица, которая находится как решение следующего многомерно-матричного уравнения
. (3.2.18)
Действительно, расписав равенство (3.2.17) поэлементно,
,
находим, что производные могут быть получены из системы линейных алгебраических уравнений [30]
. (3.2.19)
Система уравнений (3.2.19) в многомерно-матричной форме имеет вид (3.2.18).
Если функция задана соотношением
, (3.2.20)
где –
-мерная матрица,
–
-мерная матрица,
–
-мерная матрица, то
определяется как решение уравнения
. (3.2.21)
Это следует из правила (3.2.5).
Дата: 2019-02-02, просмотров: 699.