Многомерно-матричное дифференцирование

Поможем в ✍️ написании учебной работы

Имя

Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Нажимая кнопку "Продолжить", я принимаю политику конфиденциальности

Разрабатываемая в данном разделе теория многомерно-матричного дифференцирования базируется на определении многомерной матрицы (2.1.1).

Определение многомерно-матричной производной

Прежде всего дадим определение многомерно-матричной производной [46]. Пусть – -мерная гиперпрямоугольная матрица

(3.2.1)

зависящая некоторым образом от -мерной гиперпрямоугольная матрицы ,

(3.2.2)

где и – мультииндексы. Производной матрицы по матрице назовем -мерную матрицу , определяемую выражением

(3.2.3)

Из определения (3.2.3) видно, что элемент матрицы определяется как частная производная

и в матрице индексы матрицы следуют за индексами матрацы (соблюдается естественный порядок следования индексов). В отличие от работы [40] здесь индексы матриц и не делятся на строчные и столбцовые, и не нарушается естественный порядок следования индексов в производной.

Производные высших порядков определяются последовательным дифференцированием:

или

Известную скалярно-матричную производную (3.1.2) получаем как частный случай многомерно-матричной производной (3.2.3) при , .

Докажем основные правила многомерно-матричного дифференцирования.

Производная сложной функции

Пусть – многомерно-матричная функция ( -мерная матрица)

– -мерная матрица,

– -мерная матрица с различными (несовпадающими) элементами,

Тогда производная определяется как следующее -свернутое произведение:

(3.2.4)

Докажем формулу (3.2.4). По определению (3.2.3) производная является -мерной матрицей

Так как для каждого элемента этой матрицы имеем формулу [30]

то это означает справедливость формулы (3.2.4).

Более общим является случай функции , где – -мерная матрица, – -мерные матрицы, , – -мерная матрица. Тогда

. (3.2.5)

Эта формула следует из того, что для каждого элемента справедливо равенство [30]

Если дифференцируемая сложная функция , , явно зависит от аргумента , т. е. имеет вид , то

Эта формула вытекает из существующей для этого случая формулы дифференцирования для отдельного элемента матрицы [30]

Производная произведения

Пусть – -мерная матрица,

– -мерная матрица,

причем , Справедлива следующая формула дифференцирования -свернутого произведения матриц и :

. (3.2.6)

Здесь символами и обозначены подстановки типа «вперед» и «назад» (2.8.11), (2.8.12) соответственно. Количество индексов подстановок и равно размерности транспонируемых матриц.

Для доказательства формулы (3.2.6) введем обозначения

По определению -свернутого произведения (2.2.17) для матриц и будем иметь выражения

. (3.2.7)

Второе слагаемое в правой части выражения (3.2.7) дает второе слагаемое в формуле (3.2.6), т.е.

. (3.2.8)

Первое слагаемое в правой части выражения (3.2.7) есть -свернутое произведение матриц и , однако свертывание производится не по внутренним индексам, как это принято в определении (2.2.17). Обозначим такое произведение как -свернутое,

Выразим -свернутое произведение через -свернутое произведение со свертыванием по внутренним индексам. Для этого введем матрицу

, (3.2.9)

где символом обозначена подстановка типа «вперед». Из формулы (3.2.9) следует, что

. (3.2.10)

Найдем -свернутое произведение матриц и

. (3.2.11)

Подставив в формулу (3.2.11) выражение (3.2.10), получим

Из последнего равенства видно, что матрицы и связаны соотношениями транспонирования

, . (3.2.12)

В результате первое слагаемое в выражении (3.2.7) приведено к виду

. (3.2.13)

Однако порядок следования индексов в матрице (3.2.13) отличается от порядка следования индексов в производной (3.2.7). Поэтому от матрицы Z необходимо перейти к матрице так, чтобы выполнялось условие