Многомерно-матричное дифференцирование
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

 

Разрабатываемая в данном разделе теория многомерно-матричного дифференцирования базируется на определении многомерной матрицы (2.1.1).

 

Определение многомерно-матричной производной

 

Прежде всего дадим определение многомерно-матричной производной [46]. Пусть  – -мерная гиперпрямоугольная матрица

                                 (3.2.1)

зависящая некоторым образом от -мерной гиперпрямоугольная матрицы ,

                                   (3.2.2)

где  и  – мультииндексы. Производной матрицы  по матрице  назовем -мерную матрицу , определяемую выражением

                    (3.2.3)

Из определения (3.2.3) видно, что элемент  матрицы  определяется как частная производная

,

и в матрице  индексы матрицы  следуют за индексами матрацы  (соблюдается естественный порядок следования индексов). В отличие от работы [40] здесь индексы матриц  и  не делятся на строчные и столбцовые, и не нарушается естественный порядок следования индексов в производной.

Производные высших порядков определяются последовательным дифференцированием:

,

или

.

Известную скалярно-матричную производную (3.1.2) получаем как частный случай многомерно-матричной производной (3.2.3) при , .

Докажем основные правила многомерно-матричного дифференцирования.

 

Производная сложной функции

 

Пусть  – многомерно-матричная функция ( -мерная матрица)

 – -мерная матрица,

 – -мерная матрица с различными (несовпадающими) элементами,

Тогда производная  определяется как следующее -свернутое произведение:

                                     (3.2.4)

Докажем формулу (3.2.4). По определению (3.2.3) производная  является -мерной матрицей

Так как для каждого элемента этой матрицы имеем формулу [30]

,

то это означает справедливость формулы (3.2.4).

Более общим является случай функции , где  – -мерная матрица,  – -мерные матрицы, ,  – -мерная матрица. Тогда

.                (3.2.5)

Эта формула следует из того, что для каждого элемента  справедливо равенство [30]

.

Если дифференцируемая сложная функция , , явно зависит от аргумента , т. е. имеет вид , то

.

Эта формула вытекает из существующей для этого случая формулы дифференцирования для отдельного элемента матрицы  [30]

.

 

Производная произведения

 

Пусть  – -мерная матрица,

 – -мерная матрица,

 – -мерная матрица,

причем ,  Справедлива следующая формула дифференцирования -свернутого произведения матриц  и :

.                   (3.2.6)

Здесь символами  и  обозначены подстановки типа «вперед» и «назад» (2.8.11), (2.8.12) соответственно. Количество индексов подстановок  и  равно размерности транспонируемых матриц.

Для доказательства формулы (3.2.6) введем обозначения

.

По определению -свернутого произведения (2.2.17) для матриц  и  будем иметь выражения

,

.                    (3.2.7)

Второе слагаемое в правой части выражения (3.2.7) дает второе слагаемое в формуле (3.2.6), т.е.

.                            (3.2.8)

Первое слагаемое в правой части выражения (3.2.7) есть -свернутое произведение матриц  и , однако свертывание производится не по внутренним индексам, как это принято в определении (2.2.17). Обозначим такое произведение как -свернутое,

.

Выразим -свернутое произведение через -свернутое произведение со свертыванием по внутренним индексам. Для этого введем матрицу

,                                    (3.2.9)

где символом  обозначена подстановка типа «вперед». Из формулы (3.2.9) следует, что

.                                           (3.2.10)

Найдем -свернутое произведение матриц  и

.                    (3.2.11)

Подставив в формулу (3.2.11) выражение (3.2.10), получим

.

Из последнего равенства видно, что матрицы  и   связаны соотношениями транспонирования

, .                          (3.2.12)

В результате первое слагаемое в выражении (3.2.7) приведено к виду

.       (3.2.13)

Однако порядок следования индексов в матрице (3.2.13) отличается от порядка следования индексов в производной  (3.2.7). Поэтому от матрицы Z необходимо перейти к матрице  так, чтобы выполнялось условие

.                                        (3.2.14)

Подставляя выражение (3.2.12) в равенство (3.2.14), получаем

,

или

,                                    (3.2.15)

Учитывая формулу (3.2.11), запишем матрицу (3.2.15) в виде

.                                    (3.2.16)

Теперь первое слагаемое в выражении (3.2.7) записано в форме (3.2.16), а второе слагаемое – в форме (3.2.8), что и доказывает формулу (3.2.6).

 

Производная неявной функции

 

Пусть функция  задана неявно равенством

,                                                (3.2.17)

где  – -мерная матрица,

,

 – -мерная матрица,

,

 – -мерная матрица,

.

Тогда производная   есть -мерная матрица, которая находится как решение следующего многомерно-матричного уравнения

.                                (3.2.18)

Действительно, расписав равенство (3.2.17) поэлементно,

,

находим, что производные могут быть получены из системы линейных алгебраических уравнений [30]

.                                 (3.2.19)

Система уравнений (3.2.19) в многомерно-матричной форме имеет вид (3.2.18).

Если функция  задана соотношением

,                                            (3.2.20)

где  – -мерная матрица,  – -мерная матрица,  – -мерная матрица, то определяется как решение уравнения

.                                 (3.2.21)

Это следует из правила (3.2.5).

 

Дата: 2019-02-02, просмотров: 641.