Для разных типов задач различные типы разметки могут быть наиболее подходящими. Документы, созданные до широкого распространения Сети, очень часто предназначены только для визуального обмена информацией и наилучшим образом преобразуются в чистую разметку представления, так как семантическая информация, которую подразумевал автор, может быть восстановлена только эвристически. Наоборот, некоторые математические приложения и средства обучения основаны на содержании. Большинство же приложений находятся посредине между этими крайностями. Для них наиболее подходящим вариантом является объединение разметки представления и содержания.
Правила объединения разметки представления и содержания следуют из общего принципа, что смешанная разметка может быть только в тех местах, где она действительно необходима. Для разметки содержания, встроенной в разметку представления, это означает, что любые фрагменты содержания должны быть семантически значимыми и не требовать дополнительных аргументов или кванторов для того, чтобы быть четко определенными. Для разметки представления, встроенной в разметку содержания, это означает, что разметка представления должна содержаться в токене разметки содержания как неделимый элемент, используемый в качестве имени переменной или функции.
Другой способ заключается в использовании элемента semantics. Он используется для связывания выражений MathML и различных типов примечаний. Чаще всего элемент semantics используется для того, чтобы присоединить фрагмент разметки содержания к разметке представления как семантическое примечание. Таким образом, автор может определить нестандартную нотацию, которая будет использоваться при отображении конкретного выражения. Другим применением элемента semantics является включение других семантических спецификаций, таких как OpenMath выражения, в выражения MathML. В этом случае, элемент semantics может быть использован для расширения разметки содержания MathML.
MathML в документах
Все вышесказанное относится к отдельным формулам вне контекста документа. Давайте подробно рассмотрим пример, соответствующий примеру "Hello, World!", разбираемому при изучении языков программирования. Мы представим полный код документа XHTML 1.0, содержащего рассмотренный выше квадрат суммы двух переменных:
<html xmlns="http://www.w3.org/1999/xhtml" lang="en" xml: lang="en">
<head>
<title>MathML's Hello Square</title>
</head>
<body>
<p> This is a perfect square: </p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
<mrow>
<msup>
<mfenced>
<mrow>
<mi>a</mi>
<mo>+</mo>
<mi>b</mi>
</mrow>
</mfenced>
<mn>2</mn>
</msup>
</mrow>
</math>
</body>
</html>
Это стандартная структура документа XHTML. Он начинается открывающим тегом <html>, содержащим декларацию пространства имен XML и объявление языка. Элемент head содержит, как обычно, заголовок. Открывающий тег <body> beginning also has a namespace declaration of an abbreviative prefix letter m to be used for the standard MathML namespace. Затем идет обычный параграф. И, наконец, идет элемент math, который также имеет декларацию пространства имен. Внутри элемента math находится разметка MathML.
Примеры MathML
Далее мы будем приводить примеры в форме фрагментов разметки MathML, которые в реальном документе расположены в элементе math.
Примеры разметки представления
Нотация: x2 + 4x + 4 = 0.
Разметка:
<mrow>
<mrow>
<msup>
<mi>x</mi>
<mn>2</mn>
</msup>
<mo>+</mo>
<mrow>
<mn>4</mn>
<mo>⁢ </mo>
<mi>x</mi>
</mrow>
<mo>+</mo>
<mn>4</mn>
</mrow>
<mo>=</mo>
<mn>0</mn>
</mrow>
Обратите внимание на использование вложенных элементов mrow для обозначения термов. Например, левая часть уравнения является операндом для '='. Выделение термов значительно улучшает структуру для визуального отображения, воспроизведения с помощью голоса и переноса строк. Символ MathML InvisibleTimes применяется для того, чтобы сообщить программе отображения, что между 4 и x запрещен перенос строки. На самом деле, такое использование данного элемента, введенного еще в MathML 1.0, не рекомендуется. Все обычные текстовые данные задаются кодами Unicode. Тем не менее, хотя символ для замены ⁢ ожидается в Unicode 3.2, и рассматриваются предложения по улучшению Unicode, в текущей версии Unicode 3.0 такого символа не используется. Мы можем использовать ожидаемую цифровую ссылку ࠎ но для понятности будем продолжать использовать в примерах элемент InvisibleTimes.
Разметка:
<mrow>
<mi>x</mi>
<mo>=</mo>
<mfrac>
<mrow>
<mrow>
<mo>-</mo>
<mi>b</mi>
</mrow>
<mo>± </mo>
<msqrt>
<mrow>
<msup>
<mi>b</mi>
<mn>2</mn>
</msup>
<mo>-</mo>
<mrow>
<mn>4</mn>
<mo>⁢ </mo>
<mi>a</mi>
<mo>⁢ </mo>
<mi>c</mi>
</mrow>
</mrow>
</msqrt>
</mrow>
<mrow>
<mn>2</mn>
<mo>⁢ </mo>
<mi>a</mi>
</mrow>
</mfrac>
</mrow>
Элементы mfrac и msqrt используются для создания дроби и квадратного корня соответственно.
Обратите внимание, что знак 'плюс-минус' задается специальной сущностью ±, хотя в данном случае существует такой символ Unicode, как �B1;. MathML предоставляет обширный список имен элементов, задающих математические символы. В дополнение к математическим символам для вывода документа на экран и на печать, MathML предоставляет символы для воспроизведения документа с помощью речи. Для воспроизведения с помощью речи важно автоматически определять, как должен быть прочитан фрагмент
<mrow>
<mi>z</mi>
<mfenced>
<mrow>
<mi>x</mi>
<mo>+</mo>
<mi>y</mi>
</mrow>
</mfenced>
</mrow>
Как 'z умножить на величину x плюс y' or 'z умножить на x плюс y'. Символы ⁢ (U+2062) и ⁡ (U+2061) предоставляют авторам способ напрямую кодировать такие различия для программ речевого воспроизведения. Например, в первом случае, символ ⁢ (U+2062) должен быть вставлен после строки, содержащей z. MathML также содержит такие сущности как ⅆ (U+2146), представляющая дифференциал. При печати она отображается с отличными от обычного символа 'd' интервалами, а произноситься может как 'd' или 'with respect to'. Пока для исключения двусмысленности используются теги содержания или любой другой механизм, авторы всегда должны использовать описанные выше символы как сущности для того, чтобы сделать документы более доступными.
Разметка:
<mrow>
<mi>A</mi>
<mo>=</mo>
<mfenced open=" [" close="] ">
<mtable>
<mtr>
<mtd><mi>x</mi></mtd>
<mtd><mi>y</mi></mtd>
</mtr>
<mtr>
<mtd><mi>z</mi></mtd>
<mtd><mi>w</mi></mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
Элемент mtable указывает на начало таблицы в MathML. Элемент mtr определяет строку таблицы и элемент mtd содержит данные для элемента строки (ячейки). Большая часть элементов имеет атрибуты, определяющие свойства отображения на экране и на печати. Например, у элемента mfenced есть атрибуты, определяющие, какие символы должны использоваться в начале и в конце группируемого выражения. Атрибуты элементов-операторов устанавливаются в определенное справочником значение по умолчанию при помощи элемента <mo>.
Примеры разметки содержания
Нотация: x2 + 4x + 4 = 0.
<mrow>
<apply>
<eq/>
<apply>
<plus/>
<apply>
<power/>
<ci>x</ci>
<cn>2</cn>
</apply>
<apply>
<times/>
<cn>4</cn>
<ci>x</ci>
</apply>
<cn>4</cn>
</apply>
<cn>0</cn>
</apply>
</mrow>
Обратите внимание, что элемент apply используется для уравнений, операторов и функций.
Разметка содержания MathML не содержит элемента для отображения операции 'плюс-минус'. Поэтому мы используем элемент mo для объявления, что мы хотим применить разметку представления для этого оператора в качестве оператора содержания. Это простой пример того, как разметки представления и содержания могут быть объединены для расширения разметки содержания.
Нотация:
Разметка:
<mrow>
<apply>
<eq/>
<ci>A</ci>
<matrix>
<matrixrow>
<ci>x</ci>
<ci>y</ci>
</matrixrow>
<matrixrow>
<ci>z</ci>
<ci>w</ci>
</matrixrow>
</matrix>
</apply>
</mrow>
Здесь мы используем элементы matrix и matrixrow для помещения содержания в строку матрицы. Заметьте, что по умолчанию отображение элемента содержания matrix включает в себя ограничивающие круглые скобки, а, значит, нет необходимости кодировать их вручную. В этом состоит отличие от элемента представления mtable, который может и не относиться к матрице, и, следовательно, требует отдельного указания, что надо использовать скобки.
Примеры смешанной разметки
Нотация:
Разметка:
<mrow>
<semantics>
<mrow>
<msubsup>
<mo>∫ </mo>
<mn>1</mn>
<mi>t</mi>
</msubsup>
<mfrac>
<mrow>
<mo>ⅆ </mo>
<mi>x</mi>
</mrow>
<mi>x</mi>
</mfrac>
</mrow>
<annotation-xml encoding="MathML-Content">
<apply>
<int/>
<bvar><ci>x</ci></bvar>
<lowlimit><cn>1</cn></lowlimit>
<uplimit><ci>t</ci></uplimit>
<apply>
<divide/>
<cn>1</cn>
<ci>x</ci>
</apply>
</apply>
</annotation-xml>
</semantics>
</mrow>
В этом примере мы используем элемент semantics для того, чтобы представить выражение разметки содержания MathML как семантическое примечание к выражению разметки представления. В представленной разметке элемент msubsup применяется для задания нижних и верхних индексов в выражении, в данном случае - пределов интегрирования в определенном интеграле. Также для описания символов интеграла и дифференциала используются сущности ∫ и ⅆ.
Элемент semantics содержит в качестве первого дочернего элемента комментируемое выражение, а в качестве второго - сам комментарий. На тип нотации, задаваемой элементом semantics, ограничений не существует. Например, можно задавать разметку TEX или компьютерной алгебры в качестве примечания. Тип аннотации задается атрибутом encoding и элементами annotation, annotation-xml.
Элемент semantics также часто применяется, когда надо задать предложения по представлению разметки содержания документа. В этом случае, в применении к вышеописанной формуле мы получим такую разметку:
<semantics>
<apply>
<int/>
<bvar><ci>x</ci></bvar>
<lowlimit><cn>1</cn></lowlimit>
<uplimit><ci>t</ci></uplimit>
<apply>
<divide/>
<cn>1</cn>
<ci>x</ci>
</apply>
</apply>
<annotation-xml encoding="MathML-Presentation">
<mrow>
<msubsup>
<mo>∫ </mo>
<mn>1</mn>
<mi>t</mi>
</msubsup>
<mfrac>
<mrow>
<mo>ⅆ </mo>
<mi>x</mi>
</mrow>
<mi>x</mi>
</mfrac>
</mrow>
</annotation-xml>
</semantics>
Этот тип комментариев полезен, если требуется отображение разметки содержания, отличное от заданного по умолчанию. Например, по умолчанию, некоторые программы отображения могут выводить подинтегральное выражение в виде ' (1/x) dx'. С помощью комментария MathML-Presentation можно задать отображение в виде 'dx/x'. Будьте внимательны, так как программы отображения не обязаны принимать во внимание расположенную в комментариях информацию. Ее использование зависит от программы.
Дата: 2019-04-23, просмотров: 247.