Системы, управляемые потоком данных. Язык Dataflow Graph Language.
Курсовая работа Андреева М.В.
Г. Ульяновск, 1999
Введение
Одним из методов организации параллельных вычислений является метод, основанный основанный на принципе управления потоком данных. Обычно в вычислительных системах, управляемых потоком данных, команды машинного уровня управляются доступностью данных, проходящих по дугам графа потока данных (ГПД). Такому принципу управления потоком данных на уровне операций можно противопоставить принцип управления укрупненным потоком данных (Large-Grain Data Flow), в котором единица планирования вычислений крупнее (возможно, намного крупнее), чем одна машинная команда.
ГПД - одна из наиболее распространенных форм представления программы в данной модели вычислений. Вершины ГПД соответствуют отдельным процессам, а дуги задают отношения между ними. Точка вершины, в которую входит дуга, называется входным портом (портом импорта или входом), а точка, из которой она выходит, - выходным (портом экспорта или выходом). По дугам передаются данные из одного процесса в другой.
Данный метод заставляет программиста принять поэтапный подход к программированию, но, с другой стороны, избавляет от сложностей синхронизации, присущих большенству других моделей параллелизма.
Программное обеспечение
Система предназначена для работы в сети, в которой любые два компьютера могут обмениваться данными друг с другом. На любом компьютере может быть запушенно несколько процессов. Каждый процесс получает данные через порты импорта и может отслать данные через порты экспорта по дугам данных другим процессам.
Запуск программы осуществляется под управлением диспетчера, который распределяет процессы по компьютерам и устанавливает связи между процессами. Для нормальной работы диспетчера на всех компьютерах должна быть запущена специальная программа - монитор. Монитор по запросу диспетчера запускает процесс, указанный в запросе, на своем компьютере.
Порты импорта используются как очереди, и они, подобно каналам в ОС UNIX, буферизуют одно или неколько сообщений до тех пор, пока их не получит адресат. Объем буфера ограничен долько доступной емкостью памяти. Каждый порт импорта может быть связан с несколькими портами экспорта.
Порты экспорта могут иметь несколько каналов, число которых определяется диспетчером после анализа графа данных на этапе запуска процесса. Каждый канал обязательно связан только с одним портом импорта.
Подготовка прикладной программы к выполнению состоиз из следующих шагов:
конструирование графа потока данных программы
запись графа потока данных на языке графов данных DGL
обработка записи на языке DGL
написание прикладных программ для узловых процессов
компиляция узловых процессов в формат DLL
запуск узловых процессов диспетчером на основе DGL
Пример параллельной программы
В качестве примера расмотрим задачу приближенного вычисления числа Пи с использованием правила прямоугольников для вычисления определенного интеграла
где
Согласно правилу прямоугольников,
где , а .
Следует отметить, что это «процессорная» программа. Она не затрагивает многие проблемы параллельного программирования, например критическое влияние процессов ввода-вывода. Тем не менее эта задача поможет ознакомится с основными принципами построения программ, работающих в соответствии с методом управления потоком данных.
Существует множество подходов к решению контрольной задачи. Решение, приведенное ниже, иллюстрирует все основные шаги разработки программы.
Приложение А
Синтаксис языка DGL
DGL = ["DATAFLOW GRAPH" [identifier] ";"]
{Definitions}
{ProcessDecl}
Definitions = identifier "=" ConstExpr
ProcessDecl = "PROCESS" identifier ["AT" path]
["[" NumCopies "]" ]
{"EXPORT:"{ExportDecl} |
"IMPORT:"{ImportDecl}
}
"END"
ExportDecl = identifier ["[" NumCopies "]"]
"-->"
identifier ["[" Expression "]"]
":"
identifier ";"
ImportDecl = identifier ";"
NumCopies = ConstExpr
ConstExpr = Expression
Expression = Term [AddOp Term]
Term = Fact [MulOp Fact]
Fact = number | identifier | "(" Expression ")"
AddOp = "+" | "-"
MulOp = "*" | "/"
Замечания:
number - целое положительное число
все операции языка целочисленные
значение выражения NumCopies должно быть больше нуля, в противном случае оно заменяется на число 1
в выражениях можно использовать следующие переменные: с - номер текущего канала, р - номер текущей копии процесса
Список литературы
[1] Роберт Бэб, «Программирование на параллельных вычислительных системах» - Москва: Мир, 1991
[2] А.И.Водяхо, «Высокопроизводительные системы обработки данных» - Москва:Высшая школа, 1997
Системы, управляемые потоком данных. Язык Dataflow Graph Language.
Дата: 2019-07-30, просмотров: 181.