Обзор существующих решений в области разработки подсистемы синтаксического анализа
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Введение

 

В данном дипломном проекте ставится задача разработки алгоритмов морфологического анализа. В ходе выполнения проекта был проведен анализ существующих решений в сфере программных продуктов проверки орфографии. Был проведен анализ правил русского языка, которые используются при машинном анализе текста.

Алгоритмы спроектированы с учетом возможности их интеграции в существующие программные решения. Также алгоритмы дополняемы и расширяемы. Алгоритмы построены согласно ГОСТ 19.701–90.

 

 



Обзор существующих решений в области разработки подсистемы синтаксического анализа

 

Присутствующие сегодня на рынке программных продуктов системы проверки орфографии можно поделить на несколько условных категорий.

 

Microsoft Office 2003 Multilingual User Interface Pack

Microsoft Office 2003 Multilingual User Interface Pack дополняет уже встроенные в Microsoft Office средства многоязыковой поддержки, предоставляя переведенный текст для интерфейса пользователя, справки, мастеров и шаблонов приложений Microsoft Office. С помощью пакета Office 2003 MUI Pack можно работать в версии Microsoft Office на английском языке, но при этом просматривать команды, параметры диалоговых окон, разделы справки, мастера и шаблоны на знакомом языке.

В пакет Microsoft Office 2003 MUI Pack также входят средства проверки правописания Microsoft Office 2003 Proofing Tools, куда включены шрифты, средства проверки орфографии и грамматики, списки автозамены и другие инструменты, помогающие в создании и редактировании файлов Microsoft Office на выбранном языке.

Смена языка интерфейса пользователя или справочной системы распространяется на все приложения Microsoft Office. Смена языка интерфейса пользователя не оказывает влияния на формат сохраняемых файлов Microsoft Office или какого-либо другого воздействия на приложения. Конвертер для открытия файлов не потребуется. Некоторые компоненты Microsoft Office не поддерживают смену языка интерфейса пользователя или справочной системы.

Office 2003 MUI Pack работает с Microsoft Office в операционной системе Microsoft Windows 2000 или более поздней версии. Microsoft Windows 2000 обеспечивает наиболее полную поддержку для большинства языков и рекомендуется при постоянной работе с несколькими языками.

Пакет Microsoft Office 2003 MUI Pack MUI Pack распространяется на компакт-диске и имеет свою собственную программу установки.

Microsoft Proofing Tools

Пакет средств проверки правописания Microsoft Office 2003 Proofing Tools – это отдельный дополнительный продукт, содержащий средства, созданные корпорацией Майкрософт для более чем 30 языков, такие как шрифты, средства проверки орфографии и грамматики, списки автозамены, правила составления авторефератов (только для Microsoft Word), двуязычные словари, а также редакторы способов ввода IME. IME – программа, обеспечивающая ввод текста на восточноазиатских языках (китайский с традиционным письмом, китайский с упрощенным письмом, японский и корейский) в приложениях путем преобразования нажатий клавиш в сложные знаки этих языков. IME рассматривается как дополнительный вид раскладки клавиатуры (для азиатских языков).

«Орфо»

«Орфо» – это система, предназначенная для проверки и исправления правописания текстов на семи языках. Компания-разработчик системы «Орфо» предлагает несколько вариантов комплектации:

Категория 2 (Наборы словарей)

 

К этой категории отнесены библиотеки для проверки орфографии.

Hunspell

Hunspell – это формат словарей Hunspell и файлов аффиксов.

Для проверки орфографии Hunspell требуется два файла. Первый файл – словарь, содержащий слова, второй – файл аффиксов, который определяет значения специальных меток (флагов) в словаре.

Файл словаря (.dic) содержит список слов, по одному слову в строке. В первой строке словарей (за исключением персональных словарей) указывается приблизительное количество слов в словаре (для оптимального распределения памяти). После каждого слова может следовать слэш («/») и один или более флагов, соответствующих аффиксам и атрибутам. Слова в словаре также могут содержать слэши, экранированные «». По умолчанию, флаг представляет собой один (обычно, алфавитный) символ. В файле словаря Hunspell также может существовать поле для морфологического описания, отделяемое табуляцией.

Формат морфологического описания определяется пользователем.

Файл аффиксов (.aff) может содержать необязательные атрибуты. Например, SET для определения кодировки символов файлов аффиксов и словаря. TRY определяет заменяемые символы для предлагаемых замен. REP определяет таблицу замен для исправлений нескольких символов. PFX и SFX определяют классы префиксов и суффиксов, обозначенных флагами аффиксов.

Следующий образец файла аффиксов определяет кодировку символов UTF-8. Предлагаемые замены TRY отличаются от неправильного слова на одну букву или апостроф. С помощью этих флагов REP, Hunspell предлагает правильное слово, если вместо f напечатано ph или наоборот.

SET UTF-8

TRY esianrtolcdugmphbyfvkwzESIANRTOLCDUGMPHBYFVKWZ’

REP 2

REP f ph

REP ph f

PFX A Y 1

PFX A 0 re.

SFX B Y 2

SFX B 0 ed [^y]

SFX B y ied y

В этом файле определено 2 класса аффиксов. Класс A определяет префикс re– Класс B – два суффикса – ed: один для слов, оканчивающихся не на y и второй – для оканчивающихся на y. Эти классы аффиксов используются следующим файлом словаря.

В этом случае, правильными словами являются: hello, try, tried, work, worked, rework, reworked.

RuSpell

Система проверки орфографии ruSPELL для Mac OS X.

Компания Apple IMC представляет новый дополнительный сервис для русскоязычных пользователей – ruSPELL, разработанный совместно с компанией ABBYY Software House. Это программа работает под Mac OS X и позволяет проверять орфографию в большинстве программ с которыми рядовой пользователь сталкивается ежедневно. Разработка данного продукта является очередным этапом реализации новой модели бизнеса, ориентированной на конечного заказчика.

Программа ruSPELL разработана для работы под управлением Mac OS X и состоит из двух компонентов: модуля проверки орфографии Russian Spelling for Ms Office и сервиса ABBYYspeller.

Модуль проверки орфографии Russian Spelling for Ms Office предоставляет возможность проверять орфографию русских текстов в следующих программах: Word v.X, Excel v.X, PowerPoint v.X. Каждая из этих программ предоставляет свой собственный диалог Spelling (правописание), с помощью которого можно находить русские слова, написанные с ошибками, создавать и пополнять собственные словари. Сервис проверки орфографии ABBYYspeller предоставляет возможность проверять орфографию русских текстов во всех программах, работающих со стандартным пакетом AppleSpell операционной системы Mac OS X.

 

 



Морфология

 

Морфология (от греч. morphe – форма, logos – учение) – это раздел науки о языке, рассматривающий грамматические формы и грамматические значения частей речи.

Морфология рассматривает отдельные слова, но, в отличие от лексикологии, исследующей лексические значения слов, морфология изучает грамматические свойства слов.

 

Массив base

Массив base – двумерный динамический массив содержащий основы слов и указатель на строку из массива flex.

Примеры строк из массива base:

ВЗ 519

В данном примере набор символов ВЗ является основой слова. Число 519 – указатель номера строки в массиве flex, содержащей набор окончаний ассоциированных с данной основой.

Массив flex

Массив flex – двумерный динамический массив, содержащий наборы окончаний. Данный массив является зависимым от массива base, также этот массив содержит указатель на строки массива mrf, идентифицирующие морфемные свойства слова.

Пример части строки из массива flex

%БИТЬСЯ*ка % БИЛСЯ*кз%

Набор символов «БИТЬСЯ» является формой постфикса, для определённой в массиве base основы. Набор символов «ка» является идентификатором строки с дескрипторами массива mrf.

Массив mrf

Массив mrf – двумерный динамический массив, содержащий наборы дескрипторов, которые описывают морфемные свойства анализируемого слова.

Пример строки из массива mrf:

ка a ИНФИНИТИВ дст

В данной строке указано, что словоформа является Инфинитивом (начальной формой глагола), и является действительным.

Набор частей речи массива mrf указан в таблице 3.2.

 

Таблица 3.2. Описание частей речи массива mrf

Часть речи в системе Диалинг Пример Расшифровка
C мама существительное
П красный прилагательное
МС он местоимение-существительное
Г идет глагол в личной форме
ПРИЧАСТИЕ идущий причастие
ДЕЕПРИЧАСТИЕ идя деепричастие
ИНФИНИТИВ идти инфинитив
МС-ПРЕДК нечего местоимение-предикатив
МС-П всякий местоименное прилагательное
ЧИСЛ восемь числительное (количественное)
ЧИСЛ-П восьмой порядковое числительное
Н круто наречие
ПРЕДК интересно предикатив
ПРЕДЛ под предлог
СОЮЗ и союз
МЕЖД ой междометие
ЧАСТ же, бы частица
ВВОДН конечно вводное слово
КР_ПРИЛ красива краткое прилагательное
КР_ПРИЧАСТИЕ построена краткое причастие

 

Ниже перечислены все используемые граммемы:

мр, жр, ср – мужской, женский, средний род;

од, но – одушевленность, неодушевленность;

ед, мн – единственное, множественное число;

им, рд, дт, вн, тв, пр, зв – падежи: именительный, родительный, дательный, винительный, творительный, предложный, звательный;

2 – обозначает второй родительный или второй предложный падежи;

св, нс – совершенный, несовершенный вид;

пе, нп – переходный, непереходный глагол;

дст, стр. – действительный, страдательный залог;

нст, прш, буд – настоящее, прошедшее, будущее время;

пвл – повелительная форма глагола;

1 л, 2 л, 3 л – первое, второе, третье лицо;

0 – неизменяемое.

кр – краткость (для прилагательных и причастий).

сравн – сравнительная форма (для прилагательных).

имя, фам, отч – имя, фамилия, отчество.

кач – качественное прилагательное.

вопр, относ – вопросительность и относительность (для наречий).

дфст – слово обычно не имеет множественного числа.

жарг, арх, проф – жаргонизм, архаизм, профессионализм.

безл – безличный глагол.

Метод s_basean

Данный метод проводит поиск основы слова в массиве base. Если словоформа найдена, то вызывается метод s_flexan для анализа окончания. Если основа не найдена, выполняются методы поиска ошибки (first_err, second_err, third_err, fifth_err).

Описание заголовка метода s_basean

int s_basean (char **base, const int b_nstr, const int b_nstb, char **flex, const int f_nstr, const int f_nstb, char **morf, const int m_nstr, const int m_nstb, int &l, char *s_word);

В данный метод передаются указатели на массивы основ, окончаний и морфем, а также указатели на полученное для анализа слово и длинна этого слова.

Возвращает метод 1 в случае удачного выполнения (была найдена хотя бы одна словоформа), и 0 в случае неудачного выполнения (ни одной словоформы не было найдено).

Метод s_flexan

Данный метод вызывается из метода s_basean и проводит поиск окончания слова в массиве flex. Если окончание найдено, то вызывается метод s_mrf, для определения морфологических свойств слова.

Описание заголовка метода s_flexan:

void s_flexan (char **mas, const int str, const int stb, char *ok, const int a, char *w, char *s, int &id);

В данный метод переадются указатели на массив с окончаниями, его размерность, искомое окончание, номер строки с окончаниями, определённый в методе s_basean, и анализируемое слово.

Данный метод не возвращает никаких значений.

Метод s_mrf

Данный метод проводит поиск набора дескрипторов (морфологическая характеристика слова), в соответствии с проведённым анализом в методах s_basean и s_flexan. Метод s_mrf вызывается из метода s_flexan в случае, если было найдено окончание, и связка основа + окончание даёт анализируемое слово.

Описание заголовка метода s_mrf:

void s_mrf (char **mas, const int str, const int stb, char *mr, char *en);

В данный метод передаются указатели на массив дескрипторов mrf, размерности этого массива, и строка содержащая морфологическое описание данного слова. Так как у одного слова может быть несколько морфологических характеристик, то данная строка может содержать несколько наборов дескрипторов.

Метод first_err

Данный метод строит полное обратное отображение словоформы третьей категории ошибок. Метод последовательно удаляет букву из переданной словоформы.

Описание заголовка метода third_err

void first_err (char *s_word, char **ot, int &f, int q);

В данный метод передаётся полученное для анализа слово, и указатель на массив, в который будут передано множество полного обратного отображения словоформы. После построения данного множества, для каждого из обратного отображения вызывается метод s_basean и проводится попытка найти сгенерированную словоформу в словаре. Если словоформа найдена, дальнейшее выполнение останавливается и подсистема предлагает замену слова. Если словоформа не найдена то вызывается метод sec_err для поиска ошибки второй категории.

Метод sec_err

Данный метод строит полное обратное отображение словоформы по первой категории ошибок. Метод последовательно подставляет на каждое место в слове символ алфавита русского языка.

Описание заголовка метода fifth _err

void sec_err (char *s_word, char **ot, int &f, int q);

В данный метод передаётся полученное для анализа слово и указатель на массив, в который будут передано множество полного обратного отображения словоформы. После построения данного множества, для каждого из обратного отображения вызывается метод s_basean и проводится попытка найти сгенерированную словоформу в словаре. Если словоформа найдена, дальнейшее выполнение останавливается и подсистема предлагает замену слова. Если словоформа не найдена то считается, что для данной словоформы не удалось создать полное обратное отображение и данная словоформа помечается как не найденная в словаре.

 

2.7 Тестовые примеры

 

Для тестирования алгоритмов морфологического анализа были выбраны слова различных частей речи и с различными морфемными свойствами, также учитывается наличие словоформ имеющих различную морфологию, но не отличающихся друг от друга при написании.

Для тестирования алгоритмов исправления ошибок были составлены слова с ошибками первого и второго рода.

Результаты тестирования указаны в таблице 3.3.

 

Таблица 3.3. Результаты тестирования модуля морфологического анализа

Тестовое слово

Результат работы морфологического анализа

Существительное

лес С мр, ед, им С мр, ед, вн С жр, мн, рд мама С жр, ед, им люди С мр, мн, им дети С мр, мн, им

Глагол

ехать ИНФИНИТИВ дст едешь Г дст, нст, 2 л, ед идти ИНФИНИТИВ дст приехал Г дст, прш, мр, ед

Прилагательное

красивый П мр, ед, им, од, но П мр, ед, вн, но прекрасный П мр, ед, им, од, но П мр, ед, вн, но

 

синий П мр, ед, им, од, но П мр, ед, вн, но

Числительное

пять ЧИСЛ им ЧИСЛ вн восьмой ЧИСЛ-П мр, ед, им, од, но ЧИСЛ-П мр, ед, вн, но ЧИСЛ-П жр, ед, рд, од, но ЧИСЛ-П жр, ед, дт, од, но ЧИСЛ-П жр, ед, тв, од, но ЧИСЛ-П жр, ед, пр, од, но шестью ЧИСЛ тв Н

Местоимения

я МС 1 л, ед, им ты МС 2 л, ед, им мы МС 1 л, мн, им наш МС-П мр, ед, им, од, но МС-П мр, ед, вн, но

Предлоги

под ПРЕДЛ над ПРЕДЛ в ПРЕДЛ

Союзы

и СОЮЗ но СОЮЗ

Междометия

ах МЕЖД ух МЕЖД ой МЕЖД

Причастие

идущий ПРИЧАСТИЕ од, но, нст, дст, ед, мр, им ПРИЧАСТИЕ но, нст, дст, ед, мр, вн смотревший ПРИЧАСТИЕ од, но, прш, дст, ед, мр, им ПРИЧАСТИЕ но, прш, дст, ед, мр, вн

 

шедший ПРИЧАСТИЕ од, но, прш, дст, ед, мр, им ПРИЧАСТИЕ но, прш, дст, ед, мр, вн

Деепричастие

приехав ДЕЕПРИЧАСТИЕ дст, прш уйдя ДЕЕПРИЧАСТИЕ дст, прш въехав ДЕЕПРИЧАСТИЕ дст, прш

Наречие

круто Н однажды Н вкратце Н

Исправление ошибок

Категория ошибки

Вводимое слово Найденная словоформа

1. (удвоение символа)

клаввиатура клавиатура С жр, ед, им оффис офис С мр, ед, им С мр, ед, вн лиист лист С мр, ед, им С мр, ед, вн

 

теллефон телефон С мр, ед, им С мр, ед, вн

2. (перестановка двух соседних символов)

аглоритм алгоритм С мр, ед, им С мр, ед, вн лсе лес С мр, ед, им С мр, ед, вн С жр, мн, рд

1,2

сааш

САШ С мр-жр, имя, мн, рд С мр-жр, имя, мн, вн САША С мр-жр, имя, ед, им

мрое

РОЕ С мр, ед, пр С мр, имя, ед, пр МОРЕ С мр, ед, пр С жр, имя, ед, дт С жр, имя, ед, пр С ср, ед, им С ср, ед, вн С ср, ед, пр        

 

 



Оценка рынка продукта

Основные этапы исследования рынка. Потенциальные покупатели. Кто, сколько и когда будет готов купить данную продукцию в ближайшие несколько лет.

Конкуренция

Обзор производителей аналогичных товаров и их объема продаж, доходы, виды услуг, предоставляемые по сервисному обслуживанию. Доля внимания, уделяемая рекламе товара. Особенности продукции конкурента, а именно, основные характеристики, уровень цен, уровень качества, дизайн, возможности внедрения новых моделей, мнения покупателей.

Стратегия маркетинга

Схема распространения товара. Методы продажи через собственные торговые точки и через оптовые торговые организации. Методика определения цен, ожидаемый уровень рентабельности на вложенные средства. Реклама: методы организации и величина средств, необходимых для реализации рекламного проекта. Методы стимулирования продаж. Организация сервисного обслуживания клиентов. Формирование общественного мнения о предприятиях и товарах, разработка методик, позволяющих добиваться хорошей репутации.

План производства

Вид предприятия (действующее или вновь создаваемое). Необходимые производственные мощности. Места и условия закупки сырья, материалов и комплектующих. Предполагается ли производственная кооперация и с кем? Схема производственных потоков на предприятие. Как и куда будет поставляться с предприятия? Организация процесса контроля качества. Оценка возможных издержек производства и ее динамика на перспективу.

Организационный план

Организационная структура предприятия: взаимодействие все служб, координация и контроль их деятельности. Оплата и стимулирования труда руководящего персонала. Определение профиля, уровня образования и опыта специалистов, а также оценка их заработной платы, необходимые для успешного ведения дел.

Юридический план

Форма собственности и правовой статус предприятия.

Оценка риска и страхование

Освещаются проблемы, которые могут возникать у предприятия в процессе реализации проекта и основные методы защиты от потенциальных трудностей. Содержит следующие составные части: перечень возможных рисков с указанием вероятности их возникновения и ожидаемого ущерба от этого; организационные меры по профилактике и нейтрализации рисков: программу страхования от рисков.

Финансовый план

Прогноз объема реализации. Баланс денежных расходов и поступлений. Таблица доходов и затрат. Сводный баланс активов и пассивов предприятия. График достижения безубыточности.

Стратегия финансирования

Излагается план создания нового предприятия или расширения уже функционирующего. При составлении этой части бизнес-плана предприятие обязано рассмотреть следующие вопросы: средства необходимые для реализации предлагаемого проекта; источник финансирования; сроки окупаемости и размеры ожидаемого дохода от реализации проекта.


3.2 Организация и планирование работ

 

Основными задачами планирования работ по теме являются:

– взаимная увязка всех работ;

– согласование выполнения отдельных этапов работ во времени, определение длительностей работ, обеспечение их во времени и выполнение их в установленные сроки;

– определение общего объема работ и потребное для его выполнение трудовых, материальных и денежных ресурсов;

- достижение наилучшего использования выделенных ресурсов.

Выполнение этих работ ведется в направлении составления календарных ленточных графиков выполнения работ по теме. Это обусловлено тем, что выполняемая тема имеет небольшое количество работ. Работы имеют простую взаимосвязь и малую параллельность. Круг исполнителей по теме малочислен.

Планирование НИР с применением ленточного графика ведется следующим образом:

– составляется перечень работ;

– устанавливается последовательность работ;

– определяется продолжительность работ;

– строится ленточный график;

– определяется общий срок выполнения работ.

В перечне работ последовательно указываются номер и наименование работ в порядке их выполнения, а также наиболее вероятные сроки выполнения. Таблица 3.1.

Затем на основе данных таблицы 3.1. строится график выполнения работ рисунок 3.1.


Таблица 4.1.

№ п./п. Наименование работ Срок выполнения (дни)
1 Формирование требований пользователя к программному обеспечению 4
2 Обоснование актуальности поставленной задачи 5
3 Разработка и утверждение технического задания на создание программного обеспечения 7
4 Выбор возможных вариантов построения программного обеспечения 4
5 Разработка общего описания алгоритма функционирования программного обеспечения 8
6 Определение структуры и формы представления входных и выходных данных 5
7 Разработка структуры программного обеспечения 9
8 Разработка алгоритма программного обеспечения 14
9 Формирование текста программного обеспечения 22
10 Отладка программного обеспечения 11
11 Проверка возможности функционирования программного продукта 4
12 Корректировка программного продукта по результатам проверки 8
13 Подготовка технической документации на программный продукт 10
14 Подготовка отчета о проведение работ по теме 5
15 Сдача темы заказчику 3

 



Маркетинг

 

Маркетинг можно определить, как систему организации и управления деятельностью предприятия, направленную на обеспечение максимального сбыта продукции, как процесс прогнозирования потребностей рынка и удовлетворения этих потребностей путем предложения соответствующих товаров и услуг.

Другими словами, маркетинг – это приведение всех ресурсов предприятия в соответствии с требованиями и возможностями рынка для получения прибыли.

Основополагающий принцип концепции маркетинга: сначала узнать, какой товар, с какими потребительскими свойствами, по какой цене и в каких конкретных местах хочет приобрести потенциальный покупатель, а потом уже только и никак не раньше думать об организации производства, т.е. утверждается принцип: «производить то, что безусловно пользуется платежеспособным спросом».

Таким образом маркетинг можно рассматривать как систему управлением производством.

Процесс маркетинга начинается с изучения покупателя, выявления его потребностей и завершается приобретением покупателем товара (рис. 2).

Спрос на любой товар никогда не существует «сам по себе». Он всегда отражает финансовые возможности покупателя и его потребность в данном товаре. Поэтому спрос нередко называют «платежеспособной потребностью».

Мероприятия по формированию спроса имеют целью предоставить информацию для принятия решения по приобретению товара. К числу таких мероприятий относится: реклама, участие в ярмарках и выставках.

К мероприятиям формирующим предложение можно отнести любые мероприятия способствующие расширению продажи товара.

Эти мероприятия считаются особенно уместными, когда на рынке имеется много конкурирующих между собой товаров с примерно равными потребительными свойствами.

К ним можно отнести:

– скидки на количество изделий в приобретаемой партии товара;

– бонусные скидки постоянным покупателям;

– кредиты в различных его формах;

– прием подержанного товара прежней модели в качестве первого взноса за новую модель;

– подарки купившим определенное количество товара;

- резкое снижение цены в связи с переходом к выпуску новой модели.

Соотношение спроса и предложения на товар формирует понятие активной стороны на рынке. Когда спрос значительно превышает предложение, мы имеем дело с «рынком продавца». Любой товар и услуги находят на нем немедленный сбыт. Товарный ассортимент – беден, конкуренция – отсутствует. Противоположная ситуация характеризует «рынок покупателя», когда предложение значительно превышает спрос.

Следовательно дефицит и избыток товароы на рынке определяется как разница между величинами предложения и спроса. Если разница положительна (ВП > ВС) возникает дефицит.

В свою очередь величина спроса определяется следующим образом:

 

ВCi = Цi Qn Nn, где

 

Цi – цена i – го изделия;

Qn – спрос одного покупателя;

Nn – количество покупателей,

а величина предложения

 

ВПi = Цi Qiт Пт, где

 

Qiт – объем поставки i – го изделия на на рынок одним товаропроизводителем;

Пт – количество товаропроизводителей, поставляющих аналогичный товар.

Общая величина спроса (ВСоб) и предложения (ВПоб) – это сумма частных величин спроса (ВСi) и предложения (ВПi), где n, m – количество изделий, учитываемых при оценке величины спроса и предложения.



Введение

 

Важным моментом в комплексе мероприятий направленных на совершенствование условий труда являются мероприятия по охране труда. Этим вопросам с каждым годом уделяется все большее внимание, т. к. забота о здоровье человека стала не только делом государственной важности, но и элементом конкуренции работодателей в вопросе привлечения кадров. Для успешного воплощения в жизнь всех мероприятий по охране труда необходимы знания в области физиологии труда, которые позволяют правильно организовать процесс трудовой деятельности человека.

Требования к микроклимату помещения

 

Нормирование параметров воздушной среды осуществляется в зависимости от периода года и тяжести выполняемых работ (легкие, средней тяжести, тяжелые). Установлены два периода года: теплый (среднесуточная температура больше +10 оС) и холодный (среднесуточная температура меньше +10 оС).

Категория работ по тяжести – легкая 1а. К этой категории относятся работы, производимые сидя и не требующие физического напряжения, при котором расход энергии составляет до 140 Дж/с.

Поэтому оптимальные параметры микроклимата помещения должны обеспечиваться для категории 1а в соответствии с соответствующими нормативными требованиями ГОСТ 12.1.005–88.

Основные параметры микроклимата анализируемого помещения приведены в таблице 4.1 вместе с оптимальными значениями.

Таблица 4.1 Параметры микроклимата помещения для категории работ – легкая 1а

Период года

 

Температура воздуха,°С

Относительная влажность воздуха, %

Скорость движения воздуха, м/с

Существующее значение Оптимальное значение Существующее значение Оптимальное значение Существующее значение Оптимальное значение
Холодный 21–23 22–24 55 40–60 0,1 0,1
Теплый 23–25 23–25 60 40–60 0,1 0,1

 

Для создания оптимального микроклимата необходимо наличие систем:

– Обще-обменная вентиляция / кондиционирование;

–  система водяного отопления.

При пониженной температуре воздуха в помещении с учетом всех мер противопожарной безопасности установить дополнительные обогревательные приборы, система кондиционирования.

При пониженной влажности воздуха в помещении установить увлажнители воздуха.

 

Требования к освещению помещения

 

В помещении имеются источники естественного и искусственного освещения. Естественное освещение в помещении осуществляется через окна (кол-во: 1, Sокна = 2,025 м2). Искусственное освещение осуществляется системой общего равномерного освещения лампами накаливания общего назначения. Допускается использование местного освещения, предназначенного для освещения зоны расположения документов.

Работа за ПЭВМ относится к работам высокой точности.

Минимальный объект различения при работе с ПЭВМ – это точка на экране дисплея (обычно – (0,3–0,5) мм, фон – светлый, контраст текста и фона – большой). Длительность работы за компьютером по отношению ко всему рабочему времени составляет не более 70%. Поэтому работа на компьютере оценивается как зрительные работы высокой точности, разряд Б подразряд 2.

Система искусственного освещения общего типа состоит из одного четырехламповых светильника, установленного на потолке. В светильниках используются лампы накаливания общего назначения типа Б 215–225–150–1 со световым потоком 2220 лм.

Освещенность на поверхности стола в зоне размещения рабочего документа должна быть Ен = 300 лк. Местное освещение не должно создавать бликов на поверхности экрана. КЕОн = 1%.

Расчет количества светильников, необходимых для достижения нормативного значения освещенности. Расчет освещенности производится по коэффициенту использования светового потока.

При этом общее число светильников определяется по формуле

 

,                                             (1)

 

где Nсв – количество светильников в помещении, шт.;

Е – значение освещенности, лк;

S – площадь помещения, м2;

Kз – коэффициент запаса;

z – коэффициент минимально освещенности;

Фл – световой поток лампы, лм;

n – количество ламп в одном светильнике, 4 шт.;

η – коэффициент использования светового потока.

Индекс помещения находим по формуле

 

,                                           (2)

 

где А – длина помещения, м;

В-ширина помещения, м;

Нсв – высота подвеса светильников, м.

Согласно формуле (2)

По индексу помещения определяется значение коэффициента использования светового потока  = 0,18 (при  и ). Найдем для рассматриваемого помещения необходимое количество светильников из формулы (1)

шт.

Для достижения нормативного значения освещенности необходимо добавить три четырехламповых светильника, либо заменить лампы на лампы большей мощности.

 

Требования безопасности при устройстве и эксплуатации коммуникаций

 

По степени электробезопасности рассматриваемое помещение относится к помещениям с повышенной опасностью, поскольку не исключается возможность одновременного прикосновения человека к заземленным металлическим конструкциям и корпусам оборудования.

Для защиты от поражения электрическим током при прикосновении к металлическим частям оборудования, которые могли случайно оказаться под напряжением, выполнено защитное заземление корпуса установки, R < 4 Ом. Для защиты сети от перегрузки существуют предохранители.

Внутренние коммуникации (электрические) размещаются в каналах, расположенных внутри стен. Эффективным средством профилактики несчастных случаев является наиболее удачное расположение оборудования, использование, по возможности, приборов и оборудования с наиболее оптимальными конструктивными решениями. Важным средством обеспечения безопасности служит надежная изоляция токонесущих частей, кабелей, а также, заземление корпусов всех приборов и металлических частей оборудования.

 

Таблица 4 – Определение категории пожароопасных помещений

Наименование категории Удельная пожарная нагрузка, МДж/м2
В1 более 2200
В2 1401–2200
В3 181 – 1400
В4 1 – 180

 

Расчет зануления

 

Цель расчета зануления – определить сечение защитного нулевого провода, удовлетворяющего условию срабатывания максимальной токовой защиты, при известных остальных параметрах сети и заданных параметрах автоматического выключателя или плавкой вставки.

Допустим установлен распределительный щиток с защитным занулением. Электрическая сеть с глухозаземленной нейтралью имеет напряжение Uф = 200 В.

Необходимо вычислить действительное значение тока однофазного короткого замыкания и сравнить его с наименее допустимым, при известных остальных параметрах сети и защитного нулевого провода.

Условия срабатывания защиты

 

IК = k × IН,                                                    (5)

 

где IК – ток однофазного короткого замыкания, А;

k – коэффициент, принимается в зависимости от типа защиты электроустановки;

IН – номинальный ток срабатывания автоматического выключателя, А.

Если защита осуществляется автоматическим выключателем, срабатывающем без выдержки времени, то k принимается в пределах 1,25–1,4. Определяем наименьшее допустимое по условиям срабатывания значение тока: IК = 1,25 × 40 = 50 А.

Полное сопротивление трансформатора: ZТ = 1,949 Ом.

Вычисляем сопротивление фазного проводника (R, Ом) по формуле

 

R = ρ*l/S,                                                      (6)

 

где r – удельное сопротивление проводника, Ом × мм2/м;

l – длина проводника, м;

S – сечение проводника, мм2.

Тогда для линии длиной 100 м получаем активное сопротивление фазного проводника

RФ = 0,018 × 100/2,25 = 0,8 Ом.

Поскольку провод медный, принимаем внутреннее индуктивное сопротивление фазного проводника Хф = 0.

Вычисляем плотность тока в стальном нулевом защитном проводнике

δ = IK/S = 50/(40 × 2) = 0,625 А/мм2.

Активное сопротивление стального проводника rw=4,2 Ом/км.

Индуктивное сопротивление стального проводника xw=2,52 Ом/км. Тогда для линии длиной 100 м имеем:

RН.З = rw × l = 4,2 × 0,1 = 0,42 Ом, XН.З = xw × l = 2,52 × 0,1 = 0,252 Ом.

Определяем внешнее индуктивное сопротивление петли фаза-нуль (Ом/км) по формуле

 

,                          (7)

 

где w – угловая частота, рад × с-1;

L – индуктивность линии, Г;

m – относительная магнитная проницаемость среды;

m0 = 4p × 10–7, Г/м – магнитная постоянная;

l – длина линии, км;

D – расстояние между проводами линии, м.

Получаем: ХП = 0,6 × l = 0,6 × 0,1 = 0,06 Ом.

Действительное значение тока однофазного короткого замыкания, проходящего по петле фаза-нуль при замыкании фазы на корпус персонального компьютера вычисляется по формуле


,               (8)

 

Согласно формуле (8)

 

= 115 А.

 

Вывод: поскольку действительное (вычисленное) значение тока однофазного короткого замыкания превышает наименьшее допустимое по условиям срабатывания защиты значение 50 А, проводник выбран правильно, т.е. обеспечена отключающая способность системы зануления.

 


Вывод

 

Площадь на одного работающего составляет 6,5 м2, а объем – 17,6 м3, что соответствует нормативам, по которым на одного человека необходимо не меньше 6 м2. Расстояние между боковыми поверхностями мониторов компьютеров составляет около 1,5 метров, что не противоречит нормативам, по которым расстояние должно быть не менее 1,2 м. Общее размещение оборудования обеспечивает безопасный проход по комнате.

В помещении имеются источники естественного и искусственного освещения. Естественное освещение осуществляется через окна.

Для достижения нормативного значения освещенности необходимо добавить три четырехламповых светильника, либо заменить лампы, на лампы большей мощности.

Требуемое количество огнетушителей: 1 пенный огнетушитель вместимостью 10 л или 1 порошковый огнетушитель вместимостью 10 л или 9 кг.

Расчёт показал, что выбранное место соответствует нормам описанным в ГОСТах и СНИПах.

 

 



Заключение

 

В данном дипломном проекте решена задача разработки алгоритмов морфологического анализа. В ходе выполнения проекта был проведен анализ существующих решений в сфере программных продуктов проверки орфографии. Также был разработан словарь для морфологического разбора слова и реализованы алгоритмы для исправления ошибок при печати оператором.

Алгоритмы спроектированы с учетом возможности их интеграции в существующие программные решения. Также алгоритмы пополняемы и расширяемы. Алгоритмы построены согласно ГОСТ 19.701–90.

В организационно-экономической части дипломного проекта «Разработка подсистемы синтаксического анализа информационной системы» был составлен бизнес-план, рассчитаны смета затрат и договорная цена, а так же произведена оценка разрабатываемой подсистемы.

В организационной части был определен состав коллектива, основные этапы работ и график календарных работ.

В экономической части рассчитаны основная и дополнительная заработная плата коллектива, единый социальный налог, затраты на материалы и покупные изделия, накладные расходы, прибыль, налог на добавленную стоимость и договорная цена.

В части «Экологичность и безопасность проекта» дипломного проекта «Разработка подсистемы морфологического анализа информационной системы разбора текстов русского языка» был произведён расчёт оптимального места программиста. Рассчитан необходимый объём пространства для безопасной работы и указаны требования к пожаробезопасности помещения, в котором проводятся работы.

Введение

 

В данном дипломном проекте ставится задача разработки алгоритмов морфологического анализа. В ходе выполнения проекта был проведен анализ существующих решений в сфере программных продуктов проверки орфографии. Был проведен анализ правил русского языка, которые используются при машинном анализе текста.

Алгоритмы спроектированы с учетом возможности их интеграции в существующие программные решения. Также алгоритмы дополняемы и расширяемы. Алгоритмы построены согласно ГОСТ 19.701–90.

 

 



Обзор существующих решений в области разработки подсистемы синтаксического анализа

 

Присутствующие сегодня на рынке программных продуктов системы проверки орфографии можно поделить на несколько условных категорий.

 

Дата: 2019-05-29, просмотров: 173.