Дескрипторная система классификации
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска.

Суть дескрипторного метода классификации заключается в следующем:

· отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы;

· выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых;

· создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

 

Пример 2.13. В качестве объекта классификации рассматривается успеваемость студентов. Ключевыми словами могут быть выбраны: оценка, экзамен, зачет, преподаватель, студент, семестр, название предмета. Здесь нет синонимов, и поэтому указанные ключевые слова можно использовать как словарь дескрипторов. В качестве предметной области выбирается учебная деятельность в высшем учебном заведении. Ключевыми словами могут быть выбраны: студент, обучаемый, учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор, коллега, факультет, подразделение университета, аудитория, комната, лекция, практическое занятие, занятие и т.д. Среди указанных ключевых слов встречаются синонимы, например: студент, обучаемый, учащийся, преподаватель, учитель, педагог, факультет, подразделение университета и т.д. После нормализации словарь дескрипторов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, доцент, профессор, факультет, аудитория, лекция, практическое занятие и т.д.

Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:

· синонимические указывающие некоторую совокупность ключевых слов как синонимы;

· родо-видовые, отражающие включение некоторого класса объектов в более представительный класс;

· ассоциативные, соединяющие дескрипторы, обладающие общими свойствами.

Пример 2.14. Синонимическая связь: студент-учащийся-обучаемый.Родо-видовая связь: университет-факультет-кафедра. Ассоциативная связь: студент-экзамен-профессор-аудитория.

 

Системы кодирования

Для полной формализации экономической информации недостаточно простой классификации, поэтому проводят следующую процедуру ─ кодирование. Кодирование ─ это процесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования. Система кодирования ─ это совокупность правил обозначения объектов и группировок с использованием кодов. Код ─ это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой. Код базируется на определенном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Различают следующие типы алфавитов: цифровой, буквенный и смешанный.

Код храктеризуется следующими параметрами:

· длиной (L);

· основанием кодирования (A);

· структурой кода, под которой понимают распределение знаков по признакам и объектам классификации ;

· степенью информативности (I), рассчитываемой как частное от деления общего количества признаков (R) к длине кода (L): I = R/L;

· коэффициентом избыточности (К изб), который определяется как отношение максимального количества объектов (Q мах) к фактическому количеству объектов (Q факт): К изб = Q мах / Q факт .

 

Все системы кодирования можно сгруппировать в два подмножества (рис. 4.4): регистрационных и классификационных систем кодирования.

Особенностью регистрационных систем кодирования является их независимость от применяемых систем классификации. Регистрационные коды используются для идентификации объектов и передачи информации об объектах на расстояние, поэтому они должны удовлетворять следующим требованиям: минимальности длины кода, однозначности соответствия наименования объекта и его кода в течение длительного периода времени и защищённости кода от помех и ошибок.

Регистрационные коды состоят из двух частей: информационной и контрольной, предназначенной для защиты передаваемой информации от ошибок. Контрольная часть может рассчитываться по различным алгоритмам, в частности наиболее употребляемыми являются следующие формулы их расчета:

K = M ─ [∑Xi / M],

K = M ─ [∑Xi * Bi / M],

где M ─ модуль (простое число, делящееся на единицу и на само себя);

Xi ─ информационные разряды, i ─ номер разряда;

Bi ─ вес информационного разряда.

К регистрационным системам относятся порядковая и серийная системы кодирования .

Порядковая система ─ это наиболее простая по своему построению система кодирования, суть использования которой заключается в последовательном присвоении каждому объекту кодируемого множества Мо номера его порядка, т.е. в присвоении цифр натурального ряда в порядке расположения объектов. Этот порядок может быть случайным или определяться после предварительной группировки объектов, например, по алфавиту. Как правило, порядковую систему применяют для кодирования малозначных, устоявшихся и простых множеств объектов, не требующих предварительной классификации.

Серийная (серийно -порядковая ) система кодирования отличается от порядковой тем, что номенклатура кодируемых объектов Мо предварительно должна быть разбита на группировки по одному признаку и каждой группировке должна быть отведена серия кодовых обозначений, в пределах которой каждому элементу присваивается свой код по порядку. Серия обозначений для каждой группировки определяются таким образом, чтобы после присваивания кодов элементам этой группы в ней оставались бы еще свободные номера на случай появления новых объектов.

Классификационные коды используют для отражения классификационных взаимосвязей объектов и группировок и применяются в основном для сложной логической обработки экономической информации на ЭВМ, отсюда вытекают требования: однозначности отображения классификационных взаимосвязей объектов и их группировок и обеспечение максимальной простоты программирования. Группу классификационных систем кодирования можно разделить на две подгруппы в зависимости от того, какую систему классификации используют для упорядочения объектов.

Последовательные системы кодирования характеризуются тем, что они базируются на предварительной классификации по иерархической системе классификации, в результате использования которой коды нижестоящих группировок образуются путём добавления кодов к кодам вышестоящих группировок .

Параллельные системы кодирования характеризуются тем, что они строятся на основе использования фасетной системы классификации, и коды группировок по фасетам формируются независимо друг от друга.

Последовательные и параллельные системы кодирования строятся на базе разрядной или комбинированной систем кодирования .

Разрядная система применяется для кодирования объектов, определяемых несколькими соподчиненными признаками, используемыми для решения экономических задач. Кодируемые объекты систематизируются по классификационным признакам на каждой ступени классификации, каждому признаку отводится определенное число разрядов, в пределах которых кодирование группировок начинается с единицы. При разрядной системе кодирования имеет место так называемое "зависимое " кодирование. Это значит, что классификационные группировки по младшим признакам кодируются в зависимости от кода группировки, образованной по старшему признаку. Запас свободных позиций определяется структурой кода.

Код объекта, построенный по этой системе, состоит из такого числа позиций (или числа групп разрядов), сколько было учтено признаков для объектов, поэтому разрядная система кодирования называется иногда позиционной системой. Конкретное значение признака, характеризующего объект, определяется позицией и значением определенного числа в структуре кода. Длина кода зависит от числа ступеней классификации, от числа классификационных группировок на каждой ступени и от основания кодирования.

Комбинированная система кодирования, обладая всеми преимуществами разрядного кода, применяется для кодирования больших номенклатур (перечней ) объектов, которые характеризуются многими соподчиненными или независимыми признаками. Эта система базируется на сочетании принципов построения таких систем кодирования, как разрядная, серийная, порядковая и кода повторения.

Код повторения (мнемокод) ─ это буквенные или буквенно-цифровые коды, которые характеризуются тем, что в структуру кода переносят часть символьных обозначений объектов с целью повышения мнемоничности кода или для сокращения его длины.

Выбор конкретной системы кодирования зависит от объема кодируемой номенклатуры, ее стабильности, от задач, стоящих перед системой, и от показателей эффективности обработки информации при использовании какой-либо системы.

 

Рассмотрим практические примеры использования некоторых кодов при компьютерном решении экономических задач.

Коды счетов бухгалтерского учета широко применяются как при ручной, так и при автоматизированной обработке. При существующей системе учета код счетов бухгалтерского учета (рабочий план счетов) может состоять из трех уровней: первый (два знака) означает балансовый счет; второй – субсчет; третий – с аналитический счет, устанавливаемый на предприятии, организации.

В машинных программах автоматизированной обработки бухгалтерского учета встречаются различные подходы к построению кода аналитического учета. Как правило, структура кода отличается различным уровнем аналитичности и разной значностью. Программы позволяют вести учет по разным уровням аналитики (разным признакам), которые устанавливаются на конкретном предприятии, организации (фирмы).

Построение кода счетов бухгалтерского учета (рабочего плана счетов) имеет большое значение в тех программах, которые не предусматривают локальной обработки отдельных участков учета, где весь учет выполняется на основании ведения журнала хозяйственных операций, что характерно для небольших предприятий. Гибкая система построения кода позволяет при этом выполнять аналитические разработки с различной степенью детализации. Уровни аналитики – это те признаки, по которым группируются данные. Например, для счета 70 «Расчеты с персоналом по оплате труда» можно выделить два уровня: первый – для подразделения, второй – для табельных номеров. В данном случае аналитические сводки будут составлены в разрезе подразделений и табельных номеров. Для счета 10 «Материалы», например, можно выделить три уровня аналитики: первый – группа материалов (один знак), субсчет установлен в плане счетов; второй – склад (один знак); третий – номенклатурный номер материалов (два знака).

При оприходовании и отпуске материалов в первичном документе должны быть проставлены все эти коды. В этом случае при автоматизированной обработке будет обеспечено получение различных сводок синтетического и аналитического учета в разрезе выделенных признаков.

Штриховое кодирование

Штриховой код точно и однозначно определяет каждый конкретный товар, т.е. по штриховому коду можно находить товар и его характеристики, хранящиеся в базе данных торговой системы. В России, как и в других Европейских странах, используется штриховой код стандарта EAN-13.

 

Он включает 13 цифр: первые определяют, где товар произведен в России; следующие цифры – это код предприятия, которое произвело данный товар; пять цифр – код товара; одна цифра – контрольная сумма, вычисляемая автоматически по определенной формуле над предыдущими цифрами.

 Стандартный набор для штрихового кодирования включает:

· принтер для маркировки товаров на складе;

· электронные весы со встроенной печатью этикеток или дополнительным принтером на фасовке весового товара;

· кассовые аппараты со сканерами штриховых кодов в торговом зале;

· мобильный терминал на складе для учета товара.

 Использование штрихового кодирования ведет к уменьшению потерь на воровство в магазинах, к отслеживанию наличия товара на складе, к мобильному управлению ценой, к организации электронного (безбумажного учета).

 

Понятие классификаторов.

Автоматизированная обработка учетной и финансово-кредитной информации в условиях применения персональных компьютеров позволяет получать различные сводки, таблицы, ведомости, где информация расположена по каким-либо группировочным реквизитам-признакам, например, по счетам бухгалтерского учета, клиентам, работающим и т.п. Для выполнения группировок появляется необходимость кодирования этих группировочных реквизитов-признаков условными обозначениями, для чего используются различные классификаторы.

Классификатор – это систематизированный свод однородных наименований, объектов, предметов, явлений по классификационным признакам (номенклатура) и их кодовых обозначений [2, с. 114]. Код – условное обозначение объекта цифровым или алфавитно-цифровыми знаками по определенным правилам, установленным системами кодирования.

Кодирование – процесс присвоения условных обозначений (кодов) позициям номенклатуры. Коды могут быть цифровыми, буквенными и комбинированными (примеры: цифровой код – 21325, буквенный – АВС, комбинированный – АБ180).

При обработке экономических задач на ПК часто применяют мнемокоды – условное короткое обозначение объекта.

Основная цель кодирования состоит в однозначном обозначении объектов. С помощью кодирования выполняются основные функции, связанные с обработкой экономической информации: минимизация объема призначной информации при вводе ее в вычислительную систему по каналам связи; сортировка и поиск информации по ключевым словам; разработка сводных экономических отчетов по различным признакам; декодирование при переходе от кодов-признаков к их наименованиям при печати сводных экономических отчетов.

Систематизация экономической информации вызывает необходимость применения различных видов классификаторов: международных и действующих только на территории Российской Федерации. Международные классификаторы входят в состав Системы международных экономических стандартов (СМЭС) и обязательны для передачи информации между различными странами. К ним относятся, например, такие принятые ООН классификаторы, как Международная стандартная отраслевая классификация всех видов экономической деятельности (МСОК), Международная стандартная торговая классификация, Классификация основных продуктов (КОП), Классификация продовольственных и сельскохозяйственных организаций и др.

Классификаторы, действующие на территории Российской Федерации, входят в Единую систему классификации и кодирования (ЕСКК), созданной по постановлению Правительства в 1970-х годах.

ЕСКК состоит из следующих групп классификаторов:

- общероссийские классификаторы (ОК), разрабатываются в централизованном порядке и являются едиными для всей страны;

- отраслевые, единые для определенной отрасли деятельности;

- региональные, единые – для определенного региона;

- локальные, составляются на номенклатуры, характерны для определенного предприятия, организации, банка (коды табельных номеров, подразделений, клиентов и др.).

При обработке учетной и финансово-кредитной информации широкое применение находят общероссийские и локальные классификаторы.

Общероссийские классификаторы (ОК) – были переработаны в соответствии с требованиями рыночной экономики и государственной программы перехода РФ на Международную систему учета и статистики. В настоящее время их создано свыше четырех десятков.

Здесь следует привести примеры построения кодовых слов некоторых ОК, имеющих наибольшее применение при автоматизированной обработке учетной и финансово-кредитной информации.

ОКПО – ОК предприятий и организаций формируется органами государственной статистики путем присвоения кодовых номеров предприятиям, организациям, фирмам любой формы собственности. Кодовое слово состоит из трех блоков: 1 – регистрационный номер, 2 – наименование организации, 3 – ведомственная, территориальная и отраслевая принадлежность предприятия, организации, фирмы. Регистрационный номер (часть кодового слова) проставляется предприятиями и организациями в формах финансовой отчетности. Все три блока кодового слова используются органами государственной статистики для автоматического ведения ОКПО в электронном виде. Регистрационный номер состоит из восьми знаков; построен по комбинированной системе.

ОКВЭД – ОК видов экономической деятельности; (построен в соответствии с требованиями Европейского экономического сообщества – ЕЭС); кодовое слово шестизначное, включает пять признаков (класс, подкласс, группа, подгруппа, вид).

ОКФС – ОК форм собственности, двузначный, например: 10 – российская собственность, 20 – собственность иностранных государств.

ОКОПФ – ОК организационно-правовой формы включает двузначное кодовое слово. Например, код 65 – общество с ограниченной ответственностью; 67 – закрытое акционерное общество.

ОКУД – ОК управленческой документации. Объектом классификации являются общероссийские унифицированные формы документов, утверждаемые министерствами (ведомствами) РФ, входящие в унифицированную систему документации (УСД). Код состоит из семи знаков. Первые два знака указывают на принадлежность документа к определенной сфере деятельности. Например: 03 – первичная учетная документация (0315003 – приходный ордер); 04 – банковские документы; 07 – бухгалтерская отчетная документация (0700001 – баланс).

ОКОГУ – ОК органов государственного управления – объектами классификации являются органы государственной власти и управления; код пятизначный.

ОКАТО – ОК административно-территориального деления; кодовое слово включает восемь знаков. Объектами классификации являются республики, края, области, города, районы, округа, поселки городского типа, сельские населенные пункты.

ИНН – идентификационный номер налогоплательщика, является десятизначным; обозначает территорию, номер инспекции Министерства по налогам и сборам (ИМНС), порядковый номер организации [2, с. 118].

ОКОФ – ОК основных фондов, построен с учетом международной классификации отраслей и основных продуктов, имеет кодовое десятизначное слово.

ОКЕИ – ОК единиц измерения, построен на основе международной классификации единиц измерения Европейской экономической комиссии ООН (ЕЭК ООН). Единицы измерения в ОКЕИ разбиты на семь групп: меры длины, площади, объема, массы, технические единицы, единицы времени, экономические единицы (штука, тысячи штук). Код трехзначный, построен по серийной системе. Например, единица измерения в балансе, тыс.руб. имеет код 384.

К общероссийским классификаторам также относятся: ОКИН – ОК информации о населении; ОКУН – ОК услуг населению; ОКПДТР – ОК профессий рабочих, должностей служащих и тарифных разрядов; ОКВ – классификатор валюты; ОКП – ОК продукции и др.

 

При регистрации предприятия (организации) в органах государственной статистики его включают в Единый государственный регистр предприятий и организаций (ЕГПРО) и присваивают коды по следующим классификаторам: ОКПО, ОКВЭД, ОКФС, ОКОГУ, ОКОПФ, ОКАТО. Присвоенные кодовые обозначения отражаются в первичной и сводной унифицированной документации предприятия и организации.

Кратко рассмотрим порядок составления локальных классификаторов, который включает два этапа. На первом этапе выполняется классификация информации, на втором – ее кодирование.

Классификация начинается с выявления номенклатуры объектов, предметов, подлежащих кодированию. При этом руководствуются реквизитами-признаками, которые используются для составления группировок, получения сводных таблиц и расчетов. По каждой номенклатуре составляется полный перечень всех позиций, подлежащих кодированию.

 

Понятие системы

В научно-технической литературе часто используются термины ≪система≫, ≪система управления≫, ≪автоматизированная система управления≫, ≪автоматизированные информационные системы≫.

Слово ≪система≫ происходит от греческого systema, что означает целое, составленное из частей или множества элементов,

связанных друг с другом и образующих определенную целостность, единство. Понятие ≪система≫ имеет широкую область применения.

Под системой понимается совокупность связанных между собой и с внешней средой элементов или частей, функционирование которых направлено на получение конкретного полезного результата.

В соответствии с этим определением практически каждый экономический объект можно рассматривать как систему, стремящуюся в своем функционировании к достижению определенной цели. В качестве примера можно назвать систему образования, энергетическую, транспортную, экономическую и др.

Для системы характерны следующие основные свойства:

· сложность;

· делимость;

· целостность;

· многообразие элементов и различие их природы;

· структурированность.

Сложность системы зависит от множества входящих в нее компонентов, их структурного взаимодействия, а также от сложности внутренних и внешних связей и динамичности.

Делимость системы означает, что она состоит из ряда подсистем или элементов, выделенных по определенному признаку, отвечающему конкретным целям и задачам.

Целостность системы означает, что функционирование множества элементов системы подчинено единой цели.

Многообразие элементов системы и различия их природы связано с их функциональной специфичностью и автономностью. Например, в материальной системе объекта, связанной с преобразованием вещественно-энергетических ресурсов, могут быть выделены такие элементы, как сырье, основные и вспомогательные материалы, топливо, полуфабрикаты, запасные части, готовая продукция, трудовые и денежные ресурсы.

Структурированность системы определяет наличие установленных связей и отношений между элементами внутри системы, распределение элементов системы по уровням иерархии.

Управление — важнейшая функция, без которой немыслима целенаправленная деятельность любой социально-экономической, организационно-производственной системы (предприятия, организации, территории).

Систему, реализующую функции управления, называют системой управления. Важнейшими функциями, реализуемыми этой системой, являются прогнозирование, планирование, учет, анализ, контроль и регулирование.

Управление связано с обменом информацией между компонентами системы, а также системы с окружающей средой. В процессе управления получают сведения о состоянии системы в каждый момент времени, о достижении (или не достижении) заданной цели с тем, чтобы воздействовать на систему и обеспечить выполнение управленческих решений.

Таким образом любой системе управления экономическим объектом соответствует своя информационная система, называемая экономической информационной системой.

Экономическая информационная система (ЭИС) — это совокупность внутренних и внешних потоков прямой и обратной информационной связи экономического объекта, методов, средств, специалистов, участвующих в процессе обработки информации и выработке управленческих решений.

Дата: 2019-04-23, просмотров: 993.