Основные особенности экономической информации следующие:
· большие объемы ежегодно создаваемой, обрабатываемой и хранимой информации;
· большая часть этой информации имеет символьное представление, слабо приспособленное для логической и арифметической обработки;
· высокий уровень стоимостных и трудовых затрат на поиск и обработку экономической информации.
Для того, чтобы приспособить экономическую информацию для эффективного поиска, обработки на ЭВМ и передачи по каналам связи, ее необходимо представить в цифровом виде. С этой целью ее нужно сначала упорядочить (классифицировать), а затем формализовать (закодировать).
Классификатор - это документ, с помощью которого осуществляется формализованное описание экономической информации в ЭИС, содержащей наименования объектов, наименования классификационных группировок и их кодовые обозначения.
В настоящее время чаще всего применяются два типа систем классификации: иерархическая и фасетная.
Иерархическая система классификации строится следующим образом:
· исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень;
· каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком, делится на подклассы, которые образуют 2-й уровень;
· каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень и т.д.
При использовании иерархической системы классификации необходимо соблюдать следующие ограничения:
· получающиеся на каждом уровне классификационные группировки должны составлять исходное множество объектов;
· классификационные группировки на каждой ступени не должны пересекаться;
· классификация на каждой ступени должна проводиться только по одному признаку.
Достоинства иерархической системы классификации:
· простота построения;
· использование независимых классификационных признаков в различных ветвях иерархической структуры.
Недостатки иерархической системы классификации:
· жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки;
· невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.
Пример. Пусть требуется создать иерархическую систему классификации для информационного объекта «Факультет», которая позволит классифицировать информацию обо всех студентах по следующим классификационным признакам: факультет, на котором он учится; возрастной состав студентов; пол студента; для женщин - наличие детей. Система классификации представлена на рис.3.1 и будет иметь следующие уровни:
· 0-й уровень. Информационный объект «Факультет»;
· 1-й уровень. Выбирается классификационный признак - название факультета, что позволяет выделить несколько классов с разными названиями факультетов, в которых хранится информация обо всех студентах;
· 2-й уровень. Выбирается классификационный признак - возраст, который имеет три градации: до 20 лет, от 20 до 30 лет, свыше 30 лет. По каждому факультету выделяются три возрастных подкласса студентов;
· 3-й уровень. Выбирается классификационный признак - пол. Каждый подкласс 2-го уровня разбивается на две группы. Таким образом, информация о студентах каждого факультета в каждом возрастном подклассе разделяется на две группы - мужчин и женщин.
Созданная иерархическая система классификации имеет глубину классификации, равную трем.
Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами (facet - рамка). Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.
Пример. Фасет специальность содержит названия специальностей. Фасет образование содержит значения: среднее, среднее специальное, высшее.
Схема построения фасетной системы классификации в виде таблицы отображена на рис. 3.2. Названия столбцов соответствуют выделенным классификационным признакам (фасетам), обозначенным Ф1, Ф2,..., Фi,..., Фn. Например, цвет, размер одежды, вес и т.д. Произведена нумерация строк таблицы. В каждой клетке таблицы хранится конкретное значение фасета. Например, фасет цвет, содержит значения: красный, белый, зеленый, черный, желтый.
Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты. Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования: Ks=( Ф1, Ф2,..., Фi,..., Фn).
При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись. Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета.
Достоинства фасетной системы классификации:
· возможность создания классификации большой емкости, т.е. использования большого числа признаков классификации и их значений для создания группировок;
· возможность простой модификации всей системы классификации без изменения структуры существующих группировок.
Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.
Пример. Обратимся к содержанию примера, где показано построение иерархической системы классификации для информационного объекта «Факультет». Разработаем фасетную систему классификации для данного объекта.
Сгруппируем и представим в виде таблицы все классификационные признаки по фасетам (см.табл.3.1):
· фасет название факультета с пятью названиями факультетов;
· фасет возраст с тремя возрастными группами;
· фасет пол с двумя градациями;
Структурную формулу любого класса можно представить в виде:
Ks=(Факультет, Возраст, Пол)
Присваивая конкретные значения каждому фасету, получим следующие классы:
К1=(Радиотехнический факультет, возраст до 20 лет, мужчина);
K2=(Экономический факультет, возраст от 20 до 30 лет, мужчина);
К3=(Математический факультет, возраст до 20 лет, женщина) и т.д.
Таблица 3.1 | ||
Классификационные признаки | ||
Название факультета | Возраст | Пол |
Экономический | До 20 лет | М |
Информационных систем | 20-30 лет | Ж |
Математический | Свыше 30 лет | |
Радиотехнический | ||
Машиностроительный |
Дата: 2016-09-30, просмотров: 228.