Проблема представления знаний для ИС чрезвычайно актуальна, так как ИС - это система функционирование которой опирается на знания о предметной области, которые хранятся в её памяти. Представление знаний - это одно из направлений в исследованиях по искусственному интеллекту. Другие направления это – манипулирование знаниями, общение, восприятие, обучение и поведение. Перечислим ряд особенностей присущих различным формам представления знаний в ЭВМ.
1. Внутренняя интерпретируемость. Каждая информационная единица должна иметь уникальное имя, по которому ИС находит её, а также отвечает на запросы, в которых это имя упомянуто.
2. Структурированность. Информационные единицы должны были обладать гибкой структурой. Для них должен выполняться 'принцип матрешки', т.е. рекурсивная вложенность одних информационных единиц в другие. Каждая информационная единица может быть включена в состав любой другой, и из каждой единицы можно выделить некоторые её составляющие. Другими словами должна существовать возможность произвольного установления между отдельными информационными единицами отношений типа 'часть - целое',' род -вид' или 'элемент - класс'.
3. Связность. В информационной базе между информационными единицами должна быть предусмотрена возможность установления связей различного типа. Прежде всего эти связи могут характеризовать отношения между информационными единицами.. Перечисленные три особенности знаний позволяют ввести общую модель представления знаний, которую можно назвать семантической сетью, представляющей собой иерархическую сеть в вершинах которой находятся информационные единицы.
4. Семантическая метрика. На множестве информационных единиц в некоторых случаях полезно задавать отношение, характеризующее информационную близость информационных единиц, т.е. силу ассоциативной связи между информационными единицами.
5. Активность. С момента появления ЭВМ и разделения используемых в ней информационных единиц на данные и команды создалась ситуация, при которой данные пассивны а команды активны. Все процессы протекающие в ЭВМ инициируются командами, а данные используются этими командами лишь в случае необходимости. Перечисленные пять особенностей информационных единиц определяют ту грань, за которой данные превращаются в знания, а базы данных перерастают в базы знаний (БЗ).
Вариант 1 Какие существуют меры информации и когда ими надо пользоваться
Для измерения информации вводятся два параметра: количество информации I и объем данных Vд. Эти параметры имеют разные выражения и интерпретацию в зависимости от рассматриваемой формы адекватности. Каждой форме адекватности соответствует своя мера количества информации и объема данных (рисунок 2)[3].
Рисунок 2 Меры информации
Объем данных Vд в сообщении измеряется количеством символов (разрядов)в этом сообщении.
На синтаксическом уровне рассматриваются внутренние свойства сообщений, т. е. отношения между знаками, отражающие структуру данной знаковой системы.
На семантическом уровне анализируются отношения между знаками и обозначаемыми ими предметами, действиями, качествами, т. е. смысловое содержание сообщения, его отношение к источнику информации;
На прагматическом уровне рассматриваются отношения между сообщением и получателем, т. е. потребительское содержание сообщения, его отношение к получателю.
Вариант 1 Что происходит при извлечении знаний
Инженер по знаниям (аналитик) является главной фигурой при извлечении знаний из источника знаний (эксперта, документации и т.д.). Результат его работы отражает структуру представлений и рассуждений специалистов. Знания можно извлекать и другими способами, но указанная стратегия является наиболее распространенной.
Объективные трудности извлечения знаний обусловлены тем, что[4]:
a. знания эксперта многослойны, часто из цепочки рассуждений со временем выпадают звенья, которые непросто восстановить;
b. часть знаний и умений хранится в памяти в невербальной форме и связана сложной логико-ассоциативной сетью;
c. большинству экспертов не свойственна аналитичность и способность к ясному изложению.
Исходя из этого видно, что извлечение знаний это непростой процесс. И человек-аналитик, на котором лежит вся тяжесть интервьюирования источника знаний, должен обладать специальными знаниями по системному анализу, формальной логике, когнитивному моделированию, а главное, методологии извлечения знаний. Инженеры по знаниям, при обработке знаний, придерживаются следующего алгоритма работы:
анализ предметной области (ПО);
извлечение знаний;
структурирование знаний.
Дата: 2019-05-29, просмотров: 235.