Математические предпосылки и становление информатики были обеспечены успехами прежде всего в математической логике, дискретной математике, вычислительной математике, теории алгоритмов.
Математическая логика – раздел математики, изучающий доказательства и вопросы оснований математики. Особое значение для информатики имеет исчисление высказываний, исчисление суждений, раздел математической логики, в котором формально-аксиоматическим методом изучаются сложные (составные) высказывания, составленные из простых (элементарных, не анализируемых) высказываний с помощью логических связок "и", "или", "если..., то" и "неверно, что". Г. В. Лейбниц в 1668 году показал возможность представления любых чисел двоичными цифрами; к этому выводу он пришёл, занимаясь философской проблемой борьбы противоположностей и пытаясь представить мироздание в виде борьбы двух начал. Дж. Буль, английский математик, построил первый вариант алгебры логики, позволивший сводить процесс получения умозаключений к решению логических уравнений. Сочетание открытий Лейбница и Буля лежит в основе создания электронных вычислительных машин, использующих двоичную систему счисления, благодаря чему открылась возможность её широкого применения при проектировании средств вычислительной техники.
Начальной точкой отсчета современной теории алгоритмов можно считать работу немецкого математика Курта Геделя (1931 год - теорема о неполноте символических логик), в которой было показано, что некоторые математические проблемы не могут быть решены алгоритмами из некоторого класса. Общность результата Геделя связана с тем, совпадает ли использованный им класс алгоритмов с классом всех (в интуитивном смысле) алгоритмов. Эта работа дала толчок к поиску и анализу различных формализаций алгоритма. Первые фундаментальные работы по теории алгоритмов были опубликованы независимо в 1936 году годы Аланом Тьюрингом, Алоизом Черчем и Эмилем Постом. Предложенные ими машина Тьюринга, машина Поста и лямбда-исчисление Черча были эквивалентными формализмами алгоритма. В 1950-е годы существенный вклад в теорию алгоритмов внесли работы Колмогорова и Маркова. К 1960-70-ым годам оформились следующие направления в теории алгоритмов.
Классическая теория алгоритмов – формулировка задач в терминах формальных языков, понятие задачи разрешения, введение сложностных классов, формулировка в 1965 году Эдмондсом проблемы P=NP, открытие класса NP-полных задач и его исследование; Теория асимптотического анализа алгоритмов – понятие сложности и трудоёмкости алгоритма, критерии оценки алгоритмов, методы получения асимптотических оценок, в частности для рекурсивных алгоритмов, асимптотический анализ трудоемкости или времени выполнения, в развитие которой внесли существенный вклад Кнут, Ахо, Хопкрофт, Ульман, Карп; Теория практического анализа вычислительных алгоритмов – получение явных функции трудоёмкости, интервальный анализ функций, практические критерии качества алгоритмов, методика выбора рациональных алгоритмов; основополагающей работой в этом направлении, очевидно, следует считать фундаментальный труд Д. Кнута «Искусство программирования для ЭВМ».
Теоретический аспект: при исследовании некоторой задачи результаты теории алгоритмов позволяют ответить на вопрос – является ли эта задача в принципе алгоритмически разрешимой. В случае алгоритмической разрешимости задачи – следующий важный теоретический вопрос – это вопрос о принадлежности этой задачи к классу NP–полных задач, при утвердительном ответе на который, можно говорить о существенных временных затратах для получения точного решения для больших размерностей исходных данных.
Практический аспект: методы и методики теории алгоритмов (в основном разделов асимптотического и практического анализа) позволяют осуществить:
· рациональный выбор из известного множества алгоритмов решения данной задачи с учетом особенностей их применения (например, при ограничениях на размерность исходных данных или объема дополнительной памяти);
· получение временных оценок решения сложных задач;
· получение достоверных оценок невозможности решения некоторой задачи за определенное время;
Вычислительная математика – раздел математики, включающий круг вопросов, связанных с использованием электронных вычислительных машин (ЭВМ). В вычислительной математике можно выделить следующие три больших раздела:
· применение ЭВМ в различных областях научной и практической деятельности и может быть охарактеризован как анализ математических моделей.
· разработка методов и алгоритмов решения типовых математических задач, возникающих при исследованиях математических моделей;
· разработка и оптимизация способов взаимодействия человека с ЭВМ.
Информационные системы
Информационной системой называется комплекс, включающий вычислительное и коммуникационное оборудование, программное обеспечение, лингвистические средства и информационные ресурсы, а также системный персонал и обеспечивающий поддержку динамической информационной модели некоторой части реального мира для удовлетворения информационных потребностей пользователей. Часть реального мира, которая моделируется информационной системой, называется ее предметной областью. Под динамической моделью здесь понимается изменяемость модели во времени. Это «живая», действующая модель, в которой отображаются изменения, происходящие в предметной области. Такая система должна обладать памятью, позволяющей ей сохранять не только сведения о текущем состоянии предметной области, но и в некоторых случаях предысторию. Поскольку модель предметной области, поддерживаемая информационной системой, материализуется в форме организованных необходимым образом информационных ресурсов, она называется информационной моделью. Информационная система может входить в качестве компонента (подсистемы) в более сложную систему, такую, например, как система управления торговой компанией, САПР или система управления производством. Информационные системы уже многие десятки и даже сотни лет существуют и используются на практике в форме различного рода картотек и/или коллекций бумажных документов. Однако в таких системах отсутствует какая-либо автоматизация обработки данных, они позволяют лишь регистрировать и поддерживать в систематизированной форме на бумажных носителях результаты произведенных натурных измерений. В настоящее время под информационными системами, как правило, подразумеваются автоматизированные информационные системы, осуществляющие в том числе и функции автоматической обработки данных. Информационные системы используют ресурсы нескольких категории — средства вычислительной техники, системное и прикладное программное обеспечение, информационные, лингвистические и человеческие ресурсы. Лингвистические ресурсы информационных систем служат для: представления информационных ресурсов в системе; описания их свойств и свойств окружающей среды, позволяющего системе адекватно интерпретировать поддерживаемые информационные ресурсы; обеспечения взаимодействия пользователей с системой.
В общем случае к числу лингвистических ресурсов относятся те или иные естественные или искусственные языки, а также средства их лингвистической поддержки — словари лексики естественных языков, тезаурусы предметной области, переводные словари и др. Следует отметить, что тезаурусы играют в информационных системах двоякую роль. С одной стороны, это средство лингвистической поддержки используемого в системе естественного языка. Поэтому он должен быть отнесен к категориям лингвистических ресурсов. Вместе с тем тезаурус используется как контекст для интерпретации семантики поддерживаемых в системе документов, представленных на естественном языке. В связи с этим правомерно также считать тезаурус информационным ресурсом системы. Используемый в конкретных случаях набор лингвистических ресурсов системы зависит от требований, предъявляемых к ней. Информационные ресурсы системы составляют главный компонент модели предметной области, которую система поддерживает. Они являются вместе с тем «сырьем» и «конечным продуктом» работы информационной системы. Конкретный вид информационных ресурсов зависит от характера системы. Важно заметить, что в любой информационной системе поддерживается две категории информационных ресурсов. Ресурсы первой категории непосредственно используются конечными пользователями системы. Ресурсы второй категории можно было бы назвать метаресурсами. Описывая свойства ресурсов первой категории, они позволяют системе корректно оперировать ими. Как уже отмечалось, ресурсы первой категории часто называют данными независимо от среды их представления (изображения, текстовые документы, аудиозаписи и т.д.), а метаресурсы — метаданными. Используя эту терминологию, можно сказать, что метаданные — это данные о данных. Однако фактически метаданные могут описывать свойства не только собственно данных, но и информационной системы в целом отдельных ее механизмов и их функций, других ее ресурсов, поддерживаемых технологий, пользователей и т.д. Конкретные функции метаданных и их состав в значительной мере зависят от специфики рассматриваемой сие темы и характера конкретных информационных ресурсов. Уместно вспомнить, что данные в информационной системе представляют собой некоторую абстрактную модель реальности. Рассматривая соотношение между данными и метаданными, можно сказать, что метаданные — это данные более высокого уровня абстракции по отношению к описываемым ими данным.
Необходимая степень формализованности представления метаданных в информационной системе зависит от характера их использования. Метаданные, предназначенные для компьютерного использования, представляются в формализованном виде. Если же они предназначены для пользователей, то чаще всего представляются на естественном языке. В системах, основанных на технологиях баз данных, поддерживаются структурированные данные, организованные в виде таблиц или каких-либо иных структур данных. К информационным ресурсам систем баз данных относятся также и схемы баз данных. В таких системах они относятся к категории метаданных. В текстовых системах информационные ресурсы включают коллекции документов, представленных на естественных языках. Это информационные ресурсы для конечных пользователей. Кроме того, поддерживаются метаданные — тезаурусы, спецификации онтологии и т.п., которые являются информационными ресурсами, используемыми самой системой.
Искусственный интеллект
Исследователи, работающие в этом направлении, надеются достичь такого понимания механизмов интеллекта, при котором можно будет составлять компьютерные программы с человеческим или более высоким уровнем интеллекта. Общий подход состоит в разработке методов решения задач, для которых отсутствуют формальные алгоритмы: понимание естественного языка, обучение, доказательство теорем, распознавание сложных образов и т.д. Теоретические исследования направлены на изучение интеллектуальных процессов и создание соответствующих математических моделей. Экспериментальные работы ведутся путем составления компьютерных программ и создания машин, решающих частные интеллектуальные задачи или разумно ведущих себя в заданной ситуации. Систематические исследования в области искусственного интеллекта начались лишь с появлением цифрового компьютера. Первая научная статья по искусственному интеллекту была опубликована в 1950 г. А. Тьюрингом. Ниже будут указаны основные направления исследований в области искусственного интеллекта и соответствующие методы.
Представление знания.
Многие трудности при создании машин, выполняющих определенные интеллектуальные задачи, связаны с вопросами о том, какую информацию должна иметь программа, каким образом на основании этой исходной информации могут быть сделаны дальнейшие выводы и как эта информация должна храниться в компьютере. Необходимостью решения этих проблем были вызваны к жизни исследования, цель которых – ответить на вопрос, что такое знание.
Представление знаний – вопрос, возникающий в когнитологии (науке о мышлении), в информатике и в исследованиях искусственного интеллекта. В когнитологии он связан с тем, как люди хранят и обрабатывают информацию. В информатике – с подбором представления конкретных и обобщённых знаний, сведений и фактов для накопления и обработки информации в ЭВМ. Главная задача в искусственном интеллекте – научиться хранить знания таким образом, чтобы программы могли осмысленно обрабатывать их и достигнуть тем подобия человеческого интеллекта. Под термином «представление знаний» чаще всего подразумеваются способы представления знаний, ориентированные на автоматическую обработку современными компьютерами, и, в частности, представления, состоящие из явных объектов и из суждений или утверждений о них. Представление знаний в подобной явной форме позволяет компьютерам делать дедуктивные выводы из ранее сохранённого знания. Существуют десятки моделей (или языков) представления знаний для различных предметных областей. Большинство из них может быть сведено к следующим классам: – продукционные; – семантические сети; – фреймы; – формальные логические модели.
Продукционная модель,
или модель, основанная на правилах, позволяет представить знания в виде предложений типа: если (условие), то (действие). Под, условием понимается некоторое предложение-образец, по которому осуществляется поиск в базе знаний, а под действием - действия, выполняемые при успешном исходе поиска (они могут быть промежуточными, выступающими далее как условия, и терминальными или целевыми, завершающими работу системы). При использовании продукционной модели база знаний состоит из набора правил, Программа, управляющая перебором правил, называется машиной вывода. Чаще всего вывод бывает прямой (от данных к поиску цели) или обратный (от цели для ее подтверждения - к данным). Данные – это исходные факты, на основании которых запускается машина вывода - программа, перебирающая правила из базы. Продукционная модель чаще всего применяется в промышленных экспертных системах. Она привлекает разработчиков своей наглядностью, высокой модульностью, легкостью внесения дополнений и изменений и простотой механизма логического вывода.
Семантические сети
Семантика – это наука, устанавливающая отношения между символами и объектами, которые они обозначают. Семантическая сеть – это ориентированный граф, вершины которого – понятия, а дуги – отношения между ними. Понятиями обычно выступают абстрактные или конкретные объекты, а отношения – это связи типа: "это" ("i t"), "имеет частью" ("has part"), "принадлежит", "любит" и т.д.. Характерной особенностью семантических сетей является обязательное наличие трех типов отношений: класс – элемент класса; свойство – значение; пример – элемента класса.
Проблема поиска решения в базе знаний типа семантической сети сводится к задаче поиска фрагмента сети, соответствующего некоторой подсети, отображающей поставленный вопрос. Основное преимущество этой модели – в соответствии современным представлениям об организации долговременной памяти человека. Недостаток модели – сложность поиска вывода на семантической сети.
Фрейм (англ. frame - каркас или рамка) – структура знаний для восприятия пространственных сцен. Под фреймом понимается абстрактный образ или ситуация. В психологии и философии известно понятие абстрактного образа. Например, слово "комната" вызывает у слушающих образ комнаты: "жилое помещение с четырьмя стенами, полом, потолком, окнами и дверью, площадью 6-20 м2 ". Из этого описания ничего нельзя убрать (например, убрав окна мы получим уже чулан, а не комнату), но в нем есть "дырки", или "слоты", – это незаполненные значения некоторых атрибутов: количество окон, цвет стен, высота потолка. покрытие пола и др. В теории фреймов такой образ называется фреймом. Фреймом называется также и формализованная модель для отображения образа. Модель фрейма является достаточно универсальной, поскольку позволяет отобразить все многообразие знаний о мире через:
· фреймы-структуры, для обозначения объектов и понятий (заем, залог, вексель);
· фреймы-роли (менеджер, кассир, клиент);
· фреймы-сценарии (банкротство, собрание акционеров, празднование именин);
· фреймы-ситуации (тревога, авария, рабочий режим устройства) и др.
Важнейшим свойством теории фреймов является заимствованное из теории семантических сетей наследование свойств. И во фреймах, и в семантических сетях наследование происходит по АКО-связям (A-Kind-Of = вроде этого). Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются, т.е. переносятся, значения аналогичных слотов. Основным преимуществом фреймов как модели представления знаний является способность отражать концептуальную основу организации памяти человека, а также гибкость и наглядность.
Компьютерная лингвистика
Естественный язык, на котором в настоящее время представляется наибольший объем информации, является слишком сложной структурой. Проблемы языковой коммуникации "человек - компьютер - человек" и моделирования языка лежат в области исследований такой молодой науки, как компьютерная лингвистика, которая образовалась на стыке информатики и лингвистики. Компьютерная лингвистика, направление в прикладной лингвистике, ориентированное на использование компьютерных инструментов – программ, компьютерных технологий организации и обработки данных – для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных сферах и т.д., а также вся сфера применения компьютерных моделей языка в лингвистике и смежных дисциплинах. Как особое научное направление компьютерная лингвистика оформилась в 1960-е годы. Русский термин «компьютерная лингвистика» является калькой с английского computational linguistics. Поток публикаций в этой области очень велик. Компьютерная лингвистика как особая прикладная дисциплина выделяется прежде всего по инструменту – т. е. по использованию компьютерных средств обработки языковых данных. Сфера КЛ весьма разнообразна и включает такие области, как компьютерное моделирование общения, моделирование структуры сюжета, гипертекстовые технологии представления текста, машинный перевод, компьютерная лексикография. В узком смысле проблематика КЛ часто связывается с междисциплинарным прикладным направлением с несколько неудачным названием «обработка естественного языка» (перевод английского термина Natural Language Processing). Имевшее место в 1970-е годы возникновение и бурное развитие этого направления связано в первую очередь со стремительным ростом количества конечных пользователей ЭВМ. Поскольку обучение языкам и технологии программирования всех пользователей невозможно и нецелесообразно, возникла проблема организации взаимодействия конечных пользователей с компьютерными программами. Одним из способов решения этой задачи является разработка систем, позволяющих взаимодействовать с ЭВМ на естественном языке или каком-то ограниченном его варианте. Важнейшим направлением компьютерной лингвистики является разработка информационно-поисковых систем (ИПС). Последние возникли в конце 1950-х – начале 1960-х годов как ответ на резкое возрастание объемов научно-технической информации. По типу хранимой и обрабатываемой информации, а также по особенностям поиска ИПС разделяются на две больших группы – документальные и фактографические. В документальных ИПС хранятся тексты документов или их описания (рефераты, библиографические карточки и т.д.). Фактографические ИПС имеют дело с описанием конкретных фактов, причем не обязательно в текстовой форме. В настоящее время фактографические ИПС строятся на основе технологий баз данных (БД). Для обеспечения информационного поиска в ИПС создаются специальные информационно-поисковые языки, в основе которых лежат информационно-поисковые тезаурусы.
К области компьютерной лингвистики в определенной степени могут быть отнесены работы в области создания гипертекстовых систем, рассматриваемых как особый способ организации текста и даже как 16
принципиально новый вид текста, противопоставленный по многим своим свойствам обычному тексту, сформированному в гутенберговской традиции книгопечатания. В 1950-х годах составлялись программы компьютерного перевода с одного языка на другой. Они были не очень эффективны, и спустя несколько лет пришлось признать, что для успешного перевода необходимо, чтобы программа «понимала» текст, который переводит. В настоящее время прилагаются усилия к тому, чтобы наделить компьютеры более полным пониманием все больших и больших фрагментов и закономерностей естественного языка. Такое понимание оценивается по эффективности программ, отвечающих на вопросы по тексту на основании информации, содержащейся в тексте, и заложенной в программу «способности к рассуждению».
2.7 Информационные технологии
Технология при переводе с греческого означает искусство, мастерство, умение, а это ни что иное, как процессы. Под процессом следует понимать определенную совокупность действий, направленных на достижение поставленной цели. Процесс должен определяться выбранной человеком стратегией и реализоваться с помощью совокупности различных средств и методов.
Информационная технология – процесс, использующий совокупность средств и методов сбора, обработки и передачи данных (первичной информации) для получения информации нового качества о состоянии объекта, процесса или явления (информационного продукта).
Если цель технологии материального производства – выпуск продукции, удовлетворяющей потребности человека или системы, то цель информационной технологии – производство информации для ее анализа человеком и принятия на его основе решения по выполнению какого-либо действия. В последние годы появился термин новые информационные технологии, которым обозначаются технологии, основанные на использовании компьютерных и телекоммуникационных средств.
Можно выделить три основных принципа новых информационных технологий:
· интерактивный (диалоговый) режим работы с компьютером и телекоммуникационной системой;
· интегрированность с другими программными продуктами;
· гибкость процесса изменения как данных, так и постановок задач.
В настоящее время область информационных технологий представляет собой:
· обширную область знаний, имеющую фундаментальный характер, которая объединяет множество научных направлений таких как вычислительная математика, искусственный интеллект, программная инженерия, веб-технологии и другие;
· важную часть информационной индустрии и обширную область профессиональной деятельности, влияющую на все процессы современного общества;
· актуальное и активно развивающееся образовательное направление – Информатика и вычислительная техника ( Computing ), к которому относится, в том числе, и интересующие нас направления 09.03.01 и 09.03.04.
В качестве критериев классификации информационных технологий используют виды управленческой деятельности, виды обеспечения или реализуемые функции. В наиболее общем виде применительно к данному курсу можно выделить для дальнейшего рассмотрения следующие классы информационных технологий:
· информационные сетевые компьютерные технологии;
· информационные технологии организации человеко-машинного интерфейса;
· информационные технологии создания, обработки и управления документами;
· информационные технологии управления данными;
· технологии защиты информации;
· информационные технологии управления знаниями.
О становлении информационных технологий
Упомянем основные события, предшествовавшие и способствовавшие созданию информационных систем и технологий.
· В 1944 году в США создана первая электронно-вычислительная машина UNIVAC, которая открыла возможность быстрой обработки больших объемов данных.
· В 1948 году Клод Шеннон сформулировал основные положения математической теории связи, положенные в дальнейшем в фундамент теории информации.
· В те же годы Норберт Винер показал прикладные аспекты этой теории в своей книге «Кибернетика или управление и связь в животном и машине».
· В 1951 году под руководством академика С.А. Лебедева создана первая отечественная электронно-вычислительная машина МЭСМ. В следующем году создана ЭВМ БЭСМ, которая стала первой серийно выпускаемой машиной в нашей стране.
· В начале 50-х годов инженеры фирмы Веll Laboratories изобрели транзистор, что привело к появлению новых поколений ЭВМ и вызвало проникновение информационных технологий в различные области жизни, науки, образования и техники.
· В середине 50-х годов начались работы по автоматизации программирования. А. А. Ляпуновым был предложен язык логических схем программ для операторного программирования. Тогда же были разработаны первые версии языков программирования (Фортран, Алгол) и созданы соответствующие трансляторы. В 1960 году в качестве международного стандарта был принят язык Алгол-60.
· В начале 60-х годов в США разработана система COBOL, явившаяся прототипом систем управления базами данных (СУБД).
· В 60-е годы началась автоматизация простейших производственных функций, появились первые локальные системы управления в крупных фирмах для решения регулярных задач высокой размерности, в основном информационного и справочного характера, отдельные решения задач оптимального распределения ресурсов и т. д. В СССР начали создаваться автоматизированные системы управления предприятиями (АСУП).
· В 1962 году академик В. М. Глушков предложил проект Общегосударственной автоматизированной системы (ОГАС) для управления экономикой страны на базе сети вычислительных центров и систем широкополосной связи. Техническую основу ОГАС должна была составить Единая государственная сеть вычислительных центров (ЕГСВЦ), охватывающая всю страну. К сожалению, этот проект не был реализован. Кстати, В. М. Глушков первым предложил термин «безбумажная информатика».
· 1967 – черный год отечественной вычислительной техники. На правительственном уровне было принято решение о копировании американских ЭВМ IBM/360 (копии получили название ЕС ЭВМ), а многие отечественные проекты были заморожены. Это привело к ослаблению научно-технической базы в области информационных технологий и нарастающей зависимости страны от зарубежных разработок.
· 1970-е годы – первые интегрированные комплексы, работающие в пакетном режиме, повышение уровня интеллектуальности решаемых задач, формирование первых систем цифровой связи, отработка комплексных решений автоматизации управления предприятием, начало формирования современной концепции новых информационных технологий.
· 1980-е годы – появление персональных ЭВМ и локальных вычислительных сетей; расширение использования информационных технологий на основе распределённых систем, реальное воздействие элементов новых информационных технологий на всех участников производственных процессов; непосредственное влияние на процессы принятия решений высшим руководством фирм. Развития систем управления качеством на базе стандартов ISO 900х, рождение CASE- и CALS-технологий.
· 1990-е годы – появление и широкое распространение Интернет; интеграция информационных технологий в различных областях; на базе новых информационных технологий бурно развивается международная интеграция бизнеса и электронная коммерция; совместное использование данных и обмен информацией изменяют общество, возникают новые парадигмы организации производства, стандарты реконфигурации и управления проектами, внедрение технологий реинжиниринга и виртуального предприятия.
· 1994 г. – в Неаполе лидеры стран Большой семерки подчеркнули необходимость разработки всемирных проектов информационного общества, создания системы стандартов в области информационных технологий.
Дата: 2019-11-01, просмотров: 233.