Элементы структуры электронных словарей
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой
  1. главное окно словаря
  2. раздел о правилах пользования словарем («Справка», “Help”, FAQ)
  3. строка ввода — строка, в которую вводят слово или словосочетание для перевода или поиска.
  4. Зона «результаты поиска» - отдельное окно, в котором (не)отражаются результаты поиска

 

Также в электронных словарях часто встречается такая полезная функция, как «история запросов», позволяющая пользователю обращаться к списку запросов, ранее заданных им словарю. В электронном словаре, благодаря его гипертекстовому устройству, любой из элементов его структуры может быть активирован в любой момент времени и в любой очередности.

Кроме того, преимущество электронных словарей перед «бумажными» состоит в том, что электронный словарь может содержать в себе одновременно несколько электронных версий «бумажных» словарей, а также различные вспомогательные иллюстративные материалы (графику, аудио, видео)

Результаты поиска в разных словарях ранжируются на базе разных принципов:

  • по частеречной принадлежности (сначала сущ., потом глаголы или наоборот);
  • по лексическому значению (от прямого к переносному, от общего к специальному)
  • от непосредственно искомого слова до производных слов, устойчивых выражений, идиом;
  • по источникам результатов поиска в случае использования функции полнотекстового поиска → а)результаты поиска по заголовочным единицам, б) в переводах, в) результаты поиска в примерах употребления, г) комментариях.

Новые возможности электронных словарей позволяют преодолеть ограничения в использовании традиционных бумажных. К ним относятся:

— более широкие возможности отображения в словарях не только содержания словарной статьи в целом, но и частичного показа по разным критериям, разнообразные графические средства, которые не используются в обычных словарях;

— для доступа к содержанию используются разнообразные лингвистические технологии (морфологический и синтаксический анализ, полнотекстовый поиск, распознавание и синтез звука и т. п.);

— возможность более удобного использования словарей с большим объемом статей с полными и доказательными описаниями лексических значений;

 

— так как данные словари постоянно обновляются, то они является актуальными не только на данный момент.

 

Теза́урус (от греч. θησαυρός — сокровище) — собрание сведений (корпус, свод) охватывающее с максимальной полнотой понятия, определения и термины специальной области знаний или сферы деятельности, с примерами их употребления в текстах.

Теза́урус(в современной лингвистике) — особая разновидность словарей общей или специальной лексики, в которых указаны семантические отношения (синонимы, антонимы, паронимы, гипонимы, гиперонимы и т. п.) между лексическими единицами.

Тезаурусный подход

В научной терминологии нашего времени — в лингвистике, семиотике, информатике, теории искусственного интеллекта и других областях знания — тезаурус обозначает некоторое особым образом оформленное накопление.

В информатике и теории искусственного интеллекта обращается внимание на систематизацию данных, составляющих тезаурус, и на их ориентирующий характер.

Именно такая характеристика тезауруса легла в основу содержания этого понятия в общегуманитарном тезаурусном подходе:

Тезаурус — это структурированное представление и общий образ той части мировой культуры, которую может освоить субъект.

Характерные особенности тезауруса:

· неполнота любого тезауруса по сравнению с реальным развитием культуры, его фрагментарность, относительная непоследовательность; единство тезауруса, несмотря на фрагментарность составляющих его элементов, обеспечивается субъективно (внутренняя логика), в частности, через единство личности;

· иерархичность, восприятие мировой культуры сквозь призму ценностного подхода; выделенные приоритеты составляют определенную подсистему — ядро тезауруса;

· творческое пересоздание, переосмысление, вводящее герменевтический аспект в характеристику тезауруса;

· ориентирующий характер тезауруса;

· наличие родственных явлений в других тезаурусах, что ставит вопрос о генезисе тезаурусов;

· разнообразие и изменчивость тезаурусов, множественность уровней освоения культуры, при наличии ядра — отсутствие четких границ;

· действенность тезауруса, который влияет на поведение, другие проявления субъекта; воспитывающий (социализирующий) характер.

Тезаурусы лежат в основе социального конструирования реальности.

Тезаурус строится не от общего к частному, а от своего к чужому. Все новое для того, чтобы занять определенное место в тезаурусе, должно быть в той или иной мере освоено (буквально: сделано своим):

· Мир входит в сознание человека в определенной последовательности, которую определяет уже сложившаяся структура тезауруса, отбирающая, оценивающая и преобразующая (перекодирующая, переводящая на понятный «язык») многообразные сигналы извне.

· Центральное место занимает образ самого себя (самоосознание) и другого человека. От одного человека тезаурус переходит к двум (здесь важными оказываются такие аспекты человеческого существования, как дружба, любовь, спор, вражда, зависть, диалог, общение, отношение «учитель — ученик»). Затем к трем (семья: отец — мать — ребенок) и более (микрогруппа).

· Осознается ближайшая среда (окружающие вещи, мебель, дом, обозримое природное пространство).

· Следующие круги тезауруса — свой город или деревня, страна, общество (нация, класс, человечество), общественные отношения и чувства (долг, совесть, свобода, равенство, братство, избранность, отчужденность, одиночество), обучение и воспитание, «свое» и «чужое» (иностранное), человек как микрокосм, вселенная, общие законы мироздания.

Плодотворно использование тезаурусного подхода для осмысления и организации социального проектирования, где тезаурусом мы называем полный систематизированный состав информации (знаний) и установок в той или иной области жизнедеятельности, позволяющий в ней ориентироваться.

Тезаурусный подход дает новые средства для описания и понимания процессов социализации, в том числе и в динамично меняющихся социальных системах.

Тезаурусный подход к социализации позволяет, как представляется, преодолеть некоторые противоречия социализационных теорий.

Концептуальная сторона тезаурусного подхода:

· Тезаурус — индивидуальная конфигурация ориентационной информации (знаний, установок), которая складывается под воздействием макро- и микросоциальных факторов и обеспечивает ориентацию человека в различных ситуациях и на различных уровнях социальности.

· Освоение социальности в конечном счете идет по модели разделения «своего» и «чужого» (при сильном влиянии значимых других) и выработки позиции по отношению к определяемым фрагментам общественной жизни по конструкции апрейзеров

· Адаптация и интериоризация как этапы социализационного процесса в аспекте формирования тезауруса соответствуют последовательности: (1) отделение (референция) «чужого» и установление дистанции, приемлемой для отношения к нему; (2) переработка «своего» в тезаурусе вплоть до потери осмысленной референции «своего».

· Передача социального опыта от поколения к поколению, формирование нового социального опыта идут в рамках тезаурусных конфигураций. Эти рамки включают и макросоциальные влияния (структурно-функциональные и ситуативные) и микросоциальные влияния (статусно-ролевые, групповой динамики, ситуативные). Жизненные концепции могут оказывать регулирующую роль в преимуществах тех или иных влияний.

· Тезаурусы агентов социализационного процесса способны видоизменять как ход (направленность, фазы, скорость) этого процесса, так и его результативность. Результативность социализации оценивается в соответствии с тезаурусной структурой, характерной для данного общества (сообщества).

Луков Вал. А., Луков Вл. А. Тезаурусный подход в гуманитарных науках

 

Тезаурусы, особенно в электронном формате, являются одним из действенных инструментов для описания отдельных предметных областей и призваны способствовать пониманию в общении и взаимодействии лиц, связанных одной дисциплиной или профессией.

В отличие от толкового словаря, тезаурус позволяет выявить смысл не только с помощью определения, но и посредством соотнесения слова с другими понятиями и их группами, благодаря чему может использоваться для наполнения баз знаний систем искусственного интеллекта.

Термин тезаурус употребляется в теории информации для обозначения совокупности всех сведений, которыми обладает субъект.

Примеры:

· Амара-коша (Словарь Амары) — первый и наиболее важный санскритский тезаурус (III—IV век)

· Тезаурус Роже (XIX век, Англия, около 15 000 синсетов) - первый тезаурус в современном смысле слова.

· Викисловарь: многоязычный свободно пополняемый словарь и тезаурус (2004-наст.вр., проект фонда Викимедиа, в Русском Викисловаре (дамп — январь 2009) содержится 250 тыс. понятий, 67 тыс. отношений)

· РуТез — тезаурус русского языка (был создан Центром информационных исследований как инструмент для автоматического индексирования; разрабатывается с 1997 года по настоящее время, 45 тыс. понятий, 107 тыс. слов и выражений, 177 тыс. отношений).

· Тезаурус английского языка (www.thesaurus.com)

· WordNet http://wordnet.princeton.edu/

Составление тезауруса требует сограсованного участия различных специалистов (лингвистов, специалистов по информационной технологии, специалистов данной отрасли науки и технологии и т.д.).

WordNet — это электронный тезаурус/семантическая сеть для английского языка, разработанный в Принстонском университете и выпущенный вместе с сопутствующим программным обеспечением под некопилефтной свободной лицензией.

WordNet состоит из 4 сетей для основных знаменательных частей речи:

· существительных,

· глаголов,

· прилагательных,

· наречий.

Базовой словарной единицей в WordNet является не отдельное слово, а синсеты/

Синсет - синонимический ряд, объединяющий слова со схожим значением и являющийся узлом сети WordNet.

Каждый синсет дополнен дефиницией и примерами употребления слов в контексте (ля удобства использования человеком).

Слово или словосочетание может появляться более чем в одном синсете и иметь более одной категории части речи.

Каждый синсет содержит список синонимов или синонимичных словосочетаний и указатели, описывающие отношения между ним и другими синсетами.

Слова, имеющие несколько значений, включаются в несколько синсетов и могут быть причислены к различным синтаксическим и лексическим классам.

Синсеты в WordNet связаны между собой различными семантическими отношениями:

· гипероним (breakfast → meal) (завтрак → прием пищи);

· гипоним (meal → lunch) (прием пищи → обед);

· has-member (faculty → professor) (факультет → профессор);

· member-of (pilot → crew) (пилот → экипаж);

· мероним: has-part (table → leg) (стол → ножка);

· антоним (leader → follower) (лидер → последователь).

Также, существуют различные другие связи: лексические, антонимические, контекстные (слово 'x' имеет отношение к слову 'y') и другими. Среди них особую роль играет гипонимия: она позволяет организовывать синсеты в виде семантических сетей. Для разных частей речи родовидовые отношения могут иметь дополнительные характеристики и различаться областью охвата.

WordNet можно свободно использовать в коммерческих и научных целях.

Для работы с WordNet существуют различные программы, множество интерфейсов и API, реализуемых как на большинстве возможных языков, так и с помощью протокола DICT (программы GoldenDict).

 

· Официальная страница WordNet: http://wordnet.princeton.edu/

· UNL MIR (проект перевода WordNet на языки мира): http://www.unlweb.net/unlweb/index.php?option=com_content&view=article&id=57:unl-mir&catid=1:latest-news&Itemid=60

Информационно-поисковые тезаурусы

соответствии с определениями стандартов, информационно-поисковый тезаурус – это нормативный словарь, точно указывающий отношения между терминами и предназначенный для описания содержания документов и поисковых запросов.

Основные цели разработки информационно-поисковых тезаурусов:

· обеспечение перевода документов и запросов пользователей на один и тот же словарь, используемый для индексирования и поиска. Таким образом, различия в лексическом составе документа и запроса пользователя сводятся к одним и тем же единицам тезауруса.

· обеспечение последовательного использования единиц индексирования.

· обеспечение отношений между терминами – отношения между единицами тезауруса позволяют найти оптимальный термин для описания документа или запроса.

· использование как поискового средства при поиске документов.

 

Информационно-поисковый тезаурус (ИПТ) - словарь лексических единиц информационно-поискового языка, в котором заданы парадигматические (базисные) смысловые отношения между этими единицами.

Информационно-поисковый язык (ИПЯ) - формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов с целью последующего хранения и поиска.

Информационно-поисковые тезаурусы строятся для описания лексики дескрипторных ИПЯ, лексическими единицами которых являются дескрипторы.

Лексическая единицаИПЯ - обозначение отдельного понятия, принятое в информационно-поисковом языке и неделимое в этой функции.

Лексические единицы могут представлять собой принятые в естественном языке слова, устойчивые словосочетания, аббревиатуры, символы, даты, общепринятые сокращения, лексически значимые компоненты сложных слов, а также эквивалентные им кодовые или символические обозначения искусственного языка, например коды классов классификационной системы.

Дескриптор – это ключевое слово, выбранное из группы условно эквивалентных ключевых слов и представляющее данную группу при индексировании и поиске информации. Дескриптор также описывается как смысловая доминанта, или основное понятие с относящимся к нему словом, подобно заголовочному слову в толковом словаре.

В роли дескрипторов выступают термины, обозначающие отдельные понятия некоторой предметной области и удовлетворяющие принципам общеупотребительности, распространенности, краткости и терминологической точности.

Ключевое слово (КС) – отдельное слово или словосочетание естественного языка, выделяемое из текста информационного документа и отражающее его основное содержание при индексировании.

Группа условно эквивалентных КС объединяет не только те слова и словосочетания, которые признаются синонимами в естественном языке, но и такие, которые можно считать условно равнозначными с точки зрения информационного поиска, т. е. в рамках данного ИПЯ.

Парадигматические отношения (базисные, аналитические, ассоциативные)выражают постоянные семантические (смысловые) связи между ЛЕ ИПЯ, не зависящие от текста. Таковыми признаются отношения «род – вид», «целое – часть» и т. п. Они являются стабильными для каждой предметной области и могут быть зафиксированы в словаре.

Например, судак, лещ, форель относятся к семантической категории «Рыбы», т.е. отношение «род-вид» между дескрипторами рыбы – судак являются контекстуально не зависимыми. Это парадигматическое отношение.

В ИПТ обычно фиксируются следующие парадигматические отношения:

· родо–видовые,

· отношения эквивалентности (синонимии),

· ассоциативные отношения.

Отношение «род – вид» связывает два дескриптора, если объем понятия, соответствующий одному из дескрипторов, включает в себя объем понятия другого дескриптора, например, рыба – форель, рыболовные снасти – удочка, способы ловли рыбы – спиннинг.

Отношение синонимии означает, что поиск по одному из условных или истинных синонимов позволит найти в базе данных автоматизированной информационной системы (АИС) те документы, которым приписаны в качестве ключевых слов остальные.

Например, рыболовство = рыбная ловля = рыбный промысел.

Ассоциативные отношения устанавливаются между КС, принадлежащими к одной и той же или разным смысловым категориям и произвольным уровням иерархии. Они аналогичны ассоциативным связям в сознании человека, когда возникающее представление об одном объекте вызывает представления о других.

Например, при поиске по дескриптору Рыболовство пользователю АИС можно предложить провести дополнительные поиски по дескрипторам: отрасль промышленности, сырьевые ресурсы Мирового океана, водохранилища, виды рыб, млекопитающие, моллюски, способы рыбной ловли, снасти и т.д.

Ассоциативные связи, как правило, не различают в ИПТ по их семантике.

Распространены следующие виды ассоциаций:

· «целое – часть»;

· «причина – следствие»,

· «близость в пространстве или во времени»,

· «антонимия»,

· «предмет – обычая область его применения».

При разработке информационно-поисковых тезаурусов первой задачей является отбор терминов для включения в тезаурус.

Основные источники терминов для разработки информационно-поисковых тезаурусов:

· существующие тезаурусы в близких предметных областях.

· Термины – кандидаты на внесение в тезаурус – могут быть предложены экспертами предметной области.

· термины тезауруса могут быть получены из текстов предметной области применением автоматизированных методов или ручной обработки документов. .

Если в списке обнаруживается несколько близких по смыслу терминов, то из них выделяется наиболее частотный термин, остальные термины могут быть исключены и переведены в аскрипторы.

Правила включения терминов в тезаурус:

· исключаются слишком частотные термины, поскольку предполагается, что они являются малоинформативными для различения отдельных документов.

· термины тезауруса должны представлять понятия, которые реально упоминаются в литературе, и должны отбираться из соображений эффективности их использования в поиске документов.

· малочастотные термины могут быть удалены из списка или представлены как аскрипторы более общих или более частотных понятий.

· Включение новых терминов в тезаурус должно происходить с учетом уже включенных тезаурусных терминов. Термины-кандидаты должны проверяться на предмет соответствия их общности / специфичности к другим терминам тезауруса. Также должно проверяться, представляет ли термин-кандидат отдельное понятие, которому нет соответствий среди существующих терминов тезауруса. Необходимо избегать включения терминов, чьи значения пересекаются со значениями уже существующих тезаурусных терминов настолько, что индексаторам и пользователям будет трудно различать их.

 

Электронные словари

Словари представляют собой совокупность единиц, расположенных в определённом порядке, и используются в качестве справочника, который объясняет значения вписываемых единиц, даёт различную информацию о них или их перевод на другой язык, сообщает сведения о предметах, обозначаемых этими единицами.

Словари выполняют три основные социальные функции:

q информативную,

q коммуникативную,

q нормативную.

Первая позволяет кратчайшим способом – через обозначения – приобщиться к накопленным знаниям, вторая дает возможность выбрать необходимые слова родного или иностранного языка при общении, а третья, фиксируя значения и употребления слов, способствует совершенствованию и унификации языка как средства общения.

Электронные словари – вид программного обеспечения для решения лингвистических задач, доказывающий преимущества «безбумажного» подхода к обработке и хранению информации. Во-первых, они компактны и легко помещаются на одном компакт-диске. Во-вторых, гораздо удобнее в использовании: отыскать нужное слово можно гораздо быстрее, причем сразу и общие, и специализированные его значения, подключая и отключая дополнительные словари. В-третьих, электронные словари пополняемы – как за счет подключаемых словарей, так и за счет возможности создавать пользовательские словари. В-четвертых, электронные словари опережают в своем развитии «бумажные». В-пятых, электронные словари могут быть озвучены, проиллюстрированы и анимированы.

Электронные словари сочетают большой объем информации с удобством пользования, что достигается быстродействием системы поиска. Чтобы найти слово в электронном словаре, обычно достаточно просто напечатать его в командной строке словаря, нажать клавишу ENTER – и в отдельном окошке появится перевод. Многие словари позволяют переводить слова, не выходя из текстового редактopa или другого офисного приложения, с которым Вы работаете в данный момент. Для этого надо выделить нужное слово и нажать определенную комбинацию клавиш, называемых «горячими». Каждый элемент информации о слове может быть гиперссылкой в другую словарную статью. Система гиперссылок обеспечивает возможность быстрого доступа к нужной информации без изнурительного поиска, одним щелчком мыши.

Электронные словари позволяют:

q открыть и просмотреть весь список слов, находящихся в словаре в алфавитном порядке,

q найти при помощи быстродействующих поисковых средств любое слово из словаря,

q создать пользовательский словарь,

q ввести новое слово или словосочетание в словарь,

q ввести слово и его перевод из подготовленного ранее текстового файла,

q изменить грамматическую информацию или перевод в словарной статье,

q удалить слово из словаря,

q сохранить словарь.

Существуют различные классификации электронных словарей. Наиболее общей является классификация словарей на энциклопедические и лингвистические. Статьи в словарях обычно располагаются в алфавитном или систематическом порядке. Энциклопедические словари представляют собой научное или научно-популярное справочное издание, содержащее систематизированную информацию по различным областям знаний и практической деятельности. Наиболее популярными являются следующие энциклопедии: Энциклопедический словарь Брокгауза и Ефрона, Британская энциклопедия "Британика" (Великобритания и США), Энциклопедический словарь Мейера (Германия)и другие.

В отличие от энциклопедических словарей, сообщающих сведения о соответствующих реалиях – предметах, явлениях, событиях, лингвистические словари содержат информацию о значениях и употреблении слов, грамматические и фонетические особенности слов и т.п. В лингвистических словарях решается проблема соотношения между языком и речью: словари представляют слова в изолированном виде, фиксируя, прежде всего их общеобязательные и устоявшиеся значения, тогда как в живой речи значения слов могут претерпевать изменения. Стремясь отразить реальное бытие слова в языке и речи, словари выводят его значения из употреблений в разнообразных контекстах, сопровождают слово пометами и уточнениями, примерами и иллюстрациями, показывающими ситуации, в которых слово используется, и связанные с ним ассоциации. Для лингвистических словарей решается проблема размещения слов в словаре и значений в словарной статье с целью отражения общей структуры лексического состава языка и семантической структуры отдельного слова, а также проблема способов выделения и толкования значений (в связи с этим используются современные методы лексикологии и разрабатывается лексикографический метаязык).

Лингвистические словари можно разделить по следующим параметрам:

q по толкованию слов – толковые словари, разъясняющие значение и употребление слов средствами одного и того же языка (объяснения, перефразирования, синонимы и т.п.),

q по числу языков – переводные (двуязычные и многоязычные), дающие перевод и разъясняющие значение и употребление слов средствами другого языка,

q по отбору лексики – тезаурусы, охватывающие всю или большую часть лексики языка, и частные словари, отражающие некоторые тематические и стилевые пласты лексики (словари терминологические, диалектные, просторечия, языка писателей и др.), либо особые разновидности слов (словари неологизмов, архаизмов, редких слов, сокращений, иностранных слов, собственных имён),

q по способу описания слова – специальные, раскрывающие отдельные аспекты слов и отношений между ними (словари этимологические, словообразовательные, словосочетаний, грамматические, орфографические, орфоэпические, синонимические, антонимические, паронимические, рифм и др.),

q по единице лексикографического описания (меньше или больше слова) – словари корней, морфем, фразеологические, словари цитат,

q по расположению материала – идеографические, аналогические (слова располагаются не по алфавиту, а по смысловым ассоциациям), обратные,

q по назначению – словари ошибок, трудностей,

q по частоте употребительности – частотные словари (в них
приводятся числовые характеристики употребительности слов, словоформ, словосочетаний какого-либо конкретного языка, языка того или иного писателя, какого-либо произведения и т.п.).

Теорией и практикой составления словарей занимается лексикография (от греч. lexikos – относящийся к слову, grapho – пишу). С накоплением огромных словарных баз данных и развитием электронно-вычислительной техники лексикография получила новое развитие в конце прошлого века – были созданы электронные словари для массового пользователя.

Электронный словарь Lingvo является одним из многочисленных программных продуктов, разработанных российской компанией ABBYY SoftwareHouse. Подробную информацию о словаре можно найти на сайте компании по адресу http://www.abbyy.com.

Существуют двуязычные и многоязычные версии словаря Lingvo, которые постоянно совершенствуются. Двуязычный англо-русский и русско-английский словарь Lingvo создан на основе более десятка лучших английских и русских словарей: TheOxfordEnglishDictionary, Merriam-Webster'sCollegiateDictionary, Collins COBUILD EnglishLanguageDictionary, Новый большой англо-русский словарь, Толковый словарь живого великорусского языка В. И. Даля, Большой энциклопедический словарь и др. В нем представлена наиболее современная английская лексика. Начиная с версии 8.0, в состав системных словарей Lingvo входит Грамматический словарь английского языка LingvoGrammatical. Многоязычная версия Lingvo включает словари, которые позволяют переводить с русского языка на английский, немецкий, французский, испанский, итальянский и наоборот.

При вводе текста с клавиатуры в строку запроса программа начинает автоматически листать свой словарь по мере набора слова. Если переводимого слова или его грамматической формы в словаре нет, то программа выдаст перевод наиболее похожего слова. Перевод слова может варьироваться в зависимости от подключаемых словарей, так как в стандартный установочный пакет входит ряд русских и иностранных словарей. Словари подключаются и отключаются с помощью кнопок на основной панели программы. Несмотря на большой объем словарей, поиск осуществляется очень быстро.

Перевод слова появляется в отдельном окне, в котором также предусмотрена возможность переключения между словарями. Благодаря многооконному интерфейсу можно одновременно держать открытыми несколько словарных статей. Это особенно полезно, если необходимо разобраться с нюансами значений. Варианты перевода даются с указанием части речи и грамматических характеристик слова. Если переводимое слово – глагол, то указывается его вид – совершенный или несовершенный, если существительное – род, если местоимение – то род, лицо и самые употребительные падежные формы. При переводе с английского на русский дается транскрипция переводимого слова, а также, что особенно ценно, – наиболее употребительные словосочетания. При наличии звуковой карты можно прослушать и правильное звучание английских слов. В Lingvo включены 5000 наиболее употребительных слов, озвученных дикторами из Оксфорда.

В 1999 году производитель Lingvo – компания ABBYY выступила с интересной инициативой. Она предложила всем желающим размещать свои собственные словари на сайте http://www.lingvo.ru. Сегодня на сайте уже содержится множество авторских словарей, доступных для свободного использования и распространения. Среди них такие экзотические, как словарь хакерской терминологии, глоссарий сетевых терминов, словарь терминов и сокращений, связанных с трубопроводами для транспортировки нефти и газа, словарь терминов, связанных с промышленной кройкой и шитьем, созданием лекал и др. На сайте компании можно принять участие в конкурсе пользовательских словарей и бесплатно скачать полюбившиеся. Средства разработки словарей также распространяются бесплатно.

 

Современный переводчик не может конкурировать на рынке переводческих услуг без овладения информационными технологиями перевода. Перевод с помощью компьютера (ComputerAidedTranslation – CAT) включает следующие основные компьютерные технологии.

Установленные на компьютере (офлайновые) общелингвистические и специализированные электронные словари.

Системы автоматизированного перевода.

Системы переводческой памяти.

Онлайновые (сетевые) специализированные и толковые словари.

Лингвистический поиск в сети Интернет.

Современные электронные словари позволяют не только быстро найти перевод слова или выражения на различные языки, но и отыскать примеры его употребления, грамматические формы и устойчивые словосочетания, в которых это слово используется. Среди офлайновых словарей, которые нужны для каждодневной работы профессиональному переводчику, следует выделить в первую очередь Lingvo и Multitran. Это наиболее полные профессиональные многоязычные словари, включающие большое количество узкоспециализированных тематик.

Если офлайновые словари не позволяют найти приемлемого перевода терминов и выражений, то следует обратиться к поиску в сети Интернет. В Интернете можно найти перевод терминов и словосочетаний, сокращений и названий, материалы по теме перевода на русском языке и на языке перевода, а также вспомогательные для переводчика материалы (нормативные документы, обсуждения сложных тем и опыта перевода на форумах переводчиков и др.).

Системы автоматизированного (машинного) перевода (MachineTranslation, MT) могут быть использованы для быстрого перевода с различных языком больших объемов текста по специальным тематикам с учетом их специфики. После редактирования такой перевод приближается по качеству к ручному переводу. Машинный перевод является одной из технологий перевода с помощью компьютера (CAT). При машинном переводе приложение осуществляет автоматический связный перевод текста на другой естественный язык с использованием словарей и набора правил перевода с учетом морфологии, синтаксиса и семантических связей без участия человека или при его минимальном участии.

Существуют следующие виды систем машинного перевода.

FAMT (Fully-automatedmachinetranslation) – полностью автоматизированный машинный перевод (автоматический);

HAMT (Human-assistedmachinetranslation) – машинный перевод при участии человека

(автоматизированный в интерактивном режиме);

MAHT (Machine-assistedhumantranslation) – перевод, осуществляемый человеком с использованием компьютера.

Автоматизированный перевод типа HAMT рассматривается в пособии на примере системы

PROMT.

CAT перевод типа MAHT реализуется в виде систем переводческой памяти (TranslationMemory), которые используют для перевода переведенные ранее фрагменты текста, что существенно

повышает производительность переводчика без потери качества. При командной работе над проектом, такие системы позволяют использовать коллективный опыт переводчиков и обеспечивают единство терминологии, что значительно повышает единообразие перевода различными переводчиками и скорость перевода. В пособии подробно рассмотрена работа с программой памяти переводов memoQ.

1 СЛОВАРЬ LINGVO

1.1 Основные функции словаря Lingvo

Электронный словарь ABBYY Lingvo x5 (www.lingvo.ru) – это словарь с большой и современной словарной базой, который включает около 220 общелексических, тематических, лингвострановедческих и толковых словарей (профессиональная версия):

20 языков: английский, русский, немецкий, французский, испанский, итальянский,

португальский, греческий, финский, китайский, латинский, турецкий, украинский,

казахский, татарский, польский, венгерский, датский, нидерландский, норвежский, 220

словарей, более 12 миллионов словарных статей.

Толковыесловарианглийскогоязыка: Oxford English Dictionary, Oxford American Dictionary, Collins Cobuild Dictionary. Словарь NewOxfordAmericanDictionary содержит более 1000

иллюстраций.

Толковые словари русского языка: словарь Даля, словарьОжегова-Шведовой,Большая Советская энциклоперия, Большой энциклопедический словарь, Толковый словарь и др.

Около 76 000 слов и фраз в словарях общей лексики и разговорниках на английском,

немецком, французском, итальянском, испанском и китайском озвучены дикторами-

носителями этих языков.

Для тех, кто изучает английский язык, в программу включены всемирно известный учебный словарь CollinsCobuildAdvancedLearner’sEnglishDictionaryивидео-словарьWordExpress

компании EnglishClub TV. В освоении английского помогут занимательные ситуативные видео-диалогиFullContact, иллюстрированный толковый словарь английского языка NewOxfordAmericanDictionaryиангло-русскийграмматический словарь.

Приложение LingvoTutor для изучения иностранных языков, содержит комплекс упражнений для расширения словарного запаса и повышения грамотности при изучении языков. Эти упражнения включают такие разделы, как “Знакомство”, “Мозаика”,

“Варианты”, “Написание” и “Самопроверка”.

Видеоуроки предназначены для совершенствования речевого общения. В Lingvo x5 входит коллекция развлекательных и познавательных сюжетов с погружением в языковую среду.

Lingvo обеспечивает пользователям доступ к словарям через лингвистический онлайн-порталLingvo.Pro. Портал позволяет обращаться к базе переводов, дополнять ее и взаимодействовать с другими пользователями. Используя этот портал, компания ABBYY развивает модель SaaS(Software-as-a-Service),позволяющую расширить доступность своих продуктов для пользователей.

Перевод слова и словосочетания в Lingvo отображается в виде карточки перевода, в которой показывается начало словарных статей из всех словарей с заголовком, совпадающим с заданным словом или словосочетанием.

Всплывающий перевод при наведении курсора мыши на слово помогает при чтении текста в программе Word, WordPad, Excel. PDF-файлов,в браузере Explorer,интернет-страниц,ICQ, Flash-

роликов и субтитров к фильмам.

В программу Lingvo включены примеры писем на английском, немецком, французском и испанском языках по материалам двуязычных словарей OxfordConcise. Примеры описывают самые распространенные жизненные ситуации и полезны для ведения переписки.

При наличии интернет-подключения,Lingvo обеспечивает доступ конлайн-базепамяти переводов (ТМ – translationmemory) для английского, немецкого и французского языков. Программа показывает примеры современного употребления слов и словосочетаний в предложениях из художественной и технической литературы, законодательных и юридических документов, синтернет-сайтов.С помощью этой базы пользователь может подобрать точный перевод слова, определить, действительно ли употребляется в речи данный оборот, найти новые варианты перевода и примеры их использования. База памяти переводов содержит более миллиона предложений. Чтобы получить примеры из памяти переводов в карточке наведите курсор мыши на интересующий перевод и после появления рамки вокруг слова нажмите на него левой кнопкой мыши.

Электронные словники

 

СЛОВНИК -1) вэнциклопедическихизданиях - полныйпереченьназванийстатей (терминов), какправило, скраткойаннотациейиуказаниемразмеровстатей (впечатныхзнаках).2) Влингвистическихсловарях - алфавитныйилисистематическийпереченьсловарныхединиц, подлежащихтолкованиюилипереводу.


Дата: 2019-03-06, просмотров: 279.