Системы поиска в конференциях Usenet.
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Во всем мире считается самым лучшим сервисом для поиска информации в конференциях Usenet сервер DejaNews (http://www.dejanews.com/). Среди русскоязычных выделяется сервер RusNews (http://news.corvis.ru/), являющийся также новостным сервером, содержащим более 2000 новостных групп. Точно также как и в других поисковых службах мы набираем строку запроса, а сервер нам формирует список конференций, содержащих наши ключевые слова. Далее надо подписаться на отобранные нами конференции в нашей программе работы с новостями. Также имеет место аналогичный российский сервер ТЕЛА-поиск (http://tela.dux.ru/news.html).

Сетевые новости Usenet, или, как их принято называть в российских сетях, телеконференции - это, пожалуй, второй по распространенности сервис Интернет. Если электронная почта передает сообщения по принципу "от одного - одному", то сетевые новости передают сообщения "от одного - многим". Механизм передачи каждого сообщения похож на передачу слухов: каждый узел сети, узнавший что-то новое (т.е. получивший новое сообщение), передает новость всем знакомым узлам, т.е. всем тем узлам, с кем он обменивается новостями. Таким образом, посланное Вами сообщение распространяется, многократно дублируясь, по сети, достигая за довольно короткие сроки всех участников телеконференций Usenet во всем мире. При этом в обсуждении интересующей Вас темы может участвовать множество людей, независимо от того, где они находятся физически, и Вы можете найти собеседников для обсуждения самых необычных тем. Число пользователей Usenet весьма велико - по оценкам UUNET technologies, количество новых сообщений, поступающих в телеконференции ежедневно, составляет около миллиона.

Новости разделены по иерархически организованным тематическим группам, и имя каждой группы состоит из имен подуровней иерархии, разделенных точками, причем более общий уровень пишется первым. Рассмотрим, например, имя группы новостей comp.sys.sun.admin. Эта группа относится к иерархии верхнего уровня comp, предназначенной для обсуждения всего, связанного с компьютерами. В иерархии comp есть подуровень sys, предназначенный для обсуждения различных компьютерных систем. Далее, sun означает компьютерные системы фирмы Sun Microsystems, а admin обозначает группу, предназначенную для обсуждения вопросов администрирования таких компьютерных систем. Итак, группа comp.sys.sun.admin предназначена для обсуждения вопросов администрирования компьютерных систем фирмы Sun Microsystems. Таким образом, обычно, обладая минимальными знаниями английского языка, можно по имени группы легко понять, что в ней обсуждается. Например, в alt.games.vgaplanets пишут любители игры Vga Planets, а jet.testing предназначена для посылки тестовых сообщений в группу, локальную для компании Jet Infosystems.

Существуют глобальные иерархии, как-то comp, и иерархии, локальные для какой-либо организации, страны или сети. Вообще говоря, набор групп, которые получает Ваш локальный сервер Usenet, определяется администратором этого сервера и наличием этих групп на других серверах, с которыми обменивается новостями Ваш сервер. Однако, обычной является ситуация, когда сервер получает, во-первых, все глобальные иерархии, во-вторых, группы, локальные для Вашей страны и сети, и, в-третьих, группы, локальные для Вашей организации. Например, к первой группе относятся иерархии comp, news, misc, alt, rec, ко второй - иерархии relcom и fido7 в России и иерархия de в Германии, к третьей - иерархии jet для Jet Infosystems и cern в CERN.

К различным иерархиям применимы различные нормы и правила работы с ними. В первую очередь, это касается языка сообщений - в группы российской иерархии relcom лучше всего писать по-русски, в то время как в группы глобальной иерархии comp можно писать только по-английски. Не всегда в Usenet можно посылать информацию рекламного характера - например, вы можете свободно посылать рекламные сообщения в группы иерархии relcom.commerce, специально для того и созданные, а вот в группы fido7 некоммерческой сети FIDO посылать рекламу строго запрещено. Менее строгими являются ограничения на возможные объемы цитирования предыдущих авторов в Вашем письме, размер подписи Вашего письма и т.д.

Начиная работать с какой-либо группой или иерархией групп, в первую очередь нужно прочитать правила работы с ними, которые регулярно помещаются в эти группы человеком, добровольно взявшим на себя обязанности координатора группы (модератора). На самом деле, группы новостей бывают двух типов - модерируемые и обычные. Сообщения, появляющиеся в модерируемых группах, прежде чем быть разосланными по сети, просматриваются модератором. Это, конечно, является своего рода цензурой, но в таком огромном сообществе, как Usenet, невозможно поддерживать порядок без подобных строгостей.

Сегодня всякий компьютер, полноценно подключенный к Интернет, имеет доступ к новостям Usenet, но новости Usenet распространяются и по другим сетям, применяясь столь же широко, как и электронная почта. Способы и удобство работы с новостями сильно зависят от того, каким образом Вы получаете их. В Интернет Ваша программа-клиент напрямую получает новости с сервера Usenet, и между просмотром списка сообщений, содержащихся в группе, и чтением этих сообщений нет задержки. Если Вы пользуетесь новостями через электронную почту, то Вы сначала получаете список статей, а уже потом принимаете по электронной почте статьи из списка, отдельно Вами заказанные. Такой способ работы с новостями Usenet является сегодня наиболее распространенным в России, но на самом деле это весьма неудобный и устаревший метод.

Службы поиска людей.

У вас появилась возможность работать с электронной почтой, но вы не знаете адресов электронной почты партнеров вашей организации. Благодаря, так называемым, службам поиска людей в Интернет, указав ФИО вашего оппонента теоретически вы можете получить его адрес электронной почты и URL-адрес. Почему теоретически? Дело в том, что системы поиска людей, в основном берут информацию о электронных адресах из открытых источников, таких как конференции Usenet. Где гарантия, что ваши партнеры участвуют в этих конференциях? И тем не менее рассмотрим некоторые службы поиска людей. В первую очередь, традиционно, о самой популярной англоязычной системе Four 11 (http://www.four11.com/). Это действительно большой сервер - его база данных содержит порядка 6 000 000 адресов. Среди русскоязычных служб можно выделить Э-Рос (http://www.dubna.ru/eros) и Интермап (http://www.botik.ru/intermap/welcome.win0-abs.html).



ПРИЕМЫ ЭФФЕКТИВНОГО ПОИСКА

Разные методики поиска, приводят к различным результатам. Последние, к примеру, зависят от того, какой булев оператор использован в ключевом выражении. Ниже приведено несколько основных правил подбора ключевых слов.

• Чем конкретнее понятие, обозначаемое ключевым словом, тем лучше. Это сужает область поиска и делает его более предметным. К примеру, не следует вводить слово "dog" (собака), если нельзя поискать сведения о карликовом пуделе.

• Избегайте общеупотребительных слов. В качестве ключевых бесполезно использовать такие слова, как "that", "the", "program", "internet". Они настолько распространены, что поиск по ним даст многие тысячи страниц.

• Пробуйте разные формы одного ч того же ключевого слова. Например, если искомые страницы должны содержать сведения о беге (running), пробуйте поиск по всем трем формам: "run", "runs", "running".

• Не забывайте о синонимах. Так, кроме "running" (бег), можно использовать также "jog" (бег трусцой). В выражениях с булевыми операторами не забывайте разделять синонимы оператором OR.

• Пробуйте разные варианты. Если найденных страниц оказалось слишком много, попробуйте сузить условие поиска. Напротив, если результат слишком скуден, используемое ключевое слово следует заменить более общим понятием. Первый выбор далеко не всегда оптимален.

• Не забывайте добавлять кавычки. Они обязательны, если ключевое слово или выражение представляет собой название. Например, чтобы найти в Internet упоминание об этой книге, в строке для ключевых слов нужно ввести: "Special Edition Using the Internet". He забудьте поставить кавычки.

• Учитывайте регистр символов. Результат поиска нередко зависит от того, в каком регистре записано ключевое слово. Так, если оно записано строчными буквами, программа возвращает страницы, где это выражение записано как строчными, так и прописными. Однако если в строку для поиска ввести прописные символы, регистр будет строго соблюден: программа найдет только те страницы, где это выражение целиком записано прописными.

• Обращайте внимание на специфику используемого инструмента. Некоторые поисковые службы обладают свойствами, значительно облегчающими поиск нужных документов. В этой главе будет рассказано о самых популярных средствах; дополнительные сведения можно найти, щелкнув на ссылках в нижней части начальных страниц этих служб.

Если начальная страница службы поиска содержит перечень разделов (topic map), их рекомендуется использовать, так как они помогают в выборе ключевых слов. Перечень разделов содержит список дополнительных ключевых слов (основанный на словах, вводимых пользователем), которые программа рекомендует использовать в поиске, и перечень найденных источников.

Использование в ключевых выражениях булевых операторов (AND, OR, NOT) в ключевых выражениях помогает уточнить область и предмет поиска. Хотя наличие заданных ключевых слов поисковая служба проверяет во всех без исключения документах Internet, условия поиска можно изменять, задавая способ комбинации нескольких ключевых слов. Например, условием поиска может быть "golf (гольф) в сочетании с "equipment" (снаряжение), "clubs" (клубы), "bags" (сумки), "balls" (мячи) - с одним из этих слов или со всеми одновременно в любых комбинациях.

Булевы операторы, которые можно использовать для составления ключевых выражений. Оператор AND между двумя ключевыми словами задает поиск страниц, содержащих одновременно оба слова. По оператору OR будут найдены все страницы, содержащие по крайней мере одно из двух ключевых слов. Если перед ключевым словом стоит оператор NOT, служба поиска найдет страницы, в которых это ключевое слово отсутствует.

Булевыми операторами можно объединять несколько слов или выражении, взятых в кавычки. Ниже приводится несколько примеров.

• Music AND Celtic

Поиск страниц, содержащих оба слова - "Music" и "Celtic".

• Honeycutt AND Book AND NOT "Using the Internet"

Поиск страниц, содержащих слова "Honeycutt" и "Book", но не содержащих выражения "Using Internet".

• Honeycutt OR Que AND Book AND "Using the Internet"

Это условие задает поиск страниц, каждая из которых содержит хотя бы одно из двух ключевых слов - "Honeycutt" или "Que", а также слово "Book" и выражение "Using the Internet".

• Grooming AND "Yorkshire Terrier"

Поиск страниц, в каждой из которых содержится слово "Grooming" и выражение "Yorkshire Terrier" Границы поиска можно сузить, заключив часть условия с оператором в скобки.

• "Using the Internet" AND (Second OR Third)

Поиск всех страниц, каждая из которых содержит одно из двух слов ("Second" или "Third") и выражение "Using the Internet".

• (Grooming OR Care) AND (Yorkie OR Westie)

Поиск страниц, в которых содержится хотя бы одно слово из каждой пары: "Yorkie" - "Westie' "Grooming" - "Care".

• Search AND (Tool OR Index OR Directory)

Поиск страниц, содержащих слово "Search" в сочетании с одним из слов "Tool", "Index" или "Director

Некоторые средства поиска позволяют однозначно указывать системе, должны ли искомые страницы содержать то или иное ключевое слово. Для этого служат знаки "+" и "-", например +word, -word. 3i "+" показывает, что искомые страницы должны содержать данное ключевое слово, знак "-" задает noi страниц, в которых такое слово отсутствует. Ниже приводятся примеры использования включающих и ключающих символов в ключевых выражениях.

• +Honeycutt -Gerald +Jerry

По такому условию будут найдены страницы, содержащие слова "Honeycutt" и "Jerry", но не держащие слова "Gerald".

• +Book-Plus

Это условие определяет поиск страниц, содержащих слово "Book" и не содержащих слова "Pli Это выражение эквивалентно условию "Book AND NOT Plus".

Дата: 2019-12-10, просмотров: 197.