ТЕХНОЛОГИЯ ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТ
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

СОДЕРЖАНИЕ

СОДЕРЖАНИЕ. 2

ВВЕДЕНИЕ. 3

1. ТЕХНОЛОГИЯ ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТ. 4

1.1. Поисковые службы. 4

1.2. Что такое поисковые индексы и каталоги. 5

1.3. Индексы. 5

1.4. Составители каталогов. 6

2. ПОПУЛЯРНЫЕ ПОИСКОВЫЕ СЛУЖБЫ.. 7

2.1. Тематические каталоги. 7

2.2. Роботы индексов или поисковые машины. 7

2.3. Системы мета-поиска. 8

2.4. Системы поиска в конференциях Usenet. 9

2.5. Службы поиска людей. 10

3. ПРИЕМЫ ЭФФЕКТИВНОГО ПОИСКА. 11

3.1. Практические аспекты использования поисковых сервисов Интернет. 12

3.2. Составление ссылки из имени организации. 13

3.3. Нахождение информации с применением серверов глобального поиска. 13

3.4. Нахождение информационных ресурсов в каталогах. 14

3.5. Сопоставление поисковых серверов и каталогов. 14

ЗАКЛЮЧЕНИЕ. 16

ЛИТЕРАТУРА. 17


ВВЕДЕНИЕ

Сегодня каждый день множество людей неожиданно открывает для себя существование глобальных компьютерных сетей, объединяющих компьютеры во всем мире в едином информационном пространстве, имя которому - Интернет. Интернет многогранен и нельзя четко определить, что это такое. С технической точки зрения, Интернет - объединение транснациональных компьютерных сетей, работающих по самым разнообразным протоколам, связывающих всевозможные типы компьютеров, физически передающих данные по телефонным проводам и оптоволокну, через спутники и радиомодемы. Сегодня практически любой человек, обладающий доступом к компьютеру с простейшим модемом, может использовать в своей деятельности огромные информационные ресурсы, предоставляемые Интернет.

Итак, Интернет - сеть сетей, всемирная компьютерная сеть. Интернет можно рассматривать с многих позиций, вот две крайние из них. Наиболее узкое рассмотрение - объединение сетей, связанных между собой так, что в любой момент каждый компьютер в Интернет "видит" каждый другой (то есть может передать ему пакет данных и получить ответ за доли секунды). Наиболее широкое - киберпространство, рождающее киберкультуру со своим образом мысли, своим языком, своей этикой.

Интернет замечателен тем, что сеть и ее сервисы стали широко распространены в жизни общества, что они оказались достаточно хороши, чтобы река информации потекла руслом Интернет. Интернет не решил проблему хранения и упорядочения информации, но решил проблему ее передачи - дал возможность получить любую информацию где угодно, когда угодно.

Эта замечательная способность передачи информации привела к грандиозным темпам роста Интернет. Вследствие децентрализованности, нельзя точно сказать, каковы его размеры сегодня, но по оценкам "Network Wizards", количество компьютеров, полноценно подключенных в Интернет, последние два года ежегодно удваивается, составляя 6,6 миллионов компьютеров в июле 1995 года. По другим оценкам, количество компьютеров, имеющих доступ к каким-либо сервисам Интернет, весной 1995 года составляло до 30 миллионов. Это значит, что если скорость роста Интернет останется на том же уровне, то в течение ближайших лет Интернет и его сервисы станут столь же общеупотребительными, как телефон и телевидение сегодня. Очень многие компании понимают это, и, стремясь первыми прийти на этот рынок (а Интернет представляет собой, помимо всего прочего, еще и огромный рынок миллионов потенциальных клиентов), вкладывают деньги в развитие сети и сервисов, ей предоставляемых. Если в 1994 году в компании, работающие с Интернет, было вложено 42 миллиона долларов США, то уже за первый квартал 1995 года эта цифра составляла 47 миллионов (New York Times, 26 June 1995, p. D5). А деньги, как известно, делают деньги, и это является еще одним фактором, ускоряющим развитие сети. Коммерциализация Интернет - это, возможно, самый важный аспект его развития сегодня. Долгое время, до весны 1995 года, основные каналы связи и административные структуры Интернет финансировались Национальным научным фондом США, но теперь финансирование прекращено и развитие сети происходит на коммерческой основе.

Чтобы жить в городе, нужно уметь пользоваться транспортом. Для каждой поездки выбирают свой вид транспорта. За город ездят на электричках, в аэропорт можно поехать на маршрутном такси, до метро можно доехать на троллейбусе. Интернет в этом плане очень похож на город. Чтобы успешно работать с ним, нужно знать правила поведения в сети и уметь ориентироваться в множестве доступных Вам информационных сервисов. Увы, ввиду децентрализованности и молодости Интернет, не существует единой его карты или путеводителя по всем его сервисам. Эффективность работы в сети определяется знанием существующих сервисов, умением обращаться с конкретными сервисами и способностью выбрать правильный способ решения конкретной задачи. Этим определяется не только то, как скоро можно найти нужную информацию, но и то, можно ли ее найти вообще.




Поисковые службы.

Общим подходом для всех служб является поиск по заданным пользователем ключевым словам. Наличие заданных ключевых слов проверяется в теле документа, его заголовке или ссылках. В ходе поиска формируется Web-страница результатов, содержащая адреса URL, названия и краткие описания найденных источников. Общая последовательность работы со всеми службами одинакова.

1. Откройте начальную страницу службы.

2. Введите ключевые слова для поиска и нажмите . Программа возвращает Web-страницу с первой группой найденных источников, удовлетворяющих условиям поиска.

3. Обнаружив в списке нужный источник, щелкните на ссылке. Броузер откроет соответствующую Web-страницу.

По способу поиска и организации результатов все программы поиска можно разбить на две группы. Системы индексирования (search index) проводят поиск по заданным пользователем ключевым словам. Составители каталогов (search directory) организуют Web-страницы в систему иерархически связанных разделов. Способов поиска в такой системе много, включая перемещение по ссылкам от разделов высшего к разделам низших уровней. И те, и другие выводят результаты, используя базу данных, которую составляют, периодически совершая рейды по сети.

Индексы.

Появление индекса является результатом работы трех элементов программы индексирования. Схема взаимодействия между ними представлена на рис. 1. Собственно поиск по ключевым словам выполняет поисковая система (search engine). Именно к этой части программы индексирования обращается пользователь, задавая условие поиска в строке для ключевых слов. Поиск проходит в организованной программой базе данных. Совокупность найденных ссылок и адресов URL оформляется в виде Web-страницы результатов. Системы различаются своими возможностями. Некоторые из них поддерживают использование ключевых выражениях булевых операторов, позволяя существенно сузить область поиска. Другие, напротив, собирают всё, что содержит по крайней мере одно из заданных ключевых слов.

"Паук " (spider) (иногда называемый также "червем" (worm) или "гусеницей" (crawler)) должен выявить как можно больше Web-страниц. Для этого он "запоминает" все ссылки на открытые им документы. В обнаруженных таким образом новых страницах вновь отыскиваются и запоминаются ссылки. Эта процедура повторяется до тех пор, пока не будут исчерпаны все источники ссылок. Однако очевидно, что подобный метод не может гарантировать всеобъемлющих результатов: попадет ли тот или иной источник в число собран "пауком" страниц, целиком зависит от наличия ссылок на него в других документах Web.

Всякий раз, когда "паук" находит очередную Web-страницу, составитель индекса (indexer) изучает содержимое, занося слова, найденные в ссылках и тексте страниц, в гигантскую базу данных, уплотнить базу и очистить ее от повторяющихся элементов можно с помощью высокоэффективных алгоритмов строения баз данных, заложенных в составитель индекса. Это несложно, ведь в человеческой речи пока не используются уникальные слова. Составитель индекса должен в итоге создать базу, в которой URL адреса были бы соотнесены с наборами встречающихся в них слов.

Если какую-либо Web-страницу не удается найти, это еще не значит, что такой страницы не существует. Многие поисковые системы генерируют списки, в которых родственные темы собраны в разделы, организованные по принципу каталогов (такой принцип заложен, например, в Yahoo!). Если вам не удается найти нужные материалы - скажем, об уходе за йоркширским терьером (grooming Yorkshire Terrier), попробуйте отыскать их по индексу. Вполне возможно, искомая тема обнаружится среди его ссылок.

Чтобы повысить эффективность поиска по индексу, сделайте условие поиска более общим и добавьте ключевое слово "index". Так, условие Grooming AND (Yorkie OR "Yorkshire Terrier") следует изменить на Index AND (Yorkie OR Yorkshire). He исключено, что менее конкретное условие Index AND Terrier даст еще лучшие результаты. Если условие выбрано удачно, поисковая система возвратит один или несколько индексов, ссылающихся на страницы о йоркширской породе и терьерах.

Составители каталогов.

На первый взгляд отличить программы индексирования от составителей каталогов трудно. Материя для поиска для обоих инструментов служит содержимое Web-страниц.

Однако, в отличие от программ индексирования, составители каталогов не разыскивают все Web - страницы Internet. Объектом поиска для них являются адреса URL, которые включаются в систематизированный каталог. Поиск по каталогу можно проводить как с помощью броузера, так и вручную, щелкая на названиях разделов и знакомясь с их содержимым.

Тем не менее, несмотря на принципиальные различия в механизмах работы, грань между граммами индексирования и составления каталогов постепенно стирается. Все чаще можно встретить индекс, снабженный средствами построения каталога. Нередко сами Web-страницы в верхней части имеют некое подобие содержания со ссылками на отдельные разделы.



ПОПУЛЯРНЫЕ ПОИСКОВЫЕ СЛУЖБЫ

Правильный выбор инструмента поиска - ключевой момент поисковой стратегии. Если не помогает одна служба, можно попробовать другие.

Параметры броузера можно изменить так, чтобы некоторая Web-страница отображалась всякий раз, когда происходит запуск Internet (стала начальной страницей по умолчанию). Сделав начальной Web-страницу какой-либо поисковой службы, вы получите немедленный доступ ко всему набору средств поиска, которыми располагает данная служба. Excite, InfoSeek и Yahoo! являются для этого лучшими кандидатами.

Тематические каталоги.

Наиболее популярным во всем мире признан тематический каталог Yahoo! (http://www.yahoo.com/). Он представляет собой огромную базу данных URL-адресов сайтов самой различной тематики. Yahoo! предлагает вам воспользоваться иерархическим деревом при поиске информации. То есть вы выбираете сначала общую тематику, удовлетворяющую вашему запросу информации, и далее конкретизируете, следуя подсказкам каталога. В конечно результате вы получаете список сайтов, содержащих информацию, соответствующую вашему запросу. На Yahoo! вы также можете пойти и по другому пути. Проанализируйте предполагаемое содержание запрашиваемой информации и выберите ключевые слова, которые обязательно встретятся в интересующих вас материалах или их заголовках. Набираете эти слова через пробел в строке ввода на главной странице Yahoo! и нажимаете Enter. Система попытается сама подобрать интересующую вас информацию. Так как Yahoo! система англоязычная, то достаточно удобно использовать Интернет-переводчик, такой как "Сократ Интернет" (http://www.arsenal.ru/).

Если же вы ищите информацию заведомо русскоязычную, то имеет смысл использовать российские каталоги. Принцип работы с ними идентичен, тому который мы рассмотрели на примере с Yahoo!. Здесь стоит отметить первый российский каталог Russia on the Net (http://www.ru/), один из крупнейших русскоязычных каталогов List.RU (http://www.list.ru/), российский вариант Yahoo! (http://www.yahoo.ru/). Имеет место, также, каталог "Созвездие Интернет", содержащий только избранные (заявлено как самые интересные) ресурсы. Говоря о базах данных, нельзя не вспомнить замечательный российский проект "Желтые страницы Интернет" (http://www.piter-press.ru/yp), где как и в одноименной книге представлена детальная информация о самых разных ресурсах Интернет. В бизнесе также понадобятся каталоги предприятий и каталоги товаров и услуг. Пожалуй, самый крупный каталог предприятий СНГ Партнер (http://trifle.net/cis).

Системы мета-поиска.

Читая обо всех перечисленных поисковых службах, по неволе задумаешься: "а если для поиска необходимой информации не достаточно одной поисковой службы, то неужели придется входить на все здесь перечисленные сервера и каждый раз повторять один и тот же запрос?!". Наиболее качественный результат как раз будет именно при таком подходе. Но можно, исходя из экономии времени и денег, воспользоваться системами мета-поиска. Наиболее популярная в мире система такого класса Search.com (http://www.search.com/), но если мы работаем преимущественно с русскоязычными документами, то можно использовать Savvy Search (http://guaraldi.cs.colostate.edu:2000/form?lang = russian). Это достаточно мощная система отсылающая ваш запрос на 13 крупнейших поисковых машин (в том числе и российских) и возвращающая вам их отчеты. Другая российская система мета поиска "Следопыт" (http://www.medialingua.ru/www/Wwwsearc.htm) работает только с пятью англоязычными поисковыми машинами и одной русскоязычной, но интересна тем, что переводит ваш русскоязычный запрос на английский язык для англоязычных поисковых машин.

Также существуют так называемые мультипоисковые страницы:

"Все в одном" (http://www.tpi.ac.ru/~mike/search/index.htm);

Search (http://www.informika.ru/windows/intern/poisk/main.html);

БКФ Поиск (http:/bforum.virtualave.net/index09.htm) и другие.

Эти сервера не умеют посылать запросы и получать отчеты от поисковых служб как системы мета-поиска. Мультипоисковые страницы загружают во множестве окон поисковые службы и передают им ваш запрос. К тому же такие системы работают не стабильно.

Службы поиска людей.

У вас появилась возможность работать с электронной почтой, но вы не знаете адресов электронной почты партнеров вашей организации. Благодаря, так называемым, службам поиска людей в Интернет, указав ФИО вашего оппонента теоретически вы можете получить его адрес электронной почты и URL-адрес. Почему теоретически? Дело в том, что системы поиска людей, в основном берут информацию о электронных адресах из открытых источников, таких как конференции Usenet. Где гарантия, что ваши партнеры участвуют в этих конференциях? И тем не менее рассмотрим некоторые службы поиска людей. В первую очередь, традиционно, о самой популярной англоязычной системе Four 11 (http://www.four11.com/). Это действительно большой сервер - его база данных содержит порядка 6 000 000 адресов. Среди русскоязычных служб можно выделить Э-Рос (http://www.dubna.ru/eros) и Интермап (http://www.botik.ru/intermap/welcome.win0-abs.html).



ПРИЕМЫ ЭФФЕКТИВНОГО ПОИСКА

Разные методики поиска, приводят к различным результатам. Последние, к примеру, зависят от того, какой булев оператор использован в ключевом выражении. Ниже приведено несколько основных правил подбора ключевых слов.

• Чем конкретнее понятие, обозначаемое ключевым словом, тем лучше. Это сужает область поиска и делает его более предметным. К примеру, не следует вводить слово "dog" (собака), если нельзя поискать сведения о карликовом пуделе.

• Избегайте общеупотребительных слов. В качестве ключевых бесполезно использовать такие слова, как "that", "the", "program", "internet". Они настолько распространены, что поиск по ним даст многие тысячи страниц.

• Пробуйте разные формы одного ч того же ключевого слова. Например, если искомые страницы должны содержать сведения о беге (running), пробуйте поиск по всем трем формам: "run", "runs", "running".

• Не забывайте о синонимах. Так, кроме "running" (бег), можно использовать также "jog" (бег трусцой). В выражениях с булевыми операторами не забывайте разделять синонимы оператором OR.

• Пробуйте разные варианты. Если найденных страниц оказалось слишком много, попробуйте сузить условие поиска. Напротив, если результат слишком скуден, используемое ключевое слово следует заменить более общим понятием. Первый выбор далеко не всегда оптимален.

• Не забывайте добавлять кавычки. Они обязательны, если ключевое слово или выражение представляет собой название. Например, чтобы найти в Internet упоминание об этой книге, в строке для ключевых слов нужно ввести: "Special Edition Using the Internet". He забудьте поставить кавычки.

• Учитывайте регистр символов. Результат поиска нередко зависит от того, в каком регистре записано ключевое слово. Так, если оно записано строчными буквами, программа возвращает страницы, где это выражение записано как строчными, так и прописными. Однако если в строку для поиска ввести прописные символы, регистр будет строго соблюден: программа найдет только те страницы, где это выражение целиком записано прописными.

• Обращайте внимание на специфику используемого инструмента. Некоторые поисковые службы обладают свойствами, значительно облегчающими поиск нужных документов. В этой главе будет рассказано о самых популярных средствах; дополнительные сведения можно найти, щелкнув на ссылках в нижней части начальных страниц этих служб.

Если начальная страница службы поиска содержит перечень разделов (topic map), их рекомендуется использовать, так как они помогают в выборе ключевых слов. Перечень разделов содержит список дополнительных ключевых слов (основанный на словах, вводимых пользователем), которые программа рекомендует использовать в поиске, и перечень найденных источников.

Использование в ключевых выражениях булевых операторов (AND, OR, NOT) в ключевых выражениях помогает уточнить область и предмет поиска. Хотя наличие заданных ключевых слов поисковая служба проверяет во всех без исключения документах Internet, условия поиска можно изменять, задавая способ комбинации нескольких ключевых слов. Например, условием поиска может быть "golf (гольф) в сочетании с "equipment" (снаряжение), "clubs" (клубы), "bags" (сумки), "balls" (мячи) - с одним из этих слов или со всеми одновременно в любых комбинациях.

Булевы операторы, которые можно использовать для составления ключевых выражений. Оператор AND между двумя ключевыми словами задает поиск страниц, содержащих одновременно оба слова. По оператору OR будут найдены все страницы, содержащие по крайней мере одно из двух ключевых слов. Если перед ключевым словом стоит оператор NOT, служба поиска найдет страницы, в которых это ключевое слово отсутствует.

Булевыми операторами можно объединять несколько слов или выражении, взятых в кавычки. Ниже приводится несколько примеров.

• Music AND Celtic

Поиск страниц, содержащих оба слова - "Music" и "Celtic".

• Honeycutt AND Book AND NOT "Using the Internet"

Поиск страниц, содержащих слова "Honeycutt" и "Book", но не содержащих выражения "Using Internet".

• Honeycutt OR Que AND Book AND "Using the Internet"

Это условие задает поиск страниц, каждая из которых содержит хотя бы одно из двух ключевых слов - "Honeycutt" или "Que", а также слово "Book" и выражение "Using the Internet".

• Grooming AND "Yorkshire Terrier"

Поиск страниц, в каждой из которых содержится слово "Grooming" и выражение "Yorkshire Terrier" Границы поиска можно сузить, заключив часть условия с оператором в скобки.

• "Using the Internet" AND (Second OR Third)

Поиск всех страниц, каждая из которых содержит одно из двух слов ("Second" или "Third") и выражение "Using the Internet".

• (Grooming OR Care) AND (Yorkie OR Westie)

Поиск страниц, в которых содержится хотя бы одно слово из каждой пары: "Yorkie" - "Westie' "Grooming" - "Care".

• Search AND (Tool OR Index OR Directory)

Поиск страниц, содержащих слово "Search" в сочетании с одним из слов "Tool", "Index" или "Director

Некоторые средства поиска позволяют однозначно указывать системе, должны ли искомые страницы содержать то или иное ключевое слово. Для этого служат знаки "+" и "-", например +word, -word. 3i "+" показывает, что искомые страницы должны содержать данное ключевое слово, знак "-" задает noi страниц, в которых такое слово отсутствует. Ниже приводятся примеры использования включающих и ключающих символов в ключевых выражениях.

• +Honeycutt -Gerald +Jerry

По такому условию будут найдены страницы, содержащие слова "Honeycutt" и "Jerry", но не держащие слова "Gerald".

• +Book-Plus

Это условие определяет поиск страниц, содержащих слово "Book" и не содержащих слова "Pli Это выражение эквивалентно условию "Book AND NOT Plus".

ЗАКЛЮЧЕНИЕ

Итак, если Вы занимаетесь компьютерами и читаете по-английски, Интернет может служить удобным и эффективным источником информации в Вашей повседневной деятельности. Если Вы начнете пользоваться его ресурсами, то наверняка скоро выработает свои привычки и методы работы в электронном мире.

Подводя итог, можно сказать, что единой оптимальной схемы поиска в Интернет не существует. В зависимости от специфики необходимой вам информации, для ее поиска вы должны использовать соответствующие поисковые службы. В принципе, конечно, можно всегда пользоваться какой-нибудь одной поисковой системой, например Rambler, но чем грамотнее подобраны поисковые службы и составлен запрос на поиск информации, тем качественнее будут результаты поиска. А в бизнесе качество информации играет далеко не последнюю роль.



ЛИТЕРАТУРА

1. "Глобальные сети: инфоpмация и сpедства доступа" (пеpевод EARN "Guide to Network Resource Tools"), ПГТУ, Пеpмь, 1994 г.

2. Бpежнев А.Ф., Смелянский P.Л., Чумаков Н.Е. Пpотокол TCP/IP // В сб. "Технологии электpонных коммуникаций", т. 3, 1999, с. 71-129. URL ftp://ftp.elvis.ru/pub/doc/tcpip/tcp-russ.arj или через WWW: http://www.mark-itt.ru/FWO/tcpip/index.html

3. Иванников А.Д., Ижванов Ю.Л., Кулагин В.П. Перспективы использования WWW-технологии в высшей школе России // Информационные технологии, 1996. № 2. С. 24-29.

4. Информатика: учебник / под. ред. проф. Н.В. Макаровой. - М.: Финансы и статистика, 1997.

5. Использование Интернет: Пер. с англ. / Дж. Хоникат, М.Р. Браун, Т. Фронцковяк и др. - 4-е изд. - К.; М.; СПб: Издат. дом "Вильямс", 1998. - 592с.: ил.

6. Левин Д., Бароди К. Секреты Internet: Пер. с англ. К.: "Диалектика", 1996. 544 с.

7. Норенков И.П. По WWW-страницам учебных серверов. Компьютерное учебное пособие "Телекоммуникационные технологии и вычислительные сети" на сервере Центра дистанционного обучения МГТУ им. Н.Э. Баумана // Информационные технологии, 1997. № 3. С. 44-45.

8. Семенов Ю.А. Протоколы и ресурсы Internet. М.: Радио и связь, 1996. 320 с.

9. Спейнаур С., Куэрсиа В. Справочник Web-мастера: Пер. с англ. К.: BHV, 1997. 368 с.

10. Храмцов П.Б. Лабиринт Internet. Практическое руководство. М.: "ЭЛЕКТРОИНФОРМ", 1996. 256 с.

11. Частые Вопpосы и Ответы. Евгений Пескин, Relcom. 1999. URL ftp://ftp.kiae.su/relcom/faq/chawo.arj

СОДЕРЖАНИЕ

СОДЕРЖАНИЕ. 2

ВВЕДЕНИЕ. 3

1. ТЕХНОЛОГИЯ ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТ. 4

1.1. Поисковые службы. 4

1.2. Что такое поисковые индексы и каталоги. 5

1.3. Индексы. 5

1.4. Составители каталогов. 6

2. ПОПУЛЯРНЫЕ ПОИСКОВЫЕ СЛУЖБЫ.. 7

2.1. Тематические каталоги. 7

2.2. Роботы индексов или поисковые машины. 7

2.3. Системы мета-поиска. 8

2.4. Системы поиска в конференциях Usenet. 9

2.5. Службы поиска людей. 10

3. ПРИЕМЫ ЭФФЕКТИВНОГО ПОИСКА. 11

3.1. Практические аспекты использования поисковых сервисов Интернет. 12

3.2. Составление ссылки из имени организации. 13

3.3. Нахождение информации с применением серверов глобального поиска. 13

3.4. Нахождение информационных ресурсов в каталогах. 14

3.5. Сопоставление поисковых серверов и каталогов. 14

ЗАКЛЮЧЕНИЕ. 16

ЛИТЕРАТУРА. 17


ВВЕДЕНИЕ

Сегодня каждый день множество людей неожиданно открывает для себя существование глобальных компьютерных сетей, объединяющих компьютеры во всем мире в едином информационном пространстве, имя которому - Интернет. Интернет многогранен и нельзя четко определить, что это такое. С технической точки зрения, Интернет - объединение транснациональных компьютерных сетей, работающих по самым разнообразным протоколам, связывающих всевозможные типы компьютеров, физически передающих данные по телефонным проводам и оптоволокну, через спутники и радиомодемы. Сегодня практически любой человек, обладающий доступом к компьютеру с простейшим модемом, может использовать в своей деятельности огромные информационные ресурсы, предоставляемые Интернет.

Итак, Интернет - сеть сетей, всемирная компьютерная сеть. Интернет можно рассматривать с многих позиций, вот две крайние из них. Наиболее узкое рассмотрение - объединение сетей, связанных между собой так, что в любой момент каждый компьютер в Интернет "видит" каждый другой (то есть может передать ему пакет данных и получить ответ за доли секунды). Наиболее широкое - киберпространство, рождающее киберкультуру со своим образом мысли, своим языком, своей этикой.

Интернет замечателен тем, что сеть и ее сервисы стали широко распространены в жизни общества, что они оказались достаточно хороши, чтобы река информации потекла руслом Интернет. Интернет не решил проблему хранения и упорядочения информации, но решил проблему ее передачи - дал возможность получить любую информацию где угодно, когда угодно.

Эта замечательная способность передачи информации привела к грандиозным темпам роста Интернет. Вследствие децентрализованности, нельзя точно сказать, каковы его размеры сегодня, но по оценкам "Network Wizards", количество компьютеров, полноценно подключенных в Интернет, последние два года ежегодно удваивается, составляя 6,6 миллионов компьютеров в июле 1995 года. По другим оценкам, количество компьютеров, имеющих доступ к каким-либо сервисам Интернет, весной 1995 года составляло до 30 миллионов. Это значит, что если скорость роста Интернет останется на том же уровне, то в течение ближайших лет Интернет и его сервисы станут столь же общеупотребительными, как телефон и телевидение сегодня. Очень многие компании понимают это, и, стремясь первыми прийти на этот рынок (а Интернет представляет собой, помимо всего прочего, еще и огромный рынок миллионов потенциальных клиентов), вкладывают деньги в развитие сети и сервисов, ей предоставляемых. Если в 1994 году в компании, работающие с Интернет, было вложено 42 миллиона долларов США, то уже за первый квартал 1995 года эта цифра составляла 47 миллионов (New York Times, 26 June 1995, p. D5). А деньги, как известно, делают деньги, и это является еще одним фактором, ускоряющим развитие сети. Коммерциализация Интернет - это, возможно, самый важный аспект его развития сегодня. Долгое время, до весны 1995 года, основные каналы связи и административные структуры Интернет финансировались Национальным научным фондом США, но теперь финансирование прекращено и развитие сети происходит на коммерческой основе.

Чтобы жить в городе, нужно уметь пользоваться транспортом. Для каждой поездки выбирают свой вид транспорта. За город ездят на электричках, в аэропорт можно поехать на маршрутном такси, до метро можно доехать на троллейбусе. Интернет в этом плане очень похож на город. Чтобы успешно работать с ним, нужно знать правила поведения в сети и уметь ориентироваться в множестве доступных Вам информационных сервисов. Увы, ввиду децентрализованности и молодости Интернет, не существует единой его карты или путеводителя по всем его сервисам. Эффективность работы в сети определяется знанием существующих сервисов, умением обращаться с конкретными сервисами и способностью выбрать правильный способ решения конкретной задачи. Этим определяется не только то, как скоро можно найти нужную информацию, но и то, можно ли ее найти вообще.




ТЕХНОЛОГИЯ ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТ

Сегодня Интернет объединяет множество разных сетей, миллионы компьютеров, около 300 миллионов пользователей (данные от Robert Orenstein) всех континентов и, по разным оценкам, число таких пользователей увеличивается на 15-80% ежегодно. Можно выделить два основных направления в использовании Интернет в бизнесе. Это оперативный доступ к поистине необозримым кладезям информации по любой тематике (на сотнях тысяч информационных серверов), поиск и интерактивное общение с партнерами, практически в любой специализации и географическом расположении. Как сориентироваться в столь масштабном информационном пространстве? Для этого существуют специализированные поисковые сервера. Их можно разделить на тематические каталоги, роботы индексов (поисковые машины), системы мета-поиска. Также, для поиска необходимой информации в Интернет весьма полезны системы поиска в конференциях Usenet и службы поиска людей.

Стандартная технология поиска информации, реализованная, например, в протоколе Gopher, основывается на "деревьях". Примером реализации этой технологии могут служить также индексные файлы систем управления базами данных - "бинарные деревья". В тех случаях, когда поиск осуществляется автоматически на основе строгого алгоритма выбора дальнейшего пути поиска, технология, основанная на "деревьях" обеспечивает наилучшие результаты. Но в тех случаях, когда выбор осуществляет человек, не совсем ясно представляющий что он ищет, такой способ поиска часто будет приводить в тупики т.е. к информации не полной или вообще в данный момент не нужной. В таких случаях поиск приходится начинать сначала.

Основная идея, реализованная в технологии WWW(World Wide Web), состоит в том, чтобы каждый объект поиска имел ссылки на ассоциативно связанные с ним объекты. Причем в сети Internet такие ссылки может определять любой пользователь сети. В этом случае поиск не может закончиться тупиком и нужная информация может быть найдена при движении по разным путям. Такая система поиска больше напоминает паутину, чем дерево и именно эта ассоциация лежит в основе названия технологии WWW - "всемирная паутина".

Технология WWW была разработана в Европейском центре ядерных исследований (CERN) и основывается на архитектуре клиент/сервер. Программа броузер выполняет роль клиента, с ее помощью можно соединиться с программой-сервером (Web- страницей), находящейся в любом месте сети Internet. При нахождении необходимой информации, она передается программе-клиенту. При отсутствии нужной информации программе-клиенту передаются ссылки на другие серверы и так до тех пор, пока искомые сведения не будут найдены.

Web содержит миллионы документов, однако прямой доступ возможен лишь к тем немногим источникам, на которые есть ссылки на открытой в данный момент странице. При этом подавляющее число документов Web остается вне поля зрения. Чтобы исправить подобную ситуацию, предусмотрительные программисты разработали целый ряд служб, в которые заложен тот или иной метод поиска документов, не имеющий прямых ссылок.

Поисковые службы.

Общим подходом для всех служб является поиск по заданным пользователем ключевым словам. Наличие заданных ключевых слов проверяется в теле документа, его заголовке или ссылках. В ходе поиска формируется Web-страница результатов, содержащая адреса URL, названия и краткие описания найденных источников. Общая последовательность работы со всеми службами одинакова.

1. Откройте начальную страницу службы.

2. Введите ключевые слова для поиска и нажмите . Программа возвращает Web-страницу с первой группой найденных источников, удовлетворяющих условиям поиска.

3. Обнаружив в списке нужный источник, щелкните на ссылке. Броузер откроет соответствующую Web-страницу.

По способу поиска и организации результатов все программы поиска можно разбить на две группы. Системы индексирования (search index) проводят поиск по заданным пользователем ключевым словам. Составители каталогов (search directory) организуют Web-страницы в систему иерархически связанных разделов. Способов поиска в такой системе много, включая перемещение по ссылкам от разделов высшего к разделам низших уровней. И те, и другие выводят результаты, используя базу данных, которую составляют, периодически совершая рейды по сети.

Дата: 2019-12-10, просмотров: 170.