Главная Услуги Работы Персона Юзабилити анализы
IMG тел. +7(98I) 7608865
Семантическая информация и то как она послужила росту всемирной сети интернет. История образования сети интернет




ПОИСК по сайту


    Полный список статей
/ Семантическая информация / Версия для печати / translit / абракадабра :-)


<-предыдущая следующая ->

 
  google.com bobrdobr.ru del.icio.us technorati.com linkstore.ru news2.ru rumarkz.ru memori.ru moemesto.ru smi2.ru twitter.com Яндекс закладки text20.ru RuSpace RuSpace toodoo

Internet - глобальная компьютерная сеть, охватывающая весь мир. Сегодня Internet имеет около 15 миллионов абонентов в более чем 150 странах мира. Ежемесячно размер сети увеличивается на 7-10%. Internet образует как бы ядро, обеспечивающее связь различных информационных сетей, принадлежащих различным учреждениям во всем мире, одна с другой.

Если ранее сеть использовалась исключительно в качестве среды передачи файлов и сообщений электронной почты, то сегодня решаются более сложные задачи распределенного доступа к ресурсам. Около трёх лет назад были созданы оболочки, поддерживающие функции сетевого поиска и доступа к распределенным информационным ресурсам, электронным архивам.

Internet, служившая когда-то исключительно исследовательским и учебным группам, чьи интересы простирались вплоть до доступа к суперкомпьютерам, становится все более популярной в деловом мире.

Компании соблазняют быстрота, дешевая глобальная связь, удобство для проведения совместных работ, доступные программы, уникальная база данных сети Internet. Они рассматривают глобальную сеть как дополнение к своим собственным локальной сетям.

При низкой стоимости услуг (часто это только фиксированная ежемесячная плата за используемые линии или телефон) пользователи могут получить доступ к коммерческим и некоммерческим информационным службам США, Канады, Австралии и многих европейских стран. В архивах свободного доступа сети Internet можно найти информацию практически по всем сферам человеческой деятельности, начиная с новых научных открытий до прогноза погоды на завтра.

Всплеск глобальной информационной сети Internet наблюдается сейчас повсеместно. В сложившихся условиях потребность в информации о сети Internet становится особенно острой. В настоящее время по Internet распространяется множество документов, касающихся как функционирования сети и работы в ней пользователей, так и связанных с различными сферами жизни: наукой, культурой, экономикой и т.д. При чём обновление информации в Internet, обширной разветвленной сети, которая включает в себя компьютерные узлы, разбросанные по всему миру, происходит, практически, в режиме реального времени.

Кроме того, Internet предоставляет уникальные возможности дешевой, надежной и конфиденциальной глобальной связи по всему миру. Это оказывается очень удобным для фирм имеющих свои филиалы по всему миру, транснациональных корпораций и структур управления. Обычно, использование инфраструктуры Internet для международной связи обходится значительно дешевле прямой компьютерной связи через спутниковый канал или через телефон.

В настоящее время Internet испытывает период подъема, во многом благодаря активной поддержке со стороны правительств европейских стран и США. Ежегодно в США выделяется около 1-2 миллиардов долларов на создание новой сетевой инфраструктуры. Исследования в области сетевых коммуникаций финансируются также правительствами Великобритании, Швеции, Финляндии, Германии.

Однако, государственное финансирование - лишь небольшая часть поступающих средств, т.к. все более заметной становится "коммерциализация" сети (ожидается, что 80-90% средств будет поступать из частного сектора).

Интернет, как и вычислительная техника, совершил переход от использования только профессионалами до использования всеми интересующимися. И сам процесс перехода был совершенно аналогичен Сеть постепенно становилась проще в использовании: частично потому, что оборудование стало лучше, а частично потому, что сама стала скорее и надежнее. И самые смелые из тех, кто сначала не решался связываться с Интернетом, начали ее использовать. Эти новые пользователи породили огромную потребность в новых ресурсах и лучшем инструментарии. Улучшались старые средства, появлялись новые, предназначенные для доступа к новым ресурсам, что облегчало использование сети. И вот уже другая группа людей стала понимать пользу Интернет. Процесс повторялся. Этот круговорот продолжает развиваться и по сей день.

Понятие «информация»

Роль информации в личной, профессиональной и социальной жизни человека столь велика, что попытка дать ее всеобъемлющее описание обречена на провал. Понимать ведущую роль информации люди стали не очень давно. Возникновение такого понимания совпало, что весьма естественно, с бурным ростом информационных технологий. Этот рост резко увеличил то количество информации, с которым повседневно приходится иметь дело человечеству. Понятия информации, информатики и информационных систем и сетей повсеместно распространены. Почти наверняка нет человека, который не только слышал бы эти термины, но и не имел бы о них некоторого интуитивного представления, однако интуитивное понимание, а значит и подразумеваемое определение термина (понятия) «информация», далеко не однозначны. Такая ситуация часто встречается при знакомстве с достаточно общими понятиями, которые точно не определяются и их смысл вычленяется только при массовом использовании. для описания основных проблем, затрагиваемых в данном пособии, интуитивного понимания термина информация вполне достаточно. Тем не менее, для ряда оценок качества получаемой информации полезно сделать некоторые уточнения и ввести некие определения. Им и посвящен этот раздел, который стоит несколько в стороне от основных задач пособия, но знакомство с которым, на наш взгляд, все же достаточно полезно.

Слово информация происходит от латинского слова information - разъяснение, изложение. Это означает, что информация -- это нечто несущее или таящее в себе некоторые сведения. Такое определение является достаточно общим, и, как следствие, связано с потерей конкретности. Последнее обстоятельство естественно для общих определений всех базовых (фундаментальных) понятий. Его скорее можно назвать философским определением. Стало быть, для уточнения смысла термина информация необходимо уточнить и конкретизировать его содержание, обратив внимание на его основные свойства.

При введении любого нового термина теория обычно стремится определить его с помощью других терминов, которые, в конечном итоге, опираются на различные постулаты. Такой чисто теоретический подход не всегда удобен, и поэтому в нашем случае можно исходить из другого подхода, который принято называть операционным или операционалистким. В этом случае вводимая вновь величина определяется путем указания способа ее измерения. При таком подходе информацию можно определить через вызванное ею уменьшение числа возможных ответов в некоей задаче (проблеме). Таким образом, количество информации связывается с уменьшением неопределенности. Количественный подход к определению информации позволяет изучать вопросы хранения и передачи информации, однако он совершенно не касается ценности информации. Ценность информации связывают с ее прагматическим смыслом, то есть с возможностью ее разумного использования.

Поясним понятие прагматического смысла информации. Ценность информации зависит от соответствующей ситуации, а также от уровня сведений, которые могут уже иметься у индивидуума. Можно сказать, что ценность информации существенным образом зависит от характеристик воспринимающею информацию субъекта, точнее от уровня уже имеющихся у него знаний. Сумму этих знаний принято определять как тезаурус субъекта. Иными словами, ценность информации есть функция тезауруса Воспринимающего объекта и в этом смысле она относительна.

Анализ математической формулы дает совершенно разные представления о Скрытом в ней смысле в зависимости от того, каков образовательный уровень человека, с этой формулой знакомящегося. Таким образом, семантический смысл информации связан как с объектом, с которым соотносится информация, так и с субъектом, получающим и анализирующим данную информацию.

О наличии информации обычно судят, если замечают в распределении каких-либо объектов (знаков, предметов и т. д. ) некие отклонения от хаоса. Иными словами, информация определенным образом связана с упорядоченностью. Можно говорить о том, что во внешнем мире любая информация -- это упорядочение, которое может быть осмысленно истолковано. Информация искусственного происхождения, то есть информация, которая создана человеком, -- это любое целенаправленное упорядочение. В то же время следует учитывать, что информация при полном упорядочении (когда, например, все знаки в тексте строго периодически повторяются), на самом деле не так уж и велика. Собственно говоря, в том случае имеют дело только с очень малым количеством информации: наличием упорядоченности и ее характеристиками. Это соответствует минимально возможному количеству информации, иногда даже всего в 1 бит (одна единица двоичного кода). (12, с. 36-37)

Интерактивность

Термины «интерактивность», «интерактивный» сегодня можно встретить повсюду. За какие-то 5--7 лет эти слова, ранее знакомые лишь специалистам, успели приобрести рекламный опенок и вошли в моду. В такой ситуации сотрудники промоутерских агентств, увлеченные сочинением слоганов, подчас забывают о том, что же это такое. Что уж говорить о конечных потребителях рекламируемой продукции..

В свете происходящего не мешало бы напомнить, что термин «интерактивность» происходит от английского слова interaction, которое, в свою очередь, в переводе означает «взаимодействие». О каком же взаимодействии идет речь? Каковы субъекты этого процесса? Применительно к разговору об Интернете одни из участников взаимодействия является, безусловно, человек. для того же, чтобы говорить о другой субъекте, следует выделить цели, преследуемые человеком в Интернете. В подавляющем большинстве это либо получение определенной информации (текстовой, графической, звуковой -- в данном контексте это непринципиально), либо общение с другими людьми.

Очевидно, что противоположным полюсом процесса взаимодействия может стать информационный ресурс Интернета (сайт, телеконференция, хранилище файлов) или же другой человек, с которым конкретный пользователь общается с помощью служб Интернета. Сегодня все кому не лень называют Интернет «наиболее интерактивным из всех средств информации и общения». Так ли это на самом деле?

Ответить на этот вопрос поможет понятие «степень интерактивности» -- показатель, характеризующий, насколько быстро и удобно пользователь может добиться своей цели. К примеру, горячие новости политической жизни страны, безусловно, вы быстрее и с большим удобством узнаете из онлайновых изданий, чем из традиционных бумажных газет. С другой стороны, малоизвестную научную публикацию можно никогда не найти на просторах Сети, но гарантированно получить в Ленинке. да и обычный телефон (при условии, что известен номер абонента и свободна линия) обладает существенно большей степенью интерактивности, чем, к примеру, электронная почта или даже IСQ.

Общие цели, описанные выше, разумеется, состоят из более мелких подзадач. Никто, думается, не будет отрицать того факта, что процессы поиска нужной информации и общения в Сети происходят опосредованно, поскольку пользователь взаимодействует с неким интерфейсом, будь то web-страница или окно почтового клиента, а не с самим web-ресурсом.

А потому давайте попробуем проанализировать весь пройденный на настоящий момент тернистый путь развития ` wеb-технологий с позиции степени интерактивности сайтов, создаваемых с их помощью.

В начале был HTML Фактической основой стал язык НТМL, разработанный Тимом Бернерсом-Ли и Дэниэлом Конноли на основе СМ1 в 1990 году. Первым стандартом языка разметки, принятым к использованию в WWW, стал HTML уровня (версии) 0.0, включавший в себя самый минимальный набор тэгов для разметки содержимого документов. HTML 0.0 позволял описывать гиперссылки, заголовки, параграфы, списки и их пункты. В следующей версии НТМL 1.0 стало возможным внедрять в документы графические изображения. Были, кроме того, существенно расширены возможности форматирования текста. HTML 2.0 -- классика жанра. Благодаря поддержке web-форм, позволяющих передавать данные от клиента серверу, этот уровень НТМL стал вполне достаточным для создания полнофункциональных сайтов.

Как видим, степень интерактивности первых сайтов была достаточно неплохой. Минимализм -- залог скорости (текстовые страницы с небольшим количеством графики или полным ее отсутствием грузятся максимально быстро) и простоты (все страницы выглядят почти одинаково, все элементы интерфейса однотипны). web-формы и механизм ОН (а в дальнейшем -- Java-сервлеты и другие серверные технологии) вывели интерактивность на качественно новый уровень: пользователи получили возможность взаимодействовать с сайтами более полно и всесторонне, передавая сер- веру различные параметры и получая в ответ динамические страницы, сгенерированные на основе переданных значений, что называется, специально для вас». Но формы с большим количеством полей для заполнения существенно усложняют жизнь посетителей сайта, снижая простоту и удобство его использования.

Следует отметить, что существующие ныне сайты, посвященные пользовательским интерфейсам и вопросам юзабилити (www.useit.com, www.usabiliti.ru), недалеко ушли от минимализма НТМL 2.0. Да, эти сайты используют табличную верстку и определенную разработчиком цветовую гамму, но наличие последней не является столь критичным для адекватного восприятия информации, а таблицы поддерживаются семи современными браузерами, включая даже Lynx.

Первоначальные уровни языка НТМL предоставляли по большей части возможности логического форматирования документов, в то время как визуальным эффектам (таким как цветовая гамма) внимания практически не уделялось. Но в Интернет пришла коммерция, и потребовалось, чтобы сайты были красочными, производили впечатление. В то время компания Netscape уже занимала прочные позиции на рынке и начала на радость беспечным пользователям встраивать в свой браузер Navigator разнообразные возможности визуального форматирования. Многие из нововведений, предложенных Netscape, впоследствии были включены в официальную спецификацию НТМL 3.2 (напомним, что стандартизацией в области web-технологий занимается Консорциум W3С, основанный Тимом Бернерсом-Ли в 1994 году, www.w3.org).

Но тут, <вовремя> сообразив, что невнимание к отрасли web-технологий повлечет потерю крупной части потенциальной прибыли, о себе громко заявляет Microsoft, выбросив на рынок свой браузер Internet Explorer. Между Netscape и Мiсго5оа возникла жестокая конкурентная борьба, повлекшая в буквальном смысле наплевательское отношение обеих сторон к каким бы то ни было рекомендациям W3С. Названные производители любой ценой старались привлечь внимание потребителей к своей продукции, в результате чего в отрасли возник всепоглощающий кризис. Официальная спецификация HTML существовала, но ее, не будет преувеличением сказать, никто не придерживался: сайт, нормально выглядящий в одном браузере, в другом искажался до неузнаваемости. доходившее до абсурда перенасыщение НТМL возможностями визуального форматирования вообще шло вразрез с его первоначальной концепцией как языка логической разметки.

А что было с характеристиками интерактивности? В эпоху «украшательств», в течение эдакого «подросткового периода» развития сменившего пору детской чистоты и первозданности первых уровней НТМL, тенденции были крайне противоречивыми.

Возьмем, к примеру, фреймы -- это одна из ключевых разработок Netscape того времени. Идея фреймов выглядит очень красиво, но вот реализация... Недостатков на поверку оказывается гораздо больше, чем достоинств. Чтобы не быть голословным, приведу лишь некоторые самые слабые стороны технологии фреймов:

невозможность поставить ссылку на внутреннюю страницу сайта так, чтобы при переходе по такой ссылке страница отображалась внутри фреймовой структуры;

отсутствие всяческих возможностей навигации при попадании на внутреннюю страницу сайта (отображаемую без фреймов, должных ее окружать) по ссылке, выданной поисковой системой;

чрезвычайные трудности для разработчика при реализации сложной фреймовой структуры в случаях, когда при переходе по ссылке, расположенной в навигационном фрейме, необходимо менять содержимое не одного, а сразу нескольких соседних фреймов;

невозможность точного позиционирования пикселей в соседних фреймах (проблема наблюдалась в ((родном>) для фреймов браузере -- Netscape Navigator).

Еще один тезис не в пользу фреймов -- Netscape отказалась от их использования на корпоративном сайте буквально через полгода после разработки этой технологии. (14, ст.10.1)

Информационный поиск

Документальный поиск: Информационный поиск, при котором объектами поиска являются документы.

Автоматизированный информационный поиск: Информационный поиск с использованием ЭВМ.

Автоматизированный документальный поиск: Документальный поиск с использованием ЭВМ.

Библиографический поиск: Информационный поиск в библиографической базе данных.

Диалоговый поиск: Автоматизированный информационный поиск, при котором пользователь автоматизированной системы может формулировать информационные запросы в диалоговом режиме, корректировать их в процессе поиска и получать промежуточные результаты.

Пакетный поиск: Автоматизированный информационный поиск, при котором информационные запросы накапливаются в специальном массиве для последующей совместной обработки.

Ретроспективный поиск: Информационный поиск по разовым информационным запросам в ранее накопленном информационном массиве.

Поиск на естественном языке: Автоматизированный информационный поиск, для которого информационный запрос формулируется на естественном языке.

Полнотекстовый поиск: Автоматизированный документальный поиск, при котором в качестве поискового образа документа используется его полный текст или существенные части текста.

Булевский поиск: Информационный поиск, при котором информационный запрос формируется с помощью булевских операторов. ( 13, с 311 - 312)

История создания Интернета

Около 20 лет назад Министерство Обороны США создало сеть, которая явилась предтечей Internet, - она называлась ARPAnet. ARPAnet была экспериментальной сетью, - она создавалась для поддержки научных исследований в военно-промышленной сфере, - в частности, для исследования методов построения сетей, устойчивых к частичным повреждениям, получаемым, например, при бомбардировке авиацией и способных в таких условиях продолжать нормальное функционирование. Это требование дает ключ к пониманию принципов построения и структуры Internet. В модели ARPAnet всегда была связь между компьютером-источником и компьютером-приемником (станцией назначения). Сеть предполагалась ненадежной: любая часть сети может исчезнуть в любой момент.

На связывающиеся компьютеры - не только на саму сеть - также возложена ответственность обеспечивать налаживание и поддержание связи. Основной принцип состоял в том, что любой компьютер мог связаться как равный с равным с любым другим компьютером.

Передача данных в сети была организована на основе протокола Internet - IP. Протокол IP - это правила и описание работы сети. Этот свод включает правила налаживания и поддержания связи в сети, правила обращения с IP-пакетами и их обработки, описания сетевых пакетов семейства IP (их структура и т.п.). Сеть задумывалась и проектировалась так, чтобы от пользователей не требовалось никакой информации о конкретной структуре сети. Для того, чтобы послать сообщение по сети, компьютер должен поместить данные в некий ``конверт'', называемый, например, IP, указать на этом ``конверте'' конкретный адрес в сети и передать получившиеся в результате этих процедур пакеты в сеть.

Эти решения могут показаться странными, как и предположение о ``ненадежной'' сети, но уже имеющийся опыт показал, что большинство этих решений вполне разумно и верно. Пока Международная Организация по Стандартизации (Organization for International Standartization - ISO) тратила годы, создавая окончательный стандарт для компьютерных сетей, пользователи ждать не желали. Активисты Internet начали устанавливать IP-программное обеспечение на все возможные типы компьютеров. Вскоре это стало единственным приемлемым способом для связи разнородных компьютеров. Такая схема понравилась правительству и университетам, которые проводят политику покупки компьютеров у различных производителей. Каждый покупал тот компьютер, который ему нравился и вправе был ожидать, что сможет работать по сети совместно с другими компьютерами.

Примерно 10 лет спустя после появления ARPAnet появились Локальные Вычислительные Сети (LAN), например, такие как Ethernet и др. Одновременно появились компьютеры, которые стали называть рабочими станциями. На большинстве рабочих станций была установлена Операционная Система UNIX. Эта ОС имела возможность работы в сети с протоколом Internet (IP). В связи с возникновением принципиально новых задач и методов их решения появилась новая потребность: организации желали подключиться к ARPAnet своей локальной сетью. Примерно в то же время появились другие организации, которые начали создавать свои собственные сети, использующие близкие к IP коммуникационные протоколы. Стало ясно, что все только выиграли бы, если бы эти сети могли общаться все вместе, ведь тогда пользователи из одной сети смогли бы связываться с пользователями другой сети.

Одной из важнейших среди этих новых сетей была NSFNET, разработанная по инициативе Национального Научного Фонда (National Science Foundation - NSF), аналога нашего Министерства Науки. В конце 80-х NSF создал пять суперкомпьютерных центров, сделав их доступными для использования в любых научных учреждениях. Было создано всего лишь пять центров потому, что они очень дороги даже для богатой Америки. Именно поэтому их и следовало использовать кооперативно. Возникла проблема связи: требовался способ соединить эти центры и предоставить доступ к ним различным пользователям. Сначала была сделана попытка использовать коммуникации ARPAnet, но это решение потерпело крах, столкнувшись с бюрократией оборонной отрасли и проблемой обеспечения персоналом.

Тогда NSF решил построить свою собственную сеть, основанную на IP технологии ARPAnet. Центры были соединены специальными телефонными линиями с пропускной способностью 56 Kbps . Однако, было очевидно, что не стоит даже и пытаться соединить все университеты и исследовательские организации непосредственно с центрами, т.к. проложить такое количество кабеля - не только очень дорого, но практически невозможно. Поэтому решено было создавать сети по региональному принципу. В каждой части страны заинтересованные учреждения должны были соединиться со своими ближайшими соседями. Получившиеся цепочки подсоединялись к суперкомпьютеру в одной из своих точек, таким образом суперкомпьютерные центры были соединены вместе. В такой топологии любой компьютер мог связаться с любым другим, передавая сообщения через соседей.

Это решение было успешным, но настала пора, когда сеть уже более не справлялась с возросшими потребностями. Совместное использование суперкомпьютеров позволяло подключенным общинам использовать и множество других вещей, не относящихся к суперкомпьютерам. Неожиданно университеты, школы и другие организации осознали, что заимели под рукой море данных и мир пользователей. Поток сообщений в сети (трафик) нарастал все быстрее и быстрее пока, в конце концов, не перегрузил управляющие сетью компьютеры и связывающие их телефонные линии. В 1987 г. контракт на управление и развитие сети был передан компании Merit Network Inc., которая занималась образовательной сетью Мичигана совместно с IBM и MCI. Старая физически сеть была заменена более быстрыми (примерно в 20 раз) телефонными линиями. Были заменены на более быстрые и сетевые управляющие машины.

Процесс совершенствования сети идет непрерывно. Однако, большинство этих перестроек происходит незаметно для пользователей. Включив компьютер, вы не увидите объявления о том, что ближайшие полгода Internet не будет доступна из-за модернизации. Возможно даже более важно то, что перегрузка сети и ее усовершенствование создали зрелую и практичную технологию. Проблемы были решены, а идеи развития проверены в деле.

Важно отметить то, что усилия NSF по развитию сети привели к тому, что любой желающий может получить доступ к сети. Прежде Internet была доступна только для исследователей в области информатики, государственным служащим и подрядчикам. NSF способствовал всеобщей доступности Internet по линии образования, вкладывая деньги в подсоединение учебного заведения к сети, только если то, в свою очередь, имело планы распространять доступ далее по округе. Таким образом, каждый студент четырехлетнего колледжа мог стать пользователем Internet.

И потребности продолжают расти. Большинство таких колледжей на Западе уже подсоединено к Internet, предпринимаются попытки подключить к этому процессу средние и начальные школы. Выпускники колледжей прекрасно осведомлены о преимуществах Internet и рассказывают о них своим работодателям. Вся эта деятельность приводит к непрерывному росту сети, к возникновению и решению проблем этого роста, развитию технологий и системы безопасности сети. (10, с 526 - 530)
Доступ в Интернет
Доступ в Internet, обычно, получают через поставщиков услуг (service provider). Поставщики эти продают различные виды услуг, каждый из них имеет свои преимущества и недостатки. Так же как и при покупке садовой тачки (в оригинале - автомобиля) вы решаете, какими качествами должна она обладать, сколько вы за нее можете себе позволить заплатить, и, исходя из этого, выбираете подходящий вариант из предлагаемого множества.
Но перед тем, как начать действовать в этом направлении, т.е. добывать список поставщиков Internet, читать и выбирать, связываться с ними, выясните, а не имеете ли вы уже доступа в Internet, сами того не ведая. Такое вполне может иметь место - в России не так часто, в США не так уж и редко. Если ваша организация или учреждение (институт, компания) уже имеет доступ в Internet, то вряд ли вы сможете получить персональный доступ в сеть лучший, нежели ваша организация.
Другими словами, если вы уже имеете доступ в Internet, вам не надо будет платить денег из своего кармана, не надо будет суетиться вокруг поставщиков услуг и т.д., вам просто надо будет научиться пользоваться тем, что вы уже имеете.
Если ваша организация пока не имеет доступа в Internet, или вообще-то имеет, но, вот беда, не ваше подразделение (лаборатория, отдел, факультет), вам просто следует понаблюдать и прикинуть, сколько еще потенциальных пользователей имеется среди ваших сослуживцев, возможно, поговорить с ними и заручиться поддержкой, составить предложение и/или подать требование вышестоящему руководству.
Имеются (хотя это встречается, увы, пока очень редко) еще возможности получить доступ в Internet не через ее прямых распространителей, без лишних затрат.
Первый - поищите в публичных библиотеках: некоторые (центральные) имеют службу, называемую Freenet - свободная (бесплатная) сеть. Это информационная система, основанная соответствующим сообществом, обычно имеющая модемный доступ к Internet по телефону.
Второй путь полезен для молодых людей, проживающих в странах Запада, или в центральных городах у нас. Станьте студентом, поступите в западный или организованный у нас же в России совместно с Западом университет или колледж. И выберите соответствующую специальность или запишитесь на курсы, которые позволят вам добраться до заветного компьютера, имеющего доступ в Internet. Например, научитесь плести лапти - уже потом вам будет, чем развлечься, когда у вас от непрерывной работы в сети поедет крыша. И когда вы научитесь, у вас будет еще один довод начальству в пользу предоставления вам доступа в Internet: сети как воздух необходима база данных с инструкциями по плетению лаптей, без них они как без рук. Такой вклад руководство не сможет не оценить по достоинству. (2, с. 224)

Поисковые ресурсы

Информационные ресурсы - отдельные документы и отдельные массивы документов, документы и массивы документов в информационных системах (библиотеках, архивах, фондах, банках данных, других информационных системах).

Информационные ресурсы являются базой для создания информационных продуктов. Любой информационный продукт, являясь результатом интеллектуальной деятельности человека, должен быть зафиксирован на материальном носителе любого физического свойства в виде документов, статей, обзоров, программ, книг и т.д.

Информационный продукт может распространяться такими же способами, как и любой материальный продукт, с помощью услуг.

Информационные услуги возникают только при наличии базы данных в компьютерном или некомпьютерном варианте. Базы данных принято разделять на библиографические и небиблиографические.

Выпуск информационных изданий означает подготовку печатной продукции: библиографических и других указателей, реферативных сборников, обзорных изданий, справочных изданий. Информационные издания подготавливаются практически всеми видами информационных служб, органов и систем. Эти издания содержат вторичную информацию, которая создается на основе работы с базами данных, предоставление работы с которыми также является услугой. Ретроспективный поиск информации -- это целенаправленный по заявке пользователя поиск информации в базе данных и пересылка результатов либо виден распечаток по почте, либо по электронной почте в виде файла.

Объем информации, содержащейся в Интернете, и в частности, в его олицетворении -- системе WWW, не поддается измерению. Можно лишь оценить его порядок.

В начале 90-х гг. ХХ в., когда серверы WWW еще можно было сосчитать, существовали так называемые отправные точки. Это были страницы, на которых перечислялись ссылки на все WWW-серверы, сгруппированные по тематическому либо географическому признаку. Например, «Все WWW-серверы по биохимии» или «Все WWW - серверы Финляндии» (вместо термина «WWW - сервер» чаще произносят «сайт»).

Таким образом, открыв нужную отправную точку, можно было последовательно обойти все ссылки. Отправные точки стали прообразом современных каталогов ресурсов Интернета. Каталоги ресурсов подобны справочникам, содержащим систематизированные ссылки на сайт. Ссылки объединяются в группы по определенным признакам, как правило, по тематике. Каждая группа может иметь несколько уровней, т.е. каталоги имеют древовидную структуру. Кроме того, каталоги обеспечивают разнообразный дополнительный сервис: поиск по ключевым словам, списки последних поступлений, списки наиболее интересных из них. Ссылки в каталоги вносят администраторы, которые стараются сделать свои коллекции наиболее полными, включающими все доступные ресурсы на каждую тему. Также ссылки на свои ресурсы предлагают и владельцы. Администраторы каталога проверяют ссылку и вносят ее в соответствующий раздел.

Старейший каталог ресурсов (Yahoo! www.yahoo.com.) состоит из 14 разделов:

* Искусство и гуманитарные науки;

* Бизнес и экономика;

* Компьютеры и Интернет;

* Образование;

* Развлечение;

* Ресурсы правительства США;

* Здоровье;

* Новости и СМИ;

* Отдых и спорт;

* Справочная информация;

* Ресурсы по регионам;

* Естественные науки;

* Общественные науки;

* Общество и культура.

Поиск с помощью каталога ресурсов выглядит следующим образом: пользователь определяет, к какой из тем относится разыскиваемая информация; передвигаясь вглубь по дереву, находит в каталоге соответствующий раздел; обходит все страницы, перечисленные в разделе. Например, надо найти информацию о кошках породы Корниш Рекс. Тогда можно постепенно углубляясь, перейти в раздел Science > biology> zoology> Animals, Insects, аnd Pets> Mammals> Саts >Вrееds>Соrnish Rex.

Если же надо найти кто продает котят этой породы, поможет раздел Business and Есоnomy>Shopping and Services>Animals>Саts>Breeders>Cornish Rex. К удобству применения каталогов ресурсов относится то, что, если пользователю известна тема искомого документа, он будет исследовать соответствующую ветвь, не отвлекаясь на посторонние, не относящиеся к делу документы.

Однако объем каталога ограничен возможностями его администраторов и их субъективностью в выборе материала. Кроме того, тематику искомого документа не всегда можно сформулировать в пределах классификации каталога. В этом случае приходят на помощь поисковые системы.

Поиск в Интернете.

Удобство Интернета в том, что в нем можно найти практически любую информацию, даже когда мы не знаем точно, где она находиться. Если адрес страницы с интересующим нас материалом неизвестен и страницы с подходящими ссылками тоже нет, приходиться разыскивать материалы по всему Интернету. Для этого применяют поисковые системы Интернета - специальные web-узлы, позволяющие найти нужный документ.

Типы поисковых систем.

Существует два основных метода поиска в Интернете. В первом случае вы ищите web-страницы, относящиеся к определенной теме. Поиск производится путем выбора тематической категории и постепенным ее сужением. Подобные поисковые системы называют поисковыми каталогами. Они удобны, когда вам нужно вые познакомиться с новой для себя темой или добраться до широко известных «классических» ресурсов по данной теме. Второй способ поиска используется, когда тема носит узкий, специфический характер или нужны редкие, малоизвестные ресурсы. В этом случае вы должны представлять себе, какие ключевые слова должны встретиться в документе по интересующей вас теме. Эти слова надо выбрать таким образом, чтобы они, скорее всего, имелись в нужных документах, не имеющих отношения к выбранной теме. Системы, позволяющие выполнять подобный поиск, называют поисковыми указателями. Поисковые каталоги отличаются от поисковых указателей не только методом поиска, но и способом формирования. Любая поисковая система Интернета состоит из двух частей. Специализированная web-страница, доступная всем желающим и позволяющая выполнять поиск, опирается на большую, постоянно пополняемую и обновляемую базу данных, которая содержит сведения о ресурсах Интернета.

Способ пополнения этой базы данных зависит от типа поисковой системы, поисковых каталогов самое главное -- это точность отбора. Каждый найденный ресурс должен быть полезным. Тематика страницы определяется или проверяется вручную. Из-за этого объем поисковых каталогов относительно невелик. Когда объем приближается к миллиону страниц, объем ручного труда настолько велик, что дальнейший рост каталога останавливается.

Поисковые указатели, напротив, ориентированы на широту охвата. С определением слов, имеющихся на web-странице, вполне справляется автоматика, данных поискового указателя может охватывать многие миллионы web-страниц. При этом выполнять поиск в указателе труднее, чем в каталоге, потому что одни те же ключевые слова могут встречаться на web-страницах, посвященным разным темам.

Поисковые системы

Принципы поиска информации в Интернете.

Став полноправным пользователем Интернета, вы получаете доступ к огромному числу информационных ресурсов. Например, количество имеющихся в Сети НТМL-документов измеряется уже не десятками, а сотнями миллионов. А ведь в Интернете можно найти не только текст, но и программы, изображения, звуковые и видеофайлы и т. д. С одной стороны, в этом море информации наверняка найдется и та, которой вы интересуетесь, даже если сфера ваших интересов весьма специфична. С другой стороны, найти среди сотен миллионов web-страниц именно те, которые вам интересны, -- задача не из легких. Облегчить пользователям Сети поиск необходимой информации призваны поисковые системы.

Информационно-поисковые системы размещаются в Интернете на общедоступных серверах. Основой поисковых систем являются так называемые поисковые машины, или автоматические индексы. Специальные программы-роботы (известные также как пауки) в автоматическом режиме периодически обследуют Интернет на основе определенных алгоритмов, проводя индексацию найденных документов. Созданные индексные базы данных используются поисковыми машинами для предоставления пользователю доступа к размещенной на узлах Сети информации. Пользователь в рамках соответствующего интерфейса формулирует запрос, который обрабатывается системой, после чего в окно браузера выдаются результаты обработки запроса. Механизмы обработки запросов постоянно совершенствуются, и современные поисковые системы не просто перебирают огромное число документов.- Поиск ведется на основе оригинальных и весьма сложных алгоритмов, а его результаты анализируются и сортируются таким образом, чтобы представленная пользователю информация в наибольшей степени соответствовала его ожиданиям.

В настоящее время в развитии поисковых систем наблюдается тенденция объединения автоматических индексных поисковых машин и составляемых вручную каталогов Интернет-ресурсов. Ресурсы этих систем удачно дополняют друг друга, в объединение их возможностей вполне логично.

Тем не менее исследования возможностей поисковых машин, даже самых мощных из них, таких как AltaVista или HotBot, показывают, что реальная полнота охвата ресурсов Всемирной паутины отдельной такой системой не превышает 30%. Поэтому не стоит ограничиваться использованием какой-либо одной из них. Если вам не удалось отыскать интересующую вас информацию с помощью одной системы, попробуйте воспользоваться другой.

Каждая поисковая Система имеет свои особенности и, и качество полученного результата зависит от предмета поиска и точности формулировки запроса. Поэтому, приступая к поиску информации, прежде всего, нужно четко представлять себе, что именно и где вы хотите найти. Например, зарубежные системы поражают числом проиндексированных документов. Для поиска в области профессиональных знаний, особенно информации на иностранном языке, такие системы, как AltaVista, HotBot или Northern, подходят наилучшим образом.

Однако для поиска информации на русском языке, особенно в российской части Интернета, лучше приспособлены русские поисковые машины. Во-первых, они специально ориентированные именно на русскоязычные ресурсы Сети и, как правило, отличаются большей полнотой охвата и глубиной исследования эти ресурсов. Во-вторых, российские системы работают с учетом морфологии русского языка, то есть в поиск включаются все формы искомых слов. Российские системы лучше учитывают и такую исторически сложившуюся особенность российских Интернет-ресурсов, как сосуществование нескольких кодировок кириллицы.

Интерфейс всех поисковых систем построен примерно одинаково. Пользователю предлагается ввести запрос о специальное поле, а затем инициировать поиск щелчком на кнопке. Система выполняет поиск и выдает результаты в окне браузера. Кроме того, многими поисковыми системами пользователю предоставляется возможность задать дополнительные критерии поиска. Например можно искать только в определенной тематической категории или только определенных серверах.(15, с.523-525)

Расширенный поиск.

Кроме обычного запроса на естественном языке пользователи большинства систем могут также воспользоваться режимом «расширенного поиска» (в зарубежных системах -- Advanced Search), в котором с помощью специальных символов можно задать более точные критерии и область поиска. Русское название этого режима, родившееся, видимо, из не совсем точного перевода с английского, нельзя признать удачным, так как на самом деле расширенным является только набор критериев поиска, а ног область поиска в большинстве случаев существенно сужается.

Большинство поисковых систем позволяет использовать весьма развитый и сложный синтаксис запросов. Однако по данным создателей поисковых систем, которые, будучи людьми дотошными, ведут учет посещаемости различных страниц своих серверов, оказывается, что лишь около десяти процентов посетителей добираются до страниц с описанием языка усложненных запросов. Это говорит не столько о том, что пользователи Сети не желают разбираться в специальных символах и составлять некие формулы, сколько о том, что большинство ищущих вполне удовлетворяют результаты, полученные с помощью простого запроса. Тем не менее, многие функции расширенного поиска весьма удобны и одинаковы для разных систем, а запомнить правила их использования несложно. С помощью усложненных запросов можно задать самые разнообразные режимы поиска, например ограничить поиск только определенными сайтами или определенными элементами документа. Можно также настраивать способы сортировки результатов поиска, определив более и менее важные слова в запросе. Зачастую создатели системы предоставляют также возможность указания взаимного расположения искомых слов в предложении или документе, например насколько далеко одно искомое слово может отстоять от другого. Подробное описание синтаксиса запросов для конкретных систем имеется на сайтах этих систем в разделе справочной информации.

Библиотечные индексы для Internet

Начиная поиск чего-либо в Internet и имея минимум информации, а так же пытаясь огранить потери времени, для получения наиболее общей информации возможно обращение к следующей базе данных.

База данных: предмет ведет к Межсетевым ресурсам, построенным библиотекарями.

Содержание: Свыше 2,500 связей с Internet ресурсами, кратко аннотируемыми, с указанными предметными заголовками.

Поиск: Поиски могут быть ограничены названием ресурса, описанием его, или с указанными предметными заголовками.

Результаты: Результаты показаны в алфавитном порядке названиями ресурса.

Адрес: http://sunsite.berkeley.edu/InternetInd ex/

Яndех

Поисковая система Яndех располагается по адресу www.уаndех.ru. Она была официально введена в эксплуатацию 23 сентября 1997 года.

Что же такое Яndех? Вот как отвечают на этот вопрос создатели системы. Яndех -- это полнотекстовая информационно-поисковая система (ИПС), учитывающая морфологию русского и английского языков. Система Яndех предназначена для поиска информации в электронных текстах различной структуры и разных способов представления (форматов). Яndех (произносится «яндекс») расшифровывается как «языковый индекс» или, в английском написании, Yandex -- Yet Another INDEX. Также можно рассматривать Яndех как частичный перевод слова Index с английского на русский язык ( «I» означает «Я»).

В основе поисковой системы Yandex.Ru лежит системное ядро, общее для всех продуктов с префиксом Яndex (Яndex.Site, Яndex.Lib, Яndex.Dict, Яndex.СD). Первые продукты серии Яndex (Яndex.Site, Яndex.Dict) были представлены широкой публике 18 октября 1996 года на выставке Netcom'96. Поисковая машина для «русского Интернета». явилась естественным продолжением линии Яndex. Как уже говорилось, в хорошем вопросе содержится половина ответа. Искать и находить нужное в ворохе текстов в Интернете -- умение не только поисковой системы, мо и пользователя, задающего запрос. Яndex не требует от пользователя знания специальных команд для поиска. достаточно набрать вопрос («где найти дешевые компьютеры» или «нужны телефоны Москвы и Московской области»), и вы получите результат -- список страниц, где встречаются эти слова. Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Например, если задан запрос идти, то в результате поиска будут найдены ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т.д.

Яndex работает не только с языковыми запросами, но и позволяет выполнять поиск только на определенных серверах ИЛИ же исключить из поиска заведомо ненужные серверы. Появилась возможность поиска изображений по подписям к ним и по именам файлов. Также стали доступными для поиска такие объекты, как сценарии, апплеты и стили (поиск осуществляется по названию). Удобная работа с новыми возможностями предлагается на странице расширенного поиска, где сложный язык запросов сведен к заполнению полей в форме. Кроме стандартной сортировки результатов - по релевантности (то есть по степени соответствия запросу), можно отсортировать документы по дате обновления. Интересной особенностью системы является возможность поиска в Яндексе в любом месте Интернета. Для этого нужно загрузить с сайта http://bar.уаndех.ru программу пол названием Яндекс.Бар и установить ее. После этого в окне браузера появится новая панель. Она предназначена для ввода запроса на поиск (без необходимости открывать страницу Яндекса) и выполнения ряда других функций.

По внешнему виду Яндекс представляет собой типичный портал, на главной странице которого можно найти ссылки на материалы практически любой тематики. Но это не единственное его лицо, для «серьезных» пользователей, которые не хотят тратить время на загрузку ненужной в данный момент информации, существует другой Яндекс. Его страница впечатляет скромностью дизайна и скоростью загрузки. Адрес этой эссенции поисковой машины - www.ya.ru.

AltaVista

AltaVista (www.AltaVista.com) - одна из старейших поисковых систем в Интернете. Первый web-индекс был представлен компанией в 1995 году. Ядро поисковой системы обязано своим рождением странной особенности исследовательской лаборатории компании Digital Equipment Corp. Сотрудники этой лаборатории зачем - то хранили всю свою электронную переписку за последние 10 лет. Чтобы эта куча информации не просто занимала дисковое пространство, а приносила хоть какую-то пользу, была создана программа для индексирования документов и поиска нужных слов в ворохе пожелтевшей от времени электронной корреспонденции. Система получилась настолько удачной, что впоследствии с успехом перекочевала на просторы Всемирной паутины.

Индекс AltaVista содержит документы на более чем 25 языках. Локализованные версии сайта AltaVista располагаются в доменах 20 стран. В область поиска можно включить документы на всех поддерживаемых языках или только в документах на определенном языке, а на специальной странице можно узнать несколько языков для поиска на всех выбранных языках одновременно.

Hot Bot

База данных: Расположенные по всему миру WWW-страницы.

Содержание: 54 миллиона WWW-страниц(на сентябрь 1996 г.).

Поиск: Предлагает S - поиск и Эксперт (Expert (Е)) - поиск, поддерживает boolean-операторы (И и ИЛИ), поиск фразы, и выбор " человек "или" URL ". Е-поиск также поддерживает задание даты, местоположение (страна и т.д.)

TS - поиск: использует заключение фразы в двойные кавычки (например, " слова фразы ").

Результаты: Результаты показаны с названием документа, разряд уместности в проценте, URL, размер документа.

Адрес: http://www.hotbot.com/

Ditto

Сервер Ditto (www.ditto.com) отличается от большинства поисковых систем тем, что он специализируется в области так называемого визуального поиска. В данном случае под этими словами подразумевается поиск изображений по ключевым словам -- проще говоря, по незатейливому описанию. К сожалению, эти слова имеет смысл вводить только на английском языке; по крайней мере, в ответ на описание на русском система выдает фразы типа «There are no images matching your search» или «Server busy. Please try again».

Yahoo!

Базы данных: в ведении находится служба поиска Internet-ресурсов, новостей, карт, рекламных информаций, спортивная информация, бизнес, номера телефонов, персональные WWW-страницы, и email-адреса(отдельная база данных).

Содержание: Основная директория содержит: адреса (URLs) лля Internet-ресурсов и краткое описание для этих связей.

Поиск: Все Yahoo страницы предлагают не только простое поисковое окно, но и опции для этого поиска, а так же поиск Usenet или Email-адреса. Поиск может ограничиваться указанием определённого промежутка времени. Boolean операторы (и, или) и последовательный поиск также поддержаны. Отметим: если поиск в Yahoo! не привёл к положительному результату, то процесс поиска автоматически переходит на Alta Vista, которая продолжает поиск, и в случае положительных результатов автоматически возвращает найденную информацию в Yahoo!.

Если Yahoo! не может установить связь достаточно быстро с Alta Vista, то в этом случае Yahoo! будет обеспечивать страницу связи с набором инструментов поиска. После того как одна из этих связей выбирается, ключевые слова передаются к поисковой машине на ваше усмотрение.

Средством, облегчающим поиск, является наличие “tip search”(TS) - поиск с помощью “намека”: Yahoo! Является подчиненным справочником, что означает, что система не имеет так много страниц, как поисковые машины, однако задание наиболее общих ключевых слов позволит найти необходимую тему на странице высокого уровня (первая страница, которая возникает перед пользователем при посещении сайта) для организации или компании.

Результаты: Связи отображаются в соответствии с очерёдностью задаваемых слов последовательностью поиска наряду с их описательным текстом и подчиненной иерархией.

Адрес: http://www.yahoo.com/

Google

Это самая быстрая и самая большая поисковая система. Проиндексировано более полутора миллиарда страниц (из них полностью -- около половины, остальные представлены только в виде адреса и текста ссылки). Имеется возможность выбора языка интерфейса. Можно включать или исключать результаты с определенных сайтов или доменов. В отличие от большинства поисковых систем Google также оценивает популярность ресурса по количеству ссылок, ведущих к нему с других страниц. Кроме того, здесь содержится архив с возможностью поиска по всем телеконференциям системы USENET за последние 20 лет.
revolution.allbest.ru/programming/00010701_0.html
3
Создание эксклюзивных сайтов, юзибилити анализ и бесплатный анализ под запросы основных поисковых машин
Контактная информация :
тел. +7(98I) 7608865

Написать письмо на e-mail
icq 415547094  romverрейтинг на mail.ru сайта romverinbox.ru
© 1997 - 2024 romver.ru

Полная карта сайта Display Pagerank