Пропедевтический курс для интернет-консультантов Под редакцией А. В. Мартынихина

Вид материалаДокументы
Поисковые машины
Поисковые машины классификационного типа
Классификационная информационно-поисковая система Yahoo!
Поиск по рубрикатору Yahoo!
Diseases and Conditions
Web Directories
Поиск по ключевым словам
Дополнительные возможности словарного поиска
Options с основной страницы Yahoo. На этой странице можно выбрать способ поиска (Select a search method
Intelligent default
Рекомендации по организации поиска в Yahoo!
Подобный материал:
1   2   3   4   5   6   7   8

Поисковые машины


Представим себе достаточно типичную ситуацию. У Вас есть подключение к Интернет. Вы знаете, как использовать Netscape Navigator (или Internet Explorer). Но адресами медицинских ресурсов Сети Вы не располагаете.

Самый очевидный путь поиска – обратиться к сетевым поисковым машинам (ИПС – информационно-поисковая система). Они, используя введенные Вами ключевые слова, дадут Вам перечень ссылок на документы, имеющие отношение к Вашей тематике. Существуют две большие группы таких ИПС: 1) классификационные (рубрикаторы, каталоги) и 2) словарные (полнотекстовые) машины поиска. Основные различия между ними заключаются в способах сбора, хранения и предоставления информации пользователю. Иначе говоря, разница в том, кто формирует базу данных – люди (в первом случае) или компьютеры (во втором).

Поисковые машины классификационного типа


Если проводить аналогии с обычными библиотечными каталогами, то классификационные ИПС (virtual libraries) похожи на систематический каталог библиотеки. Это совокупность рубрик, расположенных в определенном порядке – от общего к частному. Ссылки рассортированы по тематическим рубрикам и снабжены аннотациями. Вы переходите от одной рубрики к другой, читаете, ищете, выбираете – как в каталоге любой библиотеки.

Компании, владеющие такими каталогами, непрерывно проводят огромную работу, исследуя, описывая и каталогизируя содержимое WWW-серверов и других сетевых ресурсов по всему миру. Результатом таких усилий является огромный иерархический (древовидный) каталог, на верхнем уровне которого собраны самые общие понятия, а элементы самого низкого уровня представляют собой ссылки на отдельные WWW-страницы и сервера вместе с кратким описанием их содержимого. Конечно, никто не даст гарантий, что такой каталог охватывает все содержимое Сети: ведь составляют его все-таки люди, а людям свойственно уставать и ошибаться. Но возможная неполнота и даже однобокость подбора материалов в таких каталогах с лихвой окупается тем, что не под силу никакому компьютеру - осмысленностью отбора. Информация, которой коснулась рука человека, становится во всех смыслах дороже – и практической пользы от нее больше, да и себестоимость ее выше.

Самая известная ИПС классификационного типа – Yahoo!

Классификационная информационно-поисковая система Yahoo!

yahoo.com


Поисковая система Yahoo! занимает первое место по количеству посещений: каждый месяц ее посещают примерно 30 миллионов человек. Это старейшая поисковая система Сети: она была запущена в 1994 году. Удивительно, но эта невероятно популярная система, обслуживающая миллионы запросов ежеденевно, зародилась как простая коллекция закладок, которую пополняли всего 2 человека - Дэвид Фило и Джерри Янг. На сегодняшний день Yahoo, это уже не просто каталог, это целая группа разнообразных сервисов, среди которых такие как каталог Yahooligans - Yahoo для детей, система персональных каналов My Yahoo, бесплатный E-mail сервис, система "Shop with Yahoo" (покупайте с Yahoo), система виртуальных клубов по интересам и многое другое. Полное имя системы - Yet Another Hierarchical Officious Oracle (Еще Один Иерархический Официозный Оракул), в сокращении Yahoo. Успех системы Yahoo! определяется обслуживающими ее людьми - сейчас в Yahoo! работают более 100 систематизаторов: именно они решают, в какую рубрику включить тот или иной документ.

В отличие от библиотечного каталога, цель организации системы Yahoo! (как и других ИПС классификационного типа) не в том, чтобы представить всю совокупность имеющихся тематических разделов и подразделов: рубрикатор Yahoo! скорее является попыткой отразить рубрики в соответствии с интересами предполагаемых пользователей. В системе примерно 25 тыс. категорий, в которых находится более 500 тыс. ссылок на Web-сайты.

Сильные стороны Yahoo! – в первую очередь его содержание и структура.

Поиск по рубрикатору Yahoo!


Общий принцип, которого следует придерживаться при работе с классификационными системами типа Yahoo! - движение хода рассуждений от общего к частному. Начинать следует с верхнего уровня рубрикатора. Если Вы уже находитесь где-то в Yahoo!, найдите на текущей странице ссылку Home для возврата на базовую страницу.

Верхний уровень в Yahoo содержит 14 рубрик: искусство и гуманитарные науки; бизнес и экономика; компьютеры и Интернет; образование; развлечения; управление; здоровье; новости и средства массовой информации; отдых и спорт; справочные источники; региональная информация; наука; социология; общество и культура. Все, что есть в Yahoo, сосредоточено в этих 14 рубриках.

Медицинскую информацию, естественно, следует искать в рубрике Здоровье (Health).

Пример поиска по теме Тетрада Фалло (Tetralogy of Fallot).

Рубрика Здоровье (Health) на дату выпуска настоящего пособия включала следующие подрубрики:

Alternative Medicine, (563), Chats and Forums (40), Children's Health (153), Companies@, Conferences (19), Death and Dying@, Dentistry@, Disabilities@, Diseases and Conditions (7296), Education (41), Emergency Services (236), Employment (110), Environmental Health (194), First Aid (15), Fitness (163), General Health (78), Health Administration (65), Health Care (361), Health Sciences (26), Hospitals and Medical, Centers (39), Institutes (33), Law@, Long Term Care (115), Medicine (4897), Men's Health (27), Mental Health (652), Midwifery (58), News and Media (197), Nursing (430), Nutrition (205), Organizations (21), Pharmacy (1081), Procedures and Therapies (281), Public Health and Safety (730), Reference (93), Reproductive Health (656), Senior Health (79), Sexuality@, Traditional Medicine (179), Travel Health and Medicine (14), Web Directories (49), Weight Issues (75), Women's Health (154), Workplace (70).

Цифры в скобках рядом с названием рубрики указывают, сколько ссылок она включает. Значок @ означает, что это отсылка, то есть информация по этой тематике включена в одну или несколько других рубрик.

Нужная нам информация относится к клинической медицине. Очевидно, что ее следует искать либо в разделе Diseases and Conditions (Болезни и состояния), где материал располагается по названиям заболеваний, либо зайти в раздел Медицина, где все сведения расположены в порядке алфавита отраслей медицины.

Мы можем выбрать раздел Кардиология из рубрики Медицина или зайти в рубрику Болезни и состояния и выбрать раздел Болезни сердца (Heart diseases). Оба эти пути приведут нас к одинаковому списку рубрик. Находим в этом списке нужную рубрику – Tetralogy of Fallot – и просматриваем ее. Теперь нам нужно ознакомиться с содержанием полученных ссылок и выбрать нужные.

Пример наглядно демонстрирует, что нет формализованного алгоритма, который можно было бы положить в основу работы с рубрикатором и который годился бы на все случаи жизни. Все зависит от вас: насколько хорошо развита Ваша профессиональная интуиция и насколько Вы опытны как пользователь Интернет. Лучший способ приобрести опыт и практические навыки поиска информации – потратить некоторое время на обыкновенное “блуждание” (surfing) по уровням рубрикатора Yahoo!. Его разделы очень подробно структурированы. Время от времени стоит заглядывать в отдельные документы и просматривать их содержание.

Очень полезно также заходить в рубрику Web Directories. Там можно найти перечень специализированных страниц сети Интернет, имеющих отношение к медицине. Многие из адресов снабжены краткими аннотациями: что включают, для чего предназначены.

Поиск по ключевым словам


Если цель поиска точно известна, можно использовать поиск по ключевым словам. При вводе ключевых слов с основной страницы Yahoo, запрос обрабатывается по методу Intelligent default, то есть Yahoo ищет наиболее подходящие результаты в таких областях: в категориях Yahoo; в Web-сайтах, зарегистрированных на Yahoo; на Altavista (запрос передается при отсутствии результатов); в новостях. Такой интеллектуальный поиск занимает довольно много времени. При задании критериев поиска для Yahoo нужно помнить, что Yahoo ищет эти слова только в названии и описании страницы, поскольку полнотекстового индекса на Yahoo нет. Поэтому не следует указывать при поиске слишком много терминов или синонимов - количество результатов снизится или даже будет нулевым. При вводе ключевых слов со страницы каталога, нужно выбрать область поиска - весь каталог Yahoo или только его текущий раздел. Это делается с помощью радиок-кнопок под полем ввода. На странице с результатами поиска выводятся сначала удовлетворяющие критерию поиска категории, а потом сайты. В случае если на Yahoo нет результатов, сразу выводятся результаты с Altavista. Вверху и внизу страницы выводится маленькая табличка, с помощью которой можно одним нажатием кнопки мыши произвести поиск в категориях Yahoo, на Altavista, в новостях и событиях. Количество результатов поиска на Yahoo, естественно, невелико, зато большинство из них являются релевантными.

Если слов несколько, они разделяются пробелами (как в рассмотренном выше примере: Tetralogy of Fallot). В системе Yahoo! пробелы между словами интерпретируются как логические операторы "И".

Пример. ЗАПРОС: Применение аспирина в лечении инфаркта миокарда. КЛЮЧЕВЫЕ СЛОВА. Myocardial infarction AND aspirin.

Механизм поиска Yahoo! будет искать все документы, в описании которых содержатся слова, заданные в качестве ключевых. При выдаче результатов подчеркиваются слова из запроса, которые встретились в документе. Ранжирование документов производится по количеству запрошенных терминов в документе (то есть в начале идут те документы, в которых ключевые слова встречаются чаще).

Хорошие результаты поиска в Yahoo! получаются, как правило, тогда, когда пользователь знает, что в базе данных информация присутствует наверняка.

Дополнительные возможности словарного поиска


Для расширенного поиска Yahoo предлагает не очень большой, но очень полезный набор инструметов. Среди средств расширенного поиска - ограничение результатов по дате, поиск в Yahoo, Usenet и среди E-mail адресов, использование логических операций над терминами и поиск конкретной фразы. Также присутствует возможность искать слова с произвольными окончаниями, указывать слова, которые должны или НЕ должны присутствовать в документе, и т.д. Чисто русские ресурсы в Yahoo не добавляются, потому что в Yahoo Inc. просто некому смотреть и оценивать их содержимое. Но те запросы, которые не дали результатов на Yahoo передаются на Altavista, а там есть хороший индекс русских ресурсов.

Можно использовать дополнительные операторы:

+ (между поисковыми терминами) – то же, что AND (в результат будут обязательно включены документы, содержащие данный термин).

– (перед поисковым термином) – то же, что NOT (в результат НЕ будут ключены документы, содержащие данный термин).

t: (перед поисковым термином) - поиск ключевых слов только в заголовках (title) документов.

u: (перед поисковым термином) - поиск ключевых слов только в адресах URL.

Важно соблюдать синтаксис при написании операторов, например, правильно писать: +t:tuberculosis, неправильно: t:+tuberculosis.

Чтобы попасть на страничку расширенного поиска, надо перейти по ссылке Options с основной страницы Yahoo. На этой странице можно выбрать способ поиска (Select a search method).
  • An exact phrase match – поиск точной фразы. В этом случае слова, веденные в окно поиска, должны трактоваться как единая фраза, как если бы эти слова были заключены в кавычки.
  • Matches on all words (AND) – поиск документов, содержащих все заданные слова. В этом случае отбираются документы, содержащие все ключевые слова без исключения.
  • Matches on any word (OR) – поиск документов, содержащих хотя бы одно из заданных слов. Отбираются документы, содержащие любое из ключевых слов, введенных в окно запроса.
  • A person's name - поиск человека по имени (учитываются заглавные буквы, а также нахождение имени рядом с фамилией и т.п.).
  • По умолчанию используется опция Intelligent default. Здесь действуют следующие принципы иерархии: наибольший вес имеют те документы, в которых содержатся все заданные слова и в которых слова находятся в заголовке документа.

Наряду со способом поиска можно выбрать область поиска (Select a search area):
  • Yahoo! (база данных Yahoo!);
  • Yahoo Categories (поиск в рубриках (Categories) базы данных Yahoo!);
  • Usenet (поиск в телеконференциях);
  • E-mail addresses (поиск среди адресов электронной почты);
  • Web Sites (поиск в заголовках сайтов, проиндексированных в базе данных Yahoo!).



Рекомендации по организации поиска в Yahoo!


Если точно известно, что искать (например, конкретное заболевание, препарат и т.п. ) – введите ключевое слово (или слова) в окно поиска Search. Затем ищите информацию, просматривая ссылки.

Если Вас интересует определенная отрасль (например, кардиология, фтизиатрия …) – найдите в рубрикаторе соответствующую рубрику и ищите информацию в ней.

Если неизвестно, что и где искать – введите в окно Search известные Вам слова из нужной предметной области, просмотрите найденные ссылки, определите, в каких рубриках находится нужная Вам информация, перейдите в эти рубрики и просматривайте содержащиеся в них документы.