Home

Назад


Уроки HTML




Как искать в Сети?

Как известно, в хорошем вопросе уже содержится половина ответа. Искать и находить нужное в действительно бескрайнем Интернете - умение не только поисковой системы, но и пользователя, задающего вопрос.

Наиболее распространенным в Интернете является поиск по ключевым словам, т.е. поиск документов, которые содержат в точности указанный текст. На запрос изготовление самогона будут найдены ссылки на страницы, содержащие слово "изготовление", и ссылки на страницы, содержащие "самогон". Чтобы получить ссылки на страницы, где встречается фраза "изготовление самогона" (а не слова по отдельности), необходимо свой запрос заключить в кавычки: "изготовление самогона"

Менее распространен поиск с использованием операндов булевой алгебры, таких, например, как AND, NOT и OR. Использование операндов существенно увеличивает эффективность поиска. К примеру, введем в поисковую систему такой запрос: (теща OR Ржевский)AND анекдот (NOT чукча). Мы получим ссылки на страницы, отвечающие следующим трем условиям:

  • содержат слово "анекдот";
  • содержат одно из слов - либо "теща", либо "Ржевский";
  • не содержат слова "чукча".

Новинка в области поиска в Интернете - Proximity search (поиск с расстоянием). Это поиск, при котором пользователь указывает, на каком расстоянии между собой должны располагаться ключевые слова в документе. Например, для русской поисковой системы Яndex при запросе "богатый /4 умный" вы требуете найти документы, в которых содержится и слово "богатый", и слово "умный", причем расстояние между ними должно быть не более четырех слов.

Еще один вид поиска - Query By Example (find similar - найти подобные). Этой полезной функцией обладает лишь часть поисковых систем. При просмотре результатов первоначального поиска вы выбираете документ или группу документов, наиболее близких к тому, что вы ищете, и даете системе команду "найти подобные документы" (Апорт, Яndex).

Очередной поиск - Query Expansion (расширенный запрос) - процесс построения нового запроса на базе предыдущего. Скажем, на запрос Яndex'у найти страницы, содержащие фразу "Билл Клинтон", вы получите многотысячный список ссылок. Установим флажок "Искать в найденном" и сделаем новый запрос: Моника. Сервер просмотрит найденные документы еще раз и оставит только страницы, содержащие слово "Моника". Так можно повторять несколько раз, постепенно сужая область поиска.

Поиск в определенных полях (Search by Field) позволяет производить поиск не только по всему html-документу, но и выборочно, по определенным полям. Например, можно искать по заголовку документа (title), в этом случае учитываются только ключевые слова, встречающиеся именно в заголовке документа. Существует поиск по полю ALT тега IMG, такой поиск используется при нахождении в Интернете изображений на определенную тему. Возможен и поиск по текстам в гиперссылках, адресах, заголовках разделов, комментариях. Например, Рамблер по запросу "$TITLE: реклама and $URL: ресурсы" найдет все страницы, содержащие слово "реклама" в заголовке и хотя бы одну имеющуюся на странице ссылку, содержащую слово "ресурсы". Многие поисковые серверы позволяют вести поиск по дате. Например, по запросу "катастрофа дата=01/08/98-25/08/98" (Апорт) будут найдены документы, содержащие слово катастрофа и созданные между 1 и 25 августа 1998 года. Может оказаться полезным поиск по ссылке. По запросу "link=www.fortunecity.com/business/fax/339" будут найдены все страницы, имеющие ссылку на данный сайт.

Морфологический поиск (Stemming): возможность системы искать слово в документах не только в строго заданном виде, но и во всех его морфологических формах. Например, в запросе указано слово "идти". Будут найдены документы также со словами "идет", "шел", "шла" и т.п.

В поиске в Сети существует такое понятие, как Weighting (весовой коэффициент). Он способствует увеличению релевантности документа (т.е. в результирующем списке ссылка на документ находится ближе к началу списка) не только с помощью количества содержащихся в нем ключевых слов, но и по месту расположения их в документе. Больший вес имеют слова в заголовке страницы, слова, выделенные тегами <H1-H6>, <B>, <STRONG>, слова, находящиеся ближе к тегам <HTML> и <BODY> документа. При поиске пользователь также может указывать поисковой системе важность того или иного слова в запросе. Например, в Рамблере по запросу "-Коза ++Овца" при выдаче результата большую релевантность получат страницы, содержащие слово "Овца", меньшую - "Коза".

Синтаксис запросов в различных поисковых системах может несколько отличаться. Ниже вы можете ознакомиться подробнее с особенностями составления запросов для конкретных поисковиков:


Международный сервер знакомств...

Перейти на:   Home    Поисковики    Начало страницы

 
Сайт создан в системе uCoz