Студопедия

Главная страница Случайная лекция


Мы поможем в написании ваших работ!

Порталы:

БиологияВойнаГеографияИнформатикаИскусствоИсторияКультураЛингвистикаМатематикаМедицинаОхрана трудаПолитикаПравоПсихологияРелигияТехникаФизикаФилософияЭкономика



Мы поможем в написании ваших работ!




Справочно-информационный материал

Поисковые системыс помощью поисковых машин производят автоматический поиск новых ресурсов и их автоматическую индексацию. Процедура индексации состоит в занесении в базу данных поисковой системы информации о страницах сервера и ключевых словах, соответствующих этим страницам. Именно к этой базе происходит обращение, когда пользователь в поисках информации на выбранную тему вводит определенное ключевое слово (или набор ключевых слов).

Самые известные международные поисковые системы – это англоязычные Altavista.com и Google.com. При вводе в поисковую строку русско-язычного текста эти поисковые системы выдают информацию на русском языке. К русскоязычным системам с наиболее разработанными поисковыми возможностями относят системы Yаndeх и Rambler.

Поисковая система позволяет осуществлять простой и расширенный поиск информации. Простой поисковый запрос может состоять из одного или нескольких слов и знаков препинания. Текст запроса вводится в поисковую строку. В результате работы поисковой системы будут найдены документы, содержащие слова запроса.

Например, запросу 'бункеровщик' удовлетворяют все документы, в которых хотя бы раз встретилось слово 'бункеровщик' в любой форме.

Как правило, регистрнаписания поисковых слов значения не имеет, поисковая система воспримет одинаково слова 'институт' и 'ИНСТИТУТ', 'Hot' и 'hOt'. Однако, иногда, в целях повышения качества поиска, регистр слов поискового запроса принимается во внимание.

Например, если запрос состоит из двух, трех или четырех слов, каждое из которых написано с большой буквы, то предполагается поиск по имени собственному, например "Волго-Балт", "И. Тургенев", "Александр Сергеевич Пушкин".

Каждый запрос, адресованный поисковой системе, обрабатывается в соответствии с правилами языка запросов. Знание и правильное применение языка поисковых запросов помогает сделать поиск информации в Интернет более быстрым и эффективным.

Фактически, языком запросов описывается некая формула, которая используется при поиске. Поисковая система «сопоставляет» с этой формулой каждый документ и в результате поиска выдает документы, которые удовлетворяют ей.

В случае, если расширенный поиск по нескольким словам не дал ожидаемого результата, можно попробовать расширить его, включив в запрос специальные значки, или операторы. Поиск операторов в документе не производится, они служат лишь инструкцией поисковой машине. Для изменения сферы действия операторов (группировки нескольких слов запроса в аргумент оператора) применяются скобки и кавычки.

Рассмотрим используемые в поисковой системеRambler операторы.

Оператор && (логическое И).Два запроса, соединенные оператором && (И), образуют сложный запрос, которому удовлетворяют только те документы, которые одновременно удовлетворяют обоим этим запросам.

По запросу 'студент&&преподаватель' найдутся только те документы, которые содержат и слово 'студент', и слово 'преподаватель'.

Оператор || (логическое ИЛИ).Сложному запросу, состоящему из двух запросов, соединенных оператором || (логическое ИЛИ) удовлетворяют все документы, удовлетворяющие хотя бы одному из этих двух запросов.

По запросу 'аудитория || лаборатория' найдутся документы, в которых есть хотя бы одно из слов 'аудитория' или 'лаборатория' (либо оба эти слова вместе).

Оператор NOT (логическое НЕ).Оператор NOT позволяет сформировать запрос, которому отвечают документы, удовлетворяющие левой части запроса и не удовлетворяющие правой.

Так, результатом поиска по запросу 'институт NOT университет' будут все документы, в которых есть слово 'институт' и нет слова 'университет'.

Если оператор не указан, используется оператор по умолчанию || (И): находятся только документы, содержащие все слова запроса.

Так, запрос 'информационные технологии управления' будет истолкован как 'информационные && технологии && управления'. На странице Расширенного поиска оператор по умолчанию можно заменить на || (И) (Искать слова запроса: хотя бы одно).

Запрос из нескольких слов, перемежающихся операторами, будет воспринят в соответствии с их приоритетом. Операторы && (И) и NOT традиционно имеют более высокий приоритет, поэтому запрос из нескольких слов при обработке сначала группируется по операторам && (И) и NOT, и лишь потом по операторам || (ИЛИ). Изменить порядок группировки можно использованием скобок и кавычек.

Изменить порядок группировки можно использованием скобок. Существует модификация оператора && (И) - оператор &&&. Он применяется для расширения границ поиска. В этом случае поиск будет производится не в пределах одного документа, а в пределах одного сайта.

Следующая группа специальных операторов поможет определить приоритет слов в поисковом запросе. Эти операторы должны стоять непосредственно перед словами поиска (без пробела) или перед кавычками, которыми окружена группа слов:

+ означает, что это слово обязательно должно быть найдено;

? означает, что могут быть также найдены документы без этого слова.

Например, в запросе +телефонная база ?Москвы слово "Москва" будет не обязательным, а слово "телефонная" - необходимым.

Для поиска цитат используют двойные кавычки. Слова запроса, заключенного в двойные кавычки, ищутся в документах именно в том порядке и в тех формах, в которых они встретились в запросе.

Например, запросу 'судно "отправилось" погрузка' удовлетворяет документ, содержащий текст '... судно закончило погрузку и отправилось ...', и не удовлетворяет документ, содержащий '.. судно закончило погрузку, чтобы отправиться ...'.

При необходимости объединения слов запроса в группы, которые будут аргументами некоторого оператора, эти группы заключаются в скобки.

Часть запроса, заключенная в скобки, сама является запросом, и на нее распространяются правила языка построения запросов.

Если запрос без скобок 'танкер катер | порт' эквивалентен запросу 'танкер && катер || порт' и, в соответствии с приоритетами операторов, означает "найти документы, содержащие либо слова 'танкер' и 'катер', либо слово порт, то запрос со скобками 'танкер (катер | порт)' равносилен запросу 'танкер && (катер || порт)', что означает "найти документы, содержащие слово 'танкер' и одно из слов 'катер' или 'порт'".

По каждому слову запроса поиск ведется с учетом правил словоизменения соответствующего языка. Рамблер понимает и различает слова русского и английского языков - по умолчанию, поиск ведется по всем формам слова.

Например, при поиске по слову 'человек' будут также найдены документы, содержащие слова 'человеку', 'человеком', 'человека' и даже 'люди'.

Чтобы провести поиск только по одной определенной форме слова, нужно взять его в двойные кавычки или воспользоваться поиском точной фразы в расширенном поиске.

Например, при поиске слова «канал» в именительном падеже, следует ввести запрос в виде ''канал''.

Для каждого запроса, состоящего из нескольких слов, существует так называемое ограничение контекста - положительное число, по умолчанию равное расстоянию в 40 слов.

В результате работы поисковой системы будут выданы только те документы, в которых встретились все слова запроса и расстояние между ними в документе составляет не более 40 слов.

Например, по запросу 'речной транспорт' будут найдены те документы, в которых слова 'речной' и 'транспорт' хотя бы один раз встретятся менее чем в 40 словах друг от друга.

Значение ограничения контекста можно изменять следующей конструкцией:

'(число, запрос)',

где: число- любое положительное число;

запрос - любой корректный с точки зрения поисковой машины запрос, состоящий более чем из одного слова.

Таким образом, по запросу '(2, речной транспорт)' поисковая система найдет только те документы, в которых между словами 'речной' и 'транспорт' хотя бы раз не стоит ни одного слова (поскольку лишь в случае их непосредственного соседства разница в порядковых номерах слов меньше 2, т.е. равна 1).

Если запрос состоит из нескольких слов, и при этом некоторые из них вообще не удалось найти в Интернете, то выдаются результаты поиска по частичному запросу, из которого отсутствующие в Интернете слова исключены.

Форма расширенного поиска(табл. 1) информации дает возможность:

· задавать дополнительные параметры поиска;

· редактировать параметры поиска и поля, заданные по умолчанию;

· выбирать наиболее удобную форму показа результатов поиска.

 

Таблица 1

Дополнительные параметры поиска

и показа результатов поиска

в системе Rambler

 

Параметр поиска Варианты параметра Результат поиска
Искать слова запроса Все Документ находится, если в нем присутствуют все слова запроса; включено по умолчанию.
Любое из слов Документ находится, если в нем встретилось хотя бы одно слово из запроса.

 

Продолжение таблицы 1

 

Параметр поиска Варианты параметра Результат поиска
  Точную фразу Документ находится, если в нем встретились все слова запроса, в том же порядке и в тех же формах, что и в запросе. Равнозначно заключению поискового запроса в двойные кавычки.
Расстояние между словами запроса Ограничивать Расстояние между словами запроса в тексте документа не должно быть слишком большим. Включено по умолчанию, т.к. повышает точность поиска.
Не ограничивать Будут найдены все документы, содержащие слова запроса, вне зависимости от того, на каком расстоянии друг от друга они находятся.
Язык документа Любой Находятся любые документы, независимо от языка; включено по умолчанию.
Русский Поиск только по "русскоязычным" документам.
Английский Поиск только по "англоязычным" документам.

 

 

Продолжение таблицы 1

 

Параметр поиска Варианты параметра Результат поиска
Исключить слова Из списка найденного исключаются те документы, в которых есть слова, перечисленные в этом поле.
Дата документа Позволяет отбирать документы, дата создания которых укладывается в заданный диапазон. Можно ограничить выдачу "новыми" (начиная с указанной даты) или "старыми" документами (до указанной даты). Даты задаются в формате день/месяц/год. По умолчанию находятся любые документы, вне зависимости от даты.
Сайты Позволяет отбирать документы, только на указанных сайтах. Можно указать несколько сайтов через запятые.
Выдавать По –10,15, 30, 50 На страницах результатов поиска выводится по 10,15, 30, 50 найденных документов (сайтов). Включено по умолчанию.
Параметр поиска Варианты параметра Результат поиска
Вывод результатов поиска Сортировать Сайты по релевантности - найденные документы группируются по сайтам. Порядок выдачи сайтов определяется их релевантностью (степенью соответствия запросу документов с сайта). Включено по умолчанию.
Страницы по релевантности - документы не группируются по сайтам. Порядок выдачи определяется релевантностью (соответствием запросу) каждого отдельного документа.
Страницы по дате (сначала новые). Порядок выдачи - от более новых документов к более старым.
Страницы по дате (сначала старые) - сначала выводятся самые старые из найденных документов.

<== предыдущая страница | следующая страница ==>
ОБЩИЕ ПОЛОЖЕНИЯ. Федеральное государственное образовательное учреждение | Задание. 1. Изучите особенности языка поисковых запросов системы Rambler

Дата добавления: 2015-07-26; просмотров: 197; Нарушение авторских прав




Мы поможем в написании ваших работ!
lektsiopedia.org - Лекциопедия - 2013 год. | Страница сгенерирована за: 0.003 сек.