Поиск в интернете очень напоминает работу старателя на золотом прииске: чтобы добыть несколько крупинок золота, приходится часами просеивать и промывать килограммы пустой породы.
Но проблема заключается не только в обилии самой различной информации в Сети. Зачастую отрицательный результат при поиске является следствием неэффективной работы с поисковым сервером. И тут мы приходим к старому, но по-прежнему справедливому утверждению: "в правильном вопросе уже содержится половина ответа".
Начнем с азов — с умения задавать правильные вопросы.
Лично убедиться что большинство Интернет - пользователей не умеют искать нужную информацию, можно очень просто – зайти на страничку последних запросов на “Яндексе “ :
http://stat.yandex.ru/queries/last20.xml
Среди банальной глупости вроде :”Как достать сетевой пароль”, “где в Windows храниться пароль к папке”, “Энциклопедия для Дябло”,”Иван-да-марья полевой цветок очень нужен помогите”,”бесплатно очень быстро скачать мал. Размеров ужастик”.
Существуют три причины, которые приводят к появлению таких запросов:
1)Общая умственная отсталость
2)Обыкновенная лень и нежелание ознакомиться со страничкой помощи в поисковике
3)Непонимание механизма работы поискового сервера.
Сначала рассмотрим принцип по которому работает любой поисковой сервер.
Многие ошибочно думают, что поисковик ищет информацию в Интернете в реальном времени, сканируя Интернет–странички сразу после получения запроса. На самом деле всё происходит не так.
Поисковой сервер– это локальная сеть из мощных компьютеров с толстым Интернет–каналом и просто огромным дисковым объёмом памяти– вплоть до десятков терабайт. Основное время сервер тратит на сканирование Интернет–страниц при помощи специальных поисковых ботов – спайдеров(spiders). Спайдеры ежедневно перебирают ip–адреса, при помощи DNS–серверов выбирая из них те, которые соответствуют адресам HTML–страниц. После нахождения рабочего IP-адреса с HTML–страницей спайдер анализирует её текстовое содержимое. Все найденные на странице слова заносятся в базу данных поискового сервера и связываются с адресом той странички, на которой они были обнаружены.
Если в строке поиска введено несколько слов, задача немного усложняется, но принцип остаётся прежним. Предположим, что в строке поиска пользователь ввёл два слова. Что произойдёт? Сначала поисковик найдёт в своей базе первое слово и связанную с ней ссылку, а затем сделает выборку из базы данных, которая будет состоять из всех слов, найденных по этой ссылке.
Видовое разнообразие:
Перед тем как перейти к описанию запросов на популярных поисковых серверах, стоит уделить внимание классификации поисковиков. Все они работают по одинаковым принципам, но некоторые различия в скорости и в и способах индексирования между ними существуют(некоторые поисковики быстрее дополняют и обновляют информацию, а некоторые – лучше упорядочивают сохраняемую информацию)
Помимо обычных поисковиков существуют мета – поисковики (wwwmetabot.ru и др.), которые сами ничего не индексируют, а переадресовывают ваш запрос сразу нескольким популярным поисковым серверам, а затем сваливают полученные результаты в одну кучу. Мета поисковиками лучше не пользоваться.
Поиск задан:
Первый принцип которым стоит руководствоваться:
1)Существительные желательно вводить в строку поиска в единственном числе в именительном падеже
2)Глаголы в неопределённой форме(инфинитиве)
Например по запросу Компьютерный мышь подключать будут среди прочего найдены и страницы, содержащие слова подключение компьютерной мыши.
К примеру, запрос winamp скачать даст больше результативных ссылок, чем winamp на русском для Wndows XP хочу скачать бесплатно.
Большинство серверов при наличие нескольких слов в запросе по умолчанию ищут страницы не только с точной фразой, заданной в строке запроса, а хотя бы с одним из данных слов.
Так, по запросу Катя Синичкина может привести на страничку Васи Синичкина или на сайт с рассказами про синичек, а по запросу “Катя Синичкина” ( с кавычками) даст ссылки только на документы с точной фразой Катя Синичкина.
Помимо задания точных фраз, очень полезно использовать два простых оператора для поиска — ИЛИ и НЕТ, а также скобки для определения очередности выполнения операторов. Оператор ИЛИ (обычно записывается как OR или |) предназначен для расширения результатов; например, запрос почта Игромании (Геймер OR Катя) выдаст ссылки на странички, содержащие слова "почта", "Игромания", а также хотя бы одно из слов — "Геймер" или "Катя". Оператор НЕТ (записывается как NOT или !) имеет прямо противоположное назначение и служит для ограничения результатов поиска. Пример: запрос Геймер NOT киберспорт даст в качестве результатов ссылки на странички со словом "Геймер", но только в том случае, если на этих страничках отсутствует слово "киберспорт" (таким образом мы отфильтровываем ненужные нам страницы о профессиональных геймерах).
* * *
Для примера возьмём Яндекс.
Использование скобок
Скобки нужны для определения порядка нахождения данных.
Пример:
(“девушки” /(-3 +3) (бикини | купальник)) ~ (порно | эротика | эротический | интим | голые)
Поиск страниц с предложениями, содержащими любое из слов “девушки” и не далее чем через три слова слева или справа – слова “бикини” или “купальник”, но не содержащие любое из слов “порно, эротика, эротческий, интим или голые”
Этот запрос выдаёт ссылки на приличные фотографии или каталоги пляжной одежды для девушек.
ЗЫ. Страшно даже подумать, куда бы нас привёл поиск, если бы ввели одно слово "девушки”
Отредактировано einar (2007-05-08 00:09:31)