Форум сайта bob.net.ru

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Форум сайта bob.net.ru » Разное » Поиск в интернете


Поиск в интернете

Сообщений 1 страница 4 из 4

1

Поиск в интернете очень напоминает работу старателя на золотом прииске: чтобы добыть несколько крупинок золота, приходится часами просеивать и промывать килограммы пустой породы.
Но проблема заключается не только в обилии самой различной информации в Сети. Зачастую отрицательный результат при поиске является следствием неэффективной работы с поисковым сервером. И тут мы приходим к старому, но по-прежнему справедливому утверждению: "в правильном вопросе уже содержится половина ответа".
Начнем с азов — с умения задавать правильные вопросы.
Лично убедиться что большинство Интернет - пользователей не умеют искать нужную информацию, можно очень просто – зайти на страничку последних запросов на “Яндексе “ :
http://stat.yandex.ru/queries/last20.xml
Среди банальной глупости вроде :”Как достать сетевой пароль”, “где в Windows храниться пароль к папке”, “Энциклопедия для Дябло”,”Иван-да-марья полевой цветок очень нужен помогите”,”бесплатно очень быстро скачать мал. Размеров ужастик”.
Существуют три причины, которые приводят к появлению таких запросов:
1)Общая умственная отсталость
2)Обыкновенная лень и нежелание ознакомиться со страничкой помощи в поисковике
3)Непонимание механизма работы поискового сервера.
Сначала рассмотрим принцип по которому работает любой поисковой сервер.
Многие ошибочно думают, что поисковик ищет информацию в Интернете в реальном времени, сканируя Интернет–странички сразу после получения запроса. На самом деле всё происходит не так.
Поисковой сервер– это локальная сеть из мощных компьютеров с толстым Интернет–каналом и просто огромным дисковым объёмом памяти– вплоть до десятков терабайт. Основное время сервер тратит на сканирование Интернет–страниц при помощи специальных поисковых ботов – спайдеров(spiders). Спайдеры ежедневно перебирают ip–адреса, при помощи DNS–серверов выбирая из них те, которые соответствуют адресам HTML–страниц. После нахождения рабочего IP-адреса с HTML–страницей спайдер анализирует её текстовое содержимое. Все найденные на странице слова заносятся в базу данных поискового сервера и связываются с адресом той странички, на которой они были обнаружены.
Если в строке поиска введено несколько слов, задача немного усложняется, но принцип остаётся прежним. Предположим, что в строке поиска пользователь ввёл два слова. Что произойдёт? Сначала поисковик найдёт в своей базе первое слово и связанную с ней ссылку, а затем сделает выборку из базы данных, которая будет состоять из всех слов, найденных по этой ссылке.
Видовое разнообразие:
Перед тем как перейти к описанию запросов на популярных поисковых серверах, стоит уделить внимание классификации поисковиков. Все они работают по одинаковым принципам, но некоторые различия в скорости и в и способах индексирования между ними существуют(некоторые поисковики быстрее дополняют и обновляют информацию, а некоторые – лучше упорядочивают сохраняемую информацию)
Помимо обычных поисковиков существуют мета – поисковики (wwwmetabot.ru и др.), которые сами ничего не индексируют, а переадресовывают ваш запрос сразу нескольким популярным поисковым серверам, а затем сваливают полученные результаты в одну кучу. Мета поисковиками лучше не пользоваться.
Поиск задан:
Первый принцип которым стоит руководствоваться:
1)Существительные желательно вводить в строку поиска в единственном числе в именительном падеже
2)Глаголы в неопределённой форме(инфинитиве)
Например по запросу Компьютерный мышь подключать будут среди прочего найдены и страницы, содержащие слова подключение компьютерной мыши.
К примеру, запрос winamp скачать даст больше результативных ссылок, чем winamp на русском для Wndows XP хочу скачать бесплатно.
Большинство серверов при наличие нескольких слов в запросе по умолчанию ищут страницы не только с точной фразой, заданной в строке запроса, а хотя бы с одним из данных слов.
Так, по запросу Катя Синичкина может привести на страничку Васи Синичкина или на сайт с рассказами про синичек, а по запросу “Катя Синичкина” ( с кавычками) даст ссылки только на документы с точной фразой Катя Синичкина.
Помимо задания точных фраз, очень полезно использовать два простых оператора для поиска — ИЛИ и НЕТ, а также скобки для определения очередности выполнения операторов. Оператор ИЛИ (обычно записывается как OR или |) предназначен для расширения результатов; например, запрос почта Игромании (Геймер OR Катя) выдаст ссылки на странички, содержащие слова "почта", "Игромания", а также хотя бы одно из слов — "Геймер" или "Катя". Оператор НЕТ (записывается как NOT или !) имеет прямо противоположное назначение и служит для ограничения результатов поиска. Пример: запрос Геймер NOT киберспорт даст в качестве результатов ссылки на странички со словом "Геймер", но только в том случае, если на этих страничках отсутствует слово "киберспорт" (таким образом мы отфильтровываем ненужные нам страницы о профессиональных геймерах).
* * *
Для примера возьмём Яндекс.
Использование скобок

Скобки нужны для определения порядка нахождения данных.
  Пример:
(“девушки” /(-3 +3) (бикини | купальник)) ~ (порно | эротика | эротический | интим | голые)
Поиск страниц с предложениями, содержащими любое из слов “девушки” и не далее чем через три слова слева или справа – слова “бикини” или “купальник”, но не содержащие любое из слов “порно, эротика, эротческий, интим или голые”
Этот запрос выдаёт ссылки на приличные фотографии или каталоги пляжной одежды для девушек.
ЗЫ. Страшно даже подумать, куда бы нас привёл поиск, если бы ввели одно слово "девушки” :D

http://m.foto.radikal.ru/0705/07/9afed0b79220t.jpg
Помощь по поиску в Яндексе

Отредактировано einar (2007-05-08 00:09:31)

0

2

Горячий след: поиск

В век Web 2.0 найти племянницу бабушки или отца будущего ребенка становится делом простым и не обременительным. Особенно если племянница – системный администратор, а папаня ведёт собственный веблог. Люди, которые соприкасаются с матрицей IT одной из граней своей личности, навеки остаются помеченными и заносятся во Всеобщий Реестр Всея, эту свалку информации, которую мы привыкли называть Интернетом.

Хорошо, когда вам надо найти пропавшего друга детства – человек по природе своей существо общительное и тщеславное, что в виртуальном пространстве выражается в большом количестве меток, которыми человек помечает посещаемую территорию. Плохо, когда вас самих хочет найти Сами-Знаете-Что, тогда никакие VPN, SSL, прокси-сервера, mutantIP и прочие средства анонимной безопасности вам не помогут. Ну или почти не помогут :).

Представьте себя бойскаутом в летнем лагере ][@ke®.ru: мы научимся выслеживать зверя по следам и заметать следы самостоятельно, прячась от настоящих хищников. Поиск необходимых людей по обрывочным сведениям и нелегальную слежку за множеством пользователей объединяет, как вы уже поняли, одно: в сети вы находитесь не одни, но под пристальным взглядом множества ботов, демонов, администраторов, рядовых и не очень пользователей. Настоящие дикие джунгли. И сейчас мы выйдем на охотничью тропу…

Поиск по ф.и.о.
Если мы заглянем на http://googlechance.com.ua/category/поиск-людей/, то познакомимся с подробной инструкцией по поиску людей в кеше гугла. Гугловоды основывают свою методику на разнообразности запросов к поисковой машине, позволяющей искать сочетания “Имя Фамилия” + резюме, “Имя фамилия” + деятельность (“водитель газели”), “Имя Фамилия” + родился, “Имя Фамилия” inurl:profile nickname inurl:profile (позволяет определить профиль человека на форуме и найти все его посты), “Имя Фамилия” +e-mail и т.д.
Только задумайтесь, сколько вам придется совершить запросов, чтобы найти одного нужного вам Иванова Виктора Петровича, водителя маршрутной Газели! Но русские хакеры - люди ленивые и любят всё оптимизировать :) Честь, хвала и вечная память ресурсу http://pipl.tubi.ru/, который позволяет искать в рунете везде, где есть разумные люди, а не только на ресурсах, где боты тупо генерируют контент:) Tubi шарит, используя тот же Google Custom Search Engine, но делает это гораздо эффективнее. На данный момент поиск идёт по следующим сайтам:

livejournal.com (Блогосфера)
liveinternet.ru (Готическое ответвление ЖЖ :)
moikrug.ru (Социальная сеть – далее СС)
webkrug.ru (Поиск по данным школ)
privet.ru (СС)
lj.rossia.org (Некоммерческое ответвление ЖЖ)
beon.ru (Блогосфера)
blogs.mail.ru (Блогосфера для детей :)
diary.ru (Блогосфера)
live.cnews.ru (Новости Web 2.0)
itblogs.ru (Социальная сеть IT-профессионалов)
blogs.klerk.ru (Блогосфера)
habrahabr.ru (СС)
genealogia.ru (по Фамилии здесь можно отследить целый род)
poisk.vid.ru (Сайт передачи «Жди меня»)
poisk.goon.ru (Заюзать лучше вручную http://goon.ru/dir/Reference/Search_people/)
bobrdobr.ru (Хранитель ссылок)
blog.presscom.org (СС)
mindmix.ru (Блогосфера)
mylivepage.ru (Разветвлённая СС)
toodoo.ru (Разветвлённая СС)
rodstvo.ru (Генеалогия, рода и кланы)
petergen.com (Петербургский генеалогический портал)
rusarchives.ru (Федеральный архив России)

Если здесь мы не увидим сайт, на котором мог засветиться «объект», добавим его сами! Сделать это проще простого на http://tubidone.blogspot.com/2007/07/pipltubi_05.html.

Поиск по № телефона
Очень известный сайт - http://www.nomer.org/, содержит сведения (адреса и телефоны) обо всех жителях московских квартир, в которых установлен телефон (не только абонентов МГТС) за 2006 год. Что значит обо всех? А значит это, что мы получим ФИО всех зарегистрированных в этой квартире людей! По Москве база на 11 000 000 номеров (Господи, где вы все в этой Москве помещаетесь?! – прим. автора). Есть и другие города. Рекомендую!

http://www.hella.ru/code/poisk.htm содержит данные по 173 городам, другим странам (в основном СНГ), содержит несколько форм запросов.
http://allo495.ru - без комментариев :).
http://phone.desk.ru/tel.asp?city=m#c – тоже самое.
http://interweb.spb.ru/phone/ - не только Питер :).
http://bigphonebook.ru/index.html?v=1 - справочник, содержащий адреса и телефоны организаций Москвы и Московской области.
http://db.spravki.net/ - базы данных Mocковского адресно-телефонного справочника (3479232 записи) и Bopонежского адресно-телефонного справочника (161859 записей).
http://spravka.net/phones/ - ВСЕ города России.
http://www.infobroker.ru - ещё одна телефонная база.

Поиск по… pipl.com
А сейчас я вам представлю настоящую жемчужину нашей коллекции! Встречайте, томная красавица Pipl.com! Создатели сайта уверяют, что Сеть в 500 раз больше, чем Веб «глазами» поисковых машин, и проверить их слова можно лишь заюзав их супер поисковик. Поисковик шарит по анкетам пользователей многих онлайн-сервисов, например, ICQ, Amazon, Frendster, Flickr, MySpace, собирая самое полно досье. Поиск осуществляется по имени, фамилии, городу, штату (области, округу) и стране.

Иное
http://www.gendrevo.ru/index - это что-то вроде Генеалогии.
http://odnoklassniki.ru - СС, требует регистрации.
http://fakultet.ru - СС, требует регистрации.
http://vkontakte.ru - СС, требует регистрации.
http://www.mates.ru/ - сайт «Место встречи», СС.
http://www.info4help.com/name.html - платный (1$) поиск по ФИО, адресу и телефону. Через что ищет, и, главное, как, не совсем понятно, но, судя по заверению пользователей, – делает это весьма эффективно.
Совсем отчаявшиеся могут полазить ближайшую сотню лет по глобальному архиву интернета http://www.archive.org/web/web.php.
Убежище
Компания Spock.com собирается организовать поиск по 6 миллиардам имен людей, живущих на планете. То есть спрятаться реально негде. И если раньше параноики могли просто не посещать инет, то теперь им лучше вообще не жить. Там, за пределами блогов и сайтов, лежит совсем другая реальность, называемая First Life. В ней нет вездесущих поисковых машин, зато есть МВД (прописка), Военкомат (учет), ЖЭК, Пенсионный Фонд, БТИ (Бюро технической информации, если на тебя зарегистрировано какое-либо недвижимое имущество), Налоговая служба (ИНН), Миграционная служба, ОВИР, Служба Занятости, Центральное Статистическое Управление и т. д., и т. п. Каждый человек с рождения становится на учёт в дюжине организаций, которые «ведут» его до самой смерти.
В нашей демократичной стране нельзя получить диплом об окончании ВУЗА без регистрации в ближайшем военкомате, как нельзя подключиться к сотовому оператору без паспорта. Такие штуки, как разрабатываемый СОРМ-4, оказываются вполне человечными по сравнению с системой, придуманной ещё полвека назад в нашем государстве. Система тормозная, «бумажная», неадекватная, даже безумная, но она следит за тобой похлеще всех глаз Большого Брата Оруэлла.
Как скрыться из реальности, тебе могут рассказать бомжи на ближайшей свалке или моджахеды всемирного террористического движения «Идущие на всех». А вот можно ли в виртуальности остаться незамеченным? «Хакер» не раз отвечал утвердительно. Пожалуй, моя любимая статья на эту тему принадлежит перу Stepa в древнем номере Х за ноябрь 2005 года («Остаться инкогнито»). Добротно и основательно написано. Но только не следует впадать в паранойю, от invisible-check в ICQ до реальной слежки со стороны ФСБ лежит целая пропасть. И если твоя девушка решит узнать о тебе чуть больше, повод ли это заметать следы и шифровать все сообщения? И если тобой заинтересовалась ФСБ, не пора ли бросить хакерство и начать жить?

Я знаю точно, затеряться во всех реальностях действительно можно. Стать джедаем невидимости и гуру анонимности, призраком виртуального и реального пространств и даже, отчасти, Электронным Богом. Весь вопрос в том, достоин ли ты этого.

xakep.ru

Отредактировано einar (2007-10-06 00:14:53)

0

3

Эффективный поиск в Google.  24 правила

http://www.google.com/intl/uk_ALL/images/logo.gif

1. Один из нескольких (логическое ИЛИ). По-умолчанию Google ищет страницы, которые содержат все слова из поискового запроса, но если требуется выдать и те, которые содержат хотя бы одно слово из заданного множества, можно воспользоваться логическим оператором ИЛИ. Ему соответствует символ "|" (по-английски он именуется pipe symbol). Пример: молоко|огурцы|селедка.

2. Кавычки. Если вам необходимо найти определенную фразу дословно, можно использовать кавычки. Пример: "Hotel California" (аналогичный запрос без кавычек вернул бы не только ссылки на все упоминания одноименной песни, но и на множество сайтов тур-операторов и гостиниц).

3. Исключение (логическое НЕ). Для того, чтобы исключить из результата поиска те страницы, которые содержат определенное слово, в поисковом запросе необходимо использовать символ "-". Пример: linux distrib download -suse (запрос вернет ссылки на страницы для скачивания различных дистрибутивов Linux, за исключением Suse).

4. Похожие слова. Для того, чтобы Google искал слова, похожие на заданное, используйте символ "~" (тильда). Будут найдены синонимы и слова с альтернативными окончаниями. Пример: ~hippo (по запросу будет так же найдено, например, слово hyppopotamus).

5. Маски. Символ "*" можно использовать как маску - условное обозначение произвольного количества любых символов. Это может быть полезно, например, если вы пытаетесь найти текст песни, но не можете при этом точно вспомнить слова. Или отыскать сайт, домен которого запомнился только отчасти. Пример: welcome to the hotel * such a lovely place; *pedia.org.

6. Расширенный поиск. Если вы забыли какой-либо из перечисленных операторов, всегда можно воспользоваться формой расширенного поиска.

7. Определения. Используйте оператор define: для быстрого поиска определений. Пример: define:Ктулху (запрос выдаст ссылку на страницу из Википедии).

8. Калькулятор. Одной из полезных и при этом малоизвестных возможностей Google является вычисление арифметических выражений. Во многих случаях это быстрее, чем использование программы калькулятора. В выражениях можно использовать операторы +, -, *, /, ^ (степень), sqrt (квадратный корень), sin, cos, tan, ln, lg, exp (ex), скобки и много чего еще. Пример: sqrt(25 * 25) * 768.

9. Числовые интервалы. В Google существует еще одна малоизвестная возможность - поиск числовых интервалов, которые можно задавать с помощью крайних значений, разделенных последовательностью из двух точек. Пример: Букер 2004..2007.

10. Поиск на заданном сайте. С помощью оператора site: можно ограничить результаты поиска определенным веб-сайтом. Именно эта возможность обычно используется при установке поисковых форм Google на сторонних ресурсах. Пример: seagate barracuda site:ixbt.com.

11. Ссылки извне. С помощью оператора link:, можно найти страницы, которые ссылаются на заданный URL. Оператор можно использовать не только для главного адреса сайта, но и для отдельных страниц. Оператор не дает гарантии, что в результате поиска будут перечислены абсолютно все страницы. Пример: link:paradigm.ru.

12. Вертикальный поиск. Вместо того, чтобы искать заданные слова во всем вебе, можно ограничить поиск какой-либо одной определенной сферой. В Google входит множество поисковых сервисов, позволяющих находить интересующую информацию в блогах, новостях, книгах, и многих других категориях:
* Blog Search
* Book Search
* Scholar
* Catalogs
* Code Search
* Directory
* Finance
* Images
* Local/Maps
* News
* Patent Search
* Product Search
* Video
* Linux resouces search and BSD resouces search

Отредактировано einar (2007-10-29 01:20:56)

0

4

13. Кино. Для поиска названий фильмов удобно использовать оператор movie:. Пример: movie:One Flew Over the Cuckoo's Nest.

14. Музыка. Оператор music: ограничит результаты поиска контентом, который тем или иным образом связан с музыкой. Пример: music:Depeche Mode 101.

15. Преобразователь единиц измерения. Google можно использовать для быстрого преобразования метров в ярды, килограммов в фунты, литров в джоули. Для этого используется абсолютно естественный для человеческого понимания синтаксис. Пример: 16 tons in pounds. Update: по тому же принципу можно выполнять преобразования между суммами в различных валютах. Например: 15 Ruble in USD. Курсы валют Google узнаёт из Citibank N.A.

16. Числовые шаблоны. Алгоритмы Google умеют распознавать тип числовых данных по шаблону их ввода. К сожалению, большинство этих шаблонов соответствуют только американским стандартам. В частности можно искать:
* региональные телефонные коды;
* номера автомобилей (US, как не сложно догадаться, only);
* инвентарные номера Федеральной Комиссии Коммуникаций FCC (так же US only);
* UPC (универсальные товарные коды, применяемые в США);
* регистрационные номера Федерального авиационного агентства (США);
* номера патентов (США);
* биржевые котировки (нужно использовать символы акций) и прогноз погоды на пять дней вперед.

17. Типы файлов. В случае, если вы хотите искать, например, только документы в формате PDF, Word или Excel, можно использовать оператор filetype:. Полный список поддерживаемых форматов на момент написания данного текста: Adobe Reader PDF (.pdf), Adobe Postscript (.ps), Autodesk DWF (.dwf), Google Earth (.kml, .kmz), Microsoft Excel (.xls), Microsoft PowerPoint (.ppt), Microsoft Word (.doc), Rich Text Format (.rtf), Shockwave Flash (.swf). Пример: stroustrup c++ language filetype:pdf. Update: Для выбора типа искомых файлов так же можно использовать оператор ext:.

18. Местоположение слова. По-умолчанию Google ищет заданный текст внутри содержимого страниц. Но если есть необходимость искать в некоей определенной области, можно использовать такие операторы как "inurl:" (поиск внутри URL), "intitle:" (поиск в заголовке страницы), "intext:" (поиск в тексте страницы), и "inanchor:" (поиск в тексте ссылок).

19. Кэшированные страницы. При поиске устаревших страниц и страниц, контент которых был обновлен, может помочь поиск в кэше поисковой машины. Для этого предназначен оператор cached:. Update: Существует так же близкий по смыслу оператор cache:, с помощью которого можно сразу получать страницы из кэша по их URL. Этой возможностью в принципе можно пользоваться как своеобразным бэкапом видимых для Google веб-страниц: даже если страница будет удалена со своего сайта, на Google может остаться ее копия.

20. Ответ на главный вопрос жизни, вселенной и всего такого. Google знает ответ даже на этот сакраментальный вопрос (если он будет записан по-английски в нижнем регистре).

21. Поиск лиц. У поисковика картинок есть интересная (и, на сколько мне известно, пока официально недокументированная) возможность - выделять из всего множества найденных изображений лица. Для того, чтобы этим воспользоваться, необходимо добавить к URL результата поискового запроса дополнительный GET-параметр imgtype=face. Пример: http://.../images?q=Audrey+Tautou&imgtype=face

22. Информация о сайте. С помощью оператора info: можно получить известную Google информацию об указанном сайте. Пример: info:habrahabr.ru.

23. Похожие сайты. С помощью оператора related: Google может выдать список сайтов, которые считает похожим на заданный. Пример: related:flickr.com.

24. Способы представления. Помимо стандартного представления результатов поиска, существуют ещё два экспериментальных, которые можно активировать с помощью оператора view:. Первый из них - timeline предназначен для отображения различных хронологических событий и может наглядно представить распределение результатов поиска на временной оси. Пример: George Washington view:timeline (результатом подобного запроса будет некое подобие биографии, материалы которой собраны с множества ресурсов Сети).

Второй способ отображения - map удобен для поиска по картам. При его выборе, в отчёте с результатами поиска сразу открывается фрейм с картой, на которой указателями помечено то, что нашел Goolge. Пример: fifth avenue ny view:map. С русским (да и любым неанглийским языком), как не сложно догадаться, сервис пока не дружит. Кроме того, релевантность поиска по картам оставляет желать лучшего (хотя бы потому что запрос Saint Petersburg view:map поставил Москву, Павловск и Петродворец выше искомого города с четко заданным названием).

PS
А вот еще отличный способ искать музыку: -inurl:(htm|html|php) intitle:"index of" "last modified" "parent directory" description size (wma|mp3) "Beirut". Вместо Beirut пишите то, что нтересует (группу или песню).

Автор: SERGIN

Отредактировано einar (2007-10-29 01:24:53)

0


Вы здесь » Форум сайта bob.net.ru » Разное » Поиск в интернете