Как ведется поиск информации в сети internet. Поиск информации в сети интернет. Язык поисковых запросов Google

Благодаря возможности поиска информации в интернете любой человек способен быть в курсе всех новостей, получать необходимые для работы или учебы сведения и расширять свои знания. Однако количество данных, загружаемых в Сеть, беспрестанно растет, и порой найти в этом изобилии необходимые материалы очень трудно.

Чтобы не оказаться в такой ситуации, человек должен обладать умением осуществлять поиск информации в интернете. Для этого необходимо знать, как работают поисковые системы, уметь четко составлять запрос и владеть некоторыми приемами, значительно упрощающими поиск.

Понятие поисковой системы

Привычные всем нам Google и Yandex или уже многими позабытые Yahoo и "Рамблер" являются главными инструментами поиска информации в сети Интернет. Они представляют собой сложную систему, состоящую из специализированных программ и мощных компьютеров. Ее принцип действия прост: пользователь формирует поисковый запрос, а система отвечает перечнем ссылок на источники информации. Ссылки выстраиваются в порядке релевантности, то есть соответствия запросу.

Первоначально интернет был достоянием немногочисленных организаций, а количество содержащейся в нем информации - небольшим. Но постепенно ситуация менялась. В 1994 году появляется сайт Yahoo.com, который, по замыслу его создателей, должен был искать нужные сведения в открытых каталогах сайтов. Однако скорость пополнения Всемирной паутины новой информации была столь большой, что поиск по каталогам очень быстро утратил целесообразность. В том же 1994 году для поиска информации на интернет-ресурсах была создана первая полноценная поисковая система WebCrawler, а три года спустя был запущен Google и анонсирован Yandex.

Характеристики поисковой системы

Возрастающий объем информации требует улучшения основных показателей качества работы поисковиков. К таковым относятся:

  • Полнота, то есть соответствие полученного перечня ссылок поисковому запросу.
  • Точность или соответствие найденных источников запросу.
  • Актуальность информации.
  • Скорость поиска, выражающаяся в устойчивости серверов к нагрузкам. Это соотношение выражается в прямой зависимости: чем больше запросов формулируют пользователи, тем оперативнее на них должна отвечать поисковая система.
  • Наглядность, заключающаяся в обеспечении для пользователя более удобного отбора необходимых ему сайтов в рамках выданных системой результатов.

Для того чтобы перечисленные характеристики находились на максимально возможном уровне, поисковые системы применяют два основных способа нахождения ресурса.

Первый связан с иерархической структурой каталогов информации. Верхние строчки занимают общие категории ("Семья", "Искусство", "Наука"), которые впоследствии делятся на более частные разделы (например, в категории "Наука" можно выделить разделы "Математика", "Физика", "История"). Разделы тоже дробятся на составные части, внутри которых находятся еще более мелкие элементы - и так до самых нижних уровней, в которых уже будет находиться искомая информация.

Второй способ поиска информации в интернете основывается на ключевых словах. Любой запрос пользователя включает в себя некое количество наиболее повторяемых в связи с интересующей темой лексем, а поисковая система выдает список сайтов, на которых они встречаются чаще всего.

Программные компоненты поисковой системы

Для облегчения поиска информации в интернете и повышения качества выдаваемой пользователю информации программы, входящие в модуль индексирования, постоянно совершенствуются. Процесс работы поисковика делится на три этапа, на каждом из которых функционируют специально разработанные для этого роботы:

  1. Spider ("Паук") скачивает web-страницы и извлекает из них все содержащиеся ссылки.
  2. Crawler ("Путешествующий паук") переходит по всем извлеченным на предыдущем этапе ссылкам и определяет дальнейшие направления поиска.
  3. Indexer ("Индексатор") анализирует все скаченные web-страницы на соответствие содержащейся в них информации запросу.

Аппаратные компоненты поисковой системы

Важным элементом функционирования поисковика является сервер, обеспечивающий качество и скорость нахождения необходимой информации. На первом этапе своей работы он анализирует пользовательский запрос. Результаты анализа проверяются по всем скаченным файлам и ранжируются по соответствию запроса найденным файлам. Полученный список может быть скорректирован дополнительными условиями поиска, заданными пользователем.

По итогам предшествующих этапов формируется сниппет - аннотация к найденным источникам, в которой выделяются слова, входящие в запрос. Именно сниппет пользователь видит на странице выдачи поисковых результатов.

Этапы поиска информации

В первую очередь необходимо сформулировать запрос. На этом этапе пользователь должен составить четкое представление о том, какой результат ему нужен. Далее планируется ход поисковой процедуры. Под ним подразумеваются стратегии поиска информации. В интернете для этого могут быть использованы конкретные сайты или их каталоги, более тщательное изучение уже известного контента или просмотр готовых баз данных (например, электронные библиотеки).

На заключительном этапе производится выделение искомой информации из результатов, представленных на странице выдачи поисковых результатов.

Методика поиска

Нельзя игнорировать даже кажущиеся элементарными правила поиска информации в интернете, такие как:

  • проверка орфографии (несмотря на то что современные поисковые системы автоматически исправляют допущенные ошибки, результат порой может отличаться от необходимого, если запрос составлен некорректно);
  • определение цели поиска (например, по запросу "ремонт ноутбука, цена" пользователь может получить список адресов компьютерных сервисов, в то время как ему была необходима именно средняя стоимость устранения поломки);
  • установка необходимых ограничений (так, в предыдущем примере поисковая система могла бы выдать информацию о стоимости ремонта ноутбуков в Санкт-Петербурге живущему в Москве пользователю, не установи он географический ареал поиска).

Но и с соблюдением этих принципов порой оказывается затруднительно получить необходимые сведения. Умение осуществлять поиск информации в интернете предполагает, что пользователь владеет особыми навыками, позволяющими скорректировать запрос.

Особенности поиска по ключевым словам

Совсем необязательно вбивать в строку поиска подробные сочинения по интересующей проблеме. Система в любом случае выберет наиболее частотные слова и, отталкиваясь от них, будет формировать результат. Однако для уточнения искомой цели можно использовать логические операторы.

Знаки "+" и "-" позволяют потребовать от системы, чтобы определенное слово обязательно присутствовало или отсутствовало в найденных источниках. Важно, чтобы знак писался слитно с необходимым словом: "ремонт ноутбука +цена".

Чтобы результат поиска буквально соответствовал запросу, рядом с ним нужно поставить восклицательный знак. По запросу "!цена" будут выдаваться только сайты, касающиеся стоимости какой либо услуги, а не сценарии детских утренников.

Если нужно получить точное соответствие фразе, а не отдельному слову, эту фразу нужно заключить в кавычки. Особенно это полезно, когда при помощи цитаты нужно найти целое произведение или высказывание какого-либо известного человека.

Расширенный поиск информации в интернете

В случае если все предыдущие советы не помогли получить искомый результат, можно воспользоваться некоторыми дополнительными функциями, которые предлагаются каждой поисковой системой. В особенности это касается возможности расширенного поиска.

Пользователю предлагается ряд фильтров, применение которых позволяет скорректировать заданные условия. Например, можно установить жесткую последовательность входящих в запрос слов, указать место их расположения на странице или уточнить форму вхождения в текст. Также можно задать образец, на который должна ориентироваться система в процессе поиска, например определенный сайт.

Функция расширенного поиска, помимо прочего, предлагает возможность задать время интересующей публикации, а также регион. Если пользователь ищет некий документ (закон, нормативный акт, публикацию произведения или исторического источника), он может сразу указать необходимый формат.

Другие способы поиска

Объем выкладываемых в Сеть данных ежедневно возрастает. Логические команды, расширенный поиск или обладание специализированными навыками поиска информации зачастую оказываются лишь одним из многих инструментов нахождения необходимых сведений.

В числе других способов поиска информации в интернете можно назвать переход по гиперссылкам, встречающимся на web-странице. Это позволяет уточнить или расширить уже найденные сведения или обнаружить новые. Еще один популярный метод поиска - по картинке. Загрузив любую фотографию в поисковик, пользователь может рассчитывать на то, что система обнаружит на ней соответствия с другими изображениями и выдаст нужные сведения о человеке, предмете или явлении.

Наконец, не следует забывать о том, что многие компании или административные органы имеют свои сайты, на которых тоже могут содержаться нужные сведения, что значительно облегчает процесс поиска информации в интернете.

1. Введение

С каждым годом объемы Интернета увеличиваются в разы, поэтому вероятность найти необходимую информацию резко возрастает. Интернет объединяет миллионы компьютеров, множество разных сетей, число пользователей увеличивается на 15-80% ежегодно. И, тем не менее, все чаще при обращении к Интернет основной проблемой оказывается не отсутствие искомой информации, а возможность ее найти. Как правило, обычный человек в силу разных обстоятельств не может или не хочет тратить на поиск нужного ему ответа больше 15-20 минут. Поэтому особенно актуально правильно и грамотно научиться, казалось бы, простой вещи – где и как искать, чтобы получать ЖЕЛАЕМЫЕ ответы.

Чтобы найти нужную информацию, необходимо найти её адрес. Для этого существуют специализированные поисковые сервера (роботы индексов (поисковые системы), тематические Интернет-каталоги, системы мета-поиска, службы поиска людей и т.д.). В данном мастер-классе раскрываются основные технологии поиска информации в Интернете, предоставляются общие черты поисковых инструментов, рассматриваются структуры поисковых запросов для наиболее популярных русскоязычных и англоязычных поисковых систем.

2. Технологии поиска

Web-технология World Wide Web (WWW) считается специальной технологией подготовки и размещения документов в сети Интернет. В состав WWW входят и web-страницы, и электронные библиотеки, каталоги, и даже виртуальные музеи! При таком обилии информации остро встает вопрос: «Как сориентироваться в столь огромном и масштабном информационном пространстве?»
В решении данной проблемы на помощь приходят поисковые инструменты.

2.1 Поисковые инструменты

Поисковые инструменты - это особое программное обеспечение, основная цель которого – обеспечить наиболее оптимальный и качественный поиск информации для пользователей Интернета. Поисковые инструменты размещаются на специальных веб-серверах, каждый из которых выполняет определенную функцию:

  1. Анализ веб-страниц и занесение результатов анализа на тот или иной уровень базы данных поискового сервера.
  2. Поиск информации по запросу пользователя.
  3. Обеспечение удобного интерфейса для поиска информации и просмотра результата поиска пользователем.

Приемы работы, используемые при работе с теми или другими поисковыми инструментами, практически одинаковы. Перед тем как перейти к их обсуждению, рассмотрим следующие понятия:

  1. Интерфейс поискового инструмента представлен в виде страницы с гиперссылками, строкой подачи запроса (строкой поиска) и инструментами активизации запроса.
  2. Индекс поисковой системы – это информационная база, содержащая результат анализа веб-страниц, составленная по определенным правилам.
  3. Запрос – это ключевое слово или фраза, которую вводит пользователь в строку поиска. Для формирования различных запросов используются специальные символы ("", ~), математические символы (*, +, ?).

Схема поиска информации в сети Интернет проста. Пользователь набирает ключевую фразу и активизирует поиск, тем самым получает подборку документов по сформулированному (заданному) запросу. Этот список документов ранжируется по определенным критериям так, чтобы вверху списка оказались те документы, которые наиболее соответствуют запросу пользователя. Каждый из поисковых инструментов использует различные критерии ранжирования документов, как при анализе результатов поиска, так и при формировании индекса (наполнении индексной базы данных web-страниц).

Таким образом, если указать в строке поиска для каждого поискового инструмента одинаковой конструкции запрос, можно получить различные результаты поиска. Для пользователя имеет большое значение, какие документы окажутся в первых двух-трех десятках документов по результатам поиска и на сколько эти документы соответствуют ожиданиям пользователя.

Большинство поисковых инструментов предлагают два способа поиска – simple search (простой поиск) и advanced search (расширенный поиск) с использованием специальной формы запроса и без нее. Рассмотрим оба вида поиска на примере англоязычной поисковой машины.

Например, AltaVista удобно использовать для произвольных запросов, «Something about online degrees in information technology», тогда как поисковый инструмент Yahoo позволяет получать мировые новости, информацию о курсе валют или прогнозе погоды.

Освоение критериев уточнения запроса и приемов расширенного поиска, позволяет увеличивать эффективность поиска и достаточно быстро найти необходимую информацию. Прежде всего, увеличить эффективность поиска Вы можете за счет использования в запросах логических операторов (операций) Or, And, Near, Not, математических и специальных символов. С помощью операторов и/или символов пользователь связывает ключевые слова в нужной последовательности, чтобы получить наиболее адекватный запросу результат поиска. Формы запросов приведены в таблице 1.

Таблица 1

Простой запрос дает некоторое количество ссылок на документы, т.к. в список попадают документы, содержащие одно из слов, введенных при запросе, или простое словосочетание (см. таблицу 1). Оператор and позволяет указать на то, что в содержании документа должны быть включены все ключевые слова. Тем не менее, количество документов может быть все еще велико, и их просмотр займет достаточно времени. Поэтому в ряде случаев гораздо удобнее применить контекстный оператор near, указывающий, что слова должны располагаться в документе в достаточной близости. Использование near значительно уменьшает количество найденных документов. Наличие символа "*" в строке запроса означает, что будет осуществляться поиск слова по его маске. Например, получим список документов, содержащих слова, начинающиеся на "gov", если в строке запроса запишем "gov*". Это могут быть слова government, governor и т.д.

Не менее популярная поисковая система Rambler ведет статистику посещаемости ссылок из собственной базы данных, поддерживаются те же логические операторы И, ИЛИ, НЕ, метасимвол * (аналогично расширяющему диапазон запроса символу * в AltaVista), коэффициентные символы + и -, для увеличения или уменьшения значимости вводимых в запрос слов.

Давайте рассмотрим наиболее популярные технологии поиска информации в Интернет.

2.2 Поисковые машины (search engines)

Машины веб-поиска - это сервера с огромной базой данных URL-адресов, которые автоматически обращаются к страницам WWW по всем этим адресам, изучают содержимое этих страниц, формируют и прописывают ключевые слова со страниц в свою базу данных (индексирует страницы).

Более того, роботы поисковых систем переходят по встречаемым на страницах ссылкам и переиндексируют их. Так как почти любая страница WWW имеет множество ссылок на другие страницы, то при подобной работе поисковая машина в конечном результате теоретически может обойти все сайты в Интернет.

Именно этот вид поисковых инструментов является наиболее известным и популярным среди всех пользователей сети Интернет. У каждого на слуху названия известных машин веб-поиска (поисковых систем) – Яndex, Rambler, Aport.

Чтобы воспользоваться данным видом поискового инструмента, необходимо зайти на него и набрать в строке поиска интересующее Вас ключевое слово. Далее Вы получите выдачу из ссылок, хранящихся в базе поисковой системы, которые наиболее близки Вашему запросу. Чтобы поиск был наиболее эффективен, заранее обратите внимание на следующие моменты:

  • определитесь с темой запроса. Что именно в конечном итоге Вы хотите найти?
  • обращайте внимание на язык, грамматику, использование различных небуквенных символов, морфологию.Важно также правильно сформулировать и вписать ключевые слова. Каждая поисковая система имеет свою форму составления запроса - принцип один, но могут различаться используемые символы или операторы. Требуемые формы запроса различаются также в зависимости от сложности программного обеспечения поисковых систем и предоставляемых ими услуг. Так или иначе, каждая поисковая система имеет раздел "Help" ("Помощь"), где все синтаксические правила, а также рекомендации и советы по поиску, доступно объясняются (скриншот страничек поисковиков).
  • используйте возможности разных поисковых систем. Если не нашли на Яndex, попробуйте на Google. Пользуйтесь услугами расширенного поиска.
  • чтобы исключить документы, содержащие определенные термины, используйте знак "-" перед каждым таким словом. Например, если Вам нужна информация о работах Шекспира, за исключением "Гамлета", то введите запрос в виде: "Шекспир-Гамлет". И для того, чтобы, наоборот, в результаты поиска обязательно включались определенные ссылки, используйте символ "+". Так, чтобы найти ссылки о продаже именно автомобилей, Вам нужен запрос "продажа+автомобиль". Для увеличения эффективности и точности поиска, используйте комбинации этих символов.
  • каждая ссылка в списке результатов поиска содержит – несколько строчек из найденного документа, среди которых встречаются Ваши ключевые слова. Прежде чем переходить по ссылке, оцените соответсвие сниппета теме запроса. Перейдя по ссылке на определенный сайт, внимательно окиньте взглядом главную страничку. Как правило, первой страницы достаточно, чтобы понять – по адресу Вы пришли или нет. Если да, то дальнейшие поиски нужной информации ведите на выбранном сайте (в разделах сайта), если нет – возвращайтесь к результатам поиска и пробуйте очередную ссылку.
  • помните, что поисковые системы не производят самостоятельную информацию (за исключением разъяснений о самих себе). Поисковая система – это лишь посредник между обладателем информации (сайтом) и Вами. Базы данных постоянно обновляются, в них вносятся новые адреса, но отставание от реально существующей в мире информации все равно остается. Просто потому, что поисковые системы не работают со скоростью света.

К наиболее известным машинам веб-поиска относятся Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Среди русскоязычных можно выделить Яndex, Rambler, Апорт.

Поисковые системы являются самыми масштабными и ценными, но далеко не единственными источниками информации в Сети, ведь помимо них существуют и другие способы поиска в Интернете.

2.3 Каталоги (directories)

Каталог Интернет-ресурсов – это постоянно обновляющийся и пополняющийся иерархический каталог, содержащий множество категорий и отдельных web-серверов с кратким описанием их содержимого.Способ поиска по каталогу подразумевает «движение вниз по ступенькам», то есть движение от более общих категорий к более конкретным. Одним из преимуществ тематических каталогов является то, что пояснения к ссылкам дают создатели каталога и полностью отражают его содержание, то есть дает Вам возможность точнее определить, насколько соответствует содержание сервера цели Вашего поиска.

Примером тематического русскоязычного каталога можно назвать ресурс http://www.ulitka.ru/ .

На главной странице данного сайта расположен тематический рубрикатор,

с помощью которого пользователь попадает в рубрику со ссылками на интересующую его продукцию.

Кроме того, некоторые тематические каталоги позволяют искать по ключевым словам. Пользователь вводит необходимое ключевое слово в строку поиска

и получает список ссылок с описаниями сайтов, которые наиболее полно соответствуют его запросу. Стоит отметить, что этот поиск происходит не в содержимом WWW-серверов, а в их кратком описании, хранящихся в каталоге.

В нашем примере в каталоге также имеется возможность сортировки сайтов по количеству посещений, по алфавиту, по дате занесения.

Другие примеры русскоязычных каталогов:
Каталог@Mail.ru
Weblist
Vsego.ru
Cреди англоязычных каталогов можно выделить:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Подборки ссылок

Подборки ссылок – это отсортированные по темам ссылки. Они достаточно сильно отличаются друг от друга по наполнению, поэтому чтобы найти подборку, наиболее полно отвечающую Вашим интересам, необходимо ходить по ним самостоятельно, дабы составить собственное мнение.

В качестве примера приведем Подборку ссылок "Сокровища Интернет" АО "Релком"

Пользователь, нажимая на любую из заинтересовавших его рубрик

  • СОДЕРЖАНИЕ

    Автомобилистам

    • Астрономия и астрология
    • Ваш дом
    • Ваши питомцы
    • Дети - цветы жизни
    • Досуг
    • Города в Сети Internet
    • Здоровье и медицина
    • Информационные агентства и службы
    • Краеведческий музей и т.д.,
    • Автомобильная электроника.
    • Музей автомото старины.
    • Коллегия Правовой Защиты Автовладельцев.
    • Sportdrive.

    Преимуществом такого вида поисковых инструментов является их целенаправленность, обычно подборка включает в себя редкие интернет ресурсы, подобранные конкретным веб-мастером или хозяином интернет странички.

    2.5 Базы данных адресов (addresses database)

    Базы данных адресов – это специальные поисковые сервера, которые обычно используют классификации по роду деятельности, по выпускаемой продукции и оказываемым услугам, по географическому признаку. Иногда они дополнены поиском по алфавиту. В записях базы данных хранится информация о сайтах, которые предоставляют информацию об электронном адресе, организации и почтовом адресе за определенную плату.

    Крупнейшей англоязычной базой данных адресов можно назвать: http://www.lookup.com/ -

    Попадая в данные поддиректории, пользователь обнаруживает ссылки на сайты, которые и предлагают интересующую его информацию.

    Широко доступных и официальных баз данных адресов в РФ нам неизвестно.

    2.6 Поиск в архивах Gopher (Gopher archives)

    Gopher – это взаимосвязанная система серверов (Gopher-пространство), распределенная по Интернет.

    В пространстве Gopher собрана богатейшая литературная библиотека, однако материалы недоступны для просмотра в удаленном режиме: пользователь может только просматривать иерархически организованное оглавление и выбирать файл по названию. С помощью специальной программы (Veronica) такой поиск можно сделать и автоматически, используя запросы, построенные на ключевых словах.

    До 1995 года Gopher являлся самой динамичной технологией Интернет: темпы роста числа соответствующих серверов опережали темпы роста серверов всех других типов Интернет. В сети EUnet/Relcom активного развития серверы Gopher не получили, и сегодня о них практически никто не вспоминает.

    2.7 Система поиска FTP файлов (FTP Search)

    Система поиска FTP-файлов – это особый тип средств поиска в Internet, который позволяет находить файлы, доступные на «анонимных» FTP-серверах. Протокол FTP предназначен для передачи по сети файлов, и в этом смысле он функционально является своеобразным аналогом Gopher.

    Основным критерием поиска является название файла, задаваемое разными способами (точное соответствие, подстрока, регулярное выражение и т.д.). Данный тип поиска, конечно же, не может соперничать по возможностям с поисковыми машинами, так как содержимое файлов никак не учитывается при поиске, а файлам, как известно, можно давать произвольные имена. Тем не менее, если Вам требуется найти какую-нибудь известную программу или описание стандарта, то с большой долей вероятности файл, его содержащий, будет иметь соответствующее имя, и Вы сможете найти его при помощи одного из серверов FTP Search :

    FileSearch ищет файлы на FTP-серверах по именам самих файлов и каталогов. Если Вы ищете какую-либо программу или еще что-то, то на WWW-серверах Вы скорее найдете их описание, а с FTP-серверов Вы сможете перекачать их к себе.

    2.8 Система поиска в конференциях Usenet News

    USENET NEWS – это система телеконференций сообщества сетей Интернет. На Западе этот сервис принято называть новостями. Близким аналогом телеконференций являются и так называемые "эхи" в сети FIDO.

    С точки зрения абонента телеконференции, USENET представляют из себя доску объявлений, в которой есть разделы, где можно найти статьи на любую тему - от политики до садоводства. Эта доска объявлений доступна через компьютер, подобно электронной почте. Не отходя от компьютера, можно читать или помещать статьи в ту или иную конференцию, найти полезный совет или вступать в дискуссии. Естественно, статьи занимают место на компьютерах, поэтому не хранятся вечно, а периодически уничтожаются, освобождая место для новых. Во всем мире лучшим сервисом для поиска информации в конференциях Usenet является сервер Google Groups (Google Inc.).

    Группы Google – это бесплатное интерактивное сообщество и служба групп обсуждений, которая предлагает самый обширный в Интернете архив сообщений сети Usenet (более миллиарда сообщений).Подробнее ознакомиться с правилами пользования сервисом можно на странице http://groups.google.com/intl/ru/googlegroups/tour/index.html

    Среди русскоязычных выделяется сервер Всемирная система USENET и телеконференции Relcom. Точно также как и в других поисковых службах, пользователь набирает строку запроса, а сервер формирует список конференций, содержащих ключевые слова. Далее надо подписаться на отобранные конференции в программе работы с новостями. Также имеет место аналогичный российский сервер FidoNet Online: конференции Fido на WWW.

    2.9 Системы мета-поиска

    Для быстрого поиска в базах сразу нескольких поисковых систем лучше обратиться к системам мета-поиска.

    Системы мета-поиска – это поисковые машины, которые посылают Ваш запрос на огромное количество разных поисковых систем, затем обрабатывают полученные результаты, удаляют повторяющиеся адреса ресурсов и представляют более широкий спектр того, что представлено в сети Интернет.

    Наиболее популярная в мире система мета-поиска Search.com .

    Объединенный поисковый сервер Search.com компании CNET, Inc. включает в себя почти два десятка поисковых систем, ссылками на которые пестрит весь Интернет.

    С помощью данного вида поисковых инструментов пользователь может искать информацию во множестве поисковых систем, однако отрицательной стороной данных систем можно назвать их нестабильность.

    2.10 Системы поиска людей

    Системы поиска людей – это специальные сервера, которые позволяют осуществлять поиск людей в Интернет, пользователь может указать Ф.И.О. человека и получить его адрес электронной почты и URL-адрес. Однако, следует отметить, что системы поиска людей, в основном, берут информацию об электронных адресах из открытых источников, таких как конференции Usenet. Среди самых известных систем поиска людей можно выделить:

    Поиск адресов e-mail

    в специальные графы поиска контактные данные (First Name. City, Last Name, Phone number), Вы можете найти интересующую Вас информацию.

    Системы поиска людей - это действительно большие сервера, их базы данных содержат порядка 6 000 000 адресов.

    3. Заключение

    Мы рассмотрели основные технологии поиска информации в Интернет и представили в общих чертах поисковые инструменты, которые существуют на данный момент в Интернете, а также структуру поисковых запросов для наиболее популярных русскоязычных и англоязычных поисковых систем и, подводя итог вышесказанному, хотим отметить, что единой оптимальной схемы поиска информации в Интернет не существует. В зависимости от специфики нужной Вам информации, Вы можете использовать соответствующие поисковые инструменты и службы. А от того, как грамотно будут подобраны поисковые службы, зависит качество результатов поиска.

  • Есть такой тип людей, которые просто обожают употреблять большое количество красивых метафор. Вот такие люди сравнивают всемирную сеть со свалкой. Будто бы в сети все свалено в большую кучу и черт там может сломать ногу. Будто бы в сети есть все, но чтобы что-то найти, приходится перекопать огромные горы мусора.

    Ну что ж, красивая метафора. Только это не означает, что она верна. Вот у многих людей на столе, на первый взгляд, навалено огромное количество бесполезных вещей. Но для тех людей, которые за этими столами работают, расположение вещей поддается вполне определенной логике. Те вещи, которые необходимы наиболее часто, как, например, чайная кружка, лежат на расстоянии вытянутой руки. А те вещи, которые необходимы не всегда, расположены дальше. И это никак нельзя назвать свалкой или беспорядком.

    В Интернете также есть своя логика. Если вы будете знать несколько правил и использовать их при поиске, то любая информация из Интернета будет, как кружка для чая, находиться на расстоянии вытянутой руки, и ощущение, что Сеть - это свалка, сразу же исчезнет.

    В этой статье мы поговорим о поисковых системах и правилах поиска в Интернете.

    УСТРОЙСТВО ПОИСКОВОЙ СИСТЕМЫ

    Для начала - маленькое лирическое отступление об устройстве поисковой системы. Так устроено, что пользователь видит только лишь интерфейс самой системы, то есть строку поиска, а все, что находится внутри системы, так там и остается.

    Первая составляющая поисковой системы - это так называемый "паук", поисковый робот. Каковы его функции? Он странствует по всей Сети, просматривая интернет - страницы, посещая ссылки. И все это он делает без остановок. Странствует паук не для собственного удовольствия. Он заносит в индекс поисковой системы абсолютно все страницы, которые просмотрел. Заносит их в виде значащих слов, которые встречаются на странице.

    Таким образом, получается, что индекс, вторая составляющая поисковой машины, представляет собой огромнейшую базу данных, при помощи которой есть возможность быстро узнать, на каких страницах в Сети встречается слово поиска. Информация для справки - весь объем индекса известной всем поисковой системы Yandex составляет более восьмидесяти гигабайт.

    Третья составляющая после индекса - собственно сама поисковая машина. Ее назначение - поиск нужных слов или фраз в индексе. Запомните, что поисковая система не занимается поиском во всем интернете - это не так. Только представьте, что это действительно так: например, весь объем проиндексированной информации на Yandex составляет 269 гигабайт. И если бы не было индекса после ввода вашего запроса, системе бы пришлось загрузить и просмотреть 260 гигабайт информации. Это нереально. Только подумайте, сколько времени уйдет на обработку одного единственного запроса.

    Следуя из того, что поиск осуществляется не во всей Сети, а по индексу, напрашиваются два вывода. Во-первых, если поисковая система не нашла какой-то информации, это вовсе не означает, что этой информации в Сети нет, ее нет в индексе конкретно этого поисковика. Во-вторых, системы поиска информации в сети отличаются друг от друга не только интерфейсом, но и, к примеру, индексом и методами его составления. Следовательно, если вы не нашли нужной вам информации в одной поисковой системе, необходимо поискать ее в другой.

    Поисковый робот, который составляет индекс, обходит все сайты по кругу и очень регулярно - таким образом, индекс всегда правильно показывает изменения, которые произошли на сайте. Сайты, которые только появились "паук" может найти самостоятельно, попав на них по ссылке с других сайтов. Также авторы сайтов могут дать знать о своем сайте "пауку".

    Последняя составляющая поисковой системы - ее World Wide Web-сервер, который является лицом системы. Это интерфейс, при помощи которого пользователи делают запросы и получают на них ответы. World Wide Web-сервер - это лишь одна из частей системы, причем не самая крупная.

    ЯЗЫК ПОИСКОВЫХ ЗАПРОСОВ

    Для того, чтобы общаться с поисковыми системами, существуют специальный язык и специальные правила. Конечно, было бы просто великолепно, если бы на ваш вопрос сразу же выдавался исчерпывающий ответ. Но сейчас над этим только ведутся работы.

    Для начала необходимо выделить ключевые слова. Надо решить, какие несколько слов более полно охарактеризуют то, что вы ищете и вводить именно эти слова. Вы скажете, что это очевидно. Да, это так. Но вы удивитесь, узнав, что многие люди вводят в строку поиска.

    На Yandex есть хорошая вещь, называемая "прямой эфир" . Это страница, на которой можно увидеть 20 последних запрашиваемых фраз или слов. Понаблюдайте за этой страницей подольше, и вы испытаете множество разных чувств. Некоторые запросы можно заносить в отдельную книгу - настолько они поразительны. Глядя на некоторые запросы, вы поймете, что так искать точно НЕ надо.

    Обычно, огромный процент запросов не несет в себе никакой ясности: "видео", "тв", "скачать" и так далее. Запрашивающие думают, что система сама должна догадываться, что же пользователи от нее хотят. Формируйте поисковый запрос четче, и чем конкретнее он будет, тем меньше ненужных результатов выдаст поисковик.

    Некоторые поисковые системы различают одинаковые запросы, но начинающиеся с большой или маленькой буквы. Например, Яндекс выдаст разное количество результатов поиска, а система Google регистр игнорирует.

    Используя знаки "+" и "-", можно либо исключать слова из поиска, либо делать их обязательными. При этом между знаком и словом не должно быть пробела. Это правило действует во всех поисковых системах.

    В этом запросе мы ищем с вами интернет-магазины компьютерной техники, не специализирующиеся на ноутбуках, а в следующем, наоборот, те магазины, которые эти самые ноутбуки продают.

    Как видите, поисковая система действительно выдала разные результаты.

    Если в вашем запросе несколько слов просто разделены пробелами, то поисковая система будет искать те страницы, на которых эти слова входят в состав одного предложения. Ну а если вы хотите найти документ, в котором содержится любое слово из перечисленных вами в запросе, необходимо использовать знак "|".

    Яндекс выдал просто чудовищное количество результатов, а все по тому, что теперь мы ищем не конкретное словосочетание, а все результаты содержащие любое из этих популярных слов. Вообще такой запрос наиболее удобно делать, если есть много слов синонимов.

    Если вы хотите найти устойчивые словосочетания, то вводите их в кавычках. Это можно применить, если вы, например, ищите строчки из каких-нибудь литературных произведений или цитаты.

    Как видите, конкретизировав запрос и дав задание поисковику искать конкретно это предложение, мы получили уже заметно меньшее количество результатов.

    ЗАКЛЮЧЕНИЕ

    Используя все вышеперечисленные методы, вы без труда найдете нужную вам информацию. Благо, поисковых систем хватает. Однако, существует огромное количество задач, выполнить которые поисковые системы не в силах.

    Представим следующую ситуацию: вам срочно требуется лучший в городе системный администратор. Как вы будете его искать? Например, вы можете дать объявление в газету, а потом несколько месяцев отвечать на множество телефонных звонков. А можете прийти в специализированное агентство и достаточно быстро найти там подходящую кандидатуру.

    Точно так же и с поисковыми системами - они рассчитаны на охват как можно большего количества информации. Если же вам нужно найти что-то особенное, тут есть смысл использовать специализированные поисковые системы, которые ищут по различным областям.

    В заключении хотелось бы дать один совет. В рамках этой статьи мы дали вам лишь обобщенную информацию по составлению поисковых запросов. На самом же деле каждая поисковая система имеет свой расширенный язык запросов. Не поленитесь изучить возможности синтаксиса запросов своей любимой поисковой системы. В будущем это значительно упростит поиск необходимых материалов. В помощь вам ссылки на справочные материалы двух самых популярных поисковиков:

    4. Глобальная сеть Интернет: поиск информации в сети

    Интернет (англ. Internet, от Interconnected Networks – объединённые сети) – глобальная телекоммуникационная сеть информационных и вычислительных ресурсов. Служит физической основой для Всемирной паутины. Часто упоминается как Всемирная сеть, Глобальная сеть, либо просто Сеть. Когда сейчас слово Интернет употребляется в обиходе, то чаще всего имеется в виду Всемирная паутина и доступная в ней информация, а не сама физическая сеть. За последние годы Всемирная паутина стала настолько популярной, что сейчас Интернет является одним из основных средств публикации информации.

    Основная цель пользователя при работе с сетью Internet – это получение информации, так как в первую очередь Internet является гигантским информационным ресурсом. Целенаправленный поиск явно или неявно требует формулировки цели поиска, понимания того, что является объектом поиска, обоснованного выбора средства поиска и эффективной методики.

    В качестве объекта поиска может рассматриваться любая информация, если имеется возможность представления ее в Internet. Это могут быть телефоны и адреса, информация о товарах и услугах, радио и теле трансляции, методическая литература, учебные курсы, конспекты лекций, аналитические обзоры, графические материалы, файлы мультимедиа, программное обеспечение, и многое другое.

    Поиск информации в сети – это последовательность действий, от определения предмета поиска, до получения ответа на имеющиеся вопросы с использованием всех поисковых сервисов, которые предоставляет сегодня Internet.

    Средствами для нахождения информации в Интернете являются справочно-поисковые системы. Все существующие типы справочно-поисковых систем в Интернете могут быть разделены на следующие группы:

    Системы Web‑поиска;

    Системы поиска FTP‑файлов;

    Системы поиска в архивах Gopher;

    Системы поиска в Usenet;

    Каталоги;

    Порталы.

    Каждая поисковая система индексирует страницы серверов особым способом, приоритеты в поиске по индексам тоже отличаются от других систем, поэтому запрос по ключевым словам и выражениям в каждой из поисковых систем может дать разные результаты.

    Методика поиска включает правила формирования запроса на поиск, методы сужения области поиска, управление процессом поиска, выбор формы представления результатов. Существует два основных метода поиска информации в Internet – с использованием поисковой машины или с использованием каталога. При этом сам механизм поиска в обоих случаях практически одинаков. Различия возникают при составление списка ключевых слов: для поисковой машины – это составление списка ключевых слов, а для каталога на этом этапе производится определение тематики разделов, в которых может находиться необходимая информация.

    4.1 Проблема поиска и поисковые системы

    В закромах Internet находятся миллиарды Web‑страниц, терабайты информации в различных файлах, но вся проблема в том, что для получения нужной информации необходимо указать ее точный адрес – URL, который состоит из доменного имени (либо IP‑адреса), пути к файлу и имени файла. Если мы найдем такой URL, то без труда введем его в адресную строку программы Internet Explorer и увидим нужную Web‑страницу, либо скачаем файл. В минимальном варианте нам необходимо знать хотя бы доменное имя ресурса, а затем, щелкая по гиперссылкам, мы сможем добраться до действительно нужной нам информации.

    Как найти адрес (URL)? Способов несколько. Самый простой способ – это увидеть доменные имена в различных рекламных материалах. Как правило, указывается короткий адрес, состоящий только из доменного имени, что-то наподобие: http://www.1tv.ru или еще короче: 1tv.ru.

    Но как быть, если адрес совершенно неизвестен? Например, необходимо найти расписание поездов дальнего следования на лето. Для этого обратимся к хранилищам таких адресов, к специальным поисковым системам. Поисковые системы выполнены в виде Web‑страниц, но на этих страницах располагается не информация как таковая, а аннотированные ссылки на другие ресурсы (страницы, сайты). Для вызова поисковой системы необходимо в адресной строке программы, например Internet Explorer указать ее адрес. Поисковых систем в сети Internet сейчас достаточно много. В таблице ниже перечислены лишь наиболее популярные поисковые системы.

    Первый этап работы поисковой системы – это индексирование информации, находящейся в Internet. Сетевой робот поисковой системы просматривает огромное количество страниц и заносит адреса и краткое содержание этих страниц к себе в базу данных, точнее в поисковый индекс. Владельцы сайтов будут очень рады, если их сайт просмотрит сетевой робот. Для того, чтобы робот обязательно просмотрел сайт и внес его в поисковый индекс, владельцы сами регистрируют свои сайты в поисковой системе (как правило, в нескольких поисковых системах). Процесс занесения адреса и описания страницы в поисковую систему называется индексация. Таким образом, когда спросите поисковую систему о том, где находится расписание поездов дальнего следования на лето, она не будет лихорадочно искать совпадения в огромной сети Internet, а всего лишь поищет в своем заранее подготовленном поисковом индексе, причем сделает это очень быстро.

    Второй этап работы поисковой системы – это выдача накопленной и отобранной, отсортированной и классифицированной информации по запросам пользователей. Рассмотрим эту работу с наиболее популярной поисковой системой Яндекс.

    4.2 Поиск по ключевым словам

    Наиболее простым и результативным поиском является поиск по ключевым словам. Разберемся с правилами поиска по ключевым словам в поисковой системе Яндекс (рис. 15).

    В других системах эти правила могут отличаться, но основные положения будут идентичны. Основной алгоритм поиска следующий: введите ключевые слова в поле запроса (например, расписание поездов), нажмите кнопку Найти. После нажатия кнопки Найти, Поисковая система выведет список ссылок на документы, наиболее точно соответствующие запросу.


    Рисунок 15 – Заглавная страница поисковой системы Яндекс

    1. Поисковая форма. Главный ее элемент – поле запроса.

    2. Статистика поиска: число найденных документов и частота заданных в запросе слов.

    4. Результаты поиска – список найденных ссылок. Для каждого документа выдается следующая информация: заголовок – ссылка на ресурс, краткая аннотации ресурса (страницы), найденные слова, похожие документы, еще с сайта, и, если найденный сайт описан в каталоге, переход в соответствующую рубрику каталога. Кроме этого, информация о размере, дате документа, URL документа.

    5. Переход на следующие страницы результата (нужно щелкнуть по номерам страниц). Сортировка по убыванию дат (первоначально список сортируется по ревалентности, то есть по степени соответствия результата запросу).

    6. «Колдунщик запросов». Здесь даются советы и предложения по уточнению вашего запроса. Можно сузить поиск по рубрике каталога или по региону.

    7. Популярные находки наших пользователей – ссылки на документы, выбранные пользователями по этому запросу (выводится только при точном соответствии).

    8. Возможность поискать в других русскоязычных поисковых машинах.

    9. Результат поиска в новостных лентах информационных агентств (выводится только при точном соответствии запросу). При высоком соответствии и актуальности эта секция может оказаться над результатами поиска.

    11. Результат поиска в энциклопедических статьях (выводится только при точном соответствии запросу).

    12. Результат поиска в базе товарных предложений магазинов (выводится только при точном соответствии запросу).

    13. Метками R1‑R5 на рисунке помечены различные рекламные блоки.

    Поскольку в поисковой системе очень много различной информации, то результат поиска по фразе «расписание поездов» очень обширен, для облегчения нахождения нужной информации его следует уточнить, для этого давайте рассмотрим, что для этого предусмотрено в поисковой форме (рис. 16).

    Рисунок 16 – Поисковая форма системы Яндекс

    Флажок «в найденном» позволяет искать в результатах предыдущего запроса. Например, по запросу расписание поездов система выдала 300 тыс. страниц, мы вводим следующий запрос дальнего следования и устанавливаем флажок «в найденном» – теперь поиск будет вестись среди этих 300 тыс. страниц. Ограничить область поиска можно, щелкнув по ссылкам Каталог, Новости, Маркет, Энциклопедии, Картинки. Щелчок по нужной ссылке заменяет нажатие кнопки Найти. Удобно сужать область поиска для нахождения картинок, например, введите в поисковое поле Путин и щелкните по ссылке Картинки. Для поиска картинки можно также указать желаемый размер картинки от значения «Мелочь» до «Огромные». Ограничивая область поиска, тем самым отсекаем часть заведомо ненужной нам информации. Но часто бывает необходимость вести поиск во всей базе, но для отсечения ненужной информации приходится вводить различные дополнительные сведения. Для этого служит Расширенный поиск. Он включается щелчком по ссылке «расширенный поиск», либо по значку «+» (рис. 17).

    Эта страница позволяет Вам более тонко указать условия поиска. Важно то, что найденные в результате документы будут соответствовать сразу всем условиям, поставленным Вами. Давайте разберемся с особенностями ввода условий расширенного поиска.

    Рисунок 17 – Страница ввода условий расширенного поиска


    1. Поле запроса – введите слова, которые обязательно должны быть в найденных документах, перед словами, которых не должно быть в документах поставьте знак минус (пробел ставьте до знака, но не после), например, – электричка.

    2. Расположение слов относительно друг друга – подряд, в одном предложении, не очень далеко (в пределах нескольких строк), на одной странице.

    3. Расположение слов на странице – где угодно (в любом месте страницы), в заголовке (заголовок страницы отображается в заголовке окна программы Internet Explorer, то есть в синей полосе), в тексте ссылки (слово является гиперссылкой), также можно указать адрес, куда ведет данная ссылка – таким образом, удобно искать те страницы, которые ссылаются на данную.

    4. Форма употребления слов. Поисковая система умеет склонять (спрягать) введенное слово и по умолчанию находит документы, в которых встречаются все формы слова. Если Вы выберите «точно так, как в запросе», то поисковая система будет искать только введенную Вами форму слова. Это удобно при поиске цитат.

    5. Язык страницы – укажите язык, на котором должна быть выполнена страница. Язык содержится в невидимом пользователю заголовке страницы. В базу поисковой системы вносятся документы русскоязычного Интернета, находящиеся в доменах su, ru, am, az, by, ge, kg, kz, md, tj, ua, uz, а также зарубежные сайты, представляющие интерес для русскоязычного поиска.

    6. Дата страницы – укажите любой из предложенных вариантов, либо введите период (даты начала и конца), в пределах которого должна находиться дата документа.

    7. Формат документа. Все Web‑страницы имеют формат HTML, то есть выполнены с использованием языка разметки гипертекста, однако, в сети Internet присутствуют документы и другого формата, которые также можно просматривать с помощью программы Internet Explorer: PDF – файл публикации, DOC – документ, созданный в программе Microsoft Word, RTF – форматированный текст (универсальный формат).

    9. Страницы находятся на сайте – укажите доменное имя сайта.

    10. Страницы похожи на страницу – укажите URL страницы-образца.

    В нижней желтой панели «Итого:» полностью сформулирован запрос. Поскольку мы ищем «свежее» расписание движения поездов, то можно воспользоваться условием Дата страницы.

    4.3 Язык запросов Синтаксис языка запросов. В поисковой системе существует специальный язык запросов, использовать который более сложно, чем форму расширенного поиска, но при его использовании можно получить наилучший результат. Поисковый запрос вводится в поисковое поле, он может содержать ключевые слова и специальные символы, позволяющие установить взаимосвязи между этими словами и ввести дополнительные параметры. Большинство этих символов представлено в табл. 1.

    Таблица 1 – Синтаксис языка запросов системы Яндекс

    Пример__«»

    поиск фразы

    «красная шапочка»
    (эквивалентно красная /+1 шапочка)

    + обязательное наличие слова в найденном документе +быть или +не быть
    ~~ или – не должно быть слова в пределах документа (И НЕ) путеводитель по парижу ~~ (агентство | тур)
    ~ не должно быть слова в пределах предложения (И НЕ) банки ~ закон
    ! искать только указанную форму слова ! Путин
    пробел или & логическое И (в пределах предложения) фабрика звезд
    && логическое И (в пределах документа) музыка && (фабрика звезд)
    | логическое ИЛИ рисунок | картинка | фото | коллаж
    /(n m) расстояние между словами (-назад +вперед)

    поставщики /2 кофе
    музыкальное /(-2 4) образование
    вакансии ~ /+1 студентов