Как найти хорошего поиска

Речь вовсе не о «Яндексе» или Bing. Есть поисковые сервисы, которые действительно лучше, чем лидеры рынка. Пусть и не во всём.

8 поисковиков, которые лучше, чем Google

1. DuckDuckGo

Что это

DuckDuckGo — это довольно известная поисковая система с открытым исходным кодом. Серверы находятся в США. Кроме собственного робота, поисковик использует результаты других источников: Yahoo, Bing, «Википедии».

Чем лучше

DuckDuckGo позиционирует себя как поисковик, обеспечивающий максимальную приватность и конфиденциальность. Система не собирает никаких данных о пользователе, не хранит логи (нет истории поиска), использование файлов cookies максимально ограничено.

Зачем это вам

Все крупные поисковые системы стараются персонализировать поисковую выдачу на основе данных о человеке перед монитором. Этот феномен получил название «пузырь фильтров»: пользователь видит только те результаты, которые согласуются с его предпочтениями или которые система сочтёт таковыми.

DuckDuckGo формирует объективную картину, не зависящую от вашего прошлого поведения в Сети, и избавляет от тематической рекламы Google и «Яндекса», основанной на ваших запросах. При помощи DuckDuckGo легко искать информацию на других языках, тогда как Google и «Яндекс» по умолчанию отдают предпочтение русскоязычным сайтам, даже если запрос введён на иностранном.

DuckDuckGo →

2. You.com

Что это

Один из новых поисковиков, выдача которого формируется не по принципу «самый короткий релевантный ответ», а представляет собой всестороннюю выжимку данных из различных источников, включая соцсети, сообщества и форумы.

Чем лучше

У You.com современный интерфейс и приятный дизайн, которые обеспечивают наглядность информации и позволяют одним взглядом охватить полную картину. Результаты отображаются в виде блоков и разбиты на категории.

В зависимости от запроса поисковик даёт релевантные подсказки, пытаясь предугадать ваши мысли. А в выдачу попадают не только популярные сайты, но и малоизвестные проекты при условии, что у них есть правильный ответ на вопрос.

Зачем это вам

You.com удобнее многих других поисковиков и значительно экономит время. По сути, сервис гуглит за вас и в один клик предоставляет целую подборку результатов, которые можно быстро изучить прямо на странице поиска.

You.com →

3. StartPage

Что это

Интересный поисковик, который объединяет в себе лучшее из двух миров. В отличие о конкурентов, использующих собственные движки, которые откровенно слабее крупных игроков, StartPage берёт выдачу из Google. Важный момент: при этом он обезличивает все ваши запросы, сохраняя анонимность.

Чем лучше

Главная фишка StartPage — это забота о конфиденциальности. Сервис использует прокси, а также специальный генератор уникальных URL, благодаря которому отпадает надобность в cookies, что и обеспечивает полную анонимность в Сети. Поисковик не фиксирует ваши запросы и IP-адрес, а ещё имеет специальный приватный режим, который активируется в выдаче и не позволяет сайтам отслеживать ваши действия.

Зачем это вам

Попробуйте, если результаты альтернативных поисковиков не устраивают, а со слежкой Google вы мириться не готовы.

StartPage →

4. Swisscows

Что это

Швейцарский сервис, в основе которого лежит семантический поиск на основе машинного обучения. Искусственный интеллект определяет контекст поискового запроса и угадывает, что на самом деле вы ищете.

Swisscows сотрудничает с Bing и использует их индексированную выдачу в дополнение к своей собственной. Монетизация осуществляется за счёт рекламы, которая основывается исключительно на поисковых запросах.

Чем лучше

Ключевая особенность сервиса — в семантическом алгоритме, который делает поиск интеллектуальным. Swisscows не хранит файлы cookies, не отслеживает ваше поведение и сохраняет анонимность — вы всегда остаётесь гостем.

Зачем это вам

Swisscows пригодится, если вам нужен честный, безопасный и анонимный поисковик с собственным индексом.

Swisscows →

5. Dogpile

Что это

Метапоисковик Dogpile выводит комбинированный список результатов из поисковых выдач Google, Yahoo и других популярных систем.

Чем лучше

Во-первых, Dogpile отображает меньше рекламы. Во-вторых, сервис использует особый алгоритм, чтобы находить и показывать лучшие результаты из разных поисковиков. Как утверждают разработчики Dogpile, их система формирует самую полную выдачу во всём интернете.

Зачем это вам

Если вы не можете найти информацию в Google или другом стандартном поисковике, попробуйте обнаружить её сразу в нескольких поисковиках с помощью Dogpile.

Dogpile →

6. BoardReader

Что это

BoardReader — система для текстового поиска по форумам, сервисам вопросов и ответов и другим сообществам.

Чем лучше

Сервис позволяет сузить поле поиска до социальных площадок. Благодаря специальным фильтрам вы можете быстро находить посты и комментарии, которые соответствуют вашим критериям: языку, дате публикации и названию сайта.

Зачем это вам

BoardReader может пригодиться пиарщикам и другим специалистам в области медиа, которых интересует мнение массовой аудитории по тем или иным вопросам.

BoardReader →

7. FindSounds

Что это

FindSounds — ещё один специализированный поисковик. Ищет в открытых источниках различные звуки: дом, природа, машины, люди и так далее. Сервис не поддерживает запросы на русском языке, но есть внушительный список русскоязычных тегов, по которым можно выполнять поиск.

Чем лучше

В выдаче только звуки и ничего лишнего. В настройках можно выставить желаемый формат и качество звучания. Все найденные записи доступны для скачивания. Имеется поиск по образцу.

Зачем это вам

Если вам нужно быстро найти звук мушкетного выстрела, удары дятла-сосуна или крик Гомера Симпсона, то этот сервис для вас. И это мы выбрали только из доступных русскоязычных запросов. На английском спектр ещё шире.

Если серьёзно, специализированный сервис предполагает специализированную аудиторию. Но вдруг и вам пригодится?

FindSounds →

8. Wolfram|Alpha

Что это

Wolfram|Alpha — вычислительно-поисковая система. Вместо ссылок на статьи, содержащие ключевые слова, она выдаёт готовый ответ на запрос пользователя. Например, если ввести в форму поиска «сравнить население Нью-Йорка и Сан-Франциско» на английском, то Wolfram|Alpha сразу выведет на экран таблицы и графики со сравнением.

Чем лучше

Этот сервис лучше других подходит для поиска фактов и вычисления данных. Wolfram|Alpha накапливает и систематизирует доступные в Сети знания из различных областей, включая науку, культуру и развлечения. Если в этой базе находится готовый ответ на поисковый запрос, система показывает его, если нет — вычисляет и выводит результат. При этом пользователь видит только нужную информацию и ничего лишнего.

Зачем это вам

Если вы, например, студент, аналитик, журналист или научный сотрудник, то можете использовать Wolfram|Alpha для поиска и вычисления данных, связанных с вашей деятельностью. Сервис понимает не все запросы, но постоянно развивается и становится умнее.

Wolfram|Alpha →

Текст был обновлён в феврале 2022 года.

Читайте также 🧐

  • 25 забавных пасхалок поиска Google, о которых вы могли не знать
  • Какие личные данные собирает о вас Google и как это запретить
  • Как изгнать Google из своего смартфона

Даже если сфера вашей деятельности напрямую не связана с поиском и обработкой информации, в быту вам все равно не обойтись без них. Самые простые на первый взгляд вещи – скажем, подбор необходимой бытовой техники или поиск редкого клипа любимого исполнителя – могут сопровождаться серьезными трудностями. Вроде бы все правильно написал в поисковой строке, ан нет, не находится! Между тем, есть простые приемы, которые позволяют искать нужные сведения в интернете быстрее и эффективнее. И даже если вы не начнете пользоваться всеми теми, о которых мы сегодня расскажем, все равно вам будет гораздо проще и легче заниматься интернет-серфингом – а ведь именно так и называется поиск информации во всемирной сети.

Правильно составляйте поисковые запросы

Это – самый главный и самый эффективный прием при поиске информации в интернете. Поиск по одному слову выдаст несколько миллионов результатов, поиск по двум – уже на порядок меньше, а на запрос из, скажем, четырех или шести слов – всего несколько тысяч, а то и меньше. К тому же чем точнее и грамотнее составлен запрос, тем выше вероятность, что искомый результат обнаружится на первой странице. Кроме того, не забывайте о том, что поисковые системы не всегда могут исправить орфографические ошибки в запросах, а некоторые и за ошибки не считают (например, не видят разницы между –тся и –ться, которая может оказаться принципиальной для поиска). И не игнорируйте заглавные буквы, если не хотите разбираться с лишними результатами. Скажем, запрос по слову «лебедь» выдаст результаты и с информацией о птице, и с данными о покойном генерале Александре Лебеде, а «Лебедь» – в основном о генерале, хотя будут попадаться и упоминания о птице, если слово стояло в начале предложения.

Используйте как минимум две поисковые системы

У разных поисковиков несколько разные способы индексации страниц. Поэтому, как правило, даже самые простые поисковые запросы в разных системах приносят разные результаты. Во-первых, то, что не заметила одна поисковая система, может заметить другая – и наоборот. Во-вторых, некоторые результаты в одной системе окажутся на десятой или двадцатой странице, а в другой попадут в первую пятерку. Кроме того, разные поисковые системы по-разному реагируют на частоту употребления слов в запросе, на наличие или отсутствие заглавных букв, на расположение слов запроса в пределах одного документа и даже одного предложения.

Уточняйте географию запросов

Для жителей Москвы этот прием менее актуален, чем для всех остальных россиян. Дело в том, что поисковые системы, даже если и учитывают месторасположение компьютера, с которого вводится поисковый запрос, тем не менее, в первую очередь индексируют страницы с наибольшим числом обращений. А такие страницы, как правило, связаны с Москвой, где сосредоточено значительное количество интернет-пользователей, которые к тому же отличаются высокой активностью. Поэтому не надейтесь на то, что поисковая система помнит, где вы живете. Лучше просто добавить в поисковый запрос упоминание о своем городе или области.

Впрочем, и москвичам не стоит пренебрегать этим приемом. Столица велика, нужные услуги могут оказывать в любом ее месте. Невелико удовольствие раз за разом кликать на результаты поиска и выяснять, что фирма расположена в трех часах езды от дома или офиса. Зато даже простое упоминание района или ближайшей станции метро позволит вывести в первые строчки результатов именно те компании, которые находятся ближе всего.

Уточняйте предметную область запросов

В принципе, это то же самое правило, которое касается и географии. Банальное слово «шина» выдаст подавляющее большинство результатов, не имеющих никакого отношения к медицине. А если у пользователя даже автомобиля нет, зато ему завтра сдавать зачет по первой медицинской помощи? Тут-то и стоит вспомнить, что простое дополнение слова «медицина» к слову «шина» уже поможет исключить из результатов большинство автомобильных ссылок и вывести на первые страницы именно шины, которые накладывают в случае переломов.

То же касается и любых других предметных областей. Как правило, у поисковых систем есть встроенное меню, позволяющее уточнять, что ищет пользователь: картинки, видео, словарные статьи, перевод слова, новостные материалы по своему запросу и так далее. Но и пользователю не стоит лениться: слово «медицинская» к слову «шина» за него не подставит ни одна поисковая система.

Пользуйтесь расширенным поиском

Этот совет прямо следует из двух предыдущих, поскольку позволяет не придумывать самому уточняющие слова в запросы, а пользоваться уже разработанной для поиска именно в этой системе структурой. Пренебрегать ею не стоит: программисты поисковых сервисов куда как лучше большинства даже продвинутых пользователей знают, какими алгоритмами пользуются их продукты и как именно они ищут. Поэтому, вводя в поисковик те же «шины», попробуйте детальнее структурировать свой запрос с помощью расширенного поиска.

Просматривайте хотя бы первые десять страниц результатов

Почему стоит следовать этому правилу? Потому что на первых страницах будут не только самые релевантные, то есть точнее всего соответствующие запросу, результаты. Там будут результаты, найденные на самых популярных страницах. А это, как правило, страницы и порталы, которые содержат не самую точную, зато лучше всего соответствующую популярным поисковым запросам информацию. Простой пример: результаты поиска по одному-единственному слову в большинстве случаев будет начинаться со ссылки на соответствующую статью в Википедии. И хотя в настоящее время информация из свободной энциклопедии вызывает куда больше доверия, чем лет пять-семь назад, не стоит ограничиваться ею. А, допустим, ссылка на научную работу, детально описывающую именно то, что ищет пользователь, окажется на двенадцатой или двадцать пятой странице – просто потому, что к этому научному порталу обращаются в десятки или сотни раз реже, чем к Википедии.

Пользуйтесь функцией «Поиск в найденном»

Этот прием тоже позволяет сужать область поиска за счет уточнения, какие именно, например, шины ищет пользователь. Поиск в найденном поможет быстро устранить подавляющее большинство результатов из смежных или вовсе посторонних областей или из других географических регионов. Нужно только помнить, что и к поиску в найденном применимы все те же вышеперечисленные правила. Кроме того, поиск в найденном позволяет структурировать результаты поиска с учетом уже полученных ссылок и найденной информации, что повышает вероятность нахождения одной-единственной требуемой ссылки.

Переформулируйте запросы с учетом уже полученных результатов

Даже беглый просмотр полученных результатов поиска, как правило, показывает, что интересующий вас предмет или понятие разные люди ищут по-разному. Не пренебрегайте их опытом! Самый простой способ – обратить внимание на предлагаемые поисковой системой варианты запросов, когда вы только вводите их в поисковую строку. Даже если воспользоваться последовательно хотя бы пяти такими «автоматическими» вариантами, это уже позволит сделать поиск более эффективным. А если добавить к автоматическим вариантам свои собственные, уточняющие и корректирующие первоначальный запрос, то и подавно.

Используйте синонимы, ищите по официальным названиям и ключевым фразам

Прием, напоминающий поиск в найденном, но позволяющий не сузить, а уточнить поиск. Скажем, пользователь ищет информацию о предмете, который более известен под просторечным названием. Тогда, получив информацию о том, как на самом деле официально, а не в разговорной речи, называется объект поиска, можно задать новый, более точный поисковый запрос. Кстати, правило действует и в другую сторону: нередко оказывается, что гораздо больше информации можно найти о предмете, введя в поисковую строку его «народное» название или прозвище, информация о которых нашлась в результате первого запроса.

Используйте операторы поиска

Этот совет не случайно стоит последним: он годится скорее продвинутым пользователям и тем, кто в школе хорошо успевал по точным наукам. Поэтому мы даже не будем углубляться в подробное описание всех операторов поиска. Скажем только, что операторы поиска – это специальные знаки типа «+», «-», «~», «|» и так далее, подставляемые в текст запроса. Их использование позволяет включать и исключать из поиска конкретные слова из словосочетания, добиваться, чтобы поисковая машина искала словосочетание в пределах одного предложения или одного документа и так далее. А если читателю интересно побольше об этом узнать – он может ввести в поисковую строку словосочетание «операторы поиска», а потом воспользоваться всеми вышеприведенными советами. Результат гарантирован!

Эффективный поиск по сайту. Постановка проблем — поиск решений.

Время на прочтение
7 мин

Количество просмотров 3.3K

Это перепечатка статьи Ивана Никитина, которая в сентябре была опубликованна на нашем сайте Nomagic.ru. Данная статья содержит только постановку задачи и обсуждению возможных решений. Ссылки на статьи с описанием решения поставленной задачи c помощью LiveSearch API на ASP и PHP можно найти в конце статьи.

У любого современного сайта, на котором присутствуют более 5 – 10 страниц с контентом, должна быть поисковая система. Как бы хорошо мы не планировали навигационную панель, или каталог товаров/разделов сайта, все равно любые наши попытки интуитивно-понятной систематизации, в конечном итоге, будут непонятны 101-му пользователю сайта.

Хотите убедиться что это так? Вот несколько простых задач, попробуйте потратить на их решение несколько минут (все примеры взяты абсолютно случайно из списка лично мне знакомых и посещаемых мною сайтов. Эти примеры ни в коем случае не призваны приуменьшить качество этих ресурсов):

  1. Найдите на сайте http://www.specialist.ru/ (не пользуясь поиском!) 2 (два) курса по Microsoft SharePoint 2007. Запишите, сколько времени вы на это потратили.
  2. Найдите на сайте http://www.sipnet.ru подтверждение того, что шлюз VoIP D-Link DVG-2001S работает с сервисом Sipnet, а также его краткое описание. Запишите, сколько времени вы на это потратили.
  3. На сайте www.megafon.ru найдите годовой отчет по итогам работы за 2006 год в формате Microsoft Word (не пользуясь поиском). Вам это удалось?

Следует ли продолжать? Думаю, вы уже согласны со мной. И точно также рассуждают разработчики сайтов, когда перед ними встает проблема создание поисковой системы. К сожалению, большинство разработчиков недооценивают сложность этого решения и полагают, что поиск можно свести (упрощенно) к SQL запросу:
SELECT * FROM products WHERE
title LIKE ‘%что-то%’
OR description LIKE ‘%что-то%’

Так-то оно может быть и так, только вот ценность такого поиска будет нулевая. Можно, конечно же, усложнить, добавить поиск по словам и их сочетаниям (меня так умиляет фраза, которую иногда встречаешь на сайтах: «Вы можете использовать AND, OR, NOT». Ага! Вы еще пользователю булеву алгебру объясните). Но проблема такого поиска заключается в том, что разработчик полагает, что пользователь будет вводить названия продуктов или заголовки новостей точно так же, как они указаны на сайте, а пользователь вводит просто то, что ему сейчас нужно, совершенно в произвольной форме, и к тому же, он, пользователь, как правило, вводит короткие запросы, состоящие из одного-двух слов. То есть пользователь ищет курсы по SharePoint 2007, он так и напишет «SharePoint 2007», а не «Windows SharePoint Services v3». И в результате мы получаем абсолютно неработающую поисковую систему, потому что подобный поиск или вывалит сотни ссылок в качестве результата, и найти что-то в результате поиска будет невозможным, или не выдаст ничего. Хотите убедиться? Возьмем два мощных ресурса с большими бюджетами на разработку и попробуем протестировать поиск на них:

  1. На сайте www.mts.ru найдите с помощью поиска кредитную форму оплаты разговоров, то есть как это оформить и как за разговоры платить… Какой запрос вы введете? «кредитная форма оплаты». Результат будет примерно таким:
    Результаты поиска по сайту "МТС" - запроса "кредитная форма оплаты"
  2. На сайте www.alfabank.ru найдите информацию об ипотечном кредитовании. Какой запрос вы введете? «Ипотека». Вот результат:
    Результаты поиска по сайту "Альфа-банк" - запроса "Ипотека"

Легко заменить, что оба раза вы получили негативный результат. В первом случае вы не получили ничего, во втором – совершенно ненужную информацию (как вам понравилась ссылка на баннер про ипотеку?). Заметьте, оба раза неудачный поиск может заставить уйти клиента навсегда: я не стану переходить на MCT, так как там нет кредитной формы оплаты разговоров (на самом деле – есть!), и я не стану обращаться в Альфа-банк, так как не смог найти условий ипотечного кредитования (еще раз – это только примеры! Ничего личного!).
Как решить эту задачу?

Реализация эффективного поиска

Во-первых, необходимо осознать, что хороший поиск – это далеко нетривиальная задача. Более того, можно сказать и так: сложность реализации хорошего поиска намного превосходит сложность реализации функционала всего сайта. Поэтому нужно сто раз подумать, прежде чем ставить перед собой такую задачу. Вы готовы взяться написать систему морфологического анализа, оценки релевантности документов, алгоритм ранжирования результатов? И самое главное, сколько человеко-часов и тысяч строк кода вы готовы положить на это?
Но мы, тем не менее, можем решить эту задачу! У нас есть, как минимум, три способа ее решения:

  1. Использование форм поисковых систем
  2. Использование доступных Веб-служб
  3. Использование сторонних решений

Все эти способы отличаются от себя по трудозатратам, стоимости и получаемому результату, но все три способа дают на порядок более качественный результат, нежели приведенные выше примеры.

Использование форм поисковых систем

Это самый дешевый и легко реализуемый способ. Вместо того чтобы писать свой сырой и некачественный код поиска, вы просто встраиваете форму на страницы своего сайта, которая передает запрос поисковой системе. В качестве такой системы мы покажем использование Google, хотя можно использовать любую другую, например, вот формы Яндекса: http://company.yandex.ru/forms/. Но мне больше нравится Google, так как, на мой взгляд, качество поиска у него намного выше, чем у других поисковиков.
Итак, рисуем примерно такую форму:
<form method="get" action="http://www.google.com/search">
<input type="hidden" name="ie"
value="windows-1251" />
<input type="hidden" name="domains"
value="www.specialist.ru" />
<input type="hidden" name="sitesearch"
value="www.specialist.ru" />
<input id="searchBarInput" type="text" name="q"
value="" />
<input id="searchBarSubmit" type="submit"
value="Искать!" />
<div>
<a id="extendedSearchLink" href="http://google.com/">
<span>Powered by <span style="color:blue">G</span>
<span style="color:red">o</span>
<span style="color:olive">o</span>
<span style="color:blue">g</span>
<span style="color:green">l</span>
<span style="color:red">e</span></span></a>
</div>
</form>

Обратите внимание, указание на то, что поиск предоставлен поисковой системой Google обязательно! Вот и все! За счет скрытых полей мы просим Google искать только на указанном сайте. Причем качество поиска будет заведомо выше, чем в приведенных примерах. Давайте убедимся:
Результаты поиска Google по сайту МТС
Первая же ссылка указывает на оформление кредитной формы оплаты на сайте МТС.
Пример с Альфа-банком:
Результаты поиска Google по сайту Альфа-банка
Первый же результат – вся информация об ипотеке Альфа-банка!
Конечно же, при всей простоте этого способа, сразу же в глаза бросается и его недостаток: пользователь переходит с вашего сайта на поисковую систему. Вообще-то, само по себе это не так страшно, ведь все ссылки с поисковика обратно ведут к вам и только к вам, но вот контекстная реклама. Не думаю, что Альфа-банк согласится с подобным предложением использовать похожую схему. 🙂
Тем не менее, этот способ можно настоятельно рекомендовать малобюджетным или некоммерческим сайтам, так как качество поиска намного перевешивает негативные стороны в виде контекстной рекламы.

Использование доступных Веб-служб

В этом способе мы попробуем отказаться от вывода чужих рекламных объявлений в результатах поиска. Многие поисковые системы предоставляют сервисы для осуществления автоматического поиска. Это и Яндекс.XML (http://xml.yandex.ru/), и службы Google и другие. Общий смысл заключается в том, что мы предоставляем свою форму поиска, которая передает запрос пользователя на наш сервер, который в свою очередь передает его поисковой системе. Получив результаты, наш сервер выводит их в любом дизайне, в любом виде на наш сайт. Пользователь даже не догадывается, что поиск осуществлялся какой-то внешней системой, так как он видит результаты в дизайне нашего сайта. Правда, у Яндекс.XML какая-то совершенно непонятная лицензионная система (требование параллельно выводить объявления Директа), а Google тихой сапой прикрыл подобный сервис примерно год назад, и сейчас предоставляет такой поиск только в совокупности с объявлениями AdSense, опять же, с контекстной рекламой.

Но и здесь можно найти выход. У Microsoft есть API для работы с поиском Live.com (http://dev.live.com/livesearch/), который (API – это «он»), позволяет реализовать подобную систему. Правда и этот API ограничивает количество запросов в день примерно на 1000 – 3000 запросов, но для средних сайтов этого хватает.

Реализовать такой поиск совершенно несложно, тем более Live Search API предусматривает SOAP вызовы XML Веб-сервиса, а это значит, что эти вызовы можно осуществить из любой платформы, и из любого средства разработки сайтов: PHP, ASP.Net и т.п.

Некоторое время назад мы сделали реализацию такого поиска, когда возникла необходимость создания поиска для сайта Specialit.ru. Увидеть ее в действии можно по адресу: http://search.specialist.ru

Если Вам покажется интересной эта тематика, оставьте, пожалуйста, свои отзывы и пожелания в комментариях к публикации, и в своей следующей статье я приведу подробный пример код реализации поисковой системы на базе Live Search API. Поверьте, там все намного проще, чем кажется на первый взгляд. 🙂

Использование сторонних решений

Однако, у способа, использующего доступные Веб-службы, например Live Search API, есть два ощутимых недостатка:

  1. Невозможность оперативно управлять переиндексацией ресурса
  2. Невозможность индексации (и как следствие поиска) в закрытых разделах сайта

Первый недостаток обусловлен тем, что роботы поисковых систем сами устанавливают расписание обновления вашего сайта в индексе, и если, например, ваш сайт не отдает корректный заголовок ответа HTTP Last-Modified (а это болезнь 90% сайтов в Интернете!), то это время может быть значительным. То есть после появления новых материалов на вашем сайте могут пройти дни, а то и недели, прежде чем они появятся в результатах поиска.
Второй недостаток вообще фатален. Робот поисковика никак не сможет получить доступ в закрытые разделы вашего сайта (например, в закрытый форум, где требуется авторизация), и поэтому информация из закрытых разделов никогда не появится в результатах поиска. Можно, конечно же, извернуться и сделать обезличенную публикацию информации из закрытых разделов (например, выводить сообщения закрытого форму без информации о пользователях), но это пройдет далеко не всегда. Например, как быть с поиском в вашей корпоративной почте?
Здесь нам могут помочь сторонние поисковые системы, например, Яндекс.Сервер (http://company.yandex.ru/technology/products/yandex-server.xml) или корпоративный Microsoft Office SharePoint Server (http://office.microsoft.com/ru-ru/sharepointserver/FX100492001049.aspx). Второй мне известен куда лучше, чем сервер от Яндекса, и он обладает достаточно мощной поисковой системой, которую можно использовать, в том числе, и для поиска по вашему сайту.
Возможно, в одной из следующих статей мы также рассмотрим интеграцию Microsoft Office SharePoint Server 2007 с вашим сайтом для построения эффективной поисковой системы.

Ссылки по теме

–  Статья про реализацию поиска по сайту с помощью LiveSearch API на ASP.NET
–  Статья про реализацию поиска по сайту с помощью LiveSearch API на PHP5

альтернативные поисковые системы

На сайте Statcounter — сервиса веб-аналитики — есть данные о рынке поисковых систем в России. Самый популярный поисковик — Google, в ноябре 2021 года им пользуются 55,29% всех пользователей. Яндексом — поменьше, но тоже много — 42,11%.

Согласно другому источнику — данным Similarweb — у Яндекса 22%, а доля Google составляет 68%. Цифры разнятся, а результат один: Гугл лидер, Яндекс второй по популярности в РФ.

Но необязательно пользоваться только ими — есть и альтернативные ресурсы. Допустим, специализированные сервисы, которые больше подходят для поиска книг, фотографий и т.д. Другие системы дают большую конфиденциальность. К примеру, не используют данные пользователей для той же рекламы, как это делают самые популярные поисковики.

Разбираемся, какие ещё системы можно использовать для поиска информации. Но сначала немного теории.

Что такое поисковая система и как она работает

Поисковая система — программа, которая помогает найти информацию в интернете. По сути, это специальный сайт, на котором собраны ссылки на множество других сайтов и их страниц. Поисковик может сортировать и фильтровать эти ссылки — по-разному для каждого пользователя и его запроса.

Допустим, пользователь открывает поиск, вводит «посмотреть фильм» и жмёт «Найти». Система старается подобрать сайты, которые лучше всего отвечают на этот запрос. Основной параметр — совпадение между словами в запросе и текстом страницы (не обязательно 100%-ное — синонимы, похожие выражения тоже могут подойти).

Но мало найти подходящие ресурсы — нужно ещё сформировать поисковую выдачу, то есть расположить сайты в определённом порядке. Для этого поисковики могут учитывать множество других факторов, помимо текста. Например, посещаемость и возраст сайта, количество ссылок на него, виды контента.

В результатах поиска могут быть не только страницы, но и картинки, и видео.

Не хотите читать долгие описания фильмов — выбирайте понравившийся из картинок

Не хотите читать долгие описания фильмов — выбирайте понравившийся из картинок

Примерно так выглядит схема работы поисковой системы

Примерно так выглядит схема работы поисковой системы

Виды поисковиков

Поисковые системы делят на четыре вида: каталоги, метапоисковые, специализированные и индексные. Давайте разберёмся, в чём разница.

Поисковые каталоги. В них информация хранится в виде категорий и подкатегорий. Эти системы устроены так же, как и тематические каталоги библиотек.

Например, есть главная категория «Образование». Она состоит из подкатегорий «Химия», «Биология», «Математика». А подкатегории делятся дальше — на более мелкие. Например, «Химия» на «Общая химия», «Органическая химия», «Физическая химия» и т.д. В результате все категории заканчиваются конкретными страницами сайтов.

Особенность каталогов в том, что малопосещаемым ресурсам сложно попасть на первые страницы выдачи. Исключение — Wikipedia.

Метапоисковые системы. Используют для работы с другими системами. Когда пользователь вводит запрос, метапоисковая система автоматически посылает его в другие поисковики — и собирает оттуда информацию. Затем фильтрует полученные данные: удаляет дублированные ссылки и формирует поисковую выдачу. По такому принципу работают многие альтернативные поисковики.

Специализированные поисковые системы. Подходят для поиска конкретной информации: изображений, книг, фильмов, отчётов. Например, фотостоки ищут только фотографии по определённым запросам. Кинопоиск тоже считается специализированным поисковиком, так как выдаёт информацию по фильмам и сериалам.

Индексные поисковые системы. Самый популярный тип. Индексная поисковая система — большая база данных, в которой хранятся ссылки на другие сайты.

Специальный робот просматривает все страницы в интернете и записывает их в базу — этот процесс называется индексацией. Когда пользователь делает запрос, поисковик просматривает базу и ищет совпадения страниц по ключевым словам (или словам, похожим на ключевые). А потом формирует результаты с учётом многих других параметров.

Именно на примере этого типа в предыдущем разделе я рассказал, что такое поисковая система.

Обзор альтернативных поисковых систем

StartPage

Компания заявляет, что это самая закрытая и приватная поисковая система в мире. Это подтверждала проверка The European Privacy Seal.

Так выглядит поисковая выдача в Startpage

Так выглядит поисковая выдача в Startpage

Минус поисковика в том, что нет русского интерфейса. Но в настройках можно выбрать язык для поисковых результатов.

Фишка StartPage в том, что платформа использует Google, но защищает конфиденциальность пользователей.

Конфиденциальность. Компания не сохраняет информацию о пользователе: IP-адрес, информацию об устройстве, суть запроса и файлы куки. (Cookies — небольшие текстовые файлы, в которых хранится информация о ваших действиях на сайтах: например, предпочтительный язык, размер шрифта, сохранённые логины и пароли.)

Сайт: https://www.startpage.com/.

DuckDuckGo

Частная поисковая система, позиционирует себя как антигугл с момента образования.

По данным StatCounter по всему миру за 2021 год, DuckDuckGo пользуются 0,66% пользователей. Компания заявляет, что за год через поисковую систему сделали 31 млрд запросов (для сравнения — количество запросов Google оценивают в 5,6 млрд в день).

Пример поиска в DuckDuckGo

Пример поиска в DuckDuckGo

Минус платформы в том, что не всегда получается получить релевантные результаты. Например, по запросу «Минск сегодня» поисковик выдал новости, которым три дня и больше.

Но у платформы есть фишка — функция bangs. Она поможет задать запрос сразу на конкретном сайте. Пример: !w рассылка. Этот запрос сразу перенаправит пользователя в Wikipedia на статью о рассылке.

Список bangs на DuckDuckGo

Список bangs на DuckDuckGo

Конфиденциальность. Компания не сохраняет IP-адрес пользователя, не использует файлы куки. Поисковые запросы — единственное, с чем платформа работает. Поэтому поиск максимально приватный.

Сайт: https://duckduckgo.com/.

Bing

По сути, Bing — аналог Google. Разработан компанией Microsoft. В СНГ им пользуются около 1% пользователей.

Минус в том, что обработка запросов занимает больше времени, чем у Google. Но поисковая выдача обычно примерно такая же.

Фишка платформы в том, что есть предпросмотр видео сразу в поиске. Если навести курсор на видео, ролик запустится в маленьком окне.

Не можете определиться, какое видео всё-таки посмотреть — пользуйтесь предпросмотром в Bing

Не можете определиться, какое видео всё-таки посмотреть — пользуйтесь предпросмотром в Bing

Конфиденциальность. Поисковик собирает все данные о пользователях, сохраняет историю поиска и информацию об устройствах. Если хотите делать анонимные запросы, не стоит пользоваться Bing.

Сайт: https://www.bing.com/.

Yahoo!

Раньше была популярной поисковой системой. Сейчас ей пользуются только 1,5% пользователей в мире (а в СНГ — около 0,3%).

Yahoo! работает при поддержке Bing, поэтому поисковая выдача одинаковая. Интерфейс — тоже.

Минус платформы — нет разделения между рекламными блоками и органическими результатами. Ещё платформа плохо определяет местоположение пользователя.

Вроде бы с выдачей все в порядке, но есть одно но: запрос сделан из Минска, а не из Украины

Вроде бы с выдачей все в порядке, но есть одно но: запрос сделан из Минска, а не из Украины

Фишек у платформы нет.

Конфиденциальность. Такая же, как и у Bing: сохраняет IP, файлы куки, историю поиска и информацию о пользовательских устройствах. Не подходит для анонимного сёрфинга.

Сайт: https://www.yahoo.com/.

Rambler

Российская поисковая платформа, которая работает с 1991 года. В 2016 году ей пользовалось 26 миллионов человек. Сколько сейчас — неизвестно.

С 2021 года Rambler принадлежит Сберу, который активно развивает свою экосистему: кинотеатр Okko TV, стриминговый сервис СберЗвук и другие. Возможно, это поможет привлечь новых пользователей.

Минус Rambler — большое количество рекламы.

Три рекламы на главной странице — многовато

Три рекламы на главной странице — многовато

Фишка — много дополнительных сервисов: афиша, поиск работы, курсы валют, погода, погода, путешествия и другие.

Конфиденциальность. Rambler сохраняет всю информацию о пользователе: IP, файлы куки, историю поиска и данные об устройствах.

Сайт: https://www.rambler.ru/.

Boardreader

Подходит для поиска текстовой информации на форумах и сервисах вопросов-ответов.

Минус платформы — найти видео и картинки не получится.

Фишка — можно быстро находить комментарии и посты по определённым критериям: язык, дата публикации, название сайта.

Задаём параметры для поиска в Boardreader

Задаём параметры для поиска в Boardreader

Конфиденциальность. В политике конфиденциальности сказано, что поисковик сохраняет всю информацию о пользователе: IP, файлы куки, историю поиска.

Сайт: https://boardreader.com/.

Dogpile

Метапоисковик, который объединяет запросы из разных систем: Google, Bing, Yahoo.

Минус поисковика — старый дизайн и выдача преимущественно на английском языке.

Поисковая выдача в Dogpile. Релевантная, но преимущественно на английском

Поисковая выдача в Dogpile. Релевантная, но преимущественно на английском

Фишка платформы — большой объём выдачи. Разработчики заявляют, что Dogpile собирает информацию из всех поисковиков, а потом формирует наиболее релевантную выдачу. А ещё на платформе практически нет рекламы.

Конфиденциальность. О пользователе собирается вся контактная информация: IP, тип браузера и платформы, реферальные и другие данные. По умолчанию сохраняется история поиска, но её можно отключить.

Сайт: https://www.dogpile.com/.

Сравнительная таблица

Система Фишка Минус Конфиденциальность
StartPage Это Google, только конфиденциальный Нет русского интерфейса Высокая
DuckDuckGo Функция bangs Выдача не всегда релевантна Высокая
Bing Предпросмотр видео в поиске Долгая обработка запроса Низкая
Yahoo! Нет Нет разделения между рекламными блоками и органическими результатами Низкая
Rambler Много дополнительных сервисов Много рекламы Низкая
Boardreader Ищет посты и комментарии по заданным критериям Не ищет видео и картинки Низкая
Dogpile Большой объем выдачи Выдача на английском языке, старый дизайн Низкая

Рейтинг поисковых систем по разным странам

Все данные (2020–2021) взяты с сайта сервиса StatCounter.

Весь мир. Google лидирует с огромным отрывом — 91,98% пользователей. На втором месте Bing с долей в 2,59%. Яндекс только на пятом месте с 0,85%.

Такое распределение по всему миру

Такое распределение по всему миру

США. Самая популярная система в стране — конечно, тоже Google (88%). На втором месте — Bing (6,02%). На третьем — Yahoo! (3,06%).

Популярность поисковиков в США: абсолютная победа Google

Популярность поисковиков в США: абсолютная победа Google

Китай. Здесь рулят свои продукты. Первое место занимает Baidu (76,64%), на втором — Sogou (14,61%). Почему-то Bing тут опережает Google (2,91% vs 2,27%).

Рейтинг поисковиков в Китае — лидируют «эндемичные»

Рейтинг поисковиков в Китае — лидируют «эндемичные»

Европа. Первое место по популярности — Google (93%). Второе занимает Bing (3,29%), а третье — Yandex (0,91%).

Популярность поисковиков в Европе

Популярность поисковиков в Европе

СНГ. Думаю, достаточно посмотреть статистику по трём странам.

Самые популярные поисковые системы в Украине — Google (93%), Яндекс (4,93%) и Bing (0,98%). Причём Яндекс — несмотря на блокировку.

В Украине картина похожа на Европу, только Яндекс и Бинг меняются местами

В Украине картина похожа на Европу, только Яндекс и Бинг меняются местами

В Беларуси — Google (74,94%), Яндекс (23,23%), Mail.Ru (1%).

В Беларуси Яндекс старается, но Google победить не получается

В Беларуси Яндекс старается, но Google победить не получается

А в России, напоминаем, Яндекс серьёзнее конкурирует с Гуглом: 42,11% уже довольно близко к 55,29%. А у Mail.Ru тоже небольшая доля 1,17%. Bing же на четвёртом месте (0,57%).

ЭКСКЛЮЗИВЫ ⚡️
Читайте только в блоге
Unisender

Поделиться

СВЕЖИЕ СТАТЬИ

Другие материалы из этой рубрики

документ

документ

Не пропускайте новые статьи

Подписывайтесь на соцсети

Делимся новостями и свежими статьями, рассказываем о новинках сервиса

«Честно» — авторская рассылка от редакции Unisender

Искренние письма о работе и жизни. Свежие статьи из блога. Эксклюзивные кейсы
и интервью с экспертами диджитала.

unisender

Всем привет, на связи lz0t и я представляю вам топ 6 поисковиков которые лучше, чем Google и Яндекс. Поехали

●DuckDuckGo

Это довольно известная поисковая система с открытым исходным кодом. Серверы находятся в США. Кроме собственного робота, поисковик использует результаты других источников: Yahoo! Search BOSS, «Википедия», Wolfram|Alpha.

Чем лучше

DuckDuckGo позиционирует себя как поиск, обеспечивающий максимальную приватность и конфиденциальность. Система не собирает никаких данных о пользователе, не хранит логи (нет истории поиска), использование файлов cookie максимально ограничено.

DuckDuckGo не собирает личную информацию пользователей и не делится ею. Это наша политика конфиденциальности.

Зачем это вам

Все крупные поисковые системы стараются персонализировать поисковую выдачу на основе данных о человеке перед монитором. Этот феномен получил название «пузырь фильтров»: пользователь видит только те результаты, которые согласуются с его предпочтениями или которые система сочтёт таковыми.

DuckDuckGo формирует объективную картину, не зависящую от вашего прошлого поведения в Сети, и избавляет от тематической рекламы Google и «Яндекса», основанной на ваших запросах. При помощи DuckDuckGo легко искать информацию на иностранных языках: Google и «Яндекс» по умолчанию отдают предпочтение русскоязычным сайтам, даже если запрос введён на другом языке.

●Нигма

Российская метапоисковая система, разработанная выпускниками МГУ Виктором Лавренко и Владимиром Чернышовым. Осуществляет поиск по индексам Google, Yahoo!, Bing, «Яндекса», Rambler, AltaVista, Aport, имеет и собственный поисковый алгоритм.

Чем лучше

Поиск по индексам всех крупных поисковых систем позволяет формировать релевантную выдачу. Помимо этого, «Нигма» разбивает результаты на несколько тематических групп (кластеров) и предлагает пользователю сузить поле поиска, отбросив ненужные или выделив приоритетные. Благодаря модулям «Математика» и «Химия» можно прямо в строке поиска решать математические задачи и запрашивать результаты химических реакций

Зачем это вам

Избавляет от необходимости искать один и тот же запрос в разных поисковиках. Кластерная система позволяет легко манипулировать результатами поиска. Например, «Нигма» собирает в отдельный кластер результаты из интернет-магазинов. Если вы не намереваетесь что-то покупать, то просто исключите эту группу. Выбрав кластер «Англоязычные сайты», вы получите выдачу только на английском. Модули «Математика» и «Химия» помогут школьникам.

К сожалению, в настоящее время проект не развивается, так как разработчики перенесли свою активность на вьетнамский рынок. Тем не менее «Нигма» пока не только не устарела, но в некоторых вещах по-прежнему даёт фору Google. Будем надеяться, что разработка возобновится.

●not Evil

Система, осуществляющая поиск по анонимной сети Tor. Для использования нужно зайти в эту сеть, например запустив специализированный браузер с одноимённым названием. not Evil не единственный поисковик в своём роде. Есть LOOK (поиск по умолчанию в Tor-браузере, доступен из обычного интернета) или TORCH (один из самых старых поисковиков в Tor-сети) и другие. Мы остановились на not Evil из-за недвусмысленного намёка на сам Google

Чем лучше

Ищет там, куда Google, «Яндексу» и другим поисковикам вход закрыт в принципе.

Зачем это вам

В сети Tor много ресурсов, которые невозможно встретить в законопослушном интернете. И по мере того как ужесточается контроль властей над содержанием Сети, их число будет расти. Tor — это своеобразная Сеть внутри Сети: со своими социалками, торрент-трекерами, СМИ, торговыми площадками, блогами, библиотеками и так далее.

●YaCy

Децентрализованная поисковая система, работающая по принципу сетей P2P. Каждый компьютер, на котором установлен основной программный модуль, сканирует интернет самостоятельно, то есть является аналогом поискового робота. Полученные результаты собираются в общую базу, которую используют все участники YaCy.

Чем лучше

Здесь сложно говорить, лучше это или хуже, так как YaCy — это совершенно иной подход к организации поиска. Отсутствие единого сервера и компании-владельца делает результаты полностью независимыми от чьих-то предпочтений. Автономность каждого узла исключает цензуру. YaCy способен вести поиск в глубоком вебе и неиндексируемых сетях общего пользования.

Зачем это вам

Если вы сторонник открытого ПО и свободного интернета, не подверженного влиянию государственных органов и крупных корпораций, то YaCy это ваш выбор. Также с его помощью можно организовать поиск внутри корпоративной или другой автономной сети. И пусть пока в быту YaCy не слишком полезен, он является достойной альтернативой Google с точки зрения процесса поиска.

●Pipl

Система, предназначенная для поиска информации о конкретном человеке.

Чем лучше

Авторы Pipl утверждают, что их специализированные алгоритмы ищут эффективнее, чем «обычные» поисковики. В частности, приоритетными источниками информации являются профили социальных сетей, комментарии, списки участников и различные базы данных, где публикуются сведения о людях, например базы судебных решений.

Зачем это вам

Если вам нужно найти информацию о человеке, проживающем в США, то Pipl будет намного эффективнее Google. Базы данных российских судов, видимо, недоступны для поисковика. Поэтому с гражданами России он справляется не так хорошо.

●FindSounds

Ещё один специализированный поисковик. Ищет различные звуки (дом, природа, машины, люди и так далее) в открытых источниках. Сервис не поддерживает запросы на русском языке, но есть внушительный список русскоязычных тегов, по которым можно выполнить поиск.

Чем лучше

В выдаче только звуки и ничего лишнего. В настройках поиска можно выставить желаемый формат и качество звучания. Все найденные звуки доступны для скачивания. Имеется поиск звуков по образцу.

Зачем это вам

Если вам нужно быстро найти звук мушкетного выстрела, удары дятла-сосуна или крик Гомера Симпсона, то этот сервис для вас. И это я выбрал только из доступных русскоязычных запросов. На английском языке спектр ещё шире. А если серьёзно, специализированный сервис предполагает специализированную аудиторию. Но вдруг и вам пригодится?

Связь со мной: Instagram.com/lz0tnn

Спасибо за прочтение, с вами был lz0t. Всем пока-пока!)

Добавить комментарий