Вы не Google / Хабр
Разработчики сходят с ума от самых странных вещей. Мы все предпочитаем считать себя супер-рациональными существами, но когда дело доходит до выбора той или иной технологии, мы впадаем в некое подобие безумия, перескакивая от комментария на HackerNews к посту в каком-нибудь блоге, и вот уже будто в забытье, мы беспомощно плывем по направлению к самому яркому источнику света и покорно преклоняемся перед ним, абсолютно позабыв о том, что именно мы изначально искали.
Это совсем не так, как рациональные люди принимают решения. Но ровно так разработчики решают использовать, к примеру, MapReduce.
Как отметил Джо Хеллерштайн в своей лекции по базам данных для студентов-баклавров (на 54-й минуте):
Дело в том, что существует примерно 5 компаний в мире, которые выполняют настолько масштабные задачи. Что касается всех остальных… они тратят невероятные ресурсы, чтобы обеспечить отказоустойчивость системы, которая им на самом деле не нужна. У людей была своеобразная «гугломания» в 2000х: «мы будем делать всё точно так же, как делает Google, потому что мы ведь тоже управляем самым большим сервисом по обработке данных в мире…» [иронично покачивает головой и ждет смеха из зала]
Сколько этажей в здании вашего дата-центра? Google решили остановиться на четырех, по крайней мере, в этом конкретном дата-центре, расположенном в округе Мейс, Оклахома.
Да, ваша система более отказоустойчива, чем вам необходимо, но подумайте, чего это может стоить. Дело не только в необходимости обрабатывать большие объемы данных. Вероятно, вы размениваете полноценную систему — с транзакциями, индексами и оптимизацией запросов — на нечто относительно слабое. Это значительный шаг назад. Сколько пользователей Hadoop идут на это осознанно? Сколько из них принимают действительно взвешенное решение?
MapReduce/Hadoop — это весьма простой пример. Даже последователи «карго-культа» уже поняли, что самолеты не решат всех их проблем. Тем не менее, использование MapReduce позволяет сделать важное обобщение: если вы используете технологию, созданную для крупной корпорации, но при этом решаете небольшие задачи, возможно вы действуете необдуманно. Даже не так, наиболее вероятно, что вы руководствуетесь мистическими представлениями о том, что имитируя гигантов вроде Google и Amazon, вы достигните тех же вершин.
Да, эта статья — очередной противник «карго-культа». Но подождите, у меня для вас полезный чек-лист, который вы можете использовать, чтобы принимать более взвешенные решения.
Классный фреймворк: UNPHAT
В следующий раз, когда вы будете гуглить какую-нибудь новенькую крутую технику (ре)формирования вашей системы, я призываю вас остановиться и просто воспользоваться фреймворком UNPHAT:
- Даже не пытайтесь обдумывать возможные решения до того, как понять (Understand) проблему. Ваша основная цель — это «решить» проблему в терминах проблемы, а не в терминах решений.
- Перечислить (eNumerate) несколько возможных решений. Не нужно сразу же показывать пальцем на ваш любимый вариант.
- Рассмотрите отдельное решение, а потом прочитайте документацию (Paper), если таковая имеется.
- Определите исторический контекст (Historical context), в котором данное решение было создано.
- Сопоставьте достоинства (Advantages) с недостатками. Проанализируйте, чем авторам решения пришлось пожертвовать, чтобы достичь своей цели.
- Думайте(Think)! Трезво и спокойно обдумайте, насколько хорошо данное решение подходит для удовлетворения вашей потребности. Что именно должно измениться, чтобы вы передумали? Например, насколько меньший объем данных должен быть, чтобы вы предпочли не использовать Hadoop?
Вы не Amazon
Применять UNPHAT весьма просто. Вспомним мой недавний разговор с компанией, которая спешно решила использовать Cassandra для процесса интенсивного считывания данных, загружаемых по ночам.
Так как я уже был знаком с документацией по Dynamo и знал, что Cassandra является производной системой, я понимал, что в этих базах данных основной фокус направлен на возможность производить запись (в Amazon была потребность сделать так, чтобы действие «добавить в корзину» никогда не подводило). Я также оценил, что разработчики пожертвовали целостностью данных — да и, по сути, каждой фичей, присущей традиционным РСУБД. Но ведь у компании, с которой я общался, возможность производить запись не была в приоритете. Честно говоря, проектом подразумевалось создание одной большой записи в день.
Amazon продает очень много всего. Если бы функция «добавить в корзину» вдруг перестала работать, они потеряли бы ОЧЕНЬ МНОГО денег. А у вас проблема того же порядка?
Эта компания решила использовать Cassandra, потому что выполнение PostgreSQL запроса, о котором идет речь, занимало несколько минут, и они решили, что это технические ограничения со стороны их железа. После прояснения пары моментов мы поняли, что таблица состояла примерно из 50 миллионов строк по 80 байт. Её чтение с SSD заняло бы около 5 секунд, если бы требовалось пройтись по ней полностью. Это медленно, но это всё равно на два порядка быстрее, чем скорость выполнения запроса составляла на тот момент.
На данном этапе у меня было много вопросов (U = understand, понять проблему!) и я начал взвешивать около 5 различных стратегий, которые могли бы решить первоначальную проблему (N = eNumerate, перечислить несколько возможных решений!), но в любом случае к тому моменту уже было совершенно ясно, что использование Cassandra было в корне неверным решением. Всё, что им было необходимо – это немного терпения для настройки, вероятно, новый дизайн для базы данных и, возможно (хотя вряд ли), выбор другой технологии… Но совершенно точно не хранилище данных в формате «ключ-значение» с возможностью интенсивной записи, которое создали в Amazon для их корзины!
Я был весьма удивлен, обнаружив, что один студенческий стартап решил строить свою архитектуру вокруг Kafka. Это было удивительно. Насколько я мог судить, их бизнес проводил всего несколько десятков очень крупных операций в день. Возможно, несколько сотен в самые успешные дни. При такой пропускной способности основным хранилищем данных могли бы служить рукописные записи в обыкновенной книге.
Для сравнения вспомним, что Kafka создавался для обработки всех аналитических событий в LinkedIn. Это просто колоссальное количество данных. Даже пару лет назад это было порядка 1 триллиона событий ежедневно, с пиковой нагрузкой в 10 миллионов сообщений в секунду. Я, конечно, понимаю, что Kafka можно использовать для работы с более низкими нагрузками, но чтобы на 10 порядков меньше?
Солнце, будучи весьма массивным объектом, и то всего лишь на 6 порядков тяжелее Земли.
Может быть, разработчики даже приняли обдуманное решение, основываясь на ожидаемых потребностях и хорошем понимании назначения Kafka. Но я думаю, что они скорее подпитывались (как правило оправданным) энтузиазмом сообщества относительно Kafka и практически не задумывались, действительно ли это тот инструмент, который им был необходим. Вы только представьте… 10 порядков!
Я уже говорил? Вы не Amazon
Ещё более популярным, чем распределенное хранилище данных от Amazon, является архитектурный подход к разработке, который обеспечил им возможности масштабирования: сервисно-ориентированная архитектура. Как отметил Вернер Фогельс в этом интервью 2006 года, которое он давал Джиму Грею, в 2001 году в Amazon осознали, что они испытывают трудности с масштабированием интерфейса (фрон-энд части) и, что сервисно-ориентированная архитектура могла им помочь. Эта идея заражала одного разработчика за другим пока стартапы, состоящие из всего лишь пары разработчиков и практически не имеющие клиентов, не принялись дробить свой софт на наносервисы.
К тому времени, когда Amazon решили перейти на SOA (Service-oriented architecture), у них было около 7800 сотрудников, а их объемы продаж превышали $3 млрд.
Концертный зал Bill Graham Auditorium в Сан-Франциско вмещает 7000 человек. У Amazon было около 7800 сотрудников, когда они перешли на SOA.
Это не значит, что вы должны откладывать переход на SOA пока ваша компания не достигнет отметки в 7800 сотрудников… просто всегда думайте своей головой. Действительно ли это лучшее решение в рамках вашей задачи? Какая именно задача перед вами стоит и есть ли иные пути её решения?
Если же вы мне скажете, что работа вашей организации, состоящей из 50 разработчиков, попросту встанет без SOA, то я поинтересуюсь, почему так много крупных компаний просто замечательно функционируют используя единое, но хорошо организованное приложение.
Даже Google — не Google
Примеры использования систем обработки высоконагруженных потоков данных (Hadoop или Spark) могут действительно вызывать недоумение. Очень часто традиционные СУБД лучше подходят для имеющейся нагрузки, а иногда объемы данных настолько малы, что для них хватило бы даже имеющейся памяти. Вы знали, что можно купить 1Тб оперативной памяти где-то за $10 000? Даже если бы у вас был миллиард пользователей, вы бы всё равно смогли обеспечить каждого из них 1 Кб оперативки.
Возможно, этого не будет достаточно для вашей нагрузки, ведь нужно будет производить чтение и запись на диск. Но неужели вам действительно потребуется несколько тысяч дисков для чтения и записи? Вот сколько у вас данных по факту? GFS и MapReduce были созданы для решения вычислительных задач в масштабах всего интернета… например, для пересчета поискового индекса во всем Интернете.
Цены на жесткие диски сейчас гораздо ниже, чем в 2003 году, когда была опубликована документация GFS.
Может быть, вы читали документацию GFS и MapReduce и обратили внимание, что одной из проблем для Google являлись не объемы данных, а пропускная способность (скорость их обработки): они использовали распределенное хранилище, потому что слишком много времени уходило на передачу байтов с дисков. Но какова же будет пропускная способность устройств, которую вы будете использовать в этом году? Учитывая, что вам даже близко не нужно будет столько же устройств, сколько было нужно Google, может быть лучше просто купить более современные диски? Во что вам обойдется использование SSD?
Может быть, вы хотите заранее учесть возможность масштабирования. А вы уже провели все необходимые расчеты? Будете ли вы накапливать данные быстрее, чем цены на SSD будут идти вниз? Во сколько раз должен будет вырасти ваш бизнес, чтобы все имеющиеся данные больше не умещались на одном устройстве? По состоянию на 2016 год, Stack Exchange обрабатывал 200 миллионов запросов в день при поддержке лишь 4 SQL серверов: основного для Stack Overflow, ещё одного для всего остального, и двух копий.
Опять же, вы можете прибегнуть к UNPHAT и всё равно решить использовать Hadoop или Spark. И решение даже возможно будет верным. Главное, это чтобы вы действительно использовали подходящую технологию для решения вашей задачи. Кстати, в Google это хорошо известно: когда они решили, что MapReduce не подходит для индексации, они прекратили его использовать.
Перво-наперво, понять проблему
Пусть мой посыл и не является чем-то новым, но, возможно, именно в таком виде он отзовется в вас или может быть, вам попросту будет легко запомнить UNPHAT и применять его в жизни. Если же нет, вы можете посмотреть речь Рича Хики на Hammock Driven Development, или книгу Поля «How to Solve it», или курс Хэмминга «The Art of Doing Science and Engineering». Потому что главное, о чем мы все просим — это думать!
И действительно понимать задачу, которую вы пытаетесь решить. Говоря вдохновляющими словами Поля:
«Глупо отвечать на вопрос, который вы не понимаете. Грустно стремиться к цели, которую вы не желаете достичь.»
Перевод на русский
Перевод: Александр Трегубов
Редактура: Алексей Иванов (@ponchiknews)
Сообщество: @ponchiknews
Иллюстрация: LucidChart Content Team
Как искать в интернете эффективно и правильно
Bubble
Поисковики стали слишком услужливыми — подстраиваются под наши интересы, стараются соответствовать законам разных стран, но нередко выдают неправильные результаты. Привычное «задай вопрос — получи ответ и перейди по ссылке» уже не работает. Или работает не всегда.
Журналистка Bubble провела эксперимент и разобралась, как отучить поисковики от манипуляций и добиться независимых результатов поиска.
Содержание
Почему искать в интернете стало сложнее
Поисковые системы много знают о своих пользователях. Например, что мы обычно ищем в сети, на что лучше реагируем, что любим. А еще — где мы живем, каким браузером пользуемся, какие у нас смартфоны и планшеты.
С помощью этих знаний Google, Bing, Яндекс и их младшие товарищи делают выдачу более персонализированной — чтобы подходила, по их мнению, каждому конкретному человеку. Они не просто ищут результат в огромном наборе ссылок, а пытаются дать то, что будет полезно именно нам — в конкретной стране, с учетом интересов и предыдущих запросов.
Иногда это удобно. К примеру, если нужно найти коворкинг в незнакомом городе или мастерскую, где быстро отремонтируют зонтик. Тут конечно поможет запрос к Google. Но он почти наверняка не сработает для сложных ответов на непростые вопросы — особенно, если для них существует несколько точек зрения.
- Эффективна ли вакцина от коронавируса?
- Помогают ли пиявки при лечении рака крови?
- Действительно ли Ленин создал Украину?
- Почему Россия воевала в Сирии?
- Какой браузер лучше — Google Chrome или Mozilla Firefox?
В этих случаях Google практически бессилен. Да, он предложит ответы на вопросы, но вряд ли им можно доверять или воспринимать всерьез. Во-первых, поисковик постарается подстроиться под ваши предыдущие запросы. Если до этого вы активно просматривали контент от противников вакцинации, то и в выдаче, скорее всего, получите статьи с этой же точкой зрения.
Во-вторых, Google или Яндекс почти наверняка учтут вашу геолокацию. Например, в поисковой выдаче о войне в Сирии россияне и жители других стран будут видеть совершенно разные источники — с разной точкой зрения.
А самое главное — такие результаты совершенно не помогают разобраться в проблеме. Скорее, еще больше запутывают пользователя.
Эксперимент: как я доказала существование пузыря фильтров
Результаты моего несложного эксперимента показали, почему недостаточно просто взять и погуглить. Я ввела несколько запросов, связанных с войной в Украине, и посмотрела, что при этом покажут разные поисковые системы.
К примеру, попробовала поискать информацию про полк «Азов» в разных поисковых системах на разных языках. Google при англоязычном запросе (Azov) показывает статьи из зарубежных медиа. Среди них — The Guardian, Deutsche Welle.
Запрос «Азов» на русском в первый раз привел нас к статье в «Википедии» и статьях в «Голосе Америки» и на сайте «Радио Свободы», а через три дня я увидела большое количество статей о песне, посвященной полку «Азов» и снова «Википедию».
Аналогичный поиск в «Яндексе» дал совсем другие результаты. Даже при англоязычном запросе в выдаче отображались ссылки на российские государственные медиа со статьями о деятельности полка — публикации с сайта «РИА Новости», ссылка на видео «Как сдавался в плен «Азов».
Запрос на русском языке в «Яндексе» мало отличался от предыдущей выдачи: снова «РИА Новости», Лента.ру вперемешку со ссылками на статьи о городе Азове.
DuckDuckGo по запросу Azov показал мне англоязычные новости иностранных медиа и материалы из «Википедии». В ответ на запрос «Азов» — новости и «Википедия» на украинском и русском языках.
Это одновременно простой и сложный эксперимент. Во-первых, просто слово «Азов» может означать и подразделение украинской армии, и город Азов, и Азовское море. Во-вторых, политизированная выдача по этому запросу от российских государственных медиа тоже повлияла на результаты.
Это не единственное известное сравнение работы разных поисковых систем. Как писало украинское информационное агентство УНИАН, в первые несколько дней после сообщений о расстрелах мирных жителей в Буче «Яндекс» вовсе не показывал россиянам информацию о том, что в этом городе что-то происходило.
Подчеркну: я использовала VPN и не авторизировалась в поисковых системах — чтобы скрыть собственные настройки, историю поиска и рекламные предпочтения. Правда не удаляла cookies, так что они могли частично влиять на результаты поиска. И, конечно же, для всех поисковых систем у меня установлен английский язык как основной.
Результаты эксперимента заставляют задуматься о том, а что же такое независимый результат поиска и существует ли он вообще? Мое предложение: считать выдачу независимой, если на нее не влияют никакие фильтры и ограничения для определенной аудитории.
Кстати, я не первая провела такой эксперимент. А американский писатель, активист и предприниматель Эли Парайзер 10 лет назад рассказал о своем опыте на конференции TED и описал его в книге «За стеной фильтров. Что Интернет скрывает от вас». Эли назвал явление пузырем фильтров — влиянием нашего поведения, интересов и социального окружения на контент, который демонстрируют онлайн-сервисы. Этим контентом может быть и лента в соцсети, и выдача в поисковой системе.
Как поисковики выбирают релевантные ответы
Цель поисковика — дать пользователю ответы на его запросы. Они могут быть однозначными типа «Буча», «Азов» или простыми — вроде «что такое оспа обезьян», «когда наступит дефолт» В любом случае Google предложит список ссылок: сначала будут те, что лучше подходят к запросу. Чем выше — тем релевантнее результат.
Причиной успеха Google стала идея всегда показывать в поиске сначала те страницы, на которые ссылается много других сайтов. Это можно считать доказательством соответствия страницы заданному запросу. Чтобы оценить уровень этой релевантности, искусственный интеллект поискового движка постоянно обучается на данных пользователей. Если посетителю подходит ответ, если он «счастлив» и больше ничего не в этом сеансе — станица занимает лучшее место в поиске.
Поначалу все шло прекрасно, но со временем механизм стал давать сбои: люди научились накручивать ссылки, а поисковик — бороться с этим.
Поисковые границы, Google-бомбинг и другие сложности поиска
На результаты поиска могут влиять информационные границы. Так называется зависимость результатов поиска от геолокации пользователя.
Проект Search Atlas показывает, как Google может менять поисковую выдачу для разных стран мира. Иногда это сугубо культурные различия — на главной странице сервиса можно посмотреть выдачу по запросу «бог» для разных регионов. Но иногда касается и некоторых политических проблем. Журналисты Wired смогли проанализировать работу сервиса и увидеть разницу в выдаче по запросу «площадь Тяньаньмэнь». Это известное в Китае место, где в 1989 году власти
По разным оценкам , погибло от нескольких сотен до нескольких тысяч людей и тысячи были ранены.
» data-bs-trigger=»focus» data-bs-custom-class=»popover_footnote» data-footnote=»{«content»:»По разным оценкам , погибло от нескольких сотен до нескольких тысяч людей и тысячи были ранены.»,»linkContent»:»»,»linkUrl»:{«value»:»»,»meta»:{}}}»>подавили протест с помощью танков.Версия Google для Великобритании и Сингапура показала изображения танков и рассказала о протестах 1989 года. Этот же запрос к специальной версии поиска для Китая выдает солнечную площадь, полную туристов — и ни слова о протестах. Авторы проекта Search Atlas считают, что хотя поисковик заблокирован в Китае с 2010 года, «Корпорация добра» все равно учитывает требования властей страны.
К сожалению, проект Search Atlas пока доступен только в виде закрытой бета-версии, поэтому я не смогла проверить, как он работает.
Сейчас влияние государства на поиск особенно заметно в России — власти просто превратили «Яндекс» в источник пропаганды. В апреле национальный поисковик перестал индексировать сайты независимых медиа. А недавнее исследование «Новой газеты» показало, что контент «Яндекс.Новостей» мало отличается от того, что показывают по российскому телевидению.
К удивительным, даже забавным забавным результатам иногда могут привести и случайные сбои. Это известно, как Google-бомбинг — поисковые бомбы. Вроде тех случаев, когда по запросу «ужасный провал» в 2003 году Google показывал биографию Джорджа Буша, в 2018 году — фото Дональда Трампа в ответ на запрос «idiot».
Кроме курьезных, случаются и обычные сбои в работе алгоритмов поиска.
В результате этого люди просто получают ошибочные ответы.Летом 2021 года Google давал британцам неправильный совет о том, когда можно выйти из самоизоляции — подсказки кардинально отличались от официальных рекомендаций властей. Технологическая журналистка и экспертка Виолет Блю обнаружила похожую проблему для запроса «зачем люди выбрасывают в океан автомобильные аккумуляторы» (why do people throw car batteries in the ocean). Поисковая система утверждала, что «захоронение аккумуляторов приносит пользу экологии и питает энергией Гольфстрим».
Авторы проекта Search Engine Land нашли неверный ответ на вопрос о том, были ли среди американских президентов участники Ку-Клус-Клана. Google не просто давал утвердительный ответ, а еще и предлагал список таких людей, хотя это неправда.
Эти истории говорят о нескольких вещах. Во-первых, не стоит всегда полагаться на первую же выдачу поисковой системы. Она может быть не достаточно точной и объективной, да и сами эти критерии тоже весьма расплывчаты.
Похоже, для журналистского исследования или научной работы — просто погуглить будет недостаточно. Учимся выключать в поисковых алгоритмах подстройку под конкретного пользователя.
Практическая часть: как отучить поисковики от манипуляций
Прежде чем искать в сети, предлагаю подумать над тем, что вы хотите получить. Если это однозначный ответ на простой, обыденный вопрос — Google или Яндекс вам в помощь. Если изучаете сложную проблему, для которой может существовать несколько точек зрения и запрос может быть предметом манипуляций (не только политических), придется заставить поиск быть объективнее.
Если требуется разобраться в сложном политическом вопросе, лучше вообще забыть о поисковых платформах, связанных с государственными структурами. Иными словами, искать правды о войне в «Яндексе» не стоит. А если хотите узнать, что ученые говорят по интересующему вас вопросу, потребуется не столько Google, сколько научные издания и специализированный поиск по научным источникам.
Подготовьте инструменты для поиска
- Установите еще один, а лучше два дополнительных браузера. Если обычно используете Google Chrome, возьмите, к примеру, Firefox. Тогда ваших привычные настройки и файлы cookies не будут влиять на результаты. Также рекомендую установить браузер Opera — в нем легко включается и отключается VPN. Конечно, если вы готовы отказаться от всех прошлых настроек, можно просто удалить cookies-файлы и очистить историю поиска. Чтобы обойти этот шаг и потом заново не авторизоваться на сайтах, рекомендую перейти в другой браузер.
- По возможности, приобретите VPN. Но помните, что новый IP-адрес все равно будет принадлежать какой-то стране, пусть и не вашей — поисковик обязательно учтет эту новую геолокацию, со всеми выкающими.
- Установите браузер TOR. Он работает на основе так называемой луковой маршрутизации — сервера, через которые идет запрос, при каждом соединении выбираются случайным образом. Это отлично анонимизирует пользователя, делает его данные почти невидимым для поиска. Впрочем, Google давно научился распознавать тех, кто приходит через Tor и часто их банит. Якобы, как спамеров.
Сделайте так, чтобы Google и Яндекс вас забыли
- Выйдите из своего аккаунта в Google (Яндексе) и воспользуйтесь анонимным режимом браузера. Это простые шаги, но они могут не сработать. Дело в том, что данные о ваших предпочтениях хранятся не только в cookies-файлах и в других настройках. Браузер умеет идентифицировать вас через дополнительные параметры (User Agent, IP-адрес, набор установленных расширений). А уже с их помощью предлагать вам подходящие результаты. Кроме того, на смартфоне все это сделать не получится.
- Работайте в другом профиле Google Chrome, а лучше — в другом браузере.
Подмените геолокацию
- Используйте Coogle.com c английским интерфейсом вместо локальной версии поисковой системы.
- Если ничего не изменилось, Включите VPN. Используйте отдельный сервис, либо встроенный VPN из браузера Opera.
- Попробуйте устанавливать разные локации (точки выхода) в вашем VPN. Задайте одинаковые поисковые запросы с разных IP и проанализируйте результат. Если выдача примерно одинакова для разных стран, скорее всего результаты объективны.
Используйте альтернативные поисковые системы
- Попробуйте поиск Bing (альтернативу Google от Microsoft), Startpage, Swisscows, Qwant, как неплохие попытки создания privacy-ориентированных поисковых платформ. Либо воспользуйтесь Brave Search либо You.com — платформой с нелинейной выдачей, где результаты группируются по категориям «новости», «веб», «соцсети» и тому подобное.
Помните, что все эти сервисы пока не очень хорошо работают с запросами на русском языке.
- Используйте, как один из вариантов, анонимную поисковую систему DuckDuckGo. Считается, что она не собирает данные о пользователях — соответственно, выдача будет «чище». Кстати, именно эта поисковая система используется по умолчанию в браузере TOR и
Electronic Frontier Foundation — авторитетная американская правозащитная организация, которая ставит своей целью защиту заложенных в Конституции и Декларации независимости прав для всех пользователей Сети.
EFF сотрудничает с DuckDuckGo для улучшения безопасного просмотра и защиты информации» data-bs-trigger=»focus» data-bs-custom-class=»popover_footnote» data-footnote=»{«content»:»Electronic Frontier Foundation — авторитетная американская правозащитная организация, которая ставит своей целью защиту заложенных в Конституции и Декларации независимости прав для всех пользователей Сети.»,»linkContent»:»EFF сотрудничает с DuckDuckGo для улучшения безопасного просмотра и защиты информации»,»linkUrl»:{«value»:»https://www.eff.org/ru/press/releases/eff-partners-duckduckgo-enhance-secure-browsing-and-protect-user-information-web»,»meta»:{}}}»>рекомендована IFF. - Работайте с прямыми источниками информации, если ваш запрос предусматривает это. Чтобы узнать достоверную статистику по заболеваемости Covid-19 или данные о смертности от оспы — найти с помощью Google сайт Центра по контролю и профилактике заболеваний США (The Centers for Disease Control and Prevention), а уже на самом ресурсе — поискать достоверную информацию. Если интересуют исследования, к примеру, зависимости от смартфонов, лучше обратиться к Google Academy https://scholar.google.com — специальному сервису Google, который ищет по статьям из научных журналов.
Доверие к таким публикациям выше, чем материалы на страницах lifestyle изданий, потому что такие тексты проходят проверку и рецензирование других ученых.
- Воспользуйтесь специализированными поисковыми платформами Science, ResearchGate, Science Direct или PubMed (для медицинской информации) — они вообще не индексируют медийные ресурса, а работают только с проверенными научными источниками.
«Главная ошибка собеса — подгонять ответы». Рекрутеры рассказали о найме в IT
Откуда берутся IT-рекрутеры, с какими трудностями они сталкиваются в попытках закрыть позиции и какие ошибки сами совершают на интервью — полезно знать перед тем, как искать работу.
Нет больше Google
Так? ❤️ Напишите мне спасибо на 👉 @levelsio или проголосуйте за это на Product Hunt
Добавить альтернативу
Google Chrome
⟶
22 909 баллов👍
Firefox
7423 балла
👍
Храбрый
5117 баллов
👍
Сафари
5030 баллов
👍
Вивальди
2678 баллов
👍
Опера
1964 балла
👍
Ungoogled Chromium
0 баллов
👍
Браузер TorПоиск Google
⟶
17 875 баллов👍
Дак Дак вперед
3368 баллов
👍
Начальная страница
3269 баллов
👍
Количество
1564 балла
👍
Экозия
0 баллов
👍
Microsoft BingПароли Google Chrome
⟶
6891 балл👍
KeePass
6440 баллов
👍
BitWarden
5753 балла
👍
1Пароль
4352 балла
👍
ЛастПасс
1241 балл
👍
Dashlane
829 баллов
👍
EnpassGoogle Analytics
⟶
2507 баллов👍
Матомо
686 баллов
👍
Глубина
676 баллов
👍
Простая аналитика
667 баллов
👍
Амплитуда
638 баллов
👍
OpenWebAnalyticsGoogle Mail
⟶
9640 баллов👍
ProtonMail
5 577 баллов
👍
Fastmail
2735 баллов
👍
Тутанота
1067 баллов
👍
Zoho Mail
895 баллов
👍
постео
679 баллов
👍
GMX
490 баллов
👍
Канарская почта
1 балл
👍
Hey. com
0 баллов
👍
Яндекс.ПочтаGoogle Документы
⟶
3729 баллов👍
Понятие
1220 баллов
👍
Медведь Писатель
908 баллов
👍
Зохо
727 баллов
👍
Рабочий процесс
385 баллов
👍
Quip
254 балла
👍
Документы Zoho
0 баллов
👍
LibreOfficeGoogle Таблицы
⟶
1986 баллов👍
Airtable
908 баллов
👍
Зохо
606 баллов
👍
Код
385 баллов
👍
QuipYouTube
⟶
4052 балла👍
Vimeo
2843 балла
👍
PeerTube
1086 баллов
👍
Dailymotion
640 баллов
👍
БитЧут
398 баллов
👍
DTubeКарты Google для веб-сайтов
⟶
1928 баллов👍
Буклет
1445 баллов
👍
Картографический ящик
387 баллов
👍
Карта 🐈
342 балла
👍
NextzenАльтернатива. ..
⟶
0 баллов👍
Погода Google
0 баллов
👍
Пароли Google ChromeGoogle AdWords
⟶
376 баллов👍
BuySellAdsGoogle Authenticator
⟶
4080 баллов👍
Аути
2721 балл
👍
1Пароль
1823 балла
👍
AndOTP
1050 баллов
👍
Аутентификатор LastPass
778 баллов
👍
Дуэт
538 баллов
👍
FreeOTP
192 балла
👍
Dashlane
0 баллов
👍
Aegis AuthenticatorGoogle Blogger
⟶
4098 баллов👍
Вордпресс
2536 баллов
👍
Среда
1733 балла
👍
Призрак
619 баллов
👍
Squarespace
0 баллов
👍
ПодстекGoogle DNS
⟶
5,925 баллов👍
Cloudflare
2306 баллов
👍
OpenDNS 1235 баллов👍
Quad9Google Диск
⟶
5003 балла👍
Nextcloud
4012 баллов
👍
Дропбокс
3042 балла
👍
МЕГА
908 баллов
👍
Зохо
768 баллов
👍
Backblaze
546 баллов
👍
Резервное копирование Arq
487 баллов
👍
Трезорит
434 балла
👍
SpiderOak
0 баллов
👍
pCloudGoogle рейсы
⟶
2380 баллов👍
Skyscanner
499 баллов
👍
Киви
488 баллов
👍
Пропущен
197 баллов
👍
ХипманкGoogle Hangouts
⟶
8 245 баллов👍
Телеграмма
7 290 баллов
👍
Сигнал
3308 баллов
👍
Дискорд
2148 баллов
👍
Slack
1113 баллов
👍
Провод
778 баллов
👍
Масштаб
750 баллов
👍
При этом
68 баллов
👍
Скрытный
0 баллов
👍
МатрицаКартины Google
⟶
3046 баллов👍
Unsplash
1319 баллов
👍
901 балл
👍
500 пикселей
868 баллов
👍
TinEyeКарты Google
⟶
6518 баллов👍
OpenStreetMap
2043 балла
👍
Здесь
0 баллов
👍
Magic EarthGoogle Poly
⟶
273 балла👍
Sketchfab
84 балла
👍
TurboSquidАкадемия Google
⟶
1204 балла👍
arXivGoogle Переводчик
⟶
3471 балл👍
Дипл
1151 балл
👍
WordReference
681 балл
👍
Translate. comПогода Google
⟶
2347 баллов👍
Темное небо
1309 баллов
👍
Погодное подземелье Этот сайт не является коммерческим и не связан с Google или какой-либо из альтернатив, перечисленных здесь.Альтернативы собираются, представляются и голосуются широкой общественностью.
Сторонник EFF. Альтернатива для… Google ChromeПоиск в GoogleПароли в Google ChromeGoogle AnalyticsGoogle MailGoogle ДокументыGoogle ТаблицыYouTubeКарты Google для веб-сайтовАльтернатива для…Google AdWordsGoogle AuthenticatorGoogle BloggerGoogle DNSGoogle DriveGoogle FlightsGoogle HangoutsGoogle ImagesGoogle MapsGoogle PolyGoogle ScholarGoogle TranslateGoogle WeatherДобавить альтернативу
21 отличная поисковая система, которую можно использовать вместо Google
В течение последних 20 лет Google был поисковой системой, которую большинство людей используют для повседневного поиска, изучения продуктов и получения последних новостей. .
С его давним господством и большей долей рынка трудно утверждать, что какая-либо поисковая система дает лучшие результаты, чем Google.
Из-за этого доминирования на рынке Google также является основной поисковой системой, на которую обращают внимание специалисты по поисковой оптимизации и маркетингу.
Однако с момента появления ChatGPT основатели Google, Ларри Пейдж и Сергей Брин, обратили внимание на OpenAI и его потенциал революционизировать поиск.
Несмотря на годы разработки искусственного интеллекта (ИИ), неизвестно, сможет ли Google превзойти своего главного конкурента в США Bing на рынке с помощью чат-бота с искусственным интеллектом.
Даже если Bing — первая крупная поисковая система, выпустившая на рынок ИИ, доминирование поисковой системы Google дает ей огромное преимущество.
Следующие несколько лет в разработке поисковых систем, безусловно, будут интересными.
Что бы ни случилось, все еще есть несколько специализированных поисковых систем, которые предлагают превосходный поиск по сравнению с Google, и стоит знать, что еще есть.
Вот 21 из лучших альтернативных поисковых систем, которые вы можете попробовать.
Поисковая система на основе ИИ
1. You.com
Скриншот с сайта You.com, февраль 2023 г. исследователь и бывший главный научный сотрудник Salesforce.Сайт работает в двух режимах: персональный режим и приватный режим.
В персональном режиме пользователи могут настраивать собственные параметры источника. Находясь в приватном режиме, они получают совершенно неотслеживаемый опыт; данные телеметрии не записываются.
Компания также предлагает YouCode, помощник по кодированию на основе ИИ, и YouWrite, помощник по письму на основе ИИ.
Платформа открытого поиска побуждает разработчиков создавать приложения и вносить свой вклад в более открытый и совместный Интернет.
Поисковая система распределения доходов
2. Yep.com
Скриншот Yep.com, февраль 2023 г.Он предназначен для прямого вознаграждения и вознаграждения создателей контента с использованием бизнес-модели распределения доходов 90/10.
Это означает, что 90% всех доходов от рекламы идут непосредственно создателям контента, позволяя им зарабатывать деньги за свою работу.
Кроме того, эта бизнес-модель позволяет пользователям напрямую поддерживать своих любимых создателей контента и гарантирует справедливое вознаграждение создателей контента.
Поисковая система без авторских прав
3. Openverse
Скриншот с сайта openverse.com, февраль 2023 г.Эта поисковая система идеальна, если вам нужна музыка для видео, изображение для поста в блоге или что-то еще, не беспокоясь о том, что разгневанные художники придут за вами за кражу их работ.
Основные поисковые системы
Основные поисковые системы — это альтернативы Google, которым удалось сохранить скромную долю рынка за последние несколько лет.
Они также могут оказаться в лучшем положении, чтобы впервые за многие годы восстановить утраченную долю рынка, но только , если они разыграют карту ИИ лучше, чем Google.
4. Bing.com
Скриншот Bing, февраль 2023 г.По состоянию на январь 2022 г. сайты Microsoft обрабатывали четверть всех поисковых запросов в США.
Можно утверждать, что Bing превосходит Google в некоторых отношениях.
Во-первых, у Bing есть программа вознаграждений, которая позволяет накапливать баллы во время поиска. Эти баллы можно обменять в магазинах Microsoft и Windows, что является хорошей привилегией.
На мой взгляд, API визуального поиска Bing превосходит своих конкурентов и гораздо более интуитивно понятен.
Bing обеспечивает такой же чистый пользовательский интерфейс для видео, что делает его основным источником для поиска видео без предвзятости YouTube.
Скриншот с сайта Bing.com, февраль 2023 г.7 февраля 2023 г. компания Bing анонсировала совершенно новую версию своей поисковой системы и браузера Edge на базе искусственного интеллекта. Заявленная цель состоит в том, чтобы «обеспечить лучший поиск, более полные ответы, новый опыт чата и возможность создавать контент».
По словам Сатьи Наделлы, председателя правления и исполнительного директора Microsoft, 5 миллиардов поисковых запросов в день остаются без ответа. Bing пытается заполнить эту пустоту.
5. Yahoo.com
Скриншот с сайта Yahoo.com, февраль 2023 г.По состоянию на январь 2022 г. доля Yahoo.com (Verizon Media) на рынке поиска составляла 11,2%.
Сила Yahoo заключается в диверсификации, предлагая такие услуги, как электронная почта, новости, финансы и многое другое в дополнение к поиску.
Yahoo внедряет инновации и развивается уже более двух десятилетий.
20 января он сделал загадочный твит о том, чтобы снова сделать поиск крутым, но не ответил на мою просьбу объяснить, что это значит.
Скриншот из Твиттера, февраль 2023 г.Поисковые системы, ориентированные на конфиденциальность
Конфиденциальность становится все более важным вопросом среди пользователей Интернета.
Поисковые системы, ориентированные на конфиденциальность, отдают приоритет конфиденциальности пользователей, и их привлекательность заключается в том, что они не отслеживают действия пользователей и не собирают личные данные.
Некоторые из самых популярных:
6. DuckDuckGo
Скриншот из DuckDuckGo, февраль 2023 г.DuckDuckGo — это поисковая система, которая также может вписаться в основную категорию, но основная «функция продажи» заключается в том, что она не собирает и не хранит вашу личную информацию. .
Это означает, что вы можете спокойно заниматься своими поисками, не беспокоясь о том, что пугало наблюдает за вами через экран вашего компьютера.
DuckDuckGo — идеальный выбор для тех, кто хочет сохранить конфиденциальность своих привычек просмотра и личной информации.
DuckDuckGo Lite — мобильная версия.
7. Стартовая страница
Стартовая страница содержит ответы от Google.
Это идеальный выбор для тех, кто предпочитает результаты поиска Google, но не хочет, чтобы их история поиска отслеживалась и сохранялась.
Он также включает генератор URL-адресов, прокси-сервис и поддержку HTTPS.
Генератор URL-адресов особенно полезен, поскольку он устраняет необходимость сбора файлов cookie. Вместо этого он запоминает ваши настройки таким образом, чтобы обеспечить конфиденциальность.
8. Swisscows
Скриншот с сайта Swisscows.com, февраль 2023 г.Swisscows — уникальный вариант в этом списке, позиционирующий себя как семантический поисковик для всей семьи.
Он также гордится тем, что уважает конфиденциальность пользователей и никогда не собирает, не хранит и не отслеживает данные.
Используется искусственный интеллект для определения контекста запроса пользователя.
Со временем Swisscows обещает отвечать на ваши вопросы с удивительной точностью.
9. Gibiru
Скриншот с сайта Gibiru.com, февраль 2023 г.Согласно веб-сайту Gibiru, Gibiru предлагает «частный поиск без цензуры» без перенацеливания и продажи личных данных.
Он утверждает, что его результаты поиска получены из модифицированного алгоритма Google, поэтому пользователи могут запрашивать информацию, которую они ищут, не беспокоясь об отслеживании действий Google.
Поскольку Gibiru не устанавливает отслеживающие файлы cookie на ваш компьютер, он претендует на то, чтобы работать быстрее, чем «поисковые системы АНБ (Агентства национальной безопасности)».
Поисковые системы, основанные на знаниях
10. Wiki.com
Скриншот с Wiki.com, февраль 2023 г.Wiki.com извлекает результаты из тысяч вики в сети.
Это идеальная поисковая система для тех, кто ценит информацию от сообщества, которую можно найти на таких сайтах, как Википедия.
11. Twitter
Скриншот из Twitter, февраль 2023 г.Twitter трудно превзойти как поисковую систему в реальном времени.
Это идеальное место для ежеминутных обновлений в случае чрезвычайной ситуации.
В конце концов Google наверстает упущенное, но ничто не сравнится с твитом в запале.
Чтобы извлечь из этого максимальную пользу, ознакомьтесь с нашим руководством по расширенному поиску в Твиттере.
Скриншот из SlideShare, февраль 2023 г.
SlideShare позволяет выполнять поиск задокументированных презентаций в виде слайд-шоу.
Вы также можете искать электронные книги и PDF-файлы, что делает его отличным инструментом, если вам нужно подготовиться к бизнес-презентации.
SlideShare также позволяет сохранять слайды и даже загружать все слайд-шоу для использования на локальном компьютере.
13. Wayback Machine
Скриншот с сайта archive.com, февраль 2023 г.Интернет-архив, также известный как Wayback Machine, отлично подходит для изучения старых веб-сайтов, но это еще не все.
Как следует из названия, эта поисковая система запрашивает огромную коллекцию документированных материалов, включая миллионы бесплатных видео, книг, музыки и программного обеспечения.
По сути, Интернет-архив представляет собой обширную онлайн-библиотеку, в которой вы можете получить доступ практически ко всему, что только можете себе представить.
Браузерный поиск
14. Brave
Скриншот с сайта Brave. com, февраль 2023 г.Brave — веб-браузер, ориентированный на конфиденциальность, который блокирует трекеры и рекламу и по умолчанию обеспечивает приватный поиск и просмотр.
Он предлагает бесплатные видеозвонки, автономные плейлисты и настраиваемую ленту новостей.
Также доступны расширенные функции безопасности, такие как интеграция IPFS, Tor (Onion Routing) и криптокошелек.
Brave предлагает вознаграждение за показ рекламы, защищающей конфиденциальность. Он утверждает, что более 50 миллионов человек используют его браузер для более быстрой и безопасной работы в Интернете.
15. Neeva
Скриншот с сайта Neeva.com, февраль 2023 г.Neeva предлагает расширение для браузера, обеспечивающее конфиденциальность, отсутствие рекламы и настраиваемый интерфейс.
Позволяет пользователям настраивать результаты поиска, выбирая предпочитаемых розничных продавцов и источники новостей, и предоставляет результаты покупок, рекомендованные экспертами.
Neeva даже предоставляет результаты рецептов с фильтрами по времени приготовления, ингредиентам и отзывам.
Neeva заявляет, что никогда не продает и не передает данные пользователей.
Специализированные поисковые системы
Специализированные поисковые системы удовлетворяют определенные потребности, предоставляя результаты на основе определенных критериев. Например:
16. WolframAlpha
Скриншот с сайта WolframAlpha.com, февраль 2023 г.WolframAlpha — это вычислительная машина знаний, позволяющая вычислять ответы на задачи и выполнять поиск в данных экспертного уровня по различным предметам, от алгебры до слова и языкознание.
Он также предлагает функции Pro для отдельных лиц, студентов и преподавателей, которым требуются профессиональные вычисления и анализ импортированных данных.
Цены начинаются с 5,49 долларов США в месяц.
17. searX
Снимок экрана с сайта searX, февраль 2023 г.searX — это бесплатная система метапоиска с открытым исходным кодом, которая предоставляет результаты поиска из нескольких источников, не отслеживая действия пользователя.
Он имеет открытый исходный код и может быть добавлен в строку поиска браузера или установлен в качестве поисковой системы по умолчанию.
Конфиденциальность поддерживается за счет смешивания запросов с поиском на других платформах и никогда не сохранения данных поиска.
Международные поисковые системы
Международные поисковые системы обслуживают определенные регионы и предоставляют результаты на основе местного языка и культуры.
Некоторые популярные международные поисковые системы включают:
18. Baidu
Скриншот Baidu, февраль 2023 г.Baidu — крупнейшая поисковая система в Китае, доля рынка которой составляет 65%.
Как и Google, он предлагает широкий спектр услуг, включая карты, музыку, видео и магазин приложений.
Baidu также имеет мобильный браузер и мобильное приложение.
19. Яндекс
Скриншот Яндекса, февраль 2023 г.Яндексом пользуются более 54% пользователей российского интернета. Он также используется в Беларуси, Казахстане, Турции и Украине.
Яндекс — в целом простая в использовании поисковая система.
В качестве бонуса он предлагает набор довольно крутых инструментов.
В январе 2023 года произошла утечка данных, в результате чего многие размышляли об актуальности того, что было раскрыто.
20. Sogou
Скриншот Sogou, февраль 2023 г.Sogou — китайская поисковая система, популярность которой растет.
Sogou Search — это интерактивная поисковая система, поддерживающая WeChat, поиск статей, поиск и перевод на английский язык и многое другое.
Он гордится тем, что предоставляет пользователям профессиональный, точный и удобный поиск с помощью собственных алгоритмов искусственного интеллекта.
Naver — крупнейшая поисковая система в Южной Корее, предлагающая ряд услуг, включая блоги, новости, музыку и покупки.
Также есть мобильное приложение для поиска на ходу.
Ваш комментарий будет первым