leo_sosnine: (Default)
[personal profile] leo_sosnine
Выдача 100 первых результатов гугла по запросу "Трамп" для корреспондента ПЖ медиа в США, наиболее часто встречающиеся результаты:



Горячий привет болванам, пользующимся этим говнопоисковиком и вообще читающим МСМ в любом виде. Тащемта довольно удивительно и обнадёживающе, что страна таки нашла в себе какие-то силы проголосовать за Трампа 2 года назад, с учётом такого брэйнвашинга.

Напомню, что в 90-е гугол поднялся на объективном алгоритме ранжирования ссылок, т.н. "пэйдж ранк", который в основном считался в зависимости от кол-ва ссылок, поставленных другими на конкретный сайт, о чём в последнее время читать не приходится, чем отодвинул от корыта старые поисковики типа альтависты.

Разумеется, и теперь возможна аналогичная ситуация, что гуглу, конечно, будет поперёк -- поэтому гуглу необходима поддержка государства, чтобы душить личинки инноваций которые им могли бы угрожать регуляциями, отсюда все эти выкрутасы по помощи демократам в выборах 2016 с отравленной выдачей, с отравленными suggestions, выпиливанием из выдачи и вообще с платформы ютуб-блоггеров и т.п.

Ну и всем известные старые выдачи гугла на запросы типа "американ инвенторс" полные негров или "white family" полные miscegenation.

Полностью хорошей альтернативы гуглу, к сожалению, нет -- приходится метаться между различными поисковиками для различных нужд, но гугла среди этого списка любому человеку интересующемуся тем, как обстоят дела в реальности, иметь не следует.

Ещё дураки те, кто, по соображениям удешевления отказались от своего локального поиска на сайте, отдав это на аутсорсинг гуглу или там йандексу. Централизация неизбежно приводит к тому, что некоторый ресурс становится удобно контролировать из одного места, поэтому всегда находится некая группа, которой реальность выгодно представлять определённым образом, которая на это дело начинает хотеть влиять и преуспевает. Такова человеческая природа и по-другому оно не работает.

Дураки также те, кто в последние 8 лет переезжает в облака, им ещё аукнется это и тяжело, особенно тем, у кого может быть потенциально неполиткорректный контент, но об этом надо написать много, подробно и отдельно.

Радует что параноики типа Рона Унца это, надо полагать, понимают -- поэтому у Унца на его сайте собственный поиск, также, как и всё остальное. Таким образом свобода достигается через независимость от централизованных сервисов.

В идеальной стране подавляющее большинство сервисов должны быть рыхлы и распределены, а также существовать различные "сдержки и противовесы" препятствующие централизации чего бы то ни было, кроме необходимых вещей типа внешней политики.

В прекрасном далёком будущем централизованных поисковиков не будет, будет рыхлый конгломерат локальных независимых сервисов, которые будут аггрегироваться опять же локально -- у каждого игрока свой собственный поисковик. Все остальные в игре будут участвовать только на правах безымянного скота.

У интернета много плюсов, но тёмная его сторона заключается во всеприсутствии, что делает монополизм лёгким, ресурсы монополизируются, централизуются и неизбежно цензурируются.

Габ, кстати, прёт отлично, там щас вроде уже 600,000 юзеров, преимущественно бывшие юзеры твитора, размах фри спича там щас просто ахтунговый -- весь и всяческий сепаратизм и неполиткорректность на любой вкус.

Re: Это не гугл

Date: 2018-09-03 04:07 am (UTC)
euthanasepam: Ла-ла-ла-ла! Ла-ла-ла-ла! (Default)
From: [personal profile] euthanasepam
Не устраивает меня то, что вместо релевантного поиска нам подсовывают всякую чушь, разбавленную рекламой и шпионским кодом.

Обыденная логика и самовосхваления Гугла создают впечатление, что достаточно несложно из такого запроса, как я написал, сделать калькуляцию подходящих к выдаче вариантов. Например, слово «сколько» не оставляет сомнений в том, что человек ищет именно количество чего-то. А слово «ежегодно» исчерпывающе ограничивает временны́е рамки поиска. Слово «женщин» безусловно сужает круг поиска до собственно женщин, а слово «беременных» предельно конкретизирует состояние этих женщин. А слово «армия» ещё и указывает «место», где искать. Ну и где же релевантная выдача? Нету. Я не хочу писать какие-то обидные слова в адрес работников Гугла, я надеюсь, что там есть люди с IQ повыше, чем у деревенского дурачка. Значит, причина абсурдных ответов на несложные запросы лежит в плоскости интересов Гугла, не относящихся к нашим интересам. Они там вроде кричат на каждом углу про бигдату и искусственный интеллект? И где это, хотел бы я знать? Пока что я совершенно ясно и отчетливо вижу, что Гугл меня обманывает и пытается использовать.

Бритва Хэнлона

Date: 2018-09-03 04:19 am (UTC)
From: [personal profile] malobukov
Не нужно объяснять зловредностью то, что можно объяснить глупостью. Это просто сложная задача, особенно на иностранном (для гугла или DDG) языке.

По-английски первая же ссылка от DDG вполне по теме и на поставленный вопрос отвечает:



Ну и разумеется никакого искусственного интеллекта (в смысле AGI) на данный момент нет и не предвидится. Все поисковые машины просто считают слова.

Date: 2018-09-03 04:22 am (UTC)
euthanasepam: Delirium Tremens (Delirium_Tremens)
From: [personal profile] euthanasepam
Согласен с методологией.

Однако мне даже в голову не приходило, что Гугл до сих пор не умеет считать неанглийские слова. Чем же они там столько лет занимаются?

Умеет

Date: 2018-09-03 04:30 am (UTC)
From: [personal profile] malobukov
Во-первых русских слов в интернете тупо меньше. Если бы было исследование на русском языке на указанную тему, о котором была бы написана популярная статья тоже на русском, обсуждённая на популярных форумах на русском, гугл бы её нашёл. Возможно такого исследования просто нет.

Во-вторых ресурсы гугла по оптимизации поиска ограничены. Они их тратят пропорционально ожидаемой отдаче. Русский язык далеко не на первом месте просто из-за размера рынка.

Date: 2018-09-03 04:47 am (UTC)
euthanasepam: Ла-ла-ла-ла! Ла-ла-ла-ла! (Default)
From: [personal profile] euthanasepam
Возможно, что и так. Если Гугл выдачу строит только по проиндексированным текстам, то у него может не оказаться ни одного подходящего под запрос. Но вот я не вижу по этой выдаче, что они считают слова на русском. Просто насыпали чего попало.

По поводу ресурсов. Нанять десяток или сотню (да хоть тысячу) консультантов с психологических и лингвистических факультетов и придать их командам своих кодеров для улучшения поискового движка и калькулятора слов — нету денег? Не поверю я в такое. Это ничтожные крохи в бюджете Гугла. Мне кажется, просто нет понимания этой проблематики.

Сделать парсер любого естественного языка, умеющий различать грамматические формы и категории даже при ошибочном написании и составить исчерпывающий словарь — это конечная и выполнимая задача. Сделать «умный» парсер, который каталогизирует «по смыслу» слова, могущие быть «ключевыми» — чуть сложнее, допустим. Но вот как-то не видно, что они чем-то таким занимаются. Просто валят всё в одно кучу: подойдёт вопрошающему — хорошо, не подойдёт — да и не очень-то хотелось.

Date: 2018-09-07 05:05 pm (UTC)
euthanasepam: Bear (Bear)
From: [personal profile] euthanasepam
Свежие новости о том, что Гугл делает с урлами — это таки про злонамеренность или про глупость? :)

Какие именно?

Date: 2018-09-07 06:39 pm (UTC)
From: [personal profile] malobukov
А то я не все новости сегодня читал.

Мне всё равно

Date: 2018-09-07 07:37 pm (UTC)
From: [personal profile] malobukov
Я большой разницы не вижу, вопрос считаю чисто косметическим. У моих сайтов доменные имена без www, поэтому вообще ничего не меняется.

Date: 2018-09-08 04:41 am (UTC)
euthanasepam: Вата бородата (vata_borodata)
From: [personal profile] euthanasepam
URL — это не «чисто косметический» вопрос, а один из краеугольных камней Интернета, на который Гугло разинуло свою голодную вонючую пасть.

Впрочем, гражданская позиция «мне всё равно» вполне понятна.

Уточняю

Date: 2018-09-08 04:15 pm (UTC)
From: [personal profile] malobukov
Мне всё равно не потому, что моя хата с краю. А потому что я не вижу принципиальной разницы. Стандарты интернета не нарушаются, браузер посылает такие же запросы и получает такие же ответы. Меняется только то, как он показывает URL пользователю.

При чём никакого злого умысла в показывании URLов таким образом я не вижу. Никто ж не возмущается, если вместо "2018 год" пишут "2018 г.", "2018 г" или вообще "2018", когда по контексту понятно.
Page generated Jun. 19th, 2025 10:55 pm
Powered by Dreamwidth Studios