leo_sosnine: (Default)
leo_sosnine ([personal profile] leo_sosnine) wrote2018-09-02 11:58 am

Don't be evil, my ass

Выдача 100 первых результатов гугла по запросу "Трамп" для корреспондента ПЖ медиа в США, наиболее часто встречающиеся результаты:



Горячий привет болванам, пользующимся этим говнопоисковиком и вообще читающим МСМ в любом виде. Тащемта довольно удивительно и обнадёживающе, что страна таки нашла в себе какие-то силы проголосовать за Трампа 2 года назад, с учётом такого брэйнвашинга.

Напомню, что в 90-е гугол поднялся на объективном алгоритме ранжирования ссылок, т.н. "пэйдж ранк", который в основном считался в зависимости от кол-ва ссылок, поставленных другими на конкретный сайт, о чём в последнее время читать не приходится, чем отодвинул от корыта старые поисковики типа альтависты.

Разумеется, и теперь возможна аналогичная ситуация, что гуглу, конечно, будет поперёк -- поэтому гуглу необходима поддержка государства, чтобы душить личинки инноваций которые им могли бы угрожать регуляциями, отсюда все эти выкрутасы по помощи демократам в выборах 2016 с отравленной выдачей, с отравленными suggestions, выпиливанием из выдачи и вообще с платформы ютуб-блоггеров и т.п.

Ну и всем известные старые выдачи гугла на запросы типа "американ инвенторс" полные негров или "white family" полные miscegenation.

Полностью хорошей альтернативы гуглу, к сожалению, нет -- приходится метаться между различными поисковиками для различных нужд, но гугла среди этого списка любому человеку интересующемуся тем, как обстоят дела в реальности, иметь не следует.

Ещё дураки те, кто, по соображениям удешевления отказались от своего локального поиска на сайте, отдав это на аутсорсинг гуглу или там йандексу. Централизация неизбежно приводит к тому, что некоторый ресурс становится удобно контролировать из одного места, поэтому всегда находится некая группа, которой реальность выгодно представлять определённым образом, которая на это дело начинает хотеть влиять и преуспевает. Такова человеческая природа и по-другому оно не работает.

Дураки также те, кто в последние 8 лет переезжает в облака, им ещё аукнется это и тяжело, особенно тем, у кого может быть потенциально неполиткорректный контент, но об этом надо написать много, подробно и отдельно.

Радует что параноики типа Рона Унца это, надо полагать, понимают -- поэтому у Унца на его сайте собственный поиск, также, как и всё остальное. Таким образом свобода достигается через независимость от централизованных сервисов.

В идеальной стране подавляющее большинство сервисов должны быть рыхлы и распределены, а также существовать различные "сдержки и противовесы" препятствующие централизации чего бы то ни было, кроме необходимых вещей типа внешней политики.

В прекрасном далёком будущем централизованных поисковиков не будет, будет рыхлый конгломерат локальных независимых сервисов, которые будут аггрегироваться опять же локально -- у каждого игрока свой собственный поисковик. Все остальные в игре будут участвовать только на правах безымянного скота.

У интернета много плюсов, но тёмная его сторона заключается во всеприсутствии, что делает монополизм лёгким, ресурсы монополизируются, централизуются и неизбежно цензурируются.

Габ, кстати, прёт отлично, там щас вроде уже 600,000 юзеров, преимущественно бывшие юзеры твитора, размах фри спича там щас просто ахтунговый -- весь и всяческий сепаратизм и неполиткорректность на любой вкус.

Бритва Хэнлона

[personal profile] malobukov 2018-09-03 04:19 am (UTC)(link)
Не нужно объяснять зловредностью то, что можно объяснить глупостью. Это просто сложная задача, особенно на иностранном (для гугла или DDG) языке.

По-английски первая же ссылка от DDG вполне по теме и на поставленный вопрос отвечает:



Ну и разумеется никакого искусственного интеллекта (в смысле AGI) на данный момент нет и не предвидится. Все поисковые машины просто считают слова.
euthanasepam: Delirium Tremens (Delirium_Tremens)

[personal profile] euthanasepam 2018-09-03 04:22 am (UTC)(link)
Согласен с методологией.

Однако мне даже в голову не приходило, что Гугл до сих пор не умеет считать неанглийские слова. Чем же они там столько лет занимаются?

Умеет

[personal profile] malobukov 2018-09-03 04:30 am (UTC)(link)
Во-первых русских слов в интернете тупо меньше. Если бы было исследование на русском языке на указанную тему, о котором была бы написана популярная статья тоже на русском, обсуждённая на популярных форумах на русском, гугл бы её нашёл. Возможно такого исследования просто нет.

Во-вторых ресурсы гугла по оптимизации поиска ограничены. Они их тратят пропорционально ожидаемой отдаче. Русский язык далеко не на первом месте просто из-за размера рынка.
euthanasepam: Ла-ла-ла-ла! Ла-ла-ла-ла! (Default)

[personal profile] euthanasepam 2018-09-03 04:47 am (UTC)(link)
Возможно, что и так. Если Гугл выдачу строит только по проиндексированным текстам, то у него может не оказаться ни одного подходящего под запрос. Но вот я не вижу по этой выдаче, что они считают слова на русском. Просто насыпали чего попало.

По поводу ресурсов. Нанять десяток или сотню (да хоть тысячу) консультантов с психологических и лингвистических факультетов и придать их командам своих кодеров для улучшения поискового движка и калькулятора слов — нету денег? Не поверю я в такое. Это ничтожные крохи в бюджете Гугла. Мне кажется, просто нет понимания этой проблематики.

Сделать парсер любого естественного языка, умеющий различать грамматические формы и категории даже при ошибочном написании и составить исчерпывающий словарь — это конечная и выполнимая задача. Сделать «умный» парсер, который каталогизирует «по смыслу» слова, могущие быть «ключевыми» — чуть сложнее, допустим. Но вот как-то не видно, что они чем-то таким занимаются. Просто валят всё в одно кучу: подойдёт вопрошающему — хорошо, не подойдёт — да и не очень-то хотелось.
euthanasepam: Bear (Bear)

[personal profile] euthanasepam 2018-09-07 05:05 pm (UTC)(link)
Свежие новости о том, что Гугл делает с урлами — это таки про злонамеренность или про глупость? :)

Какие именно?

[personal profile] malobukov 2018-09-07 06:39 pm (UTC)(link)
А то я не все новости сегодня читал.

Мне всё равно

[personal profile] malobukov 2018-09-07 07:37 pm (UTC)(link)
Я большой разницы не вижу, вопрос считаю чисто косметическим. У моих сайтов доменные имена без www, поэтому вообще ничего не меняется.
euthanasepam: Вата бородата (vata_borodata)

[personal profile] euthanasepam 2018-09-08 04:41 am (UTC)(link)
URL — это не «чисто косметический» вопрос, а один из краеугольных камней Интернета, на который Гугло разинуло свою голодную вонючую пасть.

Впрочем, гражданская позиция «мне всё равно» вполне понятна.

Уточняю

[personal profile] malobukov 2018-09-08 04:15 pm (UTC)(link)
Мне всё равно не потому, что моя хата с краю. А потому что я не вижу принципиальной разницы. Стандарты интернета не нарушаются, браузер посылает такие же запросы и получает такие же ответы. Меняется только то, как он показывает URL пользователю.

При чём никакого злого умысла в показывании URLов таким образом я не вижу. Никто ж не возмущается, если вместо "2018 год" пишут "2018 г.", "2018 г" или вообще "2018", когда по контексту понятно.