euthanasepam: Ла-ла-ла-ла! Ла-ла-ла-ла! (Default)
Кабінет психопатологічної евтаназіології ([personal profile] euthanasepam) wrote in [personal profile] leo_sosnine 2018-09-03 04:47 am (UTC)

Возможно, что и так. Если Гугл выдачу строит только по проиндексированным текстам, то у него может не оказаться ни одного подходящего под запрос. Но вот я не вижу по этой выдаче, что они считают слова на русском. Просто насыпали чего попало.

По поводу ресурсов. Нанять десяток или сотню (да хоть тысячу) консультантов с психологических и лингвистических факультетов и придать их командам своих кодеров для улучшения поискового движка и калькулятора слов — нету денег? Не поверю я в такое. Это ничтожные крохи в бюджете Гугла. Мне кажется, просто нет понимания этой проблематики.

Сделать парсер любого естественного языка, умеющий различать грамматические формы и категории даже при ошибочном написании и составить исчерпывающий словарь — это конечная и выполнимая задача. Сделать «умный» парсер, который каталогизирует «по смыслу» слова, могущие быть «ключевыми» — чуть сложнее, допустим. Но вот как-то не видно, что они чем-то таким занимаются. Просто валят всё в одно кучу: подойдёт вопрошающему — хорошо, не подойдёт — да и не очень-то хотелось.

Post a comment in response:

If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting