no subject

Возможно, что и так. Если Гугл выдачу строит только по проиндексированным текстам, то у него может не оказаться ни одного подходящего под запрос. Но вот я не вижу по этой выдаче, что они считают слова на русском. Просто насыпали чего попало.

По поводу ресурсов. Нанять десяток или сотню (да хоть тысячу) консультантов с психологических и лингвистических факультетов и придать их командам своих кодеров для улучшения поискового движка и калькулятора слов — нету денег? Не поверю я в такое. Это ничтожные крохи в бюджете Гугла. Мне кажется, просто нет понимания этой проблематики.

Сделать парсер любого естественного языка, умеющий различать грамматические формы и категории даже при ошибочном написании и составить исчерпывающий словарь — это конечная и выполнимая задача. Сделать «умный» парсер, который каталогизирует «по смыслу» слова, могущие быть «ключевыми» — чуть сложнее, допустим. Но вот как-то не видно, что они чем-то таким занимаются. Просто валят всё в одно кучу: подойдёт вопрошающему — хорошо, не подойдёт — да и не очень-то хотелось.

(108 comments)

no subject

Post a comment in response: