Важно количество бит, которые можно выжать. При идентификации по браузеру, например, разные признаки несут очень разное количество бит. Набор шрифтов важнее часового пояса. И я подозреваю что частоты слов несут мало информации (по сравнению с шумом). Кроме того есть всякий софт, который позволяет прятаться (слегка изменяя текст с использованием словарей синонимов и т.п.)
Ну и наконец никто не мешает выборку искусственно расширять, прикидываясь кем-то другим. Трёхбуквенные агенства или bellingcat так не обмануть, но можно отвертеться от массовой автоматизированной деанонимизации.
no subject
Ну и наконец никто не мешает выборку искусственно расширять, прикидываясь кем-то другим. Трёхбуквенные агенства или bellingcat так не обмануть, но можно отвертеться от массовой автоматизированной деанонимизации.