1. Слово «индекс» означает, что речь идёт не про абсолютные величины. Это синтетическая сущность, которая нужна для сравнения. Т. е. сравнительно больше или меньше показатель в отдельном городе относительно другого. Или в тот или иной момент времени. Индекс не предназначен для расчётов всех бомжей на улице.

2. Это интегральный показатель. Это означает, что индекс рассчитывается из нескольких других. Несколько — это может быть много. Точно больше одного. Т. е. из нескольких источников, которые могут дополнять и подтверждать. А могут и не. Но несколько, конечно же, надёжнее одного показателя (например, количества бомжей на улице). Правда, «Яндекс», конечно же, мог бы и более подробно написать, что и как считают — это полезно. Вот тут написано слишком мало.

3. В социологии есть некоторая магия, которая для личностей «с гуманитарным складом ума» может показаться шокирующей. Ну, например, тот же Венедиктов склонен верить опросам «Левады» и ФОМ. А там совершенно точно не считают бомжей. Там, обычно, выборка — 1600 человек. На всю Россию. И ничего — верит. И даже хвастается рейтингами радио «Эхо Москвы» и ничего у него не свербит.

Суть магии довольно проста: если мы из мешка со перемешанным рисом (генеральная совокупность) будем случайно доставать рисинки, тщательно их разглядывать и подсчитывать, то по частоте попадания дикого и белого риса, в какой-то момент, мы сможем сказать, в какой пропорции они там перемешаны. Ну, примерно. Не точно, до числа рисинок, но достаточно, чтоб определить пропорцию. И чем больше достаём — тем точнее будет. В пределе, мы пересчитаем все рисинки, но для приблизительной пропорции нам будет достаточно нескольких сотен измерений.

Так вот, для расчёта «индекса самоизоляции» будет достаточно несколько тысяч раз спросить случайного человека: дома он или попёрся куда. У «Яндекса» такая возможность есть: он просто смотрит на активность в приложениях типа «Навигатор» или «Карты» (как реально сделано, «Я» не раскрывает, а зря).

А поскольку пользователей «Я.Карт» довольно много (миллионы), то, в теории, этим измерениям и расчётам из них можно доверять.

4. Мелкая деталь: индекс самоизоляции вычисляется в баллах — от ноля до 5 с одним десятичным знаком. То есть, шкала «от 0 до 50». Это означает, что точность индекса — плюс/минус 2% (одна пятидесятая = 2%). Что вполне себе соответствует и сильно точнее социологии методом опроса (там, как правило, доверительный интервал в 2,5% с вероятностью в 95%).

ЭРГО: «Яндексу» можно доверять ровно в той же мере, что любому другому исследователю. А математика и часть её теории вероятностей — полезна. Изучай математику — не будь как Венедиктов.

seoded.blogspot.com/2020/05/index-samoizolyacii...

@темы: расширяя кругозор, технологии, яндекс, коронавирус