Как правильно считать среднюю зарплату по больнице
Я часто сталкиваюсь с таким странным заблуждением, что усреднять можно все, что имеет одинаковую размерность. Откуда берется это убеждение не очень понятно, но, видимо, все от того же – от полной профанации школьного математического образования. Так или иначе, а сравнивать средние величины можно только тогда, когда:
- сами средние имеют смысл;
- статистические распределения в усредняемых выборках сопоставимы.
Возьмем простой пример. Есть две больницы. В каждой работает 20 медсестер, 10 врачей и главврач с такими зарплатами (в тысячах грн., числа условны):
Читайте также: Наука: хорошая, плохая, злая. Учимся различать
Ошибка этого расчета в том, что несмотря на то, что все зарплаты измеряются в гривнах, нельзя тупо усреднять зарплаты работников разной квалификации. Т. е. усреднять, конечно, можно, но это не даст вам ровным счетом никакой объективной информации.Средняя зарплата в обеих больницах ~4,5 тыс., но фактически в первой больнице врачи и сестры нищие, а главный в шоколоде, а во второй все более-менее ровно, с плавной справедливой прогрессией в зависимости от квалификации.
Давайте задумаемся, что мы вообще хотим получить анализом зарплат в нескольких разных больницах? Очевидно, мы хотим понять:
- где получают больше на одинаковой должности;
- где распределение оплаты по должностям справедливее;
- где главврач зажрался, а где нет.
Ясно, что на эти вопросы в принципе нельзя ответить одним единственным числом. Значение имеет вся шкала зарплат по должностям, и сравнивать надо одну шкалу в целом с другой аналогичной шкалой. Т. е. сравнивать надо векторные величины. На этом месте у большинства людей возникает "fatal error", поскольку сравнивать векторы ни в школе, ни в университете по-хорошему не учат.
Читайте также: Организация науки: как у нас, как у них и как надо
На самом деле ничего особо сложного для понимания в этом нет. Надо просто вспомнить, что трехкомпонентный вектор можно представить как точку в обычном трехмерном пространстве, а N-компонентный – как точку в N-мерном. Мерять надо расстояние между этими точками и густоту их расположения. Все эти забавные вещи делает кластерный анализ (гугл в помощь).
Например, в случае с больницами кластерный анализ большого их колическтва может показать, что представляющие их точки разделяются на несколько обособленных кластеров (фантазирую для примера):
- тип "несправедливая богадельня" – смешные зарплаты персонала и зажравшийся главврач;
- тип "справедливая богадельня" – смешные зарплаты у всех;
- тип "частная клиника" – хорошие зарплаты у всех, главврач не в обиде, но не пижонит;
- тип "хамская частная клиника" – главврач офигел, но остальных обижает не так, как в богадельне, и т. п.
Вообще кластерный анализ – основа основ для сравнения сложных многокомпонентных систем и явлений, но в школе его вообще не вспоминают, а в университетах если и проходят, то как-то мимо. В итоге все естественники учат его самостоятельно, а гуманитарии вообще понятия о нем не имеют и продолжают радостно усреднять все, что измеряется в одинаковых единицах.
Как все сказанное относится к официальной статистике зарплат в Украине, додумайте сами.
Повідомити про помилку - Виділіть орфографічну помилку мишею і натисніть Ctrl + Enter
Сподобався матеріал? Сміливо поділися
ним в соцмережах через ці кнопки