Озадачивающая математика неопределенности (Часть 5)

Почти каждый, кто начинает заниматься построением финансовых моделей и моделированием рисков, допускает ошибки, когда они включают в свои модели деление. Обычно это используется при расчете КПЭ. Это очень запутанно и интуитивно не понятно с самого начала. Рекомендуется избегать использование деления в моделях.

Разберем данный кейс с использованием предыдущего примера про магазин. Как мы выяснили ранее, общий доход магазина соответствует Normal (12000, 71) распределению. Допустим у нас есть эти данные и мы хотим выяснить сколько при этом тратит каждый покупатель.

Мы могли бы выразить это так:

Normal (12000, 71) / 600

Это средняя сумма, которую тратит каждый человек в магазине и это фактическая сумма если все посетители тратили одинаково. Данный расчет не делает разницы между 2 вариантами интерпретации. Однако, если каждый клиент тратит сумму, которая отличается и не зависит от других клиентов, нет никакого способа пересчитать распределение отдельных расходов (которое было Uniform (15,25)). С помощью приведенной выше информации мы не можем знать, каково распределение суммы, потраченной отдельными клиентами, но оказывается, что мы можем указать среднее значение и стандартное отклонение, если все они независимо принимают решения о покупке.

Есть и еще один не самый простой способ выполнить интересующую нас оценку. Если вы изучали математику, то рано или поздно должны были наткнуться на логорифмы. Представьте, что у нас есть две неопределенные переменные, X и Y, и что Z = X / Y. Уравнение можно записать в логорифмах следующим образом:

Log Z = Log X – Log Y

Если X и Y являются случайными переменными, Log X и Log Y также являются случайными переменными, и мы уже выяснили выше, что не можем вычесть одну из другой, поэтому деление одной независимо моделируемой случайной переменной на другую также, весьма вероятно, будет ошибочным действием.

Есть много проявлений этой проблемы. Например, всякий раз, когда слово «средний» встречается в вашем анализе (средняя стоимость за единицу, среднее время обслуживания клиента, средняя цена за сырье), появляется неявный знаменатель. Распределение и форма распределения среднего значения очень сильно зависит от числа значений, по которым мы усредняем. Та же проблема возникает, когда у нас есть данные, которые мы хотим использовать отражающие средние значения, а не набор отдельных наблюдений. Правильный анализ и использование таких данных требует хорошего знания вероятностей и статистики.

СКАЧАТЬ: https://risk-academy.ru/download/david-vose-4-mistakes-in-modelling/