Сиквел задачи о конфетах (или еще раз о Центральной Предельной Теореме)

Недавно viktorpanasiuk опубликовал задачу о конфетах, которая «зацепила» многих, в том числе и меня. Задача практическая, от инженера-кондитера, формулировалась так: «Найти максимально допустимое отклонение массы конфеты при ее производстве, чтобы нетто коробки, состоящей из n=12 штук их, не выходило за пределы M=310±7 грамм в 90% случаев. Закон распределения считать нормальным».

Автор решил задачу, исходя из предположения о нормальном распределении конфет по массе, и нашел среднюю массу конфеты (очевидно, равную µ=M/n=25.83 г) и стандартное отклонение σ=1.23 г. Использование метода Монте-Карло, т.е. генерация N*n случайных чисел с гауссовым распределением конфет со средним µ и стандартным отклонением σ, подтверждает правильность решения. Распределение масс коробок является гауссовым, и его параметры близки к найденным аналитически (расчеты в Mathcad Express в форматах MCDX и XPS прилагаются). На левом графике показана гистограмма плотности распределения (по массе) конфет, а на правом — соответственно, распределения коробок.

0ff7ef8cc2b5444aa19a09545c56d40f.png

В финале процитированной статьи автор упоминает о немного измененной (на практике, более актуальной) задаче определения границ массы отдельной конфеты, при выходе за которые эту (чересчур большую или маленькую) конфету нужно отбросить, чтобы коробки удовлетворяли исходным условиям (310±7 г в 90% случаев). На мой взгляд, исходная статья уже содержит решение, надо лишь посмотреть на нее немного с другой точки зрения.
Чтобы сделать финальный шаг в рассуждениях, вспомним еще раз центральную предельную теорему (ЦПТ), которую можно интерпретировать так (см., например, Википедию), что сумма n независимых одинаково распределённых случайных величин (с одинаковыми или примерно одинаковыми средним и дисперсией) имеет распределение, близкое к нормальному. Обратите внимание: в условии теоремы предположений о характере распределений исходных случайных величин нет! Статистика конфет, таким образом, может быть любой, а их числа в коробке n=12, как показывает опыт, достаточно, чтобы можно было говорить о нормализации суммарного веса.

Давайте, ради того, чтобы убедиться в нормализации массы коробки, выберем модель равномерного распределения отдельных конфет по массе. Сложив 12 независимых псевдослучайных чисел и повторив этот вычислительный эксперимент N раз, убедимся в том, что гистограмма плотности распределения коробок конфет неплохо описывается нормальным законом (график справа), в то время, как распределение каждой из 12 конфет, действительно, равномерное (левый график):

1630af874d3d4751b98d172a620b9ab1.png

Если подобрать границы отбраковки слишком больших и слишком мелких конфет таким образом, чтобы стандартное отклонение массы конфет составило те же σ=1.23 г, то, согласно ЦПТ, дисперсия коробки (суммы n=12 конфет) составит нужное значение σ2*n.

Это и есть искомый алгоритм. Предположим, у нас есть конфетная машина, которая отрегулирована на среднюю массу конфеты µ. Далее мы можем, контролируя выборочное значение дисперсии конфет, сужать допустимый интервал, вне которого конфета отбраковывается. Независимо от характера распределения, выбор такого интервала, который обеспечит стандартное отклонение массы конфеты σ=1.23, решит поставленную задачу (благодаря нормализации веса коробки, в силу ЦПТ).

© Habrahabr.ru