Центральная предельная теорема: нормализация серий случайных величин

Центральная предельная теорема (ЦПТ) утверждает, что распределение суммы n независимых одинаково распределённых случайных величин с конечными математическим ожиданием μ и дисперсией σ² при n → ∞ сходится к нормальному распределению N(nμ, nσ²). Формально, стандартизованная сумма Z_n = (S_n − nμ) / (σ√n) сходится по распределению к стандартной нормальной величине Z ~ N(0, 1). Это фундаментальное свойство является краеугольным камнем статистического вывода, поскольку позволяет применять параметрические методы анализа к агрегированным данным независимо от исходного распределения отдельных наблюдений. Теорема Линдеберга–Леви обобщает этот результат на случай неодинаково распределённых слагаемых при выполнении условия Линдеберга.

Критический вопрос практического применения ЦПТ связан с определением минимально достаточного объёма выборки n для достижения приемлемой аппроксимации нормальным законом. Эмпирическое правило n ≥ 30 является лишь грубым ориентиром: для асимметричных или тяжелохвостых исходных распределений требуются существенно большие выборки. Мера асимметрии (skewness) и эксцесс (kurtosis) исходного распределения определяют скорость сходимости — чем дальше исходная форма от симметричной унимодальной, тем медленнее работает ЦПТ. Теорема Берри–Эссеена устанавливает верхнюю границу скорости сходимости: sup|P(Z_n ≤ x) − Φ(x)| ≤ C·ρ / (σ³√n), где ρ — третий абсолютный момент.

Скорость сходимости к нормальному распределению имеет прямые последствия для доверительных интервалов и статистических тестов. При недостаточном объёме выборки доверительные интервалы, построенные на основе нормальной аппроксимации, демонстрируют систематическое смещение покрытия: фактическая вероятность покрытия отличается от номинальной. Для корректировки этого эффекта применяются методы бутстрэпа (bootstrap), обеспечивающие непараметрическую оценку распределения статистик без предположения о нормальности. Перестановочные тесты (permutation tests) предоставляют альтернативный подход, полностью свободный от распределительных предположений.

В контексте агрегированного анализа стохастических последовательностей ЦПТ обосновывает применение z-тестов и t-тестов для оценки отклонения наблюдаемых средних от теоретических параметров генератора. При тестировании PRNG суммарный результат N последовательных вызовов нормализуется, и полученная z-статистика сравнивается с критическими значениями стандартного нормального распределения. Отклонение z-статистики за пределы ±2.576 (уровень значимости α = 0.01) свидетельствует о систематическом смещении в работе генератора. Данная методика интегрирована в автоматизированные конвейеры валидации, обеспечивая непрерывный контроль качества псевдослучайных последовательностей на промышленных объёмах данных.

Проверить теоретические выкладки