3.5. О проверке больших массивов случайных чисел.
Так как в расчетах часто используегся не вся таблица, а только часть ее, то имеет смысл проверить также части таблицы. Например, таблицу, содержащую N цифр, разбивают на 5 частей цифр и проверяют каждую из этих частей. Если , то вполне вероятно среди значений соответствующих одному (какому-нибудь) критерию, встретить значение, отвечающее Это не означает, что вся таблица плоха: просто данную часть не надо использовать как самостоятельную таблицу в расчетах, в которых требуется случайных цифр.
Можно проверить, согласуются ли 5 полученных значений с теоретическим распределением для данного критерия. Такая проверка нередко используется в качестве дополнительного теста. И с этой точки зрения ясно, что отдельные «плохие» значения обязаны появляться, если гипотеза справедлива и 5 достаточно велико.
Некоторые авторы предлагают использовать такую проверку таблицы по частям вместо проверки таблицы как целого. К сожалению, это неверная рекомендация. Автору известен пример, когда 500 000 цифр проверялись и как целая таблица и по частям: 20 частей по 25 000 цифр. Все части удовлетворяли всем пяти критериям первого теста (п. 3.2), распределение полученных значений Для каждого из критериев хорошо согласовалось с теоретическим распределением . Однако весь массив из 500 000 цифр не удовлетворял ни одному, из критериев первого теста (причем для одного из критериев было )
Такому несколько неожиданному результату можно дать следующее объяснение. Можно предположить, что рассматриваемая последовательность цифр имеет распределение, несколько отличающееся от равномерного, но для расчета по цифрам такое отличие допустимо. Отсюда не следует, что это отличие по-прежнему будет допустимым для расчета, в котором используются цифр. Наоборот, если увеличение количества цифр вызвано желанием увеличить точность расчета, то ясно, что при достаточно большом N отличие это станет недопустимым
Итак, к большим массивам случайных цифр (или чисел) предъявляются большие требования. Этот факт хорошо известен практикам: подобрать хорошую псевдослучайную последовательность, содержащую чисел, гораздо проще, чем подобрать такую же последовательность, содержащую чисел.
Это следует иметь в виду также при проверке датчиков случайных чисел: нехорошо проверять датчик тестами, охватывающими чисел, а в расчете использовать чисел.