Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике 1.5. Подготовка данныхПод подготовкой данных подразумевается процесс получения (сбора) данных об изучаемом явлении. Существует ряд методов получения исходных данных. В некоторых случаях исходные данные содержатся в существующей документации, и тогда задачей исследователя является выявление требуемых данных и организация доступа к ним. В других случаях подготовка данных может включать анкетирование, обзор проблематики или же физическое экспериментирование.
В крупномасштабных моделях, таких, как модели городских (или экономических) систем, требуемые данные обычно можно получить из существующей документации. Источниками данных для таких моделей служат, например, официальные отчеты, статистические сборники, а также материалы правительственных и международных организаций. Все чаще подобные материалы не только появляются в виде бумажных документов, но записываются и на машинные носители информации (например, на магнитную ленту или гибкий диск). Для моделей производственных систем важным источником данных может служить финансовая и техническая документация. Хотя эта документация часто недостаточна при формировании целостной основы для оценки спроса, стоимости продукции и других важных факторов, она тем не менее служит отправной точкой при моделировании. Анкетирование и обзор предметной области также являются одними из возможных методов получения данных при моделировании производственной деятельности. Физическое экспериментирование, как правило, является наиболее дорогостоящим и трудоемким методом получения исходных данных. Оно включает в себя измерение, запись и обработку данных. Особое внимание здесь следует уделять планированию эксперимента, которое позволяет убедиться в представительности условий эксперимента и правильности записываемых данных. В ряде случаев исходных данных может не существовать, при этом сама природа моделируемой системы часто исключает возможность экспериментирования. Примером такой ситуации может служить имитационное моделирование различных вариантов размещения оборудования сборочной линии. Возможным подходом к подготовке данных в таких случаях может быть предварительный синтез данных [2], который предполагает вычисление оценок продолжительности работ с использованием таблиц стандартных исходных данных. Таким образом, этот метод позволяет оценивать продолжительность выполнения работ еще до того, как они будут выполняться в действительности. Группировка данных. Одним из методов преобразования данных к удобному виду является группировка данных по классам (интервалам). Данные затем сводятся в таблицу, содержащую количество попаданий элементов данных в каждый класс. Такая таблица называется частотной и обычно дает хорошее общее представление о данных. Примером частотной таблицы могут служить представленные ниже данные о временах ожидания обслуживания посетителями:
Числа в правом столбце таблицы указывают количество попавших в каждый класс посетителей и называются частотами классов. Числа в левом столбце для каждого класса определяют интервалы значений наблюдаемой величины и называются границами класса. Разница между верхней и нижней границами класса называется размером класса. Классы, не ограниченные сверху или снизу, называются открытыми. Классы, ограниченные с двух сторон, называются закрытыми. Довольно часто первый и (или) последний классы частотной таблицы бывают открытыми. Существует несколько видов частотных таблиц, полезных .для отображения сгруппированных данных. Одним из видов является таблица накопленных частот, получаемая последовательным сложением значений частот. Ниже приводится таблица накопленных частот для данных о времени ожидания обслуживания посетителями:
Числа в правом столбце указывают общее число посетителей, время ожидания у которых оказалось меньше, чем указанная в левом столбце верхняя граница класса. Еще один вид таблиц можно получить, преобразовав частотную таблицу (или таблицу накопленных частот) в таблицу распределения частот путем деления частоты каждого класса (накопленной частоты) на общее число имеющихся в нем элементов данных. Распределения частот полезны, в частности, при сравнении нескольких законов распределений. С целью улучшения отображения данных частоты и накопленные частоты иногда представляются графически. Наиболее общим графическим представлением является гистограмма, которая отображает в виде прямоугольников частоты классов, причем высота прямоугольников пропорциональна частотам. На рис. 1.2 приведена гистограмма времени ожидания обслуживания посетителями.
Особое внимание при построении распределений частот необходимо уделять выбору числа классов и границ интервалов. При этом необходимо, учитывая, конечно, природу данных и цель их использования, следовать некоторым общим рекомендациям: 1. По возможности классы должны иметь одинаковый размер, хотя первый и последний классы при этом могут быть открытыми. 2. Интервалы классов не должны перекрываться. Другими словами, каждый элемент данных должен принадлежать одному и только одному классу. 3. Не следует обычно делать меньше 5 и больше 20 классов.
|
1 |
Оглавление
|