Порталы:

Биология Война География Информатика Искусство История Культура Лингвистика Математика Медицина Охрана труда Политика Право Психология Религия Техника Физика Философия Экономика

Мы поможем в написании ваших работ!

Лекция 3. Обзор основных математических методов, используемых при анализе информации и принятии решений

Обзор основных математических методов, используемых при анализе информации и принятии решений. Характеристики исходных данных. Методы статистической обработки данных начального уровня.

3.1 Обзор основных групп математических методов, используемых при принятии решений

Методы и подходы, которые могут использоваться для принятия решений были перечислены в лекции 3. Среди них важное значение принадлежит математическим методам. Поэтому в данном пункте дается их краткий обзор.

Отметим, прежде всего, что возможны различные классификации математических методов, используемых при принятии решений. Поэтому классификация, используемая в данной лекции, является одним из возможных вариантов, причем в ней не отражены редко используемые методы.

Математические методы (особенно сложные) применяются обычно лишь "по необходимости". Целый ряд задач не требует применения математических методов, т.к. принимаемое решение является очевидным и без использования математического аппарата. Как пример приведем "действия по инструкции", когда все возможные ситуации и соответствующие им действия исчерпывающе описаны в инструкции.

В качестве групп методов в данной лекции рассматриваются следующие:

- методы исследования операций (сейчас этот термин трактуется достаточно широко);

- основные методы статистического анализа;

- специальные методы статистического анализа.

В последующих лекциях рассматриваются также:

- методы прогнозирования;

- методы экспертного оценивания;

- анализ временных рядов;

- методы математического моделирования (при этом мы имеем в виду преимущественно имитационное моделирование, а не информационное).

Подчеркнем еще раз, что это лишь наиболее часто используемые группы методов.

3.2 Обзор номенклатуры методов исследования операций

В рамках этой группы методов обычно выделяют подгруппы задач, включающие в себя отдельные методы.

(А) Подгруппа задач "математического программирования" включает в себя такие классы задач:

- линейного программирования, в т.ч. "транспортные" задачи, задачи назначения ресурсов и пр.;

- дробно-линейного программирования;

- целочисленного программирования;

- параметрического программирования;

- нелинейного программирования;

- динамического программирования.

(Б) Подгруппа задач "теории игр" включает в себя задачи принятия оптимальных решений в условиях конфликта интересов сторон. Чаще всего рассматриваются "парные игры".

Сюда же принято относить задачи "игр с природой" (теория статистических решений).

(В) Подгруппа задач "оптимизации" в значительной мере пересекается с подгруппой "А". Ранее задачи оптимизации рассматривались как отдельное направление. Следует различать оптимизацию на дискретном множестве точек и оптимизацию в непрерывной области (т.е. случай, когда все параметры изменяются непрерывным образом). Возможны также смешанные варианты – часть параметров изменяется непрерывно, а часть дискретно.

В последнее время в рамках этой подгруппы задач все более активно начинают использоваться методы на основе "генетических алгоритмов". Они эффективны прежде всего для задач большой сложности со значительным количеством параметров, когда обычные методы требуют для своей реализации слишком больших затрат машинного времени. При этом "генетические алгоритмы" позволяют найти решение обычно не самое лучшее, но одно из "хороших".

(Г) Задачи теории "массового обслуживания".

(Д) Задачи управления запасами.

(Е) Задачи распределения ресурсов на графах и сетях.

(Ж) Задачи "теории рисков" и "управления рисками".

(З) Задачи "теории расписаний".

Большинство перечисленных групп задач допускают как детерминированные постановки, так и стохастические (для задач "массового обслуживания" преобладают стохастические постановки).

В силу ограниченного объема курса мы будем рассматривать только важнейшие из этих подгрупп методов. По остальным подробную информацию можно найти в литературе для данного модуля.

3.3 Характеристики исходных данных для анализа

Понятие "статистического распределения" тесно связано с понятием "ряда значений", которое мы рассмотрим подробнее.

В зависимости от того, какой признак, положен в основу образования ряда распределения, в литературе принято различать следующие виды рядов:

• атрибутивные — построенные по качественным признакам, т. е. не имеющим количественного выражения;

• вариационные — построенные на основе количественных значений признаков.

Могут анализироваться как одиночные (автономные) ряды, так и взаимосвязанные.

В простейшем случае мы имеем просто числовой ряд, состоящий из чисел (обычно не упорядоченных по возрастанию или убыванию).

Однако если в этом ряду значения повторяются, то информацию можно представить в виде двух "векторов значений":

- вариантов (числовых значений количественного признака);

- частот (чисел, показывающих, как часто встречаются те или иные варианты в ряду – это могут быть как абсолютные частоты встречаемости, так и относительные).

Принято различать:

- ряды, в которых возможен только дискретный (прерывистый) ряд значений (причем разницы между соседними значениями не обязательно являются постоянными);

- ряды, в которых значения параметров могут изменяться непрерывно.

На практике "непрерывность" значений может ограничиваться:

- некоторыми факторами естественного характера, связанными с самими объектами;

- максимальным количеством значащих цифр, используемых для записи чисел.

Кроме того, обычно существует некоторый диапазон (имеющий нижнюю и верхнюю границы), в котором могут изменяться значения параметра.

Для рядов дискретных значений определение их относительных частот встречаемости осуществляется в виде отношений "количества раз встречаемости" по каждому варианту дискретного значения к общему количеству значений параметра (результат обычно выражается в процентах).

При этом получившееся распределение (по частотам встречаемости) целесообразно в графической форме отразить в виде:

- либо столбчатой диаграммы;

- либо графика.

Преимущество графика может быть в том, что он допускает "неравно отстоящие дискретные значения", а диаграммы (гистограммы) ориентированы на равноотстоящие значения.

Для непрерывных рядов обычно, используется разделение всего возможного диапазона значений параметра на поддиапазоны. Затем подсчитываются частоты попадания параметра в отдельные поддиапазоны. В качестве характеристического значения для поддиапазона берется его середина (среднее значение между левым и правым краем поддиапазона). Чаще всего используются поддиапазоны равной ширины, т.е. с одинаковой разницей между правым и левым краем поддиапазона (максимальным и минимальным значением параметра для поддиапазона).

Таким образом, переход к "интервальной статистике" может (с определенными оговорками) рассматриваться как переход от непрерывного ряда значений параметра к дискретному.

Для сравнения "заполненности" интервалов рассчитывается показатель "плотность распределения" - число единиц совокупности (т.е. элементов числового ряда), приходящееся на одну единицу ширины интервала поддиапазона (соотнесение с шириной интервала существенно для интервалов неравной ширины).

Отражение таких распределений в наглядной форме позволяет улучшить восприятие результатов при анализе и, тем самым, облегчить принятие решений.

3.4 Простейшие методы статистической обработки данных

Методы статистического анализа – очень обширное направление анализа данных. По нему имеются многочисленные учебники, справочные руководства и мощные статистические пакеты для использования на компьютерах. Некоторые книги по статистическому анализу даны в списке литературы к модулю.

Отметим также, что в MsExcel также встроены определенные возможности статистического анализа. При этом в отличие от специальных статистических пакетов программа MsExcel распространена значительно шире.

Базовые методы статистического анализа данных включают в себя:

- вычисление средних значений для выборок;

- определение показателей вариации в числовых рядах;

- реже – определение показателей асимметрии и эксцесса для числовых рядов;

- определение соответствия фактических распределений значений различным статистическим распределениям (в т.ч. имеется в виду и подбор наиболее подходящих видов распределений для имеющихся экспериментальных данных);

- определение наличия или отсутствия достоверных различий между двумя выборками (для выборок с попарно связанными и попарно не связанными вариантами).

К статистическим методам начального уровня относятся также методы типа "разведочного анализа", позволяющие за счет наглядного представления информации решать некоторые вопросы оценки целесообразности использования в дальнейшем различных направлений статистического анализа.

Для наглядного представления данных могут использоваться стандартные средства программ типа "электронных таблиц", специализированных пакетов для статистического анализа данных, а также программ, специально предназначенных для наглядного отображения информации (например, Microcal Origin). Некоторые возможности этих методов Вам будет необходимо изучить в рамках лабораторной работы к данному модулю.

Большой класс статистических методов составляют методы непараметрического анализа (непараметрическая статистика), которые подробно обсуждаются в специальной литературе. Сама граница этих методов (между ними и параметрическими) в литературе может "проводиться" несколько по- разному.

Особенно широко эти методы применяются в психологических исследованиях.

Перечислим некоторые методы и их назначение.

А) Метод использующий критерий хи-квадрат. Предназначен для оценки различия двух выборок по форме распределения их значений, представленных в виде гистограмм.

Б) Критерий различия сдвига (положения). Этот метод нацелен на проверку следующих гипотез:

- отсутствие различий во взаимном положении (медианах) двух независимых совокупностей, например наблюдений одних объектов "без обработки" и других объектов после обработки с анализом систематического сдвига значений второй выборки как результата обработки;

- сдвиг выборок друг относительно друга равен значению d.

В) Критерии различия масштаба (рассеяния). Назначение – проверка гипотезы о:

- отсутствии различий в "масштабах" ( вразбросе или рассеянии значений) двух выборок из независимых совокупностей;

- наличии отношения масштабов выборок величиной g.

Г) Критерии интегральных различий.

Предназначены для обнаружения всех возможных отклонений от гипотезы об идентичности двух совокупностей.

Д) Анализ таблиц сопряженности признаков.

Назначение – Для анализа двумерных таблиц сопряженности или кросс таблиц двух переменных с проверкой гипотезы о независимости переменных.

В этой группе методов могут использоваться различные коэффициенты.

Подробнее с этими методами можно ознакомиться с использованием литературы, рекомендованной для изучения данного модуля. Однако считается, что непараметрические методы обладают меньшей "информативностью " чем параметрические методы.

Поэтому, а также в силу ограниченности объема курса, мы не будем эти методы далее подробно рассматривать.

<== предыдущая страница	\|	следующая страница ==>
Условия эффективности решений	\|	Лекция 4. Обзор важнейших методов статистического анализа

Дата добавления: 2015-07-26; просмотров: 115; Нарушение авторских прав

Мы поможем в написании ваших работ!

lektsiopedia.org - Лекциопедия - 2013 год. | Страница сгенерирована за: 0.004 сек.