Студопедия

Мы поможем в написании ваших работ!




Дисперсионного анализов

 

При проведении экспериментов по исследованию различных технических систем (процессов и устройств) и обработке их результатов часто применяют статистические методы, в которых используют стохастические или корреляционные взаимосвязи между параметрами и факторами. Получить, например, математическую модель какого-либо процесса – значит найти математическое описание этих взаимосвязей.

Обычно в задачу корреляционного, регрес­сионного и дисперсионного анализов входит получение на основании экспериментальных данных математической модели процесса и ее исследование.

Методы корреляционного и регрессионного анализа применимы только для таких параметров, которые при изучении физической природы объекта являются взаимосвязанными.

На первом этапе обычно оценивают степень тесноты взаимосвязи значений функции отклика с одной или несколькими независимыми переменными. В первом случае используется коэффициент парной корреляции , во втором – коэффициент множественной корреляции .

Коэффициент парной корреляции

,

где – объем выборки; и – средние арифметические значения и в рассматриваемой выборке; , – их средние квадратические отклонения.

Коэффициент множественной корреляции с исполь­зованием метода определителей находится по формуле

,

где – число независимых переменных; – определитель, составленный из всех коэффициентов парной корреляции; – определитель, получающийся из исключением левого столбца и верхней строки.

;

 

Значения и находятся в пределах от -1 до +1. Если они достоверны, т.е. существенно отличаются от 0, значит между исследуемыми факторами имеется линейная корреляционная зависимость. В противном случае эта зависимость отсутствует либо является существенно нелинейной. В результате корреляционным анализом подтверждается наличие взаимосвязей между исследуемыми факторами.

На следующем этапе обработки экспериментальных данных с помощью регрессионного анализа выбирают модель, в наилучшей степени описывающую указанные взаимосвязи. Уравнение, по которому могут быть найдены числовые значения выборочных средних функций отклика при соответствующих значениях независимых переменных, называется уравнением регрессии. В общем случае оно может быть записано в виде

.

Одним из универсальных способов получения регрессионных моделей при сглаживании экспериментальных данных является метод наименьших квадратов. За критерий оптимальности модели при этом принимается минимум суммы квадратов отклонений экспериментальных значений функции от предсказанных по уравнению регрессии:

,

где – экспериментальное значение функции при -м значении аргумента; – значение функции, предсказанное уравнением регрессии при том же значении аргумента.

Нетрудно видеть, что выражение под знаком суммы представляет собой площадь квадрата со стороной .

При построении регрессии в виде прямой линии выражение принимает вид:

.

Здесь -е значение функции , предсказанное уравнением регрессии первого порядка; , – коэффициенты регрессии.

Коэффициенты регрессии находятся путем решения системы линейных уравнений:

.

Ее решение дает возможность рассчитать и по экспериментальным данным:

.

.

В технике часто требуется построить модель в виде . Для этого ее путем логарифмирования приводят к виду

.

Для получения искомых величин и в формулы и вместо истинных значений и подставляют их логарифмы. В ГОСТ 27.202-83 приводится ряд формул для определения коэффициентов других распространенных зависимостей.

При аппроксимации неизвестных функций отклика в математической статистике часто используют полиномиальные модели, а наиболее часто – простейшие из них – квадратичные.

где , , , – коэффициенты регрессии.

С позиций статистики полиномиальная модель удобна тем, что позволяет увеличить степень точности аппроксимации путем повышения порядка полинома.

При определении параметров уравнения регрессии все переменные и соотношения между ними выгодно выражать в стандартизированном масштабе. Значения переменных в стандартизированном масштабе определяются по формуле

,

где – значения переменных в натуральном масштабе; – их среднеквадратичные отклонения от среднеарифме­тического значения .

Статистическое уравнение адекватно описывает результаты опытов, если квадратическое отклонение от экспериментальных данных значений зависимой переменной , рассчитанной по уравнению регрессии, обусловлено только ошибкой воспроизведения (т.е. случайным характером этого параметра).

Применение корреляционного и регрессионного анализа правомерно и эффективно при соблюдении ряда условий:

1. Параметр оптимизации – случайная величина с нормальным законом распределения.

2. Дисперсия не зависит от абсолютных значений величины и остается постоянной и однородной при различных наблюдениях .

3. Значения независимых переменных , ,…, изменяются с пренебрежимо малыми ошибками по сравнению с ошибкой в определении .

4. Переменные , ,…, линейно независимы.

5. Процесс изменения зависимой переменной является стационарным и случайным.

6. Экспериментальные данные получены из ряда независимых испытаний и образуют случайную выборку из данной генеральной совокупности.

Рассмотрим проверку выполнения этих условий.

1. Соответствие нормальному закону распределения устанавливается либо по большим выборкам с помощью критериев Пирсона или Колмогорова, либо на основании анализа природы величины .

2. Для оценки однородности дисперсии проводят параллельные опыты в различных точках матрицы плана.

Однородность ряда дисперсий при одинаковом числе опытов (для определения каждой из них) оценивают с помощью критерия Кохрена – отношения максимальной дисперсии к сумме всех дисперсий ряда.

3. Воспроизводимость опытов и однородность дисперсий достигается, когда выявлены и устранены источники нестабильности эксперимента, а также с помощью более точных средств и методов измерений.

Достаточную точность измерения значений независимых переменных можно проверить, сопоставив ее с диапазоном изменения последних. Считается, что ошибки определения независимых переменных не должны превышать 5…7% интервала их варьирования. Ошибки в определении значений зависимой переменной не влияют столь значительно на точность регрессионного анализа и могут составить до 30% интервала варьирования.

4. Отсутствие коррелированности независимых переменных проверяется расчетом парных коэффициентов корреляции между ними.

5. Случайные процессы называют стационарными в том случае, когда основные характеристики процесса (математическое ожидание, дисперсия и др.) постоянны или однородны во времени. Поскольку при пассивном эксперименте свойства процесса определяются по одной представительной выборке, распространять полученные результаты на весь процесс можно лишь при условии его стационарности.

Поскольку результаты корреляционно-регрессионного анализа, полученные на базе ограниченного числа экспериментальных данных, являются случайными величинами, необходимо оценить их достоверность, определить доверительные интервалы, в которых находятся их истинные значения.

Для этого производится комплекс операций:

1. Оценка достоверностикоэффициентов корреляции.

2. Оценка значимости коэффициентов регрессии.

3. Оценка адекватности уравнения регрессии.

4.2. Пассивный и активный эксперимент, их место и роль в машиностроении. Основные принципы планирования эксперимента.

Приступая к построению статистической модели, экспериментатор обычно имеет начальные представления о том, как влияют изучаемые факторы на выходные параметры.

При выборе вида модели обычно отвечают на вопрос, допустимо ли представлять функцию отклика линейной или заведомо известно, что зависимости являются немонотонными или сильно нелинейными. В области, где функция отклика имеет экстремум, предположение о линейном характере модели скорее всего не будет подтверждено. Если в дальнейшем потребуется, могут быть проведены дополнительные опыты по уточнению вида модели. При этом результаты первой серии опытов не пропадают и используются в полной мере для построения нелинейной модели.

При планировании экспериментов исходный этап включает определение основного уровня факторов ( =0) и выбор интервалов варьирования с учетом области действия разрабатываемой модели, предполагаемого характера поверхности отклика и вероятной погрешности определения параметров , а также точности фиксирования принятых уровней факторов. Чем больше погрешность опытов и ниже точность поддержания факторов, тем шире должны быть приняты их интервалы варьирования.

4.3.Ортогональное планирование первого порядка

Рассмотрим основные виды линейных и нелинейных статистических моделей 1. При разработке линейной модели ограничиваются обычно варьированием факторов на двух уровнях. Для проведения полного факторного эксперимента (ПФЭ) при факторах необходимо осуществить – опытов со всевозможными сочетаниями двух ( и ) уровней факторов (табл.).

Матрица планирования ПФЭ 23 получается повторением матрицы ПФЭ 22 для факторов и при и (табл. ).

 

Матрица планирования ПФЭ 22
№ опыта Факторы
+ +
+
+
Матрица планирования ПФЭ 23
№ опыта Факторы
+ + +
+ +
+ +
+
+ +
+
+
         

Аналогичным образом могут быть построены матрицы планирования с большим числом факторов, однако при этом число опытов быстро растет и при становится весьма значительным. При этом количество опытов ( ) намного превышает число неизвестных коэффициентов регрессии ( ) линейной модели.

Для построения модели с тремя факторами необходимо определить четыре коэффициента (b0, b1, b2, b3), поэтому достаточно всего четырех опытов и можно воспользоваться дробным факторным эксперимен­том (ДФЭ) –- половиной ПФЭ 23, называемой полурепликой 23-1 . Для этого надо выбрать из опытов матрицы ПФЭ 23 (табл.) такие, в которых бы факторы , , равномерно принимали все возможные значения. Если

 

 

Матрица планирования ДФЭ 23-1 ( )
№ опыта Факторы
+ +
+ +
+ +

воспользоваться гене­рирующим соотношением, (или ), то можно получить две антисимметричные экономные матрицы ДФЭ, одинаково пригодные для построения модели (табл.).

Аналогичным образом могут быть построены полуреплики, четверть реплики и реплики более высокой дробности ПФЭ , что дает существенную экономию количества опытов.

Так, для ПФЭ требует проведения опытов. Однако для определения семи коэффициентов линейного уравнения регрессии задачу можно решать, проведя всего 8 опытов, воспользовавшись ДФЭ , в котором реплика дробности 1/8. Рекомендуемыми генерирующими соотношениями при этом могут быть , , или др.

 

Матрица планирования ДФЭ 24-1 ( )
№ опыта Факторы Взаимодейству-ющие факторы
+ + + + + + + +
+ + + +
+ + + +
+ + + +
+ + + +
+ + + +
+ + + +
+ + + +
+
+
+

При построении нелинейной модели, учитывающей, кроме линейных членов, также некоторые взаи­модействия ( ), в матрицу вводят допол­нительные столбцы, содержащие соответст­вующие произведения факторов (табл.), и увеличивают число опытов.

Так, планируя выявить эффекты взаимодействия факторов , , и , при можно воспользоваться восемью опытами, если для построения матрицы экспериментов воспользоваться генерирующим соотношением, например (табл. 3.4). Это позволяет найти четыре коэффициента для линейных членов (b1, b2, b3, b4,), свободный член (b0) и три эффекта взаимодействия (b12, b24, b23).

Условия проведения опытов задают значения факторов в столбцах , , , . Столбец заполнен знаками «+», а столбцы , , образованы как произведения соответствующих столбцов и применяются при последующем вычислении коэффициентов регрессии.

Матрицы планирования экспериментов формируются таким образом, чтобы выполнить обеспечивающие простоту вычисления и оптимальные оценки коэффициентов модели требования:

1. Нормировки – сумма квадратов элементов каждого столбца равна числу элементов

.

2. Симметрии – сумма элементов каждого столбца равна нулю

.

3. Ортогональности – сумма произведений элементов каждой пары столбцов равна нулю

; .

При выполнении этих требований все коэффициенты регрессии определяются независимо друг от друга с одинаковой погрешностью по результатам всех опытов.

 

Вопросы для самопроверки.

1. В чем отличие корреляционного, регрессионного и дисперсионного анализов?

2. Поясните сущность сглаживания экспериментальных данных методом наименьших квадратов.

3. Как оценивается достоверность результатов анализа?

4. Каким условиям должен отвечать исследуемый параметр при реализации планируемого эксперимента?

5. Общие правила выбора параметров статистической модели. Функция и шкала желательности.

6. Как планируется полный и дробный факторный эксперимент?

Рекомендуемая литература.

1. Аверченков, В.И. Основы математического моделирования технических систем: учеб. пособие / В.И. Аверченков, В.П. Федоров., М.Л. Хейфец – Брянск: Изд-во БГТУ, 2004.

2. Вентцель, Е.С. Теория вероятностей / Е.С. Вентцель. – М.:Советское радио, 1972.

3. Шеннон, Р. Имитационное моделирование систем – искусство и наука / Р. Шеннон. –М.: Мир, 1978.

4. Фёдоров, В.П. Математическое моделирование в машиностроении:

учебное пособие. / В.П.Фёдоров – Брянск: БГТУ, 2013.= 112 С.

 

Лекция 5. (Окончание раздела 3) «Обработка результатов эксперимента и принятие решений» (1 час)

План лекции:

5.1. Ортогональное планирование второго порядка. Рототабельное планирование эксперимента.

5.2. Принципы построения экспертных систем и технология принятия статистических решений.

 

5.1. Ортогональное планирование второго порядка. Рототабельное планирование эксперимента

5.1.1. Ортогональное планирование второго порядка

 

Если поверхность отклика является существенно нелинейной, тогда в уравнение модели необходимо ввести квадратичные члены второго порядка. Для этого достраивают матрицу в соответствии с планами эксперимента второго порядка .

Расширенная матрица содержит:

- опытов в точках ДФЭ – ядро плана, из которого определяются линейные члены и их взаимодействия;

- опытов в центре плана, для оценки ошибки опытов;

- дополнительных опытов в «звездных» точках, расположенных по координатным осям на расстоянии .


<== предыдущая страница | следующая страница ==>
Основы кибернетического моделирования | Отсюда общее число опытов

Дата добавления: 2015-06-30; просмотров: 162; Нарушение авторских прав




Мы поможем в написании ваших работ!
lektsiopedia.org - Лекциопедия - 2013 год. | Страница сгенерирована за: 0.005 сек.