КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Для управления технологическим процессом необходимо знать закономерности, которые объективно описывают ход процесса и позволяют предсказывать результаты. Закономерности делятся на две группы. К первой группе относятся статистические закономер­ности, связывающие установившиеся значения технологических параметров. С помощью статистической математической модели решаются задачи, связанные с изменением технологических режимов для получения оптимальных технико-экономических показателей. Ко второй группе относятся динамические закономерности, связы­вающие параметры в неустановившемся режиме.

Статистические методы позволяют определить уравнения связи, анализировать параметры процесса, построить математическую мо­дель процесса, или, другими словами, установить взаимозависимость между различными факторами и технологическими результата­ми процесса, характеризующими его как в статике, так и в дина­мике.

Статистическое исследование промышленного процесса вклю­чает:

- определение законов распределения параметров процесса (нор­мального, логнормального и др.) для выяснения возможности при­менения тех или иных статистических методов обработки результатов;

– определение тесноты и формы связи между отдельными параме­трами процесса;

– получение статистической модели процесса в виде регрессионного уравнения и оценка его адекватности;

– определение динамических характеристик процесса.

Корреляционный анализ позволяет оценивать тесноту связи различных параметров или факторов, влияющих на процесс. Этот метод широко применяется при исследовании промышленных про­цессов. Определяя коэффициент корреляции, если он достаточно высок, можно получить информацию, позволяющую выбрать основ­ные регулирующие воздействия на процесс, точки и методы измерения факторов и установить минимально необходимое количество изме­ряемых параметров. Если коэффициент линейной корреляции по абсолютной величине мал, то это свидетельствует о более сложной зависимости (нелинейной) между измеряемыми параметрами или о существенном влиянии на них других факторов,

В этом случае необходимо вычисление более сложной зависимости в виде нелинейного уравнения.

Получение таких уравнений методом наименьших квадратов составляет основу регрессионного анализа.

Для корреляционного и регрессионного анализов, как правило, используются данные промышленного процесса. Однако при большом количестве лабораторных опытов они также могут быть обработаны статистически.

Для статистической обработки используются:

1.  Записи в сменных рабочих журналах режимных параметров процесса и результатов работы смены.

2.  Данные специального опробования в течение длительного времени с записью значений параметров процесса не только обычно регистрируемых ОТК, но и ряда дополнительных по выбору иссле­дователя.

3.  Показатели, полученные в результате специально спланиро­ванных изменений режима технологического процесса.

Любой технологический процесс может быть охарактеризован определенным числом входных параметров, которые в различной мере влияют на выходные параметры.

Целью исследования часто является установление количественной зависимости между этими параметрами. Различают два вида связи: функциональную и стохастическую (вероятностную). Если одна случайная величина Y (функция отклика, зависимая переменная) полностью определяется по значениям другой случайной величины Х (входная переменная, независимая переменная, фактор), т.е. Y = f ( X ), то эта зависимость называется функциональной. В практике исследовательских работ чаще встречается то, что одному значению переменной X соответствует совокупность выходных значений переменной Y, которая появляется под влиянием множества побочных факторов. В этом случае говорят о корреляционной зависимости между величинами.

В статистике задачу определения зависимости случайной величины Y от фиксированной переменной X называют схемой регрессионного анализа. Нахождение регрессионного уравнения и последующая проверка значимости его коэффициентов так же решается этими методами.

Оценка тесноты или силы связи между двумя случайными величинами X и Y осуществляется методом корреляционного анализа.

О наличии или отсутствии связи между двумя случайными вели­чинами в первом приближении судят по корреляционному полю.

Для характеристики тесноты связи между величинами X и Y пользуются безразмерной r величиной, называемой коэффициентом корреляции. Выборочный коэффициент линейной корреляции вычисляют по формуле:

,

где СКО входной X  и выходной Y величин: ;            ,

- количество измерений;

- средние значения входного и выходного параметров;

- результаты эксперимента.

Коэффициент корреляции указывает только на тесноту линейной связи между переменными, а знак – на характер влияния: .

Если r > 0, то уменьшение X вызывает увеличение Y, если r < 0, то увеличение фактора X вызывает уменьшение функции отклика Y, при |r| = 1 – считается, что связь между величинами является линейной и функциональной, для |r| = 0 - связи нет или она нелинейная.

Т.к. коэффициент корреляции рассчитывают по выборке из генеральной совокупности, то он всегда будет содержать ошибку.

Для проверки применяют t-отношение:

,

где  - число степеней свободы,

  - критерий Стьюдента, определяемый по таблицам распределения Стьюдента для заданного уровня значимости α = 1-Р и числа степеней свободы (Приложение 1).

Если , то между факторами существует линейная корреляция. Принимается, что при  связь считается неслучайной.

Задача линейного регрессионного анализа решается многими способами. Одним из них является метод наименьших квадратов (МНК). Суть его состоит в том, что зная положение точек (результатов эксперимента) на плоскости, так провести линию регрессии, чтобы сумма квадратов отклонений  вдоль оси Оy (ординаты) этих точек U от проведенной прямой была минимальной.

Искомое уравнение регрессии имеет вид: ,

где - коэффициенты уравнения регрессии.

Уравнение регрессии показывает изменение условного среднего выходной случайной величины (для данного вида зависимости это ), при фиксированных значениях входной случайной величины - . Если функция регрессии известна, то по значению одной величины можно прогнозировать изменение значения другой случайной величины.

Задачу МНК аналитически можно выразить следующим образом:

 или .

Для решения задачи необходимо вычислить значения коэффициентов и  минимизирующих сумму отклонений .Для этого необходимо  вычислить частные производные функции по коэффициентам и  и приравнять их к нулю:    {

Решая эту систему получаем:

{

 Преобразуем полученную систему нормальных уравнений:

{

Преобразуем выражения для расчета оценок  и  неизвестных параметров уравнения регрессии:

,

,

.

 

Проверка значимости коэффициентов и адекватности уравнения регрессии.

 

После нахождения уравнения регрессии необходимо проверить значимость его коэффициентов  и . Оценку значимости выполняют по критерию Стьюдента. При этом проверяется нуль-гипотеза: , т.е. j – коэффициент регрессии генеральной совокупности равен нулю. Если  выполняется условие:

,

 где  -  j – коэффициент регрессии;

   - среднее квадратичное отклонение j – коэффициента;

   f = nk - число степеней свободы; k - число учитываемых признаков в уравнении регрессии, для парной линейной корреляции k = 2, то принимается нулевая гипотеза о незначимости найденных коэффициентов уравнения регрессии.

Если условие не выполняется, т.е. , то принимаются альтернативная гипотеза о значимости коэффициентов уравнения : . В случае принятия нуль-гипотезы незначимый коэффициент исключается из уравнения регрессии, а оставшиеся коэффициенты находят заново.

Средние квадратические отклонения для коэффициентов и  рассчитываются по формулам:

;

,

где  - остаточная дисперсия (дисперсия адекватности)  относительно линии регрессии.

,

где - величины, вычисляемые по уравнению регрессии

Другим важным элементом регрессионного анализа является проверка адекватности уравнения регрессии.

Если истинная регрессия имеет тот же вид, что рассматриваемая модель, то дисперсия адекватности служит несмещенной оценкой истинной дисперсии эксперимента и ее можно сравнивать с другими подобными оценками. Проверка осуществляется по критерию Фишера.

Если дисперсия адекватности меньше какой-либо оценки другой сравниваемой дисперсии (например , ), то нет оснований сомневаться в пригодности модели к описанию результатов эксперимента. Если же , то вычисляют отношение Фишера  и применяют односторонний критерий Фишера. Если , вычисляемое при заданном уровне значимости, меньше табличного значения квантиля , определяемой по таблицам распределения Фишера (см..Приложение 4), где = f ад ,, , то рассматриваемая модель не противоречит результатам эксперимента и принимается.

В случае невозможности проведения дублирующих опытов принимается соотношение:

,

где  - число степеней свободы ;  - число степеней свободы .

Если это условие выполняется, то считается, что выбранная модель соответствует характеру взаимодействия факторов X и Y и адекватно описывает исследуемый процесс.

Задача 1.1  

На обогатительной фабрике были проведены исследования процесса фильтрования магнетитового концентрата. Изучали влияние содержания твердого в пульпе (Х i, %) на удельную производительность вакуум-фильтра (Y i, т/ч·м2). С целью установления зависимости между параметрами были выполнены их одновременные измерения и получены результаты, представленные в таблице 1.1.

Таблица 1.1

№ вари­анта Измеряемые величины  Результаты измерений
1 Y , т / ч · м2 Х, % 1,01   1,2   0,9 1,1  1,43 1,76 1,0 1,31 1,2   55    45   60    50   35      33   55     40 49
2 Y , т / ч · м2 Х, % 1,15   1,2   0,95 1,1  1,45 1,70 1,0 1,30 1,25   55    47   60   50   34      30    58     40 45
3 Y , т / ч · м2 Х, % 0,9   1,2   0,85 1, 25 1,4 1,86 1,0 1,31 1,22   58   45   60    41   35      30   55     39 44
4 Y , т / ч · м2 Х, % 1,05  1,2  0,79  1,1  1,43 1,8 1,15 1,31 1,12   57    41   60    50   35      30   55     33 49
5 Y , т / ч · м2 Х, % 1,01   1,2   0,9 1,1  1,43 1,76 1,0 1,31 1,2   56    47    60   52   34      31   55     39 42
6 Y , т / ч · м2 Х, % 1,1   1,2   0,9  1,11  1,41 1,66 1,0 1,31 1,2   50   47   59    51   32      30    57     40 45
7 Y , т / ч · м2 Х, % 1,5   1,2   0,9 1,1  1,45 1,70 1,0 1,30 1,25   35   47   60  50   37      30    54    40 45
8   Y , т / ч · м2 Х, %C 0,95  1,2  1,69  1,1  1,43 1,8 1,15 1,31 1,12   60    44   33    50   35    30   55     40  54
9 Y , т / ч · м2 Х, % 1,01  1,22  0,85 1,1  1,45 1,86 1,0 1,31 1,2   55    45   60    50     37      30     55     40 47
10 Y , т / ч · м2 Х, % 1,5   1,2   0,9  1,1  1,43 1,76 1,0 1,31 1,2   32   47   60  52    35      31   55     41 45
11 Y , т / ч · м2 Х, % 0,81   1,2   0,9  1,1  1,4 1,70 1,0 1,31 1,27   56    45   60   50   35     31   52     36 40
12 Y , т / ч · м2 Х, % 0,95   1,2   0,9  1,1  1,4 1,65 1,0 1,31 1,24   56    48   60   51   35     31   53     36 44
13 Y , т / ч · м2 Х, % 0,9   1,2   0,85 1,25 1,4 1,80 1,12 1,31 1,22   59   45   60    41   33     30   55     39 42
14 Y , т / ч · м2 Х, % 1,5   1,2  0,89  1,15  1,40 1,8 1,05 1,31 1, 27  37   44   60   50    35      30   55     40 42
15 Y , т / ч · м2 Х, % 0,9   1,2   0,85 1, 25 1,4 1,86 1,01 1,30 1,23   58   45   60    41   35       30   55     37 44

Определить параметры уравнения, описывающего зависимость между содержанием твердого в пульпе и удельной производительностью вакуум-фильтра.

Провести графический анализ результатов эксперимента и полученного уравнения регрессии, проверить адекватность полученной модели.

 

Задача 1.2

К основным характеристикам вещественного состава полезных ископаемых определяющим технико-экономические показатели обогащения, относят: содержание и флотируемость ценных компонентов; сложный минеральный состав не только вмещающих, но и рудных пород; характер вкрапленности и срастания минералов. С целью изучение раскрытия минералов в различных классах крупности и возможности увеличения раскрытия за счет уменьшения тонины помола были проведены исследования пробы медно-цинковой руды. Измельчение руды осуществляли в стержневой мельнице. Для оценки степени раскрытия минералов была проведена флотация. Были проведены опыты по изучению влияния продолжительности измельчения Хi,мин. на  степень извлечения концентрата У,%.

Результаты опытов приведены в таблице 1.2.

 

 Таблица 1.2- Результаты флотации при различной продолжительности измельчения материала

№ вариан­та Изме­ряемые величи­ны Результаты измерений
16 Х,мин У, % 10         15      20       25      30    35         40 38,06 57,05  68,12  72,74  75,19    79,2 88,39  
17 Х,мин У, % 10         15      20       25      30    35         40 37,6 59,15  65,22  74,04  75,9    79,46   85, 9  
18 Х,мин У, % 10         15      20        25      30    35         40 40,01 56, 5  69, 2    72,54  79,1    82,2 88,39  
19 Х,мин У, % 10         15      20       25      30    35         40 39,08 57,75  68,52  73,64  77,29    80,2   88,5  
20 Х,мин У, % 10         15      20       25      30    35         40 36,6 59,15  66, 2    71,70  75,17    78,25 87,9  
21 Х,мин У, % 10         15      20       25      30    35         40 38,0 57,0  66,92     73,14   76,13     79,25  88,3  
22 Х,мин У, % 10         15      20       25      30    35         40 39,14 56,85  67,12  74,74  75,89    79,22 86,35  
23 Х,мин У, % 10         15      20       25      30    35         40 38,1 57,65  68,92  73,44  75,56    79,28 86,99  
24 Х,мин У, % 10         15      20       25      30    35         40 39,16 55,85  68,32  73,94  77,79    81,26 87,16  
25 Х,мин У, % 10         15      20       25      30    35         40 35,66 57,63  63,68  71,96  74,73    79,38 87,87  
26 Х,мин У, % 10         15      20       25      30    35         40 35,66 57,63  63,68  71,96  74,73    79,38 87,87  
27 Х,мин У, % 10         15      20       25      30    35         40 35,66 57,63  63,68  71,96  74,73    79,38 87,87  
28 Х,мин У, % 10         15      20       25      30    35         40 35,66 57,63  63,68  71,96  74,73    79,38 87,87  
29 Х,мин У, % 10         15      20       25      30    35         40 35,66 57,63  63,68  71,96  74,73    79,38 87,87  
30 Х,мин У, % 10         15      20       25      30    35         40 35,66 57,63  63,68  71,96  74,73    79,38 87,87  
31 Х,мин У, % 10         15      20       25      30    35         40 40,05 55,6    69,12    73,50  79,15    81,2 88,47  
32 Х,мин У, % 10         15      20       25      30    35         40 39,8 57,85  68,50   73,14  76,39    80,22   88,59  
33 Х,мин У, % 10         15      20       25      30    35         40 38,9 59,0  69,90     75,3   75, 3     80,25  89,9  
34 Х,мин У, % 10         15      20       25      30    35         40 40,10 54,80  67,35  75,9  77,8    80,26 89,16  
35 Х,мин У, % 10         15      20       25      30    35         40 39, 6 61,05  65,12  78,74  80,19    85,2 90,2  
36 Х,мин У, % 10         15      20       25      30    35         40 38,6 55,15  66,20   73,04  78,9    83,46   86, 9  
37 Х,мин У, % 10         15      20       25      30    35         40 39,54 56,63  67,55  70,74  76,89    79,92 86,55  
38 Х,мин У, % 10         15      20       25      30    35         40 40,15 52,85  69,30  70,90  75,9    80,29  87,96  
39 Х,мин У, % 10         15      20       25      30    35         40 36,96 58,62  65,8   72,96  76,73    79,88 88,91  
40 Х,мин У, % 10         15      20       25      30    35         40 39,2 55,63  64,8   70,96  75,13    79,5  89,14  

 

Определить параметры уравнения прогноза степени извлечения концентрата от продолжительности измельчения руды. Провести графический анализ результатов эксперимента и полученного уравнения регрессии, проверить адекватность полученной модели.

 

 

Дата: 2019-02-02, просмотров: 239.