Коефициентът на множествена корелация, оценката на качеството на изградената модел, значението на проверка
Коефициентът на множествена корелация
Ако частните няколко регресионни модели са значителни корелационните коефициенти, т. Д. Между ефективни променливи и фактор на модела променливи наистина съществува корелация отношения, в този случай, се смята за изграждането на коефициента на множествена корелация да бъде подходящо.
Използване коефициент множествена корелация характеризиращ кумулативния ефект на всички променливи на продуктивни променлив фактор в модел на множествена регресия. [36]
Формулата за определяне на коефициента на корелация на множествена регресия уравнение чрез матрицата на сдвоени корелационни коефициенти:
където - детерминантата на матрицата на сдвоените корелационни коефициенти;
- mezhfaktornoy детерминанта на матрицата на корелация.
Както може да се види от формулите, стойността на коефициента на множествена корелация зависи не само от резултата на съответствието с всеки един от факторите, но и на корелация mezhfaktornoy. Счита формула позволява да се определи общата корелационен коефициент, без да се прибягва до регресия уравнение многократно, и с помощта на чифт корелационни коефициенти.
Таблица 17 - Резултати от изчисляването на множествена коефициент на корелация
Оценка на качеството на конструираната модел
Коефициент на множествена определяне на R 2 е квадрата на коефициента на множествена корелация.
Коефициент на множествена определяне характеризира процент конструирана регресионен модел обяснява промяната на ефективните стойности на променливата по отношение на средното ниво, т.е.. Е. показва съотношението на общото отклонение ефективно променлива обяснява с промяната на променливи фактори, включени в модела на регресия. По-високата стойност на множествена коефициент на определяне, по-добре конструирани регресионен модел описва връзката между променливите.
За коефициента на множествена решителност винаги се извършва на неравенството:
Следователно, включването на линеен регресионен модел допълнителна променлива стойност фактор не намалява коефициента на множествена определяне. [26]
Таблица 18 - на изчислените коефициенти за определяне
Високи стойности на коефициентите за определяне R 2 показват, че регресионния модел е добре приблизително оригиналните данни и такива регресионни модели може да се използва за прогнозиране на ефективни стойности на индекса.
Проверете значение (качество) на уравнението на регресия - това означава да се определи дали един математически модел, който изразява връзката между променливите, експериментални данни, е достатъчно, ако са включени в уравнението на обяснителни променливи, за да опише зависимата променлива. За да се получи цялостна оценка на качеството на модела, за всяко наблюдение на относителните отклонения определяне на средната грешка приближение. Проверка на адекватността на регресионно уравнение (модел) с помощта на средна грешка приближение, стойността на които не трябва да надвишава 12-15% (максимална стойност).
Формулата за изчисляване на средната грешка приближение:
където п - брой променливи в множествена регресия; F (xi1 xi2 ..., Xin ..) - и-ти прогнозна стойност на променливата у; - и-ти пилотен променливата у.
Таблица 20 - Средна грешка на приближение
Както се вижда от резултатите от изчислението, средната грешка приближение не превишава допустимите стойности на 12-15%, което показва адекватността на получените модели.
Проверка на значението на линейни множество регресия уравнение коефициенти.
Тестване на значението на индивидуалните коефициенти на уравнението означава, че ако коефициентът на променлива незначителен, а след това се доверите на влиянието на тази променлива на ценностите на получената функция не може да бъде база. Незначителни коефициенти следва да бъдат определени, равни на нула, т.е. съответстващ променлива трябва да бъде изключен от по-нататъшно разглеждане.
За да тествате значението на всеки един от A0 коефициентите. a1, ..., за се използва т-статистика на Student, който е експериментална стойност, изчислена по формулата:
където AI - коефициентът на променливата ХI. - стандартната грешка на коефициента,
при което - стандартното отклонение на стойностите на променливата у; - средното квадратично отклонение на стойностите на Xi; - коефициент на множествена определяне на регресия уравнение като цяло; - коефициент на множествена характер фактор характеризиращи връзката между XI и други фактори (х1 х2, ..., XI-1, XI + 1, ..., хп ..) От уравнението на регресия.
Всяка от експерименталните стойности на статистика се сравнява с критичната стойност (I = 1,2, ..., N), който се търси от Student маса разпределение за дадено ниво на значимост използвани и броят на степените на свобода к, равна на К = m-N-1. В този случай, при ниво на значимост б = 0.05 и к = 13-3-1 = 9 = 2.26. [26]
Таблица 21 - Изчислените експерименталните стойности на Т - статистика Student
Ако>. тогава хипотезата за значението на коефициента AI не е отхвърлено, както и съответната променлива XI остава в уравнението. В противен случай, коефициент AI се счита за незначителен и съответната променлива да бъде изключен от уравнението на регресия. По този начин, чрез сравняване на получените експериментални стойности на критично. може да се заключи, че не-значимите коефициенти във всичките четири уравнения не го правят.
Проверка на значението на линейна регресия уравнение множествена като цяло
Ако се окаже, че за дадено ниво на значимост б уравнение е незначителен, не е възможно да го използвате, и е установено, зависимостта трябва да се пренебрегва.
За да тествате значението на регресионно уравнение използва експериментални Fischer F-статистиката:
където m - обем на пробата; п - броят на променливи в множествена регресия; F (xi1 xi2 ..., Xin ..) - и-ти прогнозна стойност на променливата у; - средни експерименталните стойности на случайна променлива Y. [26]
Експерименталните стойности на критерий на Fisher сравнение с критичните стойности = F (Б; К1; k2) при избраното ниво на значимост използва. Броят на степените на свобода k1 = m - п - 1, k2 = N.
Когато избраното ниво на значимост б = 0.05 и броят на степените на свобода k1 = 13 - 3 - 9 = 1, k2 = 3 = 8.81
Таблица 22 - Изчислените експерименталните стойности на точния тест на Fisher
При сравняване на експериментални критерии Fisher критични стойности (ниво на значимост б = 0.05 Fkr = 8.81), всички отговарят Fop> Fkr и заключава, че, с вероятност р = 1, б = 0.95, всички уравнения са значителни и ние имаме някаква причина да се доверят вградени регресионни уравнения.
Оценка на точността на линейна регресия уравнение множествена
Крайният статистическата процедура - оценка на точността на изградените регресионни уравнения.
Квалификация близост експерименталните стойности Yi на случайната променлива Y и изчислява стойностите на F (XI), получен чрез линейна регресия уравнения се извършва с помощта на средната квадратична грешка съгласно следната формула:
Таблица 23 - Резултати от изчисляване на средните уравнения квадратни грешки