Дисперсионен анализ



Дата15.10.2018
Размер67.59 Kb.
#87742
В сферата на статистиката важен изследователски елемент е проучването на зависимостите между явленията и процесите в различни човешки области на развитие. За тази цел се разработват изключително прогресивни и надеждни методи, които след уточняване на качествената страна на изучаваните явления и процеси чрез предварителен съдържателен анализ, спомагат да се определят природата на зависимостите между тях и основните фактори, от които се влияе обекта на проучване (явлението). Тези статистически методи измерват зависимостта. Дали съществува или не взаимосвързаност и зависимост се установява посредством метода на групировките и статистическите таблици. Чрез т. нар. дисперсионен анализ се установява дали влиянието на даден фактор или група фактори е съществено при дадени условия или не е. Следва да се измери количествено степента на теснотата на връзка между изучаваните явления или техните признаци. Това става с помощта на корелационния анализ. Съществуват функционална и корелационна връзка. Взаимовръзките в природата са основно функционални, а в обществото - корелационни. Функционалната връзка е пълна и строго фиксирана. При нея на всяко значение на независимата променлива х съответства строго определено едно или няколко значения на зависимата променлива у. Вариацията на променливата у се определя непълно от вариацията на фактора х. Корелационната зависимост е всъщност степента на теснота на зависимост между явленията от обективната действителност. Корелационната връзка не е строго определена, каквато е функционалната. Вариацията на променливата у не се определя напълно от вариацията на фактора х. Корелационната връзка не се потвърждава при всеки отделен случай, а само в масовото проявление на явленията. Това означава, че всяко изменение на фактора не води до определено изменение на резултата. Тази зависимост не може да се прояви в чист вид, защото върху явлението резултат действат едновременно, но разнопосочно различни фактори и условия. Следователно тя е един вид непълна функционална връзка. Така, когато тя бива измервана, трябва да се установи как и в каква форма тя ще се прояви, ако е функционална.

Видовете корелационна зависимост се дефинират по следните критерии:



  1. В зависимост от направлението (насоченост, тип) на корелационната връзка различаваме:

    • положителна (еднородна) , за която е характерно еднопосочното изменение на x и y.

    • отрицателна (разнородна), при която измененията в числените значения на x и средните числени значения на y стават в противоположни направления.

  2. В зависимост от тенденцията (формата) в изменението на средните числени значения на величината на изучавания признак, които се извършват във връзка с измененията на фактора различаваме праволинейна (линейна) и криволинейна корелация. При праволинейната корелация средните числени значения на изследвания показател се изменят под влияние на показателя фактор приблизително равномерно. Графически тази връзка се представя с права линия. Криволинейната корелация се характеризира с неравномерно изменение на средните числени значения по изучавания показател под влияние на фактора. Графически това е крива линия. В зависимост от вида на статистическите редове корелационната зависимост бива при редове на разпределение и при динамични редове.

  3. В зависимост от броя на факторите тя бива единична (проста) корелация, множествена и частична. Корелационната връзка е единична, когато причинната връзка се наблюдава между две явления, които са представени от 2 статистически реда. Единият изразява вариацията на независимата променлива, а другият - вариацията на зависимата променлива. Множествена корелация е налице, когато зависимата променлива се обуславя от корелацията на две или повече променливи или зависими величини. Частична корелация - при нея с помощта на съответни методи се измерва зависимостта между зависимата и независимата променлива, а останалите независими променливи условно се държат на едно постоянно равнище.

  4. В зависимост от скалирането (номинална, рангова, ординална), на която са представени изучаваните показатели се установяват 2 групи методи за изучаване коефициента на корелация:

    • при силни скали се използват параметрични методи

    • при слаби скали се използват непараметрични методи.

Етапите, през които се преминава при извършване на корелационен анализ са:

  1. предварителен (априорен) - при него се определя независимата и зависимата променлива, които трябва да произлизат от качествено еднородна съвкупност

  2. въз основа на разполагаемите емпирични данни се определя най-подходящия статистически модел

  3. определяне степента на теснотата на връзка между фактора и резултата. Корелационната зависимост може да бъде измерена, представена.

Измерители на корелационна зависимост са коефициентът на корелация и коефициентът на определението (детерминации). В зависимост от характера на връзката, коефициентът на корелацията се изменя в различни граници.

Една от най-често срещаните формули за изчисляване на коефициента на корелацията е:

S2y

r = √1 - ──

σ2y (1)

където S2y е стандартната грешка на оценката. Това е мярка за разсейването на емпиричните (фактическите) значения на y около регресионната линия. Тя е част от общата дисперсия σ2y , поради което колкото S2y е по-малка, толкова връзката е по-тясна (по-силна). В обратния случай връзката е по-слаба. Това е лесно разбираемо, като се има предвид, че при пълна корелационна зависимост (практически това означава функционална зависимост) фактическите значения на y биха лежали върху регресионната линия, а фактическите значения съвпадат с теоретичните (yi = ŷi).

Формално погледнато според формула (1) полученото значение за r е винаги положителна величина, варираща в граници от 0 до 1. В действителност обаче корелационна връзка може да бъде положителна (пряка), когато параметърът b е положителна величина. При r = 0 липсва каквато и да е корелационна връзка, а при r = 1 връзката е максимално тясна (пълна) и се възприема като функционална. В някои случаи обаче връзката може да е и отрицателна (обратна), когато с нарастването на факторната променлива x , значенията на резултативната величина y намаляват. В такива случаи параметърът b на регресионното уравнение е отрицателна величина, от което следва, че и на получения корелационен коефициент трябва да се постави знак минус. По този начин коефициентът на единичната обикновена корелация може да приеме значения в граници от -1 до +1, т.е. -1 ≤ r ≤ 1. Колкото корелационният коефициент е по-близо до единица, толкова и връзката е по-тясна.

Коефициентът на индетерминацията (на неопределението) е величина, допълваща коефициента на детерминацията до единица – (1 – r2) . И двата коефициента имат ясен смисъл:



  • величината r2 × 100 показва какъв процент от общата вариация на зависимата променлива y се обуславя от факторната променлива x .

  • величината (1 – r²)100 определя останалата част от общата вариация на y , която се дължи на всички останали влияния (включително и случайните) извън включения в модела (изследвания) фактор x .

При наличие на линейна връзка между факторната величина x и следствието y , коефициентът на корелацията може да се намери и по други начини, без предварително да се провежда регресионен анализ.

Един от тези начини е известен като метод на нормираните отклонения (метод на Браве):

─── ─ ─

xy – x × y



r = ─────────

σx σy (2)


Друг широко използван метод за изчисление на линейна корелация е този на Пирсън (Pearson):

─ ─


(xi x) (yi – y)

r = ─────────────

─ ─


√∑ (xi – x)2 ∑ (yi – y)2 (3)
Ако се търси зависимостта между два признака на една съвкупност, които са подрени на първо, второ, трето и т.н. място, т.е. от 1 до n . Тогава тези два признака са подредени по рангова скала. Ранжирането може да се извърши и по експертни оценки. Коефициенти на корелация на ранговете са: коефициент на Спирман, коефициент на Кендъл.

Корелационният коефициент на Кендъл е еквивалентен на този на Спирман по отношение на условията за използване (предположения) и мощност. Двата коефициента обаче имат различна величина. В най-общия случай зависимостта между стойностите им е: -1 ≤ 3 (Кендъл) и R ≤ 1 (Спирман). Това се дължи на коренно различната хипотеза в двата случая и интерпретация на резултата. Коефициентът на Спирман има същото значение, каквото е и коефициентът на Пирсън, но за рангови променливи. Коефициентът на Кендъл има смисъл на вероятност и представлява вероятността за това дали данните в първата променлива са в същия ред, както във втората или не са. Има две разновидности на коефициента на Кендъл – τb и τc . Те са почти еднакви по стойност. Ако има несъответствие между двете стойности е по-сигурно да се интерпретира по-малката.



Корелационен коефициент на Спирман – мярка за зависимост между две променливи, които са в ординалната скала. Стойностите му са между -1 и +1, като 0 означава липса на връзка, а близките до единица стойности са силна връзка в права или обратна посока, в зависимост от знака. Този коефициент е аналогичен на коефициента на Пирсън, без да е обвързан с изискването за нормалност на променливите, което го причислява към групата на непараметричните.




Каталог: files -> files
files -> Р е п у б л и к а б ъ л г а р и я
files -> Дебелината на армираната изравнителна циментова замазка /позиция 3/ е 4 см
files -> „Европейско законодателство и практики в помощ на добри управленски решения, която се състоя на 24 септември 2009 г в София
files -> В сила oт 16. 03. 2011 Разяснение на нап здравни Вноски при Неплатен Отпуск ззо
files -> В сила oт 23. 05. 2008 Указание нои прилагане на ксо и нпос ксо
files -> 1. По пътя към паметник „1300 години България
files -> Георги Димитров – Kreston BulMar
files -> В сила oт 13. 05. 2005 Писмо мтсп обезщетение Неизползван Отпуск кт


Сподели с приятели:




©obuch.info 2024
отнасят до администрацията

    Начална страница