Учебни записки “Статистически методи във физическото възпитание” за студенти от магистърска степен на нса

Тема 6. Статистическа проверка на хипотези

Изтегляне 1.05 Mb.

страница	6/9
Дата	22.07.2016
Размер	1.05 Mb.
	#240

1 2 3 4 5 6 7 8 9

Тема 6. Статистическа проверка на хипотези

6.1. Основни понятия
Голяма част от научните изследвания се отнасят до сравняване на разпределението на две или повече променливи величини. Така например типични за изследванията в областта на физическото възпитание са проблемите за сравняване на нивото на двигателните качества на различни категории подрастващи, за съпоставяне на ефективността на различни методики на подготовка и др.

Особеното на тези сравнения е, че изводите, които се правят, трябва да се отнасят до целите съвкупности, а данните, с които разполага изследователят, обхващат само извадка от нея. Поради това първоначално се формулират предположения – хипотези, като впоследствие се прави проверка дали данните от извадката ги потвърждават или отхвърлят.

Нулевата или работна (Н₀) - тя твърди, че няма статистически достоверна разлика в сравняваните статистически показатели. Въпреки, че в извадките може да се наблюдава известна разлика, тя е случайна и не може да бъде обобщена за генералните съвкупностите.
Алтернативна хипотеза (Н₁), която твърди, че констатираната разлика в сравняваните статистически показатели в извадките е статистически достоверна и може да бъде обобщена за генералните съвкупности.

Решенията, които се вземат при проверката на статистически хипотези, имат вероятностен характер. Това се дължи на факта, че изследванията са репрезентативни, т.е. изводите за генералната съвкупност се правят въз основа на изследване на относително малка, но репрезентативна извадка. Приемането или отхвърлянето на нулевата хипотеза се прави с определено степен на сигурност, като в същото време се допуска възможността за грешка на статистическите изводи.

Степента на сигурност, с която се приема за вярна алтернативната хипотеза, се нарича гаранционна вероятност (Р).

Рискът да се допусне грешка, като се приеме за вярна алтернативната хипотеза се нарича равнище на значимост ().

В практиката се използват следните стойности за гаранционната вероятност (Р) и равнище на значимост ():

Р= 95%, на която съответства  = 0,05 (5% възможност за грешка).
Р= 99%, на която съответства  = 0,01 (1% възможност за грешка).
Р=99,9%, на която съответства =0,001 (0,1% възможност за грешка).

6.2. Алгоритъм за проверка на хипотези
Общата процедура за проверка на статистически хипотези предполага преминаването през няколко поредни стъпки:
І стъпка - Формулиране на нулевата и алтернативната хипотеза.

Както вече бе споменато, нулевата (Ho) хипотеза е предположение за нулева разлика, нулев ефект.. Ако емпиричните данни сочат известни различия - те се дължат на случайни фактори. Противоположно е твърдението на алтернативната хипотеза (Н1), според която наблюдаваните в емпиричните данни различия са резултат на закономерно действащи фактори.

ІІ стъпка - Избор на подходящ критерий за проверка на хипотезата.

Хипотезите се проверяват със специфични критерии. За целта е необходимо да се познават условията, на които трябва да отговарят променливите величини, естеството на извадките и някои други особености, които са разгледани в следващия раздел.

ІІІ стъпка - Изчисляване на емпиричната стойност на критерия (Критерий_emp).

За всеки един критерий има разработена процедура за изчисляването му по данни от извадката.

ІV стъпка – Определяне на табличната стойност на критерия (Критерий ).

Тя се взема от приложение, в зависимост от степените на свобода (k) и равнището на значимост (). Към статистическата литература има приложени таблици с критични стойности на критериите, към които е описан и начинът на изчисляване на степените на свобода. В настоящото ръководство тези таблици се намират, приложени към съответната тема.

V стъпка – Вземане на решение.

За целта табличната (теоретичната) стойност на критерия се сравнява с емпиричната (изчислената по данни от извадката). Именно това сравнение дава основание за формулиране на извод коя от хипотезите (нулевата или алтернативната) е вярна. Възможностите са две:

Емпиричният критерий да е по-малък от теоретичния. В такива случаи за правдоподобна се приема нулевата хипотеза (Н_о).
Емпиричният критерий да е по-голям или равен на теоретичния. В такива случаи нулевата хипотеза (Н_о) се отхвърля и за вярна се приема алтернативната хипотеза (Н₁).

Вземането на решение може да стане и въз основа на равнището на значимост (), което съответства на емпиричната стойност на критерия, чиято стойност се изписва в разпечатките на SPSS:

Равнището на значимост () да е по-голямо от възприетото ( > 0,05 (0,01 или 0,001). В такъв случай няма основание за отхвърляне на нулевата хипотеза (Н_о).
Равнището на значимост () да е по-малко или равно на възприетото ( ≤ 0,05 (0,01 или 0,001). Това означава, че нулевата хипотеза (Н_о) се отхвърля в полза на алтернативната.

Както вече бе споменато, аналогична информация носи гаранционната вероятност P/%/, която при известно равнище на значимост се изчислява по формулата:

P /%/ = (1 -  )*100
Възможностите придобиват следния вид:

Гаранционната вероятност да е по-малка от възприетата (95% или 99%). В такъв случай за вярна се приема нулевата хипотеза (Н_о).
Гаранционната вероятност да е равна или по-голяма от 95% (99%). В такъв случай се отхвърля нулевата и за вярна се приема алтернативната хипотеза.

Обобщение на начините за вземане на решение е представено в таблица 6.1.

Таблица 6.1

Хипотеза	Решение, основано на стойността на критериите за проверка на хипотези	Решение, основано на достигнатото равнище на значимост	Решение, основано на гаранционната вероятност
Приемане на H_o	Критерий_emp<Критерий _	>0,05 (0,001;0,001)	P/%/<95% (99%;99,9%)
Приемане на H₁	Критерий_emp≥Критерий _	≤0,05 (0,001;0,001)	P/%/≥95% (99%;99,9%)

Въпреки голямото разнообразие от статистически критерии за проверка на хипотези, тази обща принципна схема се спазва винаги. Особено важен момент в процедурата е изборът на критерия. Непознаването на вида на променливите, вида на извадките, както и случаите, в които се прилага съответният критерий, може да доведе до некоректно ползване на статистическите методи, а оттам до утвърждаване на неверни научни изводи.

6.3. Критерии за проверка на хипотези
Изборът на критерий за проверка на дадена хипотезата зависи от:

1. Използвания статистически метод и показатели, които се сравняват (за сравняване на средни аритметични, дисперсии, относителни дялове и др. се ползват различни критерии).

2. Естеството на променливите величини, които подлежат на обработка – на първо място е важно дали променливите са количествени или категорийни (качествени). На второ място изборът на критерий трябва да се съобрази и с вида на разпределение на променливите (нормално или не). От тази гледна точка са разработени две големи групи от статистически критерии:

Параметрични – прилагат се при количествени (интервално и пропорционално скалирани) признаци, когато предварително е установено, че разпределението на променливите е нормално.
Непараметрични – прилагат се при качествени (номинално и рангово) скалирани признаци, а така също, когато разпределението на количествен признак не е известно или не е нормално.

3. Вида на извадките, които подлежат на сравнение. От гледна точка на начина, по който са съставени, те биват:

Независими - когато изборът на единиците в едната извадка не е предопределен от избора на единиците в другата извадка (с други думи изследваните лица от двете извадки са различни и няма никаква връзка между тях). Експерименти за сравняване на експериментална и контролна група са типичен пример за независими извадки.
Зависими са извадките, когато единиците от едната извадка предопределят тези във втората. Типичен случай са изследванията за сравняване на променливи преди и след някакво въздействие. Очевидно е, че експерименти от такова естество са коректни само в случай, че изследваните лица (единици) от първото и второто изследване са едни и същи.

4. Броя на извадките, които се сравняват.
В таблица 6.2 е направена систематизация на основите критерии, които се ползват при научни изследвания във физическото възпитание.

Таблица 6.2

Променливи величини	Брой на извадките	Вид на извадките	Критерии за проверка на хипотези
Количествени, които имат нормално разпределение	Две	Независими	t-критерий на Стюдънт за независими извадки
	Две	Зависими	t -критерий на Стюдънт за зависими извадки
	Три и повече	Независими	F-критерий на Фишер (дисперсионен анализ)
	Три и повече	Зависими	Дисперсионен анализ за повтарящи се наблюдения
Алтернативни	Две	Независими	U-критерий на Стюдънт
Алтернативни	Две	Зависими	²-критерий на Мак Немар
Номинални	Две и повече	-	²-критерий на Пирсън
Рангови и количествени, които имат ненормално разпределение	Две	Независими	U-критерий на Ман Уитни
	Две	Зависими	T-критерий на Уилкоксън
	Три и повече	Независими	Критерий на Кръскал Уолис
	Три и повече	Зависими	²- критерий на Фридман

t-критерият на Стюдънт за независими извадки се прилага за проверка на нулевата хипотеза за сравняване на средни аритметични величини , когато:

Променливите са количествени и имат нормално разпределение;
Извадките са две и са независими.

Емпиричната стойност на критерия се изчислява (t_emp) по формула 6.1, а табличната му стойност се отчита от приложение 8:

(6.1)

където:

- ср. аритметични в извадките

S₁² и S₂²– дисперсии в извадките

п₁ и п₂ – обем на извадките

t-критерият на Стюдънт за зависими извадки се използва за сравняване на средни аритметични величини, когато:

Признаците са метрично скалирани и имат нормално разпределение.
Извадките са две и са зависими.

Емпиричната му стойност е изчислява по формула 6.2, а табличната се отчита от приложение 8.

(6.2)

където:
d – разлики между І и ІІ изследване за всяко изсл. лице

d - средна аритметична на тези разлики

n – обем на извадката

6.4. Изчисляване на t-критерия на Стюдънт за независими извадки

Задача за разучаване 6.1.

По данните от файла Ph_education.sav. изчислете t-критерия на Стюдънт за независими извадки и установете съществуват ли статистически значими разлики между резултатите на експериментална и контролна група в тест 30 м. гладко бягане (t1_1) при І-во изследване.

1. Изберете Analyze>Compare Means>Independent Samples T Test (фиг. 6.1).

Фиг. 6.1

Фиг. 6.2
2 Изпратете променливата (фиг. 6.2), в която са записани резултатите на двете групи в полето Test Variable(s).

3. Изпратете в полето Grouping Variable променливата, в която е записана принадлежността към сравняваните категории (групи). Натиснете бутона Define Groups и в отворилия се прозорец задайте кодовете на сравняваните групи.

4. Потвърдете с Continue>OK .

Резултатът от обработката е в 2 части:

В първата се изписва информация за разпределението на стойностите в двете извадки (таблица 6.4). Във втората част е изписана информация за статистическата значимост на разликите между средните стойности в двете извадки (таблица 6.5). Използвани са следните означения:

N- брой на наблюденията във всяка от извадките
Mean - средна аритметична
Std. Deviation – стандартно отклонение
t – емпирична стойност на t-критерия на Стюдънт за независими извадки
df – степени на свобода к=n1+n2-2
Sig. (2-talied) – равнище на значимост
Mean differences – разликата между емпиричните средни

Таблица 6.4.

Таблица 6.5

Резултатите от проверката на хипотези за сравняване на средни стойности на две групи се представят по начина, представен на таблица 6.6. За удобство под таблицата може да се изпише и критичната стойност на критерия.

Таблица 6.6

Показател	Експериментална			Контролна			d	t	P(t)
Показател	n₁	_	S₁	n₂	_	S₂	d	t	P(t)
30 m.	25	6,17	0,37	25	6,26	0,35	0,09	0,90	62,93

Забележка: Критичната стойност на t-критерия на Стюдънт при k=n₁+n₂-2=48. и =0.05 е равна на 2,01 (виж приложение 8).
6.5. Изчисляване на t-критерия на Стюдънт за зависими извадки

6.5.1. За целия масив от данни

Задача за разучаване 6.2.

По данните от файла Ph_education.sav, изчислете t-критерия на Стюдънт за зависими извадки и установете статистическата достоверност на прираста на резултатите в тест 30 м. гл. б. (t1_1 и t1_2).

1. Изберете Analyze>Compare Means>Paired Samples T Test (фиг. 6.1).

Фиг. 6.3

2. В отворилия се диалогов прозорец (фиг. 6.3) изберете променливата, в която се намират резултатите от първото изследване. Името и се изписва на реда Variable 1 в полето Current Selections. Изберете и променливата с резултатите от второто изследване. Изпратете двойката променливи в прозореца Paired Variables и потвърдете с ОК.

Разпечатката съдържа 3 части:

В първата е пред-ставена информация за броя на наблюденията, средните стойности и вариативността на изследваните показатели в двете извадки;
Във втората са представени коефи-циентите на корелация между І и ІІ изследване, с оглед да се провери дали наистина извадките са зависими (корелирани).

В третата е характеризирана големината (Mean) и статистическата значимост (t и ) на разликите между средните стойности на двете извадки.

Резултатите от сравнението се представят в научни разработки по начина, представен в таблица 6.7.

Таблица 6.7

Показател		n	І изследване		ІІ изследване		d	t	P(t)
			_	S₁	_	S₂
1	30 m. I izsledvane 30 m. II izsledvane	50	6,22	0,36	5,90	0,46	-0,32	7,65	100,00

Забележка: Критичната стойност на t-критерия на Стюдънт при k=n-1=49 и =0.05 е равна на 2,01 (виж приложение 8).

 Решете задача 5 от изпитния проект.
6.5.2. За отделни подгрупи

Задача за разучаване 6.3

По данните от файла Ph_education.sav, изчислете t-критерия на Стюдънт за зависими извадки и установете статистическата достоверност на прираста на резултатите на експериментална и контролна група в тест „Совалка”. (t2_1 и t2_2).

Когато се обработват данни от педагогически експеримент с две групи (опитна и контролна) е необходимо да се установи статистическата значимост на прираста на резултатите на двете групи отделно. По тази причина файла се разделя на групи за самостоятелна обработка по начина, описан в 3.5.2. След това се прилага алгоритъма, представен в настоящия раздел.

Краткото описание на процедурите е, както следва:

Data>Split File и задайте разделяне на масива за самостоятелна обработка по променливата group.
Analyze>Compare Means>Pared Samples T Test

Резултатът от обработката след редактиране на разпечатката на SPSS е представен в таблица 6.8.

Таблица 6.8

Тест “Совалка”	І изследване		ІІ изследване		d	t	P(t)
Тест “Совалка”	_	S₁	_	S₂	d	t	P(t)
Експериментална	14,77	0,64	13,36	0,63	-1,41	14,51	100,00
Контролна	14,72	0,50	14,61	0,42	-0,11	3,52	99,80

 Решете задача 6 от изпитния проект.

Изтегляне 1.05 Mb.

Сподели с приятели:

1 2 3 4 5 6 7 8 9