Учебни записки “Статистически методи във физическото възпитание” за студенти от магистърска степен на нса



страница4/9
Дата22.07.2016
Размер1.05 Mb.
1   2   3   4   5   6   7   8   9

Тема 3 – Вариационен анализ


3.1. Въведение

 

Единиците на статистическите съвкупности се различават (варират) по величината на наблюдаваните признаци. Вариацията е присъщо свойство на статистическите съвкупности. Ако тя не съществуваше, статистическите проучвания щяха да бъдат излишни. Тези различия са породени от различни по своето естество фактори, които най-общо се разделят на две категории:



  • закономерни, които действат еднакво върху всички изучавани единици и определят типичното, закономерното състояние на признака (например типично, характерно за баскетболистите е, че имат висок ръст).

  • случайни, които действат с различна сила върху изучаваните единици и водят до индивидуални отклонения във величината на признака (отделните баскетболисти се различават по своя ръст).

Задача на статистическото проучване е да даде обобщаващи количествени характеристики на състоянието на изследвания признак. За целта е необходимо, на първо място, да се установи какво е типичното за дадената съвкупност стойност на признака, за да се опише влиянието на закономерно действащите фактори. На второ място, от особена важност е характеризиране на разсейването, варирането на стойностите на признака, за да се отчете влиянието на случайните фактори. Трета група от показатели носят информация за формата на разпределението на емпиричните стойности и степента на съответствието му с някое от известните теоретични разпределения, най-често с това на нормалното разпределение.

 

  



3.2. Показатели за средно равнище
 

Показателите за средно равнище представляват обобщаващи количествени характеристики, с помощта на които се описва типичното, характерното състояние на изследвания признак.  Най-често употребяваните показатели са средна аритметична величина (), мода (Mo) и  медиана (Me).



  • Средната  аритметична величина () е най-често използваният в научно-изследователската практика показател за средно равнище. Изчислява се по формулата:

 



3.1

Където:

Х - сума на стойностите



п – брой на наблюденията



  • Модата (Mo)  е онази стойност, която има най-голяма абсолютна честота, т.е. която се повтаря най-голям брой пъти.

  • Медианата (Ме) е онази стойност на променливата величина, която заема средно положение във вариационния ред и го дели на две равни части.  Броят на стойностите, които са по-малки или равни на медианата, е равен на броя на тези, които са по-големи или съвпадат с  нея.

  

3.3. Показатели за разсейване

 

 



Показателите за разсейване дават  количествена характеристика на величината на отклоняване на стойностите от типичното, средното равнище. За измерване на статистическото разсейване най-често се използват показателите размах (R), стандартно отклонение (S) и коефициент на вариация (V).

 


  • Размахът (R) е най-елементарният измерител на статистическото разсейване. Той представлява разликата между най-голямата и най-малката стойност на променливата величина и носи информация за диапазона, в който варират значенията на признака. Изчислява се по формулата:  

 

 (3.2)

където:

Xmax - най-голямата стойност на променливата

Xmin - най-малката стойност на променливата

           

Тъй като в изчисляването на размаха участват само двете крайни стойности на вариационния ред, той е твърде неустойчив измерител на разсейването.

 


  • Стандартното отклонение (S) е  най-прецизният и често използван показател за разсейване. Той описва големината на отклонение на стойностите на променливата от средната аритметична величина. Формулата, която го дефинира е:

 

 

(3.3)

където:

Xi – всяка една стойност на променливата в извадката

- средна аритметична величина

п – обем на извадката

 

Изброените статистически показатели за разсейване изразяват степента на различията в същата мерна единица, в която е изследваният признак. Това създава затруднения при сравняване на вариацията на различни признаци.

Показателят, който дава възможност за сравняване на различията на признаци, изразени в различни мерни единици или относно различна средна стойност е коефициентът на вариация (V). Той се изчислява по формула:

 




 

(3.4)


където:

S – стандартно отклонение

- средна аритметична величина

 

Освен за сравняване на разсейването на стойностите на различни променливи, коефициентът на вариация се ползва и за оценяване на степента на разсейването (еднородността на извадката):



  • Счита се, че разсейването на признака е малко (извадката е еднородна), когато стойността му е до 10-12%.

  •  Между 10 и 30% извадката е приблизително еднородна.

  • Когато е над 30% разсейването на признака е голямо (извадката е силно нееднородна).


 

3.4. Форма на разпределението

В настоящото помагало многократно е използван терминът “разпределение на променливата величина”, с който се означава съответствието между стойностите на променливата  и техните абсолютни  или относителни честоти. Тъй като  статистическите проучвания се основават на изследването на извадки, това разпределение се нарича емпирично. Ако то се онагледи графично, по конфигурацията на графичния образ може да се съди за закономерността, на която е подчинено изучаваното масово явление, и да се търси аналог сред т. нар. теоретични разпределения.

Изключително важно място  в теорията на статистиката заема  нормалното разпределение. То носи наименованието Гаус-Лапласово по имената на немския математик Карл Гаус (1777 – 1855) и френския математик Пиер Лаплас (1739 – 1827), които са го  изследвали и описали теоретично. Нормалното разпределение стои в основата на изясняване на  важни положения от репрезентативните статистически проучвания, интервалното оценяване, проверката на хипотези, методите за изготвяне на нормативи и др. Прилагането на параметрични методи за проверка на хипотези и за изследване на зависимости между променливите величини също изисква предварително изясняване на въпроса доколоко разпределението на емпиричните данни следва закона на нормалното разпределение. Ще се спрем накратко на някои негови особености:



Фиг. 3.1

На фигура 3.1 е представена хистограма на резултатите в тест 30 м. гл. б., които се ползват за практическите упражнения в настоящото помагало. Както се вижда, разпределението на честотите следва една характерна тенденция – най-често се срещат стойностите, които се намират около средната, а онези, които са близки до минималната и максималната стойност се срещат най-рядко. На същата графика е представена и кривата на нормалното разпределение. Много ясно се вижда, че разпределението на емпиричните стойности (височината на правоъгълниците на хистограмата) в голяма степен наподобява това на нормалното разпределение. Преди да се спрем на статистическите показатели, които описват степента на приближение на емпиричното към теоретичното нормално разпределение ще разгледаме някои характерни негови особености:

1. Кривата на разпределение на стойностите на променливата и съответните им абсолютни или относителни честоти е камбановидна (фигура 3.2).

 

 



Фиг. 3.2

 

2. Средната аритметична величина, модата  и медианата съвпадат по стойност и определят центъра разпределението.



3. Стандартното отклонение (S) определя заостреността на кривата на разпределение. Колкото отклоненията от средното равнище са  по-малки, толкова кривата е по-изострена и обратно. На фиг. 3.3 са представени две емпирични разпределения с еднакъв център, но с различно разсейване.

 



Фиг. 3.3

  

4. Кривата на нормалното разпределение е симетрична по отношение на перпендикуляра, спуснат от нейния връх към абсцисата, където се намира средната аритметична величина. На фигура 3.2 е представено симетрично разпределение, а на фигура 3.4 две несиметрични разпределения.. Разпределение а е с дясно изтеглено, а б - с ляво изтеглено рамо.


а - дясноизтеглено

б-лявоизтеглено




Фиг. 3.4

Симетричността на разпределението се описва с показателя за асиметрия (Аs), който при нормално разпределение е равен на нула (As=0). Когато коефициентът на асиметрия е с положителен знак, кривата на разпределение е с дясно изтеглено рамо (а), средната аритметична е по-голяма от модата и медианата. При разпределение с ляво изтеглено рамо (б) стойността на коефициента на асиметрия е с отрицателен знак, а средната аритметична е по-малка от модата и медианата.

  За симетричността на емпиричното разпределение се съди по изчисления от извадката по формула 3.5 коефициент на асиметрия (As).  



(3.5)

където:

m3 – трети централен момент, който се изчислява по формула 3.6

S – стандартно отклонение

 

Третият централен момент се изчислява по формула:

 



(3.6)

където:

Xi – всяка една стойност на променливата в извадката

- средна аритметична величина

п – обем на извадката

 

Абсолютната стойност на получения по данни от извадката коефициент се сравнява с табличната стойност на коефициента, подбрана от приложение 3 в от обема на извадката (n) и равнището на значимост (). В случай че:



  • |As| < Asсе приема, че разпределението на емпиричните данни е симетрично.

  • |As| As    се счита, че разпределението е несиметрично.

 

5. Височината на върха на нормалното разпределение се описва с показателя ексцес (Ех), който при нормално разпределение е равен на нула. На фигура 3.5 са представени примерни разпределения с нормален (б), повишен - положителен (а) и понижен - отрицателен ексцес (в).

  

  

Фиг. 3.5


Информация  за степента на съвпадение на височината на върха на емпиричното разпределение с приетия за еталон връх на нормалното разпределение (Ex=0) дава изчисленият по формула 3.7 коефициент на ексцес (Ex). 





(3.7)

където:

m4четвърти централен момент, който се изчислява по аналогичен на третия централен момент начин,  като разликите между всяка една стойност на променливата и средната аритметична се повдигат на четвърта степен

S – стандартно отклонение

 

Абсолютната стойност на изчисления коефициент се сравнява с подбраната в зависимост от обема на извадката (n) и равнището на значимост () таблична стойност (приложение 4). В случай че:



  • |Ex|< Ex    се приема, че разпределението на емпиричните данни има нормален ексцес.

  • |Ex| Ex    се счита, че разпределението има ненормален ексцес.

  Изчислените емпирични стойности на коефициентите на асимерия и ексцес на представеното на фиг. 3.1 разпределение на резултатите в тест 30 м. гл. б. са съответно As=0,331 и Ex=-0,286. При обем на извадката n=50 и a=0,05 критичните стойности са съответно As=0,533 и Ex=0,848. Тъй като емпиричните стойности са по-малки от критичните може да се приеме, че разпределението на променливата е нормално.

3.5. Вариационен анализ със SPSS

3.5.1. Обработка на целия масив


Задача за разучаване 3.1.

По данните от файла Ph_education.sav направете вариационен анализ на резултатите от първото тестиране.



1. Изберете менюто Analyze> Descriptive statistics>Descritives (фиг. 3.6).





Фиг. 3.6
2. В диалоговия прозорец Descriptives (фиг.3.7) маркирайте променливите, натиснете бутона със стрелката и ги изпратете в полето Variable(s);



Фиг. 3.7

3. Натиснете бутона Options. В отворилия се диалогов прозорец (фиг. 3.8) отбележете статистическите показатели, които да включи обработката.



Средно равнище

          Mean - средна аритметична величина

          Sum - сума на стойностите

Разсейване

          Std. deviation - стандартно отклонение

          Variance - дисперсия

          Range - размах

          Minimum - минимална стойност

          Maximum - максимална стойност

          S.E. mean - репрезентативна грешка



Разпределение

         Kurtosos - ексцес

         Skewness - асиметрия

Фиг. 3.8

4. Натиснете бутона Continue, за да се върнете към основния диалогов прозорец и OK, за да стартирате обработката.



3.5.2. Обработка на подгрупи от базата данни


Задача за разучаване 3.2.

Разделете масива от данни на групи за самостоятелна обработка по променливата grupa и направете вариационен анализ за резултатите в тест «Совалка».







  1. Изберете Data>Split File (фиг. 3.9). Появява се диалоговият прозорец, показан на фигура 3.10. От него личи, че по подразбиране програмата обработва всички случаи.



Фиг. 3.9



Фиг. 3.10

2. Задайте последователно:



  • Compare groups (ако искате анализът за групите да се появи в една таблица) или Organize output by groups (ако искате анализът за всяка група да се появи в отделна таблица),

  • Изпратете променливата, в която е записана принадлежността към групите, за които желаете да осъществите самостоятелна обработка в полето Groups Based on;

  • Потвърдете с ОК.

3. Повторете вариационния анализ по алгоритъма, описан в 3.5.1. Като резултат обработката ще бъде осъществена за всяка от групите.

3.6. Представяне на резултати от вариационен анализ

Резултатът от обработката (задача за разучаване 3.1) се появява в разпечатката на SPSS по начина, представен на таблица 3.1:

Таблица 3.1

При публикуване в научни разработки таблицата се нуждае от редактиране, изписване на статистическите показатели с възприетите символи и допълнително изчисляване на коефициента на вариация (V%). Окончателно оформената таблица изглежда по начина, представен в таблица 3.2.

Таблица 3.2.



Показател

Тест

n

Xmin

Xmax

R



S

V

As

Ex

1

30 m

50

5,45

7,01

1,56

6,22

0,359

5,78

0,33

-0,29

2

Sovalka

50

13,93

16,43

2,5

14,75

0,567

3,85

0,82

0,07

3

Jonglirane

50

2

4

2

2,82

0,628

22,30

0,15

-0,47

4

Kombinran

50

10,45

14,61

4,16

13,10

0,919

7,01

-0,48

0,56

Забележка: Критичните стойности на коефициентите на асиметрия и ексцес при n=50 и =0.05 са равни на 0.673 и 1.324

Резултатите от вариационния анализ на отделните групи (задача за разучаване 3.2.) се появява по начина, представен в таблица 3.3, а редактираният и вид – в таблица 3.4.

Таблица 3.3

Таблица 3.4





Показател

Тест

n

Xmin

Xmax

R



S

V

As

Ex

1

Експериментална

25

13,93

16,43

2,5

14,77

0,63

4,32

0,99

0,31

3

Контролна

25

14,09

15,61

1,52

14,72

0,49

3,39

0,39

-1,19

Забележка: Критичните стойности на коефициентите на асиметрия и ексцес при n=50 и =0.05 са равни на 0.927 и 1.803


Решете задачи 1 и 2 от изпитния проект.
Тема 4. Сигмален метод за изработване на нормативи
4.1. Основни понятия

Свойствата на нормалното разпределение имат голямо приложение в научно приложната дейност в спорта и физическото възпитание. Най-често на тях се основава разработването на нормативи за оценка на резултатите в спортно-педагогическите тестове. Норматив в спортната наука се нарича гранична стойност на резултата, които позволява изследваното лице да се причисли към дадена класификационна група.

Граничните стойности се изчисляват на основата на закона за нормалното разпределение, на които не се спрем накратко.

От теорията е известно, че вероятността (Р%), дадена стойност на променливата величина, да се намира в интервала от Х1 до Х2 може да бъде представена с площта, заключена между кривата на нормалното разпределение (фиг. 4.1), абсцисата и перпендикулярите, спуснати към нея в точки и. Вероятността не зависи от средната аритметична и стандартното отклонение, а само от множителя Z, който се нарича стандартизирано (нормирано) отклонение и се изчислява по формула 4.1:



(4.1)

Фиг. 4.1


Това важно свойство на нормалното разпределение намира израз в т.нар. “правило на трите сигми(фиг.4.2).

Фиг. 4.2


От фигурата се вижда, че в интервала попадат централните 68, 26% от случаите в генералната съвкупност, което означава, че вероятността за попадане на един случайно взет резултат в този интервал е 68,26%. Вероятността за попадане на даден резултат в интервала е 95,45% и т. н.

На практика това свойство на нормалното разпределение се използва за изработване на нормативи по т. нар. сигмален метод. В него се използват средната стойност () и стандартното отклонение (S). Броят на степените, словесната оценка и процентът от случаите, които попадат към тях се определят от изследователя. В таблица 4.1 са дадени границите и словесните оценки на норматив по пет степенната скала на Щефко:

Таблица 4.1

Словесна оценка

Граници

Процент от случаите към всяка от оценките

Кумулативен % от случаите

Ниска

Под   –2.S

2.27

2,27

Под средна

От  –2.S до -1.S

13.59

15,86

Средна

От  –1.S до +1.S

68.26

84,12

Над средна

От  +1.S до +2.S

13.59

97,71

Висока

Над +2.S

2.27

99.98

 
Недостатък на този оценителна скала е фактът, че твърде голям процент от случаите попадат към средната оценка, което прави норматива недостатъчно селективен. В практиката се ползва и следната седем степенна скала (таблица 4.2):

 Таблица 4.2



Словесна оценка

Граници

Процент от случаите към всяка от оценките

Кумулативен % от случаите

Много ниска

Под   –2.S

2.27

2,27

Ниска

От  –2.S до -1.S

13.59

15,86

Под средна

От  –0,5.S до -1.S

14,99

30,85

Средна

От  –0,5.S до +0,5.S

38,29

69,14

Над средна

От  +0,5.S до +1.S

14,99

84,12

Висока

От  +1.S до +2.S

13.59

97,71

Много висока

Над +2.S

2.27

99.98

 

За изчисляване на нормативи с помощта на SPSS биха могли да се ползват персентилите, защото при идеално нормално разпределение сигмалните и персентилните оценки съвпадат. За разработване на 5 степенен норматив е необходимо да се изчислят Р2, Р16, Р84 и Р98.1 За разработване на норматив със 7 степенна скала е необходимо да се изчислят Р2, Р16, Р30, P70, P84 и Р98.

 

Законът на нормалното разпределение дава възможност да се оценява и всяка една стойност на променливата чрез т. нар. Z-оценка (виж формула 4.1). Очевидно е, че ако оценяваната стойност е под средното равнище, нейната Z–оценка е отрицателна, ако съвпада със средната стойност Z=0, а ако е по-голяма от нея – Z e положително число. В програмните възможности на SPSS е заложено, успоредно с осъществяване на вариационен анализ да се изчислят и Z-оценките са всяка една стойност на Х.

 

Оценяването на всяка една стойност със Z-оценки създава известни затруднения, защото част от оценките (тези по-ниски от средната стойност) са отрицателни. Поради това в практиката се ползват и т.нар. Т-оценки. Тяхната стойност се изчислява по формула 4.2:



(4.2)

 

Чрез това преобразуване средната стойност се оценява с 50 точки. Оценките на резултатите варират от 0 до 100 т., но вероятността за получаване на резултат по-малък от 20 т. и по-голям от 80 т. е много малка. При нормално разпределение стойността им съвпада с персентилните оценки. Друго предимство, което имат Т -оценките при изработване на нормативна база по резултати от повече тестове е, че те дават възможност за осредняване на оценките.



При разработването на нормативи трябва да се спазват следните важни условия:

  • Те се съставят на базата на реално проучване на състоянието на оценяваните признаци, на основата на достатъчна по обем репрезентативна извадка.

  • Съставените нормативи се отнасят за съвкупността, която е изследвана и не могат да бъдат използвани за друга съвкупност.

  • Нормативите периодически трябва да се осъвременяват, защото физическото развитие и дееспособност на подрастващите от различните поколения се променят.


4.2. Задачи за упражнение


Задача за разучаване 4.1

По данните от файла Ph_education.sav изчислете необходимите стойности, за да разработите 5-степенен норматив за оценка на резултата в тест 30 м. гл. б. при І изследване. Ползвайте процентните разпределения, представени в таблица 4.1.




Изчисляването става с калкулатор, като се ползва средната стойност и стандартното отклонение на променливата. Със SPSS могат да се изчислят стандартизираните стойности (Z-оценките) на всеки резултат или да се изчислят персентилите, които съответстват на границите на норматива Analyze>Descriptive Statistics>Frequencies

Представяне на резултатите от обработката

Словесна оценка

Граници

Процент към всяка от оценките

Ниска

Под 5,50 сек.

2.27

Под средна

От 5,50 до 5,85 сек.

13.59

Средна

От 5,86  до  6,58 сек.

68.26

Над средна

От 6,59 до 6,94 сек.

13.59

Висока

Над 6,94 сек.

2.27

Забележка: Нормативът е направен на базата на средната стойност ( =6,22 сек.)  и стандартното отклонение (S=0,36 сек.)

Решете задача 3 от изпитния проект.

1   2   3   4   5   6   7   8   9


База данных защищена авторским правом ©obuch.info 2016
отнасят до администрацията

    Начална страница