Лекции по Въведение в статистиката



Дата03.09.2017
Размер135.6 Kb.
#29381

Чернова на лекции по Въведение в статистиката

Павлина Йорданова pavlina_kj@abv.bg




Тема 7. Статистическо разсейване, асиметрия, ексцес.
Само едно число никога не е достатъчно за описване на действителността.
Средните величини са обобщаващи характеристики и не дават информация за разпръснатостта на измерените значения на признака около тях. Вярно е, че значенията на признака са около средната аритметична, но също така е вярно, че много от тях се различават от нея. Отклоненията се измерват с различните измерители на вариация. Колкото вариацията е по-малка, толкова съвкупността е по-еднородна. Ако всички значения на признака са равни вариацията е нула.
7.1. Статистическа вариация. Методи за измерване.

Най-често използваните характеристики на разсейването са: размах на разсейването, средно аритметично отклонение, средно квадратично отклонение, дисперсия. Всеки измерител може да бъде определен в абсолютни числа, като наследява мярката на признака, който характеризира или в относителни числа - като процент от средната аритметична величина. Когато сравняваме вариации се използва втория подход.



  • Размах на разсейването

Дава представа за амплитудата на изменение на признака при отделните единици. При определянето му участват само най-малкото и най-голямото измерено значение на признака, за това е много груб измерител. Прилага се предимно при степенни редове.

Абсолютният размер на размаха на разсейването се определя по формулата:

R = Xmax - Xmin.

Средният размер на размаха на разсейването е наименованата величината, която се определя по формулата



  • Средно аритметично отклонение

Средното аритметично отклонение измерва степента на разсейване на отделните наблюдения около средното аритметично, независимо в каква посока са самите отклонения.

В абсолютни числа, в зависимост от това дали се пресмята от групирани или от негрупирани данни имаме:



  • непретеглено средноаритметично отклонение



  • претеглено средноаритметично отклонение

За сравняване се използва неговия относитeлен размер,



,

който показва каква част е то от средното аритметично.



  • Средно квадратично (стандартно) отклонение

Представлява осредняване на отклоненията на измерените значения на признака при отделните статистически единици от тяхната средна аритметична по формулата за средна квадратична, т.е.

  • при негрупирани данни стандартното отклонение се пресмята по формулата

;

Тази величина наследява мярката на разглеждания признак.

Относителният размер на стандартното отклонение се намира от

.

Със средствата на математическата статистика е показано, че когато се работи с малки по обем извадки, по-добра оценка на стандартното отклонение на генералната съвкупност се получава, когато от n в знаменателя извадим единица. Тогава стандартното отклонение



  • при негрупирани данни се определя по формулата

;

  • при групирани данни

Това е най-добрия измерител на разсейването на наблюденията около .

Квадратът на стандартното отклонение се нарича дисперсия. Това е ненаименована величина и има следните свойства:

- дисперсията на равни наблюдения е нула.



  • ако към всички измерени значения на признака прибавим или извадим една и съща константа дисперсията не се променя.

  • ако всички измерени значения на признака умножим с една и съща константа дисперсията на новата съвкупност се получава като умножим дисперсията на старата съвкупност по квадрата на тази константа.

До сега разгледахме общата дисперсия. Тя измерва вариацията на признака в цялата съвкупност и има n-1 степени на свобода. Ако разделим съвкупността на k подгрупи можем да анализираме междугруповата и вътрешногруповата дисперсия. Виж Дисперсионен анализ в [1].

Въпроси към темата:

Защо абсолютният размах на разсейването е твърде груба негова характеристика?

Какво измерва стандартното отклонение?

Примерни ситуации и решения:

Пример 1: По данните от Табл.1 пресметнете средния абсолютен и относителен размер на размаха на разсейването, абсолютния и относителен размер на средното аритметично отклонение и на стандартното отклонение, определете дисперсията на разпределението на наблюдаваните фирми по признака “брутна печалба”. Определете същите характеристики от групирани данни, т.е. от Табл. 2.

Решение: Първо ще използваме Табл.1 и ще определим съответните характеристики от негрупирани данни.

Средният абсолютен размер на размаха на разсейването е



Относителният размер на размаха на разсейването около средното е



което е един сравнително широк размах, т.е. екстремалните измерени значения значително се различават от останалите.

Абсолютният размер на средното аритметично отклонение е

Съответният относителен размер на средното аритметично отклонение е



Абсолютният размер на стандартното отклонение е



Относителният размер на стандартното отклонение е



Дисперсията е квадрата на абсолютния размер на стандартното отклонение и е 306,12.



Сега ще определим съответните характеристики от групирани данни.

Табл. 9.

Бр. печалба в х.лв.

fi











Над 14 до 23

7

18,5

36,73

293,84

1349,09

10792,74

Над 23 до 32

11

27,5

27,73

277,30

768,95

7689,53

Над 32 до 41

14

36,5

18,73

262,22

350,81

4911,38

Над 41 до 50

21

45,5

9,73

204,33

94,67

1988,13

Над 50 до 59

23

54,5

0,73

16,79

0,53

12,26

Над 59 до 68

32

63,5

8,27

264,64

68,39

2188,57

Над 68 до 77

27

72,5

17,27

449,02

298,25

7754,58

Над 77 до 86

12

81,5

26,27

341,51

690,11

8971,47

Общо:

147

x

x

2109,65

x

44308,66

Размахът на разсейването при групирани данни е същият както при негрупирани данни, което е индикатор, че добре сме подбрали интервалите, по които е извършена групировката.

От Табл. 9 определяме, че абсолютният размер на средното аритметично отклонение е



Съответният му относителен размер е



Абсолютния размер на стандартното отклонение е



Съответният относителен размер е



Дисперсията е квадрата на стандартното отклонение и е 301,42.

Приблизителните стойности на числовите характеристики на извадката, пресметнати от групирани и негрупирани данни се дължат на сравнително равномерното разпределение на единиците в отделните интервали, по които е извършена групировката.

Задачи за упражнение:

Задача 1: По данните от Табл. 3 пресметнете абсолютния и относителен размер на размаха на разсейването, абсолютния и относителен размер на средното аритметично отклонение и на средното квадратично отклонение и определете дисперсията на разпределението на туристите по признака “Средни месечни разходи за нощувки в курортен комплекс Х през 2014г.”. Пресметнете същите характеристики и от групирани данни. На какво се дължат различията в получените резултати? Кои са по-точни и защо?
7.2. Моменти, асиметрия, ексцес.



Моментите са обобщаващи характеристики на разпределението на наблюдаваната величина. Те биват начални и централни. Централните се получават от началните, като на мястото на самите величини поставим отклоненията им от средната аритметична. Освен първите, останалите моменти са ненаименовани величини. В названията на моментите обикновено се споменава и степента на значенията на признака във формулата.

В зависимост от вида на изходните данни началните моменти се пресмятат по формулите:

- при негрупирани данни

- при групирани данни

Първият начален момент съвпада със средната аритметична, т.е. M1 = .

s – тия централен момент ще означаваме с ms.

Първият централен момент m1 е нула. Вторият, съвпада с дисперсията, т.е. m2 = s2. Третият m3 характеризира асиметрията, а четвъртият, m4 - ексцеса.

Фиг.10.



f(x)

0 х

Стандартна нормалната крива е графиката на функцията

, x Î R.

Тя съвпада с графиката на плътността на стандартно нормално разпределена случайна величина. На фиг. 10 и фиг. 11 тя е начертана с плътна линия. Лицето на фигурата под нормалната крива и над абсцисната ос е единица. Отклоненията в хоризонтална посока от нормалната крива се наричат – асиметрия. Илюстрирани са на фиг. 10. Първични представи за асиметрията на разпределението на единиците от извадката по групировачния признак получаваме, когато начертаем полигона или хистограмата на разпределението и ги сравним с нормалната крива. Количествено можем да я измерим чрез следните ненаименовани величини:



  • коефициент на асиметрия на Пирсън ,

  • коефициент на асиметрия на Юл ,

  • моментен коефициент на асиметрия .

Различните коефициенти на асиметрия, изчислени по една и съща извадка имат различни стойности, за това при сравнителен анализ трябва да се използва един и същ коефициент. Общото при трите коефициента е, че при симетрични разпределения те са равни на нула. Положителни са, когато имаме дясна асиметрия (виж --- на фиг. 10), а отрицателни при лява (виж -××-××- на фиг. 10). Колкото абсолютната стойност на коефициента на асиметрия е по-голяма, толкова по-несиметрични са двата склона на кривата на разпределението на изследваната съвкупност по този признак.

Отклоненията във вертикална посока от нормалната крива се наричат – ексцес (изостреност). Първични представи за ексцеса на разпределението на единиците от извадката по групировачния признак получаваме, когато начертаем полигона или хистограмата на разпределението и ги сравним с нормалната крива. Моментният коефициент на ексцес е един ненаименован количествен измерител на ексцеса и се определя по формулата:



.

Тук имаме -3 за да сравняваме Е с нулата. Когато Е > 0 говорим за положителен ексцес и изостреност над нормалната крива, при Е < 0 имаме отрицателен ексцес и полигона и хистограмата са по-ниски от нормалната крива, иначе имаме нормален ексцес. Различните случаи са илюстрирани на фиг.11.



Фиг. 11.

f(x)

0 х
Примерни ситуации и решения:

Пример 1: По данните от Табл. 8 пресметнахме, че средната аритметична е 27 х.лв., Me = 26,28 х.лв., Mo = 26 х.лв. Намерете средното аритметично и средното квадратично отклонение в абсолютни и относителни числа и пресметнете дисперсията. Определете коефициентите на асиметрия и ексцес.

Решение:



Средното аритметично отклонение е 7,6 х.лв. и е 28,15% от средноаритметичния размер на ДМА.





Табл. 10. Размер на ДМА на 100 частни зем. стопанства в обл. Х към 31.12.2014г.

ДМА

в х. лв.

ЗC

в бр.

Междинни изчисления
















До 10

5

5

22

110

2420

-53240

1171280

10 ¸ 20

15

15

12

180

2160

-52920

311040

20 ¸ 30

45

25

2

90

180

-360

720

30 ¸ 40

25

35

8

200

1600

12800

102400
над 40

10

45

18

180

3240

58320

1049760

Общо:

100

x

62

760

9600

-35400

2635200

.

Средното квадратично отклонение е 9,798 х. лв. и е 36,3% от средноаритметичния размер на ДМА. Дисперсията е 96 х. лв.

За да пресметнем асиметрията и ексцеса ни е необходимо да определим третия и четвъртия централен момент.





  • Коефициентът на асиметрия на Пирсън е

.

  • Коефициентът на асиметрия на Юл е

.

  • Моментният коефициент на асиметрия е

.

  • Моментният коефициент на ексцес е

т.е. имаме по-ниска от нормалната крива.


Задачи за упражнение:

Задача 1: По данните от Табл.1. определете коефициентите на асиметрия и ексцес на разпределението на фирмите по признака “Средна брутна печалба за 2014 г.” Пресметнете същите характеристики и по данните от Табл.2. На какво се дължат различията в получените резултати?

Задача 2: ІІо данните Табл.3. определете коефициентите на асиметрия и ексцес на разпределението на туристите по признака “Среден месечен разход за нощувки в курортен комплекс Х през 2014 г.”. Определете същите коефициенти от групирани данни. Защо съответните характеристики, пресметнати по двата начина, се различават?
С какво може да ни бъде полезен Excel в случая:

1. Функцията AVEDEV(x) връща.

2. Функцията DEVSQ(x) връща.

3. Функцията STDEV(x) връща.

4. Функцията STDEVP(x) връща.

5. Функцията SKEW(x) връща моментния коефициент на асиметрия.

6. Функцията KURT(x) връща моментния коефициент на ексцес.

7. Виж също Tools -> Data Analysis -> Descriptive Statistics.


1 Петров В., Т. Тодоров. Основи на статистиката. В.Търново, 2000.


Последна редакция 03.9.2017 г.

Каталог: tadmin -> upload -> storage
storage -> Литература на факта. Аналитизъм. Интерпретативни стратегии. Въпроси и задачи
storage -> Лекция №2 Същност на цифровите изображения Въпрос. Основни положения от теория на сигналите
storage -> Лекция 5 система за вторична радиолокация
storage -> Толерантност и етничност в медийния дискурс
storage -> Ethnicity and tolerance in media discourse revisited Desislava St. Cheshmedzhieva-Stoycheva abstract
storage -> Тест №1 Отбележете невярното твърдение за подчертаните думи
storage -> Лекции по Въведение в статистиката
storage -> Търсене на живот във вселената увод
storage -> Еп. Константинови четения – 2010 г някои аспекти на концептуализация на богатството в руски и турски език


Сподели с приятели:




©obuch.info 2024
отнасят до администрацията

    Начална страница