Лекции по Въведение в статистиката



страница2/3
Дата26.09.2018
Размер0.68 Mb.
#83283
1   2   3
Решение: Определяме средните аритметични по двата признака

Останалите междинни изчисления са дадени в Табл. 19.



Използваме (1) и получаваме



Табл.20.

ф. №

Ср.Дн. Печ.

ПТ

Междинни изчисления

Xi

Yi

Отклонения от ср. на Х

Отклонения от ср. на Y

Произведение от откл.

Квадрати на откл. по Х

Квадрати на откл. по Y

1

220

4

-100,71

-3,43

345,31

10143,37

11,76

2

250

6

-70,71

-1,43

101,02

5000,51

2,04

3

300

7

-20,71

-0,43

8,88

429,08

0,18

4

310

8

-10,71

0,57

-6,12

114,80

0,33

5

280

7

-40,71

-0,43

17,45

1657,65

0,18

6

330

9

9,29

1,57

14,59

86,22

2,47

7

350

9

29,29

1,57

46,02

857,65

2,47

8

400

10

79,29

2,57

203,88

6286,22

6,61

9

270

6

-50,71

-1,43

72,45

2571,94

2,04

10

420

8

99,29

0,57

56,73

9857,65

0,33

11

370

9

49,29

1,57

77,45

2429,08

2,47

12

350

8

29,29

0,57

16,73

857,65

0,33

13

330

7

9,29

-0,43

-3,98

86,22

0,18

14

310

6

-10,71

-1,43

15,31

114,80

2,04

Общо:

4490

104

0

0

965,71

40492,86

33,43

Определеният корелационен коефициент показва, че между наблюдаваните признаци има силна правопропорционална зависимост.



Пример 2: С цел да се определи силата на праволинейната зависимост между краткотрайните и дълготрайните материални активи на туристическите фирми, обслужващи регион Х, са извършени 200 наблюдения върху такива фирми. Данните са дадени в Табл. 21 Оценете корелационния коефициент между тези два признака.

Решение: Ще използваме формула (2). За целта пресмятаме средните аритметични и стандартните отклонения на двата признака. Получаваме



За определянето на сумата от числителя на формула (2) построяваме помощна Табл.21, съдържаща произведенията . Изчисляваме корелационния коефициент на Браве по групирани данни




Табл.21.

Обем на ДМА в д.х. лв.




Обем на краткотрайните активи в х.лв.

Брой

фирми

до 35

над 35 до 45

над 45 до 55

Над 55 до 65

над 65

Среди на интервалите

30

40

50

60

70

до 15

10

15

5

3

0

0

23

над 15 до 25

20

7

20

7

4

0

38

над 25 до 35

30

3

15

18

9

2

47

над 35 до 45

40

1

4

17

19

5

46

над 45 до 55

50

0

3

5

10

5

23

Над 55

60

0

1

5

8

9

23

Брой фирми

x

26

48

55

50

21

200



Табл.22.




30

40

50

60

70

Общо:

10

4500

2000

1500

0

0

8000

20

4200

16000

7000

4800

0

32000

30

2700

18000

27000

16200

4200

68100

40

1200

6400

34000

45600

14000

101200

50

0

6000

12500

30000

17500

66000

60

0

2400

15000

28800

37800

84000

Общо:

12600

50800

97000

125400

73500

359300


Задачи за упражнение:

Задача 1: С цел изследване на зависимостта между обема на дълготрайните материални активи и равнището на производителността на труда са наблюдавани 12 еднотипни промишлени предприятия. Резултатите от наблюдението са дадени в Табл.23.

Табл.23.

Фирма №

1

2

3

4

5

6

7

8

9

10

11

12

ДМА в млн. лв.

2

3,3

5,3

2,5

7

4,5

1,1

3,2

6,3

4,2

3,7

5,2

ПТ изд/ч.

4,1

6,2

7

6,7

7,7

6,3

4

6

7

6,8

4

8

Определете силата на зависимостта между наблюдаваните признаци.
Задача 2: Управител на фирма решава да изследва зависимостта между обема на персонала и обема на чистата печалба за една година в еднородни на своята фирми. Наблюдава 120 такива фирми. Данните са дадени в Табл.24. Помогнете му да оцени силата на праволинейната зависимост между тези два признака.

Табл.24.



Обем на чистата печалба

Обем на персонала в брой лица

Брой фирми

до 45

над 45 до 65

над 65 до 85

над 85

До 0,2

5

5

3

0

13

над 0,2 до 0,4

7

10

7

0

24

над 0,4 до 0,6

3

15

12

2

32

над 0,6 до 0,8

1

4

13

5

23

над 0,8 до 1

0

3

7

6

16

над 1

0

1

5

6

12

Брой фирми

16

38

47

19

120



14.3. Измерване на зависимости при неметрирани признаци
Ако поне един от изследваните признаци е представен на слаба скала (например ординална), не можем да пресметнем корелационния коефициент на Браве. Ако двата признака са представени на рангова скала се използват коефициентите на корелация на Спирмън или Кендал. В общия случай можем да използваме коефициентите на взаимносвързаност (на контингенция) на Пирсън и Чупров. При един дихотомен и един метриран признак са подходящи бисериалните коефициенти на корелация и т.н.

Да започнем с Ранговите коефициенти на корелация.

Да предположим, че над единиците от съвкупността са извършени наблюдения, върху два признака, измерени на рангова скала. Спирмън използва като измерител на близостта на ранговете, сумата от квадратите на разликите им. Ако съществува силна положителна зависимост между ранговете на единиците, те би трябвало да съвпадат и сумата от квадратите на разликите им би била нула. Ако зависимостта е силна отрицателна, ранговете ще са подредени в обратен ред. Разликите им в този случай, ако n е четно, ще образуват редица само от нечетните числа от – (n-1) до (n-1) или ако n е нечетно, само от четните числа в този интервал. Тогава сумата от квадратите им ще е .

При липсата на каквато и да е зависимост можем да приемем, че тази сума ще е средното аритметично на двете крайни възможности, т.е.

Като отнесем тази величина към действителната сума от квадратите на разликите, т.е.

получаваме измерител на зависимостта, който би бил нула при силна правопропорционална зависимост между ранговете. Ето защо ранговият коефициент на корелация на Спирмън се пресмята по формулата



За да използваме този коефициент, ранговете по един и същ признак трябва да са различни числа от 1 до n. Те се получават като на всяка от единиците определим различна степен на притежаване на наблюдаваното качество.

За да разкажем как се пресмята Ранговия коефициент на корелация на Кендал, трябва да дефинираме понятията съответствия и инверсии. Да предположим, че статистическите единици са подредени по ранговете на признака Х във възходящ ред. Брой на съответствията на i – тата статистическа единица ще означаваме с рi, и това е броят на двойките след i – тата, т.е. за j = i+1,…,n такива че Хi < Xj и Yi < Yj. Брой на инверсиите на i – тата статистическа единица ще означаваме с qi, и това е броят на двойките след i – тата, т.е. при j = i+1,…, n, за които Хi < Xj и Yi > Yj. Ако всички двойки са разположени в еднакъв порядък, възходящо, сумата от всички съответствия P ще е равна на сумата на естествените числа от 1 до n-1, т.е.

,

а сумата от инверсиите ще е нула.

По аналогичен начин ако ранговете на признака Y са подредени низходящо, сумата от инверсиите Q ще е

,

а сумата от съвпаденията ще е нула.

Като измерител на зависимостта между двата статистически признака Кендал използва отношението на разликата между съответствията и инверсиите и сумата на естествените числа от 1

до n-1, т.е. неговия корелационен коефициент има вида



.

В голяма част от литературата този коефициент се означава с и се нарича


Каталог: tadmin -> upload -> storage
storage -> Литература на факта. Аналитизъм. Интерпретативни стратегии. Въпроси и задачи
storage -> Лекция №2 Същност на цифровите изображения Въпрос. Основни положения от теория на сигналите
storage -> Лекция 5 система за вторична радиолокация
storage -> Толерантност и етничност в медийния дискурс
storage -> Ethnicity and tolerance in media discourse revisited Desislava St. Cheshmedzhieva-Stoycheva abstract
storage -> Тест №1 Отбележете невярното твърдение за подчертаните думи
storage -> Лекции по Въведение в статистиката
storage -> Търсене на живот във вселената увод
storage -> Еп. Константинови четения – 2010 г някои аспекти на концептуализация на богатството в руски и турски език


Сподели с приятели:
1   2   3




©obuch.info 2024
отнасят до администрацията

    Начална страница