Решение: Определяме средните аритметични по двата признака
Останалите междинни изчисления са дадени в Табл. 19.
Използваме (1) и получаваме
Табл.20.
-
ф. №
|
Ср.Дн. Печ.
|
ПТ
|
Междинни изчисления
|
Xi
|
Yi
|
Отклонения от ср. на Х
|
Отклонения от ср. на Y
|
Произведение от откл.
|
Квадрати на откл. по Х
|
Квадрати на откл. по Y
|
1
|
220
|
4
|
-100,71
|
-3,43
|
345,31
|
10143,37
|
11,76
|
2
|
250
|
6
|
-70,71
|
-1,43
|
101,02
|
5000,51
|
2,04
|
3
|
300
|
7
|
-20,71
|
-0,43
|
8,88
|
429,08
|
0,18
|
4
|
310
|
8
|
-10,71
|
0,57
|
-6,12
|
114,80
|
0,33
|
5
|
280
|
7
|
-40,71
|
-0,43
|
17,45
|
1657,65
|
0,18
|
6
|
330
|
9
|
9,29
|
1,57
|
14,59
|
86,22
|
2,47
|
7
|
350
|
9
|
29,29
|
1,57
|
46,02
|
857,65
|
2,47
|
8
|
400
|
10
|
79,29
|
2,57
|
203,88
|
6286,22
|
6,61
|
9
|
270
|
6
|
-50,71
|
-1,43
|
72,45
|
2571,94
|
2,04
|
10
|
420
|
8
|
99,29
|
0,57
|
56,73
|
9857,65
|
0,33
|
11
|
370
|
9
|
49,29
|
1,57
|
77,45
|
2429,08
|
2,47
|
12
|
350
|
8
|
29,29
|
0,57
|
16,73
|
857,65
|
0,33
|
13
|
330
|
7
|
9,29
|
-0,43
|
-3,98
|
86,22
|
0,18
|
14
|
310
|
6
|
-10,71
|
-1,43
|
15,31
|
114,80
|
2,04
|
Общо:
|
4490
|
104
|
0
|
0
|
965,71
|
40492,86
|
33,43
|
Определеният корелационен коефициент показва, че между наблюдаваните признаци има силна правопропорционална зависимост.
Пример 2: С цел да се определи силата на праволинейната зависимост между краткотрайните и дълготрайните материални активи на туристическите фирми, обслужващи регион Х, са извършени 200 наблюдения върху такива фирми. Данните са дадени в Табл. 21 Оценете корелационния коефициент между тези два признака.
Решение: Ще използваме формула (2). За целта пресмятаме средните аритметични и стандартните отклонения на двата признака. Получаваме
За определянето на сумата от числителя на формула (2) построяваме помощна Табл.21, съдържаща произведенията . Изчисляваме корелационния коефициент на Браве по групирани данни
Табл.21.
Обем на ДМА в д.х. лв.
|
|
Обем на краткотрайните активи в х.лв.
|
Брой
фирми
|
до 35
|
над 35 до 45
|
над 45 до 55
|
Над 55 до 65
|
над 65
|
Среди на интервалите
|
30
|
40
|
50
|
60
|
70
|
до 15
|
10
|
15
|
5
|
3
|
0
|
0
|
23
|
над 15 до 25
|
20
|
7
|
20
|
7
|
4
|
0
|
38
|
над 25 до 35
|
30
|
3
|
15
|
18
|
9
|
2
|
47
|
над 35 до 45
|
40
|
1
|
4
|
17
|
19
|
5
|
46
|
над 45 до 55
|
50
|
0
|
3
|
5
|
10
|
5
|
23
|
Над 55
|
60
|
0
|
1
|
5
|
8
|
9
|
23
|
Брой фирми
|
x
|
26
|
48
|
55
|
50
|
21
|
200
|
Табл.22.
-
|
30
|
40
|
50
|
60
|
70
|
Общо:
|
10
|
4500
|
2000
|
1500
|
0
|
0
|
8000
|
20
|
4200
|
16000
|
7000
|
4800
|
0
|
32000
|
30
|
2700
|
18000
|
27000
|
16200
|
4200
|
68100
|
40
|
1200
|
6400
|
34000
|
45600
|
14000
|
101200
|
50
|
0
|
6000
|
12500
|
30000
|
17500
|
66000
|
60
|
0
|
2400
|
15000
|
28800
|
37800
|
84000
|
Общо:
|
12600
|
50800
|
97000
|
125400
|
73500
|
359300
|
Задачи за упражнение:
Задача 1: С цел изследване на зависимостта между обема на дълготрайните материални активи и равнището на производителността на труда са наблюдавани 12 еднотипни промишлени предприятия. Резултатите от наблюдението са дадени в Табл.23.
Табл.23.
-
Фирма №
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
12
|
ДМА в млн. лв.
|
2
|
3,3
|
5,3
|
2,5
|
7
|
4,5
|
1,1
|
3,2
|
6,3
|
4,2
|
3,7
|
5,2
|
ПТ изд/ч.
|
4,1
|
6,2
|
7
|
6,7
|
7,7
|
6,3
|
4
|
6
|
7
|
6,8
|
4
|
8
|
Определете силата на зависимостта между наблюдаваните признаци.
Задача 2: Управител на фирма решава да изследва зависимостта между обема на персонала и обема на чистата печалба за една година в еднородни на своята фирми. Наблюдава 120 такива фирми. Данните са дадени в Табл.24. Помогнете му да оцени силата на праволинейната зависимост между тези два признака.
Табл.24.
-
Обем на чистата печалба
|
Обем на персонала в брой лица
|
Брой фирми
|
до 45
|
над 45 до 65
|
над 65 до 85
|
над 85
|
До 0,2
|
5
|
5
|
3
|
0
|
13
|
над 0,2 до 0,4
|
7
|
10
|
7
|
0
|
24
|
над 0,4 до 0,6
|
3
|
15
|
12
|
2
|
32
|
над 0,6 до 0,8
|
1
|
4
|
13
|
5
|
23
|
над 0,8 до 1
|
0
|
3
|
7
|
6
|
16
|
над 1
|
0
|
1
|
5
|
6
|
12
|
Брой фирми
|
16
|
38
|
47
|
19
|
120
|
14.3. Измерване на зависимости при неметрирани признаци
Ако поне един от изследваните признаци е представен на слаба скала (например ординална), не можем да пресметнем корелационния коефициент на Браве. Ако двата признака са представени на рангова скала се използват коефициентите на корелация на Спирмън или Кендал. В общия случай можем да използваме коефициентите на взаимносвързаност (на контингенция) на Пирсън и Чупров. При един дихотомен и един метриран признак са подходящи бисериалните коефициенти на корелация и т.н.
Да започнем с Ранговите коефициенти на корелация.
Да предположим, че над единиците от съвкупността са извършени наблюдения, върху два признака, измерени на рангова скала. Спирмън използва като измерител на близостта на ранговете, сумата от квадратите на разликите им. Ако съществува силна положителна зависимост между ранговете на единиците, те би трябвало да съвпадат и сумата от квадратите на разликите им би била нула. Ако зависимостта е силна отрицателна, ранговете ще са подредени в обратен ред. Разликите им в този случай, ако n е четно, ще образуват редица само от нечетните числа от – (n-1) до (n-1) или ако n е нечетно, само от четните числа в този интервал. Тогава сумата от квадратите им ще е .
При липсата на каквато и да е зависимост можем да приемем, че тази сума ще е средното аритметично на двете крайни възможности, т.е.
Като отнесем тази величина към действителната сума от квадратите на разликите, т.е.
получаваме измерител на зависимостта, който би бил нула при силна правопропорционална зависимост между ранговете. Ето защо ранговият коефициент на корелация на Спирмън се пресмята по формулата
За да използваме този коефициент, ранговете по един и същ признак трябва да са различни числа от 1 до n. Те се получават като на всяка от единиците определим различна степен на притежаване на наблюдаваното качество.
За да разкажем как се пресмята Ранговия коефициент на корелация на Кендал, трябва да дефинираме понятията съответствия и инверсии. Да предположим, че статистическите единици са подредени по ранговете на признака Х във възходящ ред. Брой на съответствията на i – тата статистическа единица ще означаваме с рi, и това е броят на двойките след i – тата, т.е. за j = i+1,…,n такива че Хi < Xj и Yi < Yj. Брой на инверсиите на i – тата статистическа единица ще означаваме с qi, и това е броят на двойките след i – тата, т.е. при j = i+1,…, n, за които Хi < Xj и Yi > Yj. Ако всички двойки са разположени в еднакъв порядък, възходящо, сумата от всички съответствия P ще е равна на сумата на естествените числа от 1 до n-1, т.е.
,
а сумата от инверсиите ще е нула.
По аналогичен начин ако ранговете на признака Y са подредени низходящо, сумата от инверсиите Q ще е
,
а сумата от съвпаденията ще е нула.
Като измерител на зависимостта между двата статистически признака Кендал използва отношението на разликата между съответствията и инверсиите и сумата на естествените числа от 1
до n-1, т.е. неговия корелационен коефициент има вида
.
В голяма част от литературата този коефициент се означава с и се нарича
Сподели с приятели: |