Лекционни записки



Pdf просмотр
страница24/36
Дата09.07.2023
Размер3.24 Mb.
#118248
1   ...   20   21   22   23   24   25   26   27   ...   36
Манчева, Ж. Управление на риска на проекта



80
Мерки на разсейването
След формата и централната тенденция, третата основна характеристика на всяко разпределение е разпръснатостта или разсейването на измерванията в него. Докато мерките на централната тенденция са точки, то мерките на разсейването са интервали или разстояния върху измерителната скала, които показват как стойностите са разсеяни или концентрирани около средната.
Най-често използваните мерки на разсейването са: размах, дисперсия и стандартно отклонение. За рангови данни е приложима само първата мярка, а за метрични данни се използват и трите мерки.
Размах
Размахът е най-простата мярка на разсейването. Определя се като разликата между най-голямата и най-малката стойност в извадката и описва диапазона, в който се намират стойностите. Предимството на размаха е, че се изчислява много лесно. Като недостатък може да се посочи това, че при пресмятането му не участват всички стойности от разпределението, а само двете крайни стойности. С нарастването на броя на измерванията размахът се променя, като увеличава стойността си. Ето защо размахът е неустойчива мярка и не дава адекватно описание на разсейването. Следващият пример илюстрира това.
Пример. Дадени са две множества от данни А и В: А = {10, 11, 13, 15,
15, 17, 19, 20}, В = {10, 14, 14, 15, 15, 15, 17, 20} (данните от двете множества са измерени в едни и същи мерни единици). Да се пресметнат средната стойност, медианата, модата и размаха за всяко едно от двете множества.
Може ли чрез размаха да се определи в кое от множествата А и В разсейването на стойностите е по-голямо?
Решение. В следващата таблица са представени резултатите за четирите обобщени числови характеристики за двете множества:


81
Двете множества А и В имат един и същ размах 10, дори и еднакви мерки на централната тенденция 15, но стойностите в тях се различават.
Това се вижда и от диаграмите на честотното разпределение. Следователно размахът не може да се използва за сравнение на разсейването на двете множества.
За размаха се използват още и наименованията ширина на вариацията и размах на вариацията.
За изчисляването на размаха в Excel се използват функциите MAX и
MIN: Размах = MAX(област с данни) - MIN(област с данни).
Дисперсия и стандартно отклонение
За измерване на разсейването на стойностите в дадено разпределение се използват дисперсията и стандартното отклонение.
Дисперсията (за извадката s
2
) се дефинира като средно аритметично на квадратите на отклоненията на измерванията от тяхната средна
μ (съответно ) . Така дисперсията на генерална съвкупност с обем N е


82 а дисперсията на извадка с обем n е
Ако искаме да получим дисперсията на дадена извадка, то използваме последната формула за
s
2
. Но ако целта ни е по извадката да получим оценка за дисперсията на генералната съвкупност, то тази формула дава изместена оценка за
. Формулата, по която се получава неизместена оценка за
, е
Ако стойността
x
i
има честота
f
i
, то за пресмятане на дисперсията може да се използва формулата с тегла където k е броят на различните стойности на променливата.
Независимо че дисперсията е надеждна мярка на разсейването, фактът, че нейната размерност е квадрат на размерността на оригиналните измервания, може да доведе до трудности в съдържателната интерпретация на тази мярка. В този случай е по-добре да се използва друга мярка на разсейването – стандартно отклонение. Стандартното отклонение
(съответно
s
) се пресмята като квадратен корен от дисперсията:


83
За изчисляването на стандартното отклонение на извадката в Excel се използва функцията STDEV (неизместнена оценка), а за изчисляване на стандартното отклонение на генералната съвкупност - STDEVP.
Стандартното отклонение е мярка за отклоненията на стойностите на разпределението от тяхната средна. От формулите се вижда, че при пресмятането на дисперсията и на стандартното отклонение участват всички стойности на разпределението. Затова двете мерки се влияят от екстремални стойности. По-точно, във формулите се съдържат квадратите на отклоненията (разликите) на измерванията спрямо средната им стойност, представляваща център на разпределението. Ето защо колкото по-големи са тези отклонения, т.е. колкото по-голямо е разсейването на данните около тяхната средна, толкова по-големи ще са дисперсията и стандартното отклонение.
Важно е да се отбележи, че стандартното отклонение притежава още едно предимство – то се получава в същите мерни единици, в които са измерени стойностите от разпределението. Това позволява да се определи колко далече, т.е. на колко стандартни отклонения от средната стойност се намира всяка една стойност.
Стандартното отклонение се използва при интерпретацията на стойностите, които отстоят на разстояние едно стандартно отклонение вляво и вдясно от средната. Ако разглежданото разпределение е нормално, то в интервала се намират 68,26 % от всички измервания.
Макар че повечето разпределения на практика се отклоняват в някаква степен от нормалното, то може да се каже, че приблизително 2/3 от стойностите в повечето разпределения попадат в този интервал.


84
Следващите две честотни диаграми показват, че разсейването на данните в първата диаграма, т.е. стандартното отклонение е по-малко в сравнение с това за данните от втората диаграма.
Коефициент на вариация CV
Тъй като дисперсията и стандартното отклонение зависят от скалата на измерване, то те не могат да се използват за сравняване на разсейването на променливи, които се измерват в различни скали. За тази цел се използва коефициент на вариация, който е безразмерна величина и се изразява в проценти. Означава се със CV и се пресмята по формулите: съответно за генерална съвкупност и за извадка.
Като недостатък на коефициента на вариация може да се посочи това, че той е приложим само когато средната е положително число. Освен това, при липса на информация за средната и за стандартното отклонение интерпретирането му може да доведе до неправилни изводи. Коефициентът на вариация е относителна величина и върху него не оказва влияние абсолютното значение на изучавания показател. С помощта на коефициента


85 на вариация може да се сравни колебаемостта на случайната величина, изразен в различни единици на измерение. Коефициентът се изменя от 0 до
100%. Колкото по-голям е коефициентът, толкова по-силна е колебаемостта.
Установена е следната качествена оценка на различните значения на коефициента на вариация: до 10% е слаба колебаемост; 10 – 25% е умерена колебаемост; над 25% е висока колебаемост.


Сподели с приятели:
1   ...   20   21   22   23   24   25   26   27   ...   36




©obuch.info 2024
отнасят до администрацията

    Начална страница