УНИВЕРСИТЕТ “ПРОФ. Д-Р АСЕН ЗЛАТАРОВ” - БУРГАС
ТЕХНИЧЕСКИ ФАКУЛТЕТ
К У Р С О В А З А Д А Ч А
ТЕМА: СТАТИСТИЧЕСКИ АНАЛИЗ НА МОДЕЛИ
СТУДЕНТ: АНЯ БИНЕВА ИВАНОВА
СПЕЦИАЛНОСТ: ХИ, ФАК.№164
БУРГАС
10.01.2002 год.
ОСНОВНИ ПОНЯТИЯ В СТАТИСТИЧЕСКИЯ АНАЛИЗ
Експерименталното определяне на всяка величина Х цели намирането на нейната истинска стойност х. Измерената стойност на Х се различава от х и Х-х е грешката на измерването, която е неизвестна поради неизвестността на х. Грешките могат да бъдат груби, систематични и случайни. Първите два вида са свързани с методите на измерване и регистриране на величината. Случайните грешки произтичат от същността на процеса и най-често са резултат на неконтролируеми и случайни изменения на параметрите на процеса и измервателната апаратура. Експерименталните резултати, които ще се използуват за целите на моделиране трябва да не съдържат груби и систематични грешки.
І. Случайни събития
Наблюдаването на конкретна стойност на случайна величина Х представлява случайно събитие. Ако при N измервания величината е наблюдавана m пъти то е честотата на събитието. С увеличаването на N честотата на събитието клони очевидно към неговата вероятност Р. Това дава възможност да се дефинира сума от събития (като събитие, представляващо наблюдаване на едно от няколко събития) и произведение от събития (като събитие представляващо едновременно наблюдаване на няколко събития).
ІІ. Случайни величини
Ако експерименталното определяне на дадена величина е случайно събитие, то тя може да се разглежда като случайна величина и грешката при нейното определяне е случайно число. Съответствието между случайните величини Х и възможността за нейното експериментално определяне представлява закона за разпределение на случайната величина. Ако случайната величина Х може да приема всички стойности в даден интервал [x1, x2], т.е. , то тя може да се разглежда като непрекъсната.
Непрекъснатите случайни величини се характеризират с функцията на разпределение F(x), която представлява вероятността Р измерването Х да бъде по-малко от зададено х.
/1/
т.е. вероятността измерваното Х да попадне в интервала -1, x2]:
/2/
От /2/ може да се дефинира плътността на разпределение като функция, която характеризира случайните величини:
/3/
От /2/ и /3/ следва, че:
/4/
От /1/ и /2/ се вижда, че F(x) е ненамаляваща функция, което заедно с /4/ води до:
/5/
Плътността на разпределение се определя трудно от експерименталните данни, но дава възможност да се въведат параметри, които да характеризират случайната величина. Като такива числени характеристики по-нататък ще бъдат използувани математичното очакване и дисперсията.
ІІІ. Математично очакване
Случайната величина Х може да получава различни стойности Х1, ......, Хn. От тях може да се определи случайната величина mx=M(X), така че при m тя да клони към истинската стойност х. Тази величина се нарича математично очакване и се определя като средно аритметично от безкраен брой опити.
/6/
Това е следствие от едно свойство на сходяща редица от числа Х1, Х1, . . . , Хn, . . . , която има точка на сгъстяване х. От нея може да се получи сходяща редица.
/7/
която също клони към х.
ІV. Дисперсия
Математичното очакване дава възможност да се получи центрирана случайна величина, чийто стойности са очевидно “центрирани около нулата”:
/8/
Математичното очакване на квадрата на центрираната случайна величина представлява дисперсията на случайната величина и характеризира разсейването на случайната величина около математичното й очакване:
/9/
може да се получи средноквадратичното отклонение:
/10/
V. Закон на Гаус
Математическото очакване и дисперсията характеризират случайната величина при даден закон за разпределение. Възможни са различни закони за разпределение. От тях на практика се среща най-често нормалният закон на разпределение (на Гаус). Той е в сила, когато случайната величина зависи от съвкупност от независими или слабо зависими случайни величини с произволни закони за разпределение, но без доминиране на някои от тях.
Плътността на вероятността на нормалното разпределение има вида:
/11/
и достига максималната си стойност при х=m.
Вероятността една нормално разпределена случайна величина да се намира в зададен интервал (-, х) се получава от /4/ и /11/:
/12/
където Ф е функцията на Лаплас:
/13/
По същия начин може да се определи вероятността стойността на една нормално разпределена величина да попадне в интервала [x1,x2):
/14/
Ако в /14/ положим х1=m-3 и х2=m+3 се получава Р=0,998, т.е. практически достоверно всички стойности на случайната величина Х са разположени в интервала m3. В противен случай наблюдението се приема за груба грешка.
VІ. Статистическа обработка на експериментални резултати.
На практика се работи с краен брой наблюдения, от които се получават не стойностите на самите параметри
Нека Y е случайна величина и а е някакъв параметър на разпределението. Параметърът е оценка на а ако има следните свойства:
-
Състоятелност, т.е. клони към а с увеличаване на опитите;
-
Неизместеност, т.е. М[]=a (не се допускат системни грешки при определяне на );
-
Ефективност, т.е. .
Оценките представляват параметрите при краен брой експерименти.
/15/
Оценката е отместена, но от нея се получава неотместената оценка:
,
където са степени на свобода.
Осен числени оценки са възможни и интервални оценки, т.е. интервал с размер 2, в който попада разликата .
/16/
По този начин, извън този доверителен интервал , вероятността да попаднат наблюдения а е много малка . Тук е доверителна вероятност, а - ниво на значимост.
Намирането на доверителния интервал се затруднява от това, че законът за разпределение на зависи от неизвестната стойност на а. за избягване на това неудобство се работи с някаква функция на у1,......, уn. Тази функция се подбира така, че законът на нейното разпределение зависи от а, а само от броя на опитите и от вида на закона за разпределение на Y. Ако Y има нормално разпределение, величината:
/17/
има разпределение на Стюдънт. Това разпределение зависи от степените на свобода, която се определя от броя на наблюденията N, намален с броя на линейните връзки между тях. Разпределението на Стюдънт зависи от степените на свобода и при съвпада с нормалното разпределение.
При зададени степени на свобода и доверителна вероятност могат да се определят доверителните граници на t:
/18/
т.е. с вероятност истинската стойност на случайната величина t се намира в интервала, чиито граници се определят от таблични данни за t. Доверителният интервал за математичното очакване е:
Ширината на доверителния интервал на математичното очакване е 2, където:
/19/
и намалява с увеличаването на броя на наблюденията.
Аналогично може да се намери и доверителният интервал на дисперсията ако се използва разпределението на Пирсън.
/20/
Сподели с приятели: |