Лекции по Въведение в статистиката



Дата13.10.2018
Размер262.5 Kb.
#86826

Чернова на лекции по Въведение в статистиката

Павлина Йорданова pavlina_kj@abv.bg




Тема 1 Елементи от теорията на вероятностите

Случайността поражда разнообразието в природата.

Теорията на вероятностите моделира масовите явления, събития и величини, които се използват в Статистиката и Иконометрията. В тази тема ще се запознаем с основни понятия и твърдения, които служат за основа, върху която са изградени статистическите методи и алгоритми.



1.1. Опит. Събития. Вероятност.

Най-общо казано, опитът е комплекс от действия, извършени при строго определени условия. За да бъде определен един опит трябва да са известни възможните изходи от него. Тези изходи, описани така че в резултат от опита да се случва точно един от тях се наричат елементарни изходи(елементарни събития). Ще ги означаваме с . Множеството от всички елементарни изходи -  се нарича пространство на елементарните изходи. Неговото определяне представлява първата крачка при създаването на вероятностен модел на експеримент.

Елементарното събитие дава пълна информация за възможна реализация на провеждания опит. Може един и същ експеримент да бъде стохастично моделиран по различни начини.

Да разгледаме няколко примера на описване на структурата на пространството на елементарните събития.

П р и м е р 1.1: При еднократно подхвърляне на монета пространството от елементарни изходи може да се моделира с два изхода, Г – “Пада се герб” и Л – “Пада се лице”.

= {Г, Л}.

П р и м е р 1.2: При двукратно подхвърляне на монета пространството от елементарни изходи може да се моделира с четири изхода. Нека означим с Гi изхода “Пада се герб при i – тото подхвърляне” и с Лi изхода “Пада се лице при i – тото подхвърляне”, i = 1, 2. Тогава

= {Г1Г2, Г1Л2, Л1Г2, Л1Л2}.

Забележка: Друг начин за моделиране на същия експеримент може да бъде = {Г1, Л1}.

П р и м е р 1.3: При трикратно подхвърляне на монета пространството от елементарни изходи може да се моделира с осем изхода. Нека означим с Гi изхода “Пада се герб при i – тото подхвърляне” и с Лi изхода “Пада се лице при i – тото подхвърляне”, i = 1, 2, 3. Тогава

= {Г1Г2Г3, Л1Г2Г3, Г1Л2Г3, Г1Г2Л3, Г1Л2Л3, Л1Г2Л3, Л1Л2Г3, Л1Л2Л3}.

Забележки: 1. Можем да моделираме този експеримент чрез = {Г1, Л1}.

2. Трети начин за моделиране на същия експеримент може да бъде = {Г1Г2, Г1Л2, Л1Г2, Л1Л2}.

3. Четвърти начин за моделиране на същия експеримент може да бъде = {ГГГ, ГЛЛ, ГГЛ, ЛЛЛ}, т.е. без наредба.

П р и м е р 1.4: При подхвърляне на зар до първата единица нека означим с 1i изхода “Първата единица се е паднала при i – тото подхвърляне”, i = 1, 2, …. Тогава можем да моделираме с

= {11, 12, 13,…}.

В този случай съдържа изброимо много елементарни изходи.

П р и м е р 1.5: При съвсем точно определяне на продължителността на живот на електрическа крушка, можем да моделираме експеримента с пространство от елементарни изходи, описващи продължителността на живота на крушката (като реално число). Тогава съдържа неизброимо много елементарни изходи.

Да преминем към въвеждането на следващото важно понятие – събитие.



Невъзможно събитие ще наричаме твърдение, което не може да се реализира при даден експеримент. Ще го означаваме с . Невъзможното събитие не може да бъде елементарен изход.

Невъзможно събитие е например “Сумата от точките върху два зара, подхвърлени по случаен начин е 1”.



Събитие ще наричаме всяко подмножество на . Т.е. твърдение, което в резултат от опита може да се сбъдне, но може и да не се сбъдне.

Събитие, което със сигурност ще се реализира при даден експеримент ще наричаме сигурно събитие и ще го означаваме с , т.к. то се представя чрез всички елементарни събития.

Например “Сумата от точките върху два зара, подхвърлени по случаен начин не е по-малка от 2”.

Ще казваме, че събитието А е благоприятстващо за събитието В, ако от А следва В. Виж фиг. 2. В много случаи е удобно на всяко случайно събитие А да съпоставим множество от благоприятстващите го елементарни събития. Това множество се бележи също с А. Фактът, че А е благоприятнстващо за В тогава означава, че А В.

Например

1. Ако означим с А събитието “Върху подхвърлен по случаен начин зар са се паднали 4 точки”, а с В събитието “Върху подхвърлен по случаен начин зар са се паднали четен брой точки”

то А е благоприятстващо за В.

2. Събитието “ и  са четни” е благоприятстващо за събитието “ +  е четно”.

Ще казваме, че събитието е противоположно на събитието А, ако се представя чрез всички елементарни събития, които не са благоприятстващи за А. Това означава, че в резултат от опита, събитието се сбъдва винаги, когато не се сбъдва А. Виж фиг. 3, където множеството от благоприятстващите елементарни събития на е оцветено в сиво.

Ще казваме, че събитията А и В са равносилни (съвпадат), ако те се представя чрез едни и същи множества от благоприятстващи елементарни събития. Накратко А B.



Ще казваме, че се е сбъднало поне едно от събитията А или В, ако в резултат от опита се е случило елементарно събитие, което е благоприятстващо за А или В. Това ще означаваме накратко с А В. Т.е. А В тогава и само тогава, когато А или В. Виж фиг. 4, където множеството от благоприятстващите елементарни събития на А В е оцветено в сиво.

С.р.: Докажете, че А .

Ще казваме, че събитията А и В са се случили едновременно, ако в резултат от опита се е случило елементарно събитие, което е благоприятстващо за А и В. Това ще означаваме накратко с АВ, което е все едно А В, което е все едно А,В. Т.е. А В тогава и само тогава, когато А и В. Виж фиг.5, където множеството от благоприятстващите елементарни събития на А В е оцветено в сиво.

С.р.: Докажете, че А .

Събитията А и В се наричат несъвместими, ако нямат общи благоприятстващи елементарни събития. Т.е. ако А В . Виж фиг. 6.

Операциите или могат да бъдат обобщени за краен брой или за изброимо много събития.

При п , ако А1, А2, …, Ап са събития, то с множеството от елементарни събития се представя събитието “Сбъднало се е поне едно от събитията А1, А2, …, Ап”, а с множеството от елементарни събития се представя събитието “Събитията А1, А2, … и Ап са се сбъднали едновременно”.

В сила са следните закони на де Морган: , .

С.р.: Докажете законите на де Морган.

Събитията А1, А2, …, Ап, п   образуват пълна група (Виж фиг. 7) ако:



  1. всеки две от тях са несъвместими и

  2.  .

По друг начин казано - събитията А1, А2, …, Ап, п   образуват пълна група ако в резултат от опита, почти сигурно се случва точно едно от тях.

От определението за елементарен изход се вижда, че пространството от елементарни изходи е пълна група събития.

Докажете, че за всеки събития А1, А2, …, Ап е в сила представянето

.

Докажете, че за всяко събитие В и за всяка пълна група събития А1, А2, …, Ап, п е в сила представянето В . Виж фиг. 8.



Следните две таблици поясняват връзката между два различни начина на задаване на една и съща информация.

Събития

Множество на бл. ел. събития

А

А

Сигурното събитие

Пространството от ел. събития

Невъзможно събитие

Празно множество




Релации между събития

Релации между множествата от благоприятстващи събития

А  В

А  В

Ще се сбъднат А и В

АВ

Ще се сбъдне А или В

АВ

А и В са несъвместими

АВ=

А нама да се сбъдне



Вероятността на елементарното събитие, най-общо казано е мярка за обективната възможност то да се сбъдне. Тя е неотрицателно число и сумата от всички такива вероятности е 1. Когато пространството на елементарните събития е крайно или безкрайно, но изброимо, вероятността на А се задава като сума от вероятностите на благоприятстващите А елементарни събития и се означава с Р(А).

Класическа дефиниция за вероятност. Ако елементарните събития са равновъзможни и пространството им е крайно множество, е приложима класическа дефиниция за вероятност. Ако А е събитие, свързано със същия опит

( 0 )

където с m(A) сме означили броя на благоприятстващите елементарни събития за събитието А, а с m() – броя на всички елементарни събития.

Геометрична дефиниция за вероятност. Ако опитът представлява случаен избор на точка в геометрично множество G с положителна крайна мярка (лице, повърхнина, обем) S(G) и А  G, то

( 0 )

където S(A) e мярката (лицето, повърхнината, обемът) на А.

Статистическа дефиниция за вероятност. Ако многократно и независимо се повтаря един и същ опит, n пъти и А е твърдение, за което можем да кажем дали се е сбъднало или не при всеки един от тези опити, то е приложима статистическа дефиниция за вероятност. Т.е.

( 0 )

където n(A) е броят на изходите, при които е настъпило събитието А.

Т.е. според статистическа дефиниция за вероятност, при достатъчно голям брой опити Р(А) е относителният дял на изходите, при които е настъпило събитието А.

В сила е следната формула за събиране на вероятностите: Ако всеки две от събитията А1, А2, …, Аn са несъвместими, то

Р(А1  А2  …  Аn ) = Р(А1) + Р(А2) + …+ Р(Аn)

В частност: Ако събитията А1, А2, …, Аn образуват пълна група, то



Р(А1) + Р(А2) + …+ Р(Аn) = 1.

Това свойство е вярно и ако n = .

Да отбележим, че

Въпроси към темата:

Подхвърля се зар с размери 9мм на 10мм на 11мм. Защо при този опит не е приложима класическа дефиниция за вероятност?

Ако зарът е с правилна форма. Намерете вероятността на събитието “След като е подхвърлен по случаен начин зарът показва четен брой точки”. А каква е вероятността на събитието той да покаже точно 6 точки?

Подхвърлете 1000 пъти правилен зар и се убедете, че действително броят на падналите се 6-ци е около 167. Защо това е така?


1.2 Условна вероятност. Формула за умножение на вероятностите.Независимост.

Формула за пълната вероятност. Формула на Бейс.
Понякога сбъдването на дадено събитие В увеличава или намалява обективната възможност за сбъдването на друго събитие А. За да се определи шанса на тази възможност се въвежда следното понятие.

Вероятността на събитието А, при условие, че се е сбъднало събитието В се означава с P(A/B) и за P(B)>0 се дефинира посредством

От тази дефиниция, лесно се получава следната формула за умножение на вероятностите.

Ако P(B)>0, то

Вярно е също, че ако P(А)>0

От последните две равенства получаваме формулата на Бейс, че когато P(А)>0 и P(B)>0



Формула за умножение на вероятностите се обобщава за повече от две събития:

Ако P(Аi)>0, за всяко i = 1,…,n



По-горе е написана една от всичките n! = 1…n формули за умножение на вероятностите. Останалите се получават като разместим по всички възможни начини местата на събитията А1,…Аn.

Ще казваме, че събитията А и В са независими ако P( A / B ) = P( A ).

Не е трудно да се докаже, че ако P( A,B ) > 0, събитията А и В са независими тогава и само

тогава, когато

P( A,B ) = P( A )P( B ).

При повече от две събития имаме два вида независимост.



Събитията А1,…Аn са 2 по 2 независими, когато всеки две от тези събития са независими.

Събитията А1,…Аn, за които P(А1,…Аn) > 0 са независими в съвкупност, когато вероятността за едновременното сбъдване на всеки к от тях е равна на произведението от вероятностите им.

Четирите равенства, определящи независимостта в съвкупност на събитията А, В и С са следните



P(A,B) = P(A)P(B), P(A,C) = P(A)P(C), P(C,B) = P(C)P(B) и

P(A,B,С) = P(A)P(B)P(С).

Общият брой на подобни равенства за независимост в съвкупност на n на брой събития е



2n n - 1.

Когато за няколко събития се говори, че са независими се подразбира, че са независими в съвкупност.

От независимост в съвкупност следва независимост 2 по 2. Обратното твърдение не е вярно.

Вероятностите на събитията от всяка пълна група събития се наричат априорни вероятности. Сумата им винаги е равна на 1.

Ако Н1,…Нn образуват пълна група и P(А)>0, то P(H1/A),…,P(Hn/A) се наричат апостериорни

вероятности. Тяхната сума също е 1.

За всяка пълна група събития Н1,…Нn с положителни вероятности и за всяко събитие А е в

сила следната формула за пълната вероятност

P(A) = P(A/H1)P(H1)+ …+ P(A/ Hn)P(Hn).

Тя е вярна и когато пълната група съдържа  събития.

Когато проведеният опит е двуетапен, то е разумно пълната група събития да бъде съставена

от събития, описващи възможните изходи от първия етап на експеримента.



Въпрос: Могат ли две несъвместими събития да са независими? Обосновете отговора си.
1.3 Случайни величини. Закони на разпределение. Числови характеристики.
Много величини, с които се сблъскваме в ежедневието си са случайни. Например: Курсът на долара на 01.06. следващата година, населението на България към 31.12. тази година, Брутния вътрешен продукт на България през текущата финансова година, броя на туристите, които ще посетят Варна през следващата година.

Най-общо казано, случайни величини са тези, чиято стойност се определя в резултат от някакъв експеримент. Те са функции на елементарното събитие.



Функция на разпределение на случайната величина ще наричаме P( < х), разгледана като функция на х и ще я означаваме с F(x).

Няколко случайни величини са еднакво разпределени, ако имат една и съща функция на разпределение.

На практика това означава, че тези величини имат едно и също поведение, но изобщо не е задължително след провеждането на експеримента те да имат еднакви стойности.



х ,F = min { x : F ( x ) } се наричаме -квантил на функцията на разпределение F.

Случайните величини 1,2,…,n са две по две независими, ако за всяка n-торка реални числа х12,…,хn, събитията 1 < x1”, …, n < xnса две по две независими.

Случайните величини 1,2,…,n... са независими в съвкупност, ако за всяка n-торка реални числа х12,…,хn, събитията 1 < x1”, …, n < xnса независими в съвкупност.

Когато за няколко случайни величини се говори, че са независими, се подразбира, че са независими в съвкупност.

Случайна величина, чиито възможни значения могат да се запишат като крайна или безкрайна числова редица се нарича дискретна случайна величина.

Таблицата



i

x1

х2



xk



Общо:

P(  = i )

p1

р2



pk



1

където x1 ,…, xk,… са възможните значения на , а pi = P( = xi ), се нарича ред на разпределение

на случайната величина . Възможно е местата на колоните и редовете да са разменени.

Тъй като = x1”, “ = x2”,…,“ = xk”,… образуват пълна група събития, то



р1 + р2 + …+ рk + … = 1.

Функцията на разпределение на гореописаната дискретна случайна величина e стъпаловидна с интервали на постоянство (-, x1], ( x1, x2], … , ( xk-1, хk], …. В точката хi, F(x) скача нагоре, с величина на скока pi. Ако възможните й значения x1 ,…, xk са краен брой, то функцията й на разпределение за х (-, x1] е 0, а за х ( xk, ] e 1.



С какво може да ни бъде полезен Excel в случая:

По даден ред на разпределение, в който възможните значения на случайната величина  са означени с X’s = (x1, ..., xn), а съответните вероятности са означени с probabilities = (p1, ..., pn) функцията PROB(Xs, probabilities, lower_limit, upper_limit) пресмята

P(  [lower_limit, upper_limit)).

Ако липсва параметърът upper_limit тази функция пресмята P( = lower_limit).

Ако е дискретна случайна величина, с възможни значения x1 ,…, xk,…, е дискретна случайна величина, с възможни значения y1 ,…, ym,…, е дискретна случайна величина, с възможни значения z1 ,…, zs, … лесно може да се докаже, че , и са независими в съвкупност тогава и само тогава, когато за всяка тройка цели, положителни числа е в сила n, i, s е изпълнено



P(  = xn,  = yi,  = zj ) = P( = xn)P( = yi)P( = zj).

Нататък в този параграф x1 < x2 < < xk < ще са запазени символи за възможните значения на дискретната случайна величина .

Последователно съединените с отсечки, точки с координати ( x1, p1 ), ( x2, p2 ), …,( xk, pk ),… образуват полигон (многоъгълник) на разпределение на .

Редът на разпределение и полигонът определят еднозначно функцията на разпределение на дискретната случайна величина. От тук следва, че за да бъдат няколко случайни величини еднакво разпределени е необходимо и достатъчно, те да имат един и същ ред на разпределение или да имат един и същ полигон.

Сумата х1 р1 + х2 р2 + …+ хkрk = се нарича средно значение (математическо очакване) на дискретната случайна величина и се бележи с Е.

Сумата х12 р1 + х22 р2 + …+ хк2рк = се нарича втори момент на дискретната случайна величина и се бележи с Е2.

Най-вероятните, най-възможните значения на дискретната случайна величина се наричат моди на и се означават с mod . По-късно ще разгледаме една оценка на mod . Тя се нарича още емпирична мода М0 т.к. се определя от емпиричните данни. Да отбележим, че емпиричната мода М0 и теоретичната mod са две различни величини.

Ако съществува неотрицателна функция , която да е такава, че



тя се нарича плътност на разпределение на , а случайната величина се казва, че е абсолютно-непрекъснато разпределена.



Свойства на плътността:

1. Ако съществува производната на функцията на разпределение на случайната величина , тя съвпада с плътността на разпределение на .

2. Лицето на фигурата, определена от абсцисната ос и графиката на Р(x) е равно на 1. Т.е.

.

3. Лицето на фигурата, определена от абсцисната ос и графиката на Р(x) при х [a, b) е равно на P(a < b) = = F(b) - F(a). На следващата фигура тази част е защрихована.

Д
искретните случайни величини нямат плътност на разпределение, но имат ред на разпределение и функция на разпределение.

Когато има плътност на разпределение Р(x), средно значение (математическо очакване)



на абсолютно-непрекъснатата случайна величина , наричаме



l - ти момент на абсолютно-непрекъснатата случайна величина наричаме

И в дискретния и в непрекъснатия случай са верни следните дефиниции и свойства.

1. Математическото очакване на константа е равно на същата константа.

2. Математическото очакване на константа, умножена по случайна величина е равно на същата константа, умножена по математическото очакване на случайната величина т.е.



Е(c)=cЕ.

3. Математическо очакване на сума от случайни величини е равно на сумата от математическите очаквания на случайните величини, т.е.



Е(1+…+n) = Е1 +…+ Еn.

  1. Математическото очакване на произведение от независими случайни величини 1,,n е

равно на произведението от математическите очаквания на същите случайни величини, т.е.

Е(1.….n)=Е1.….Еn.

Е(-E)2 се нарича дисперсия на случайната величина и се означава с D.

Лесно се доказва, че дисперсията е неотрицателно число и D = E2 -(E)2.

Да обърнем внимание на факта, че теоретичната D и емпиричната дисперсии са две различни величини. Както ще покажем по-късно, емпиричната дисперсия

е най-добрата оценка на теоретичната дисперсия, т.е. за D.

Дисперсията има следните свойства:


  1. Дисперсията на константа е нула, т.е. Dc = 0.

  2. Дисперсията на константа плюс случайна величина е равна на дисперсията на случайната

величина, т.е. D(c + )= D.

  1. Дисперсията на константа по случайна величина е равна на квадрата на константата по дисперсията на случайната величина, т.е. D(c)= c2D.

  2. Ако 1, 2, …, n са независими случайни величини, то D(1+…+n)=D1+…+Dn.

Ковариация на 1 и 2 се нарича Е((1-E1)(2-E2)) и се означава с cov(1 , 2).

Вярно е, че



  1. D(1 + 2) = D1 + D2 + 2cov(1,1).

  2. cov(1 , 2) = Е(12) - Е1Е2 .

Коефициент на корелация на случайните величини 1 и 2 наричаме

Вярно е, че





  1. Ако случайните величини 1 и 2 са независими, то те са некорелирани, т.е.

cor(1 , 2) = 0.

  1. Случайните величини 1 и 2 са некорелирани тогава и само тогава, когато Е12 =Е1Е2.

Средноквадратично(стандартно) отклонение на се нарича .

Въпроси:

1. Математическото очакване може да приема произволни реални значения. Може ли да се каже същото за средноквадратичното отклонение?

2. Ковариацията може да приема произволни реални значения. Може ли да се каже същото за корелоционния коефициент?

3. Може ли математическото очакване на случайната величина да е извън интервала от възможни значения на ? Може ли да се каже същото за mod ?





Последна редакция 13.10.2018 г.

Каталог: tadmin -> upload -> storage
storage -> Литература на факта. Аналитизъм. Интерпретативни стратегии. Въпроси и задачи
storage -> Лекция №2 Същност на цифровите изображения Въпрос. Основни положения от теория на сигналите
storage -> Лекция 5 система за вторична радиолокация
storage -> Толерантност и етничност в медийния дискурс
storage -> Ethnicity and tolerance in media discourse revisited Desislava St. Cheshmedzhieva-Stoycheva abstract
storage -> Тест №1 Отбележете невярното твърдение за подчертаните думи
storage -> Лекции по Въведение в статистиката
storage -> Търсене на живот във вселената увод
storage -> Еп. Константинови четения – 2010 г някои аспекти на концептуализация на богатството в руски и турски език


Сподели с приятели:




©obuch.info 2024
отнасят до администрацията

    Начална страница