Лекция Запознаване със средата на електронните таблици Excel. Работа с данни в работния лист. Въвеждане и използване на формули и функции. Равномерно и Гаусово (нормално) разпределения и основни статистически



Дата16.08.2017
Размер50.52 Kb.
#27887
ТипЛекция




Лекция 1. Запознаване със средата на електронните таблици Excel. Работа с данни в работния лист. Въвеждане и използване на формули и функции. Равномерно и Гаусово (нормално) разпределения и основни статистически

параметри
Работният лист в Excel се състои от колонки (означени с букви A, B, C, D….), редове (означени с цифри 1, 2, 3,…) и клетки, чийто адрес се задава с буквата на колонката и цифрата на реда.

Във всяка клетка мoже да се въведе информация във вид на:



  • текст (етикет или пояснение за потребителя, не за компютъра)

  • константа (число)

  • формула, която трябва да започне със знака (=).

В аргументите на формулата е полезно да се означават адресите на клетките, в които са въведени числата с които смятаме. Така при всяка промяна на данните в клетките резултата се актуализира автоматично.

Вградените функции се достигат с бутоните Insert/Function или с бутона fx, ако е изведен на панела с инструменти. Функцийте може също да се изписват директно след знак за равенство и след като курсорът е маркирал полето, където ще се получи резултата.

Избирането на блок от клетки става със задаване на адреса на първата клетка от блока, двуеточие, и последната клетка, например =sum(А1:В3) сумира числовото съдържание на клетките от А1 до В3. Ако клетките не са свързани се използва запетая, например =sum(А1:А5, В3) сумира числовите съдържания на клетките от А1 до А5 плюс съдържанието на клетката В3.

Когато операциите се извършват с поредица от числа (масиви), вместо Enter се натиска Shift+Ctrl+Enter. В такъв случай операцията се извършва елемент по елемент и е необходимо масивите да имат подходяща съгласувана размерност.



Случайна величина и разпределения на случайните величини

Тъй като при всяка реализация на един експеримент, независимо от поддържането на видимо еднакви условия, измерваната величина приема различни стойности, тя се нарича случайна величина. Примери за това могат да бъдат броят на слънчевите часове в един ден, разстоянията изминати от един неутрон с енергия 10МеV преди да бъде погълнат във вода, или числата които се получават при хвърляне на два зара. Възможните стойности, които получава дадена случайна величина, ще я означаваме с х, обикновено са ограничени в определена област и са разпределени по начин, който се описва от някяква математическа функция. Във физиката разпределението на стойностите на случайната величина х се задава чрез функция на вероятностната плътност f(x), наричана също плътност на вероятноста. Ако случайната променлива е дискретна, функцията fi) задава вероятноста да се получи стойност xi. Ако х е непрекъсната променлива, вероятноста стойноста и да лежи в интервала (x, х+dx) се дава от израза f(х)dx.

Очевидно са валидни следните равенства:

Най-простото вероятностно разпределение е равномерното разпределение, което се дефинира с еднаква вероятност в целия разглеждан интервал и нулева вероятност извън него:



Средната стойност и дисперсията се изчисляват лесно за равномерно разпределение:



Величината σ се нарича средноквадратична грешка и служи като мярка за отклонение от средната стойност на резултатите на измерването.

Вградената функцията rand() в Excel генерира случайни числа с равномерно разпределение в интервала (0,1).

Друго важно разпределение е Гаусовото (нормално) разпределение, което има широко приложение при обработка на данни тъй като описва разпределението на грешките при експерименталните измервания. То се задава от следната формула:



В частния случай когато средната стойност е нула и дисперсията е единица разпределението се нарича стандартно нормално разпределение:



Нормалното разпределение може да се изведе при две прости и естествени предположения: 1) Резултатите са независими един от друг 2) Вероятноста резултата да бъде отляво или отдясно на средната стойност е еднаква т.е. вероятноста е симетрична спрямо средната стойност

Може да се пресметне, че вероятноста една нормално разпределена величина да се отличава от средната си стойност с по-малко от σ е:

Така, стойностите на нормално разпределена случайна величина са групирани в близка околност около средната стойност, с радиус от порядъка на средноквадратичното отклонение σ. Затова σ се разглежда като мярка за големината на случайната грешка при измерванията.

Друго интересно свойство на нормалното разпределение е, че сумата на две случайни величини с нормални разпределения х=х1 + х2, също е нормално разпределена със средна стойност и дисперсия равни на сумите т.е.:

Това свойство е само частен случай на един много по-общ резултат, известен като централна гранична теорема, която има много формулировки с различна степен на общност:



Н
ека имаме множество от N независими случайни величини xi, с еднакво разпределение, с еднакви средни стойности x и дисперсии 2. Тогава случайната величина определена от сумата:


се подчинява на нормално разпределение със средна стойност x и дисперсия 2/N.

На практика може да се използва N>10. Забележително е, че няма изискване за вида на разпределението на сумарните случайни величини, освен това разпределението да е еднакво за всички елементи в сумата. Нещо повече в някои случай теоремата е верна даже и за различни вероятностни разпределения на елементите в сумата.

Трябва да се имат предвид следните свойства на средната стойност и на дисперсията:

където а и b са константи.


ПРАКТИЧЕСКА ЧАСТ

Зад.1 Генерирайте поредица от 50 случайни числа с нормално (Гаусово) разпределение като използвате Генератора на случайни числа в програмата Excel: Tools/DataAnalysis/Random generator/Normal. По подразбиране средната стойност и дисперсията са 0 и 1 т.е. разпределението е стандартно. Вие може да изберете произволни значения за средна стойност и дисперсия на поредицата (примерно средна стойност 11.7 и дисперсия 1.7)


Зад.2 Изчислете основните статистически параметри на поредицата от числа: средна стойност, средно абсолютно отклонение, сума на квадратите на отклоненията, средноквадратично отклонение, дисперсия.

Изчисленията направете по два начина и сравнете резултатите:




  1. Като използвате вградените статистични функции, съответно:

average(), avedev(), devsq(), stdev(), var().


  1. Като използвате формулите за съответните величини:


Зад.3 Постройте хистограма на поредицата от числа като използвате

вградената функция Histogram в пакета DataAnalysis. Първият аргумент е поредицата от числа, зададена като поредица от клетки или с име, ако присвоите такова. Вторият аргумент е поредицата от интервали bin, в които се отчита броя на попадналите числа от поредицата случайни числа. Ако не зададете интервалите bin, програмата ги съставя автоматично.


Зад.4 Генерирайте повторно поредица с по-голям брой числа (примерно 250) и отново постройте хистограмата. Получената крива е по-близко до идеалното нормално разпределение.
Зад.5 Генерирайте 12 колонки от по 50 случайни числа в интервала (0,1) с равномерно разпределение като използвате функцията RAND(). Изчислете в нова колонка сумите на числата във всеки ред. Постройте хистограма на числата в новата колонка. Проверете дали хистограмата апроксимира нормално разпределение със средна стойност 6 и дисперсия 1. Това упражнение илюстрира частен случай на централната гранична теорема, който гласи че сумата от голям брой равномерно разпределени числа се приближава към нормално разпределение.
Каталог: ~tank -> ComputerDataProcessing
~tank -> Програма за изчисляване на средна стойност
ComputerDataProcessing -> Лекция спектрален анализ на периодични процеси цел на спектралния анализ на сигналите е определянето на
ComputerDataProcessing -> Лекция Интерполация и прекарване на крива през точки
ComputerDataProcessing -> Лекция 5 Основни елементи на програмната среда matlab
ComputerDataProcessing -> Лекция Основи на линейната филтрация. Формиране на
ComputerDataProcessing -> Лекция №4. Апроксимация на зависимост между две величини (апроксимираща крива). Метод на най-малките квадрати. Линейна и квадратична регресия
ComputerDataProcessing -> Лекция 10. Статистически анализ
ComputerDataProcessing -> Лекция Дискретни вероятностни разпределения. Биномно разпределение и разпределение на Поасон. Графични възможности в Excel


Сподели с приятели:




©obuch.info 2024
отнасят до администрацията

    Начална страница