Всеки ред от таблицата с данни се състои от конкретни стойности, отра



Дата16.10.2018
Размер104.67 Kb.
#89373
Честотни разпределения

Всеки ред от таблицата с данни се състои от конкретни стойности, отра-

зяващи характеристики на изследваната променлива за всеки отделен

случай. Ако броят на разглежданите случаи е незначителен, тогава

представената в таблицата информация ще бъде обозрима. Но когато

анализираме данни за много повече случаи, тогава се налага да обоб-

щим, да асимилираме информацията от този дълъг списък в таблица, с

която да може да се работи.

При работа с голямо количество данни трябва да можем да обобщаваме

данните, за да представим най-съществените им характеристики в обоз-

рими мащаби. Най-лесният начин да направим това е като преброяваме,

колко пъти дадена стойност се среща в списъка (таблицата). Така пре-

подреждаме данните от оригиналната таблица, където стойностите за

всяка променлива са записани по реда, в който са регистрирани случаи-

те на изследването. Сега ние променяме това подреждане според стой-

ностите на разглежданата променлива. Това всъщност е едно разпре-

деление на случаите за показване на честотата, с която се среща всяка

конкретна стойност на променливата. Затова преподреждането на дан-

ните по описания по-горе начин се нарича честотно разпределение.

Иначе казано, нека променливата X да разделя съвкупността от из-

следвани обекти (случаи) на класи (категории). Обектите, които принад-

лежат към един и същ клас притежават еднакви стойности. Нека призна-

ка X да притежава k различни стойности x1, x2, ... , xk; k<=N. Съвкупността

от обекти, които имат стойност xi образува клас i. Броят на обектите от

клас i задава абсолютната честотата на класа, която се бележи с fi. Су-

мата от честотите на всички класове в съвкупността от обекти предс-

тавлява обемът на извадката или генералната съвкупност.

Процесът на обобщаване на информацията може да започне с конструи-

ране на разпределение по описания по-горе начин. Нека разгледаме мо-

нетния архив с данни за 296 монети 47. Да образуваме честотно разпре-

деление "_·_e_Чгпо отношение на променливата

От това представяне става ясно, че някои класове в разпределението са

по-силно заети отколкото други. Има и класове в интервално скали-

раната величина X, които изобщо не са заети. Освен това, пълното из-

брояване на стойностите за променливата X със съответните честоти

все още не задоволява изискванията за компактно представяне на ем-

пиричните данни.

Подходящо би било няколко стойности да бъдат обединени в една група,

т. нар. статистически клас или интервал. Броят на интервалите се избира

според обема на извадката или генералната съвкупност. За по-голяма

прегледност не бива да се допускат повече от 15 статистически класа. В

такъв случай, честотното разпределение ще представлява списък от ин-

тервали с еднаква дължина, съпроводени с броя на попадащите в тях

обекти (абсолютни честоти на статистическите класове). Конструирането

на честотно разпределение при интервално деление се постига по след-

ния начин:

1. Избираме броя (a) на статистическите класове, обикновено не по-

малко от 5, но не повече от 15.

2. Определяме дължината (di) на всеки клас i. Намираме разликата меж-

ду най-малката и най-голямата стойност във вариационния ред, която се

дели на броя на класовете.

3. Определяме началната стойност за първия интервал и конструираме

следващите интервални деления без препокриване на стойностите.

4. Преброяваме обектите, попадащи в конструираните интервални деле-

ния, абсолютните честоти fi за всеки интервал се отбелязват в таблица.

Честотното разпределение придобива следния вид:




При изчисляване на честотни разпределения с интервално деление мо-

же да се използва програмата Statistica. Модулът "Честотни разпределе-

ния" (Frequency Tables) дава възможност за автоматично генериране на

честотни таблици на базата на въведените данни за разглежданите еди-

ници на наблюдението. За представения тук пример определяме името

на променливата, за която трябва да се построи честотната таблица (D -

диаметър на монетата) с опцията "Променливи" (Variables). За честотна

таблица с интервално деление в 7 интервални класа, при които дължи-

ната на интервала е 7 единици трябва да зададем под "Метод на катего-

ризация за таблици и диаграми" (Categorization Method for tables and

Graphs) дължина на интервала = 3 единици (Step size = 3) и начална точ-

ка за първия интервален клас = 14 (starting at: 14). След потвърждаване

на настройките получаваме таблица, която включва основни сведения за

честотното разпределение: интеврали, честоти, натрупани честоти, про-

центи и натрупани проценти. Основните настройки в модула "честотни

таблици" са показани на следната фигура:




Честотно разпределение може да се получи за номинално, рангово, ин-

тервално и пропорционално скалирани величини. Бихме могли да обра-

зуваме честотно разпределение от различен тип, което осветява специ-

фични свойства на оригиналните данни. Това е честотното разпре-

деление с относителни дялове. Това е представяне, в което честотите не

се изразяват като абсолютни стойности, а като проценти (относителни

дялове) от общия брой разглеждани случаи. Тук би трябвало да се обър-

не внимание на някои особености. Относителните дялове могат да под-

веждат, когато общия брой на случаите е много малък. Така незначител-

ни разлики в честотите получават по-голямо значение, когато се превър-

нат в проценти. Поради това при всички честотни разпределения с отно-

сителни дялове е задължително да се приведе изрично общият брой на

разглежданите случаи. За съжаление това изискване много често се иг-

норира в научни публикации. При наличието на това сведение, читателят

би могъл да изчисли абсолютните стойности, когато той би искал да знае

какви са те. Други видове честотни разпределения, които понякога са по-

лезни, но са подходящи само за ординално и интервално скалирани ве-

личини са честотните разпределения с натрупани честоти. Такова предс-

тавяне е необходимо, когато искаме да покажем колко случая са над и

колко са под някаква определена фиксирана величина.



Друг вид честотни разпределения са кръстосаните разпределения. Те се

конструират, с цел обобщаване на изходните данни за няколко колони от

таблицата с регистрираните случаи. Резултатът е т.нар. кръстосана кла-

сификация (cross-classification, cross-table). Тук имаме изброяване на

случаите по дадена променлива в зависимост от друга променлива.

Например, език на надписа на монетите, в зависимост от монетарницата,

където са били сечени те.

Програмата Statistica дава възможност бързо и ефективно да построя-

ваме кръстосани таблици за две или повече променливи. За тази цел

служи модулът "Таблици и етикети" (Tables and Banners). Групирането

може да се извършва в списъци с най-много шест променливи. За целта,

най-напред задаваме вида на анализа, които предстои да извършим като

"Определяне на вида на таблицата" (Specify Table). Избираме опцията

"Кръстосана таблица" (Crosstabulation table), след което трябва да фик-

сираме променливите, които ще участват в анализа (Specify tables). От

общо шест списъка с променливи, трябва да подберем тези наименова-

ния на променливи, които са ни необходими. В нашия случай това ще

бъдат променливите "Владетел" (W) и "Ецик на надписа" (EZ). Останали-

те списъци остават празни, доколкото няма други променливи, които да

участват в построяването на таблицата. Модулът за определяне на

кръстосани таблици е показан по-долу.


Всеки начин за обвързване на променливите способства и образуване на

кръстосани таблици спомага за разкриване на различни характеристики

на данните, с които разполагаме. От приведената по-горе таблица виж-

даме, например, че 33% от монетите, с които разполагаме са били сече-

ни в Монетарница Пауталия с гръцки надписи. Докато монетите от на-

ходката от монетарница Виминациум са преобладаващо с латински над-

писи (14%). Тази информация не може да бъде непосредствено видима

от първично регистрираните данни, които се намират в неподреден, нек-

ласифициран вид. Затова, изборът на подходящия метод за обобщаване

на данните е от съществено значение за изводите, които могат да бъдат

направени с тях.



Таблици

Таблицата представлява една от основните форми за представяне на

количествени данни. В количественото изучаване на исторически проце-

си се използват три основни вида таблици:

• таблици с изходни данни

• таблици с данни след първична обработка (обобщаващи таблици -

честотни разпределения)

• таблици с крайни резултати (след провеждането на количествен ана-

лиз)

По външния си вид таблиците представляват комбинация от вертикални



колони и хоризонтални редове, така че в образуваните по този начин

клетки да могат да се нанасят стойности. В зависимост от начина на

представяне на резултатите различаваме два вида таблици: комбина-

ционни и координационни.



Координационната таблица представя количествените сведения за ед-

на променлива, която се описва с нейните разновидности или само по

редове, или само по колони. Представените данни не са обвързани с

друга променлива, а са само съпоставими. Координационните таблици

се образуват по два начина - вертикално и хоризонтално. При верти-

кално образуваните таблици имаме данни само в колоните на табли-

цата, обратно - при хоризонтално конструираните таблици данните се

описват в редовете на таблицата.



Таблиците с количествени данни имат следните основни елементи: заг-

лавие, челна колона, челен ред, таблични колони и таблични редове.

Заглавието определя изследваното явление, страните откъм които то

се разглежда, териториалните и времевите ограничения на явлението.

Използваните мерни единици следва да бъдат определени за всички из-

ползвани в таблицата променливи. Към заглавието на таблицата трябва

да се спомене и източникът на представените в таблицата данни (в ско-

би или под линия). Възможно е, например, следното заглавие: "Демог-

рафски социално-биологичен баланс за България към 1.1.1985 г. (Ста-

тистически годишник на НРБ, 1986, с. 459.)". Територията и периодът, за

които се отнасят данните в таблицата се поставят в края на заглавието.

Челната колона е най-лявата колона от таблицата. Тя включва опре-

делението на променливата, за която е конструирана таблицата, а в дол-

ната си част разновидностите или интервалните деления за тази про-

менлива, които се описват в т.нар. антетки. Например бихме могли да

имаме определение "производство на зърнени храни" с разновидности:

пшеница, ръж, ечемик, царевица.



Челният ред е най-горният ред от таблицата. Той носи определението

на променлива (втора променлива), по която е съставена таблицата. Под

него се описват разновидностите или интервалните деления в съответ-

ните антетки.

Между челната колона и челния ред е включено тялото на таблицата,

което се състои от пресичащи се таблични колони и таблични редове.

Табличната колона е отделна колона от тялото на таблицата, която има

антетка - общо определение в челния ред и поделения в челната колона.

Във всяка таблична колона се вписват данните според определенията в

антетките на челния ред. Последната или първата колона може да бъде

и сборна, т.е. съставена от сборовете на табличните редове. При опис-

ване на хронологични последователности от данни не се използват

сборни колони. Таблицата е отворена надясно и може да бъде продъл-

жена в тази посока с данни за следващите времеви периоди. Таблични-

те колони могат да се номерират отляво надясно в горната или долната

част на антетките им в челния ред.

Табличен ред е отделен ред в тялото на таблицата, който има антетка с

общо определение в челната колона и поделения в челния ред. Във все-

ки табличен ред се вписват данни за променливата, определена в чел-

ната колона и според подразделенията в челния ред. Най-горният или

най-долен табличен ред е сборен - съставен от сборовете на табличните

колони. Когато в табличните колони се внасят хронологични данни, т.е.

челната колона има последователни раздели, периоди или моменти от

време, тогава сборният ред отсъства. Таблицата е отворена в долната

си част и може да бъде допълвана. Табличните редове се номерират в

най-лявата част на всяка антетка от челната колона. При последовател-

ни подразделения номерирането не е уместно. При отсъствие на данни в

някоя от клетките на таблицата се нанася тире. Когато в клетката е пос-

тавена точка, това означава, че данните в тези подразделения са под

мерната единица. Да разгледаме следния пример за координационна



таблица:
Каталог: files -> files
files -> Р е п у б л и к а б ъ л г а р и я
files -> Дебелината на армираната изравнителна циментова замазка /позиция 3/ е 4 см
files -> „Европейско законодателство и практики в помощ на добри управленски решения, която се състоя на 24 септември 2009 г в София
files -> В сила oт 16. 03. 2011 Разяснение на нап здравни Вноски при Неплатен Отпуск ззо
files -> В сила oт 23. 05. 2008 Указание нои прилагане на ксо и нпос ксо
files -> 1. По пътя към паметник „1300 години България
files -> Георги Димитров – Kreston BulMar
files -> В сила oт 13. 05. 2005 Писмо мтсп обезщетение Неизползван Отпуск кт


Сподели с приятели:




©obuch.info 2024
отнасят до администрацията

    Начална страница