Тема и Занятия



Дата21.01.2018
Размер84.59 Kb.
#49621
Research in Public Administration
6th class readings


Тема и Занятия

Упражнение


Въведение към дедуктивна статистики
АНАЛИЗ НА ИНТЕРВАЛНИ И ПРОПОРЦИОНАЛНИ ДАННИ
1. T- Teст

2. ANOVA


3. Човешки взаимоотношения

4. Проста (линейна) регресия

5. Сложна регресия


Виж материалите, които следват

СЛЕДВАЩА СЕДМИЦА: Анализ на непараметрични данни









Въведение

Да се направи заключение в статистиката значи, че ако знае нещо за една величина (обикновено променлива величина), човек може да пресметне, обясни или прогнозира някои отговори или резултати относно зависимата променлива величина.
Целта на един анализ е да се опита да се идентифицира и разбере колко са важни променливите величини са за една друга. Те търсят отговор на теоретични и практични въпроси.
Примерно, какво образование най-добре подготвя един гражданин за доживотна служба и публично участие? Дали някоя математическа или езикова програма води до по-добро представяне вместо друга? За да може да се отговори на тези въпроси, изследователите разчитат на вътрешни статистически анализи и тестове.
Кой статистически тест,от избраните от вас, зависи от нивото на измерване на данни, като номинална, поредна, интрвална и пропорционална величини.
Примерно, някои хора подкрепят харченето на повече пари за удължена (пред/след) училищна програма, докато други-не. Защо има различия? Изследователят пита 100 гражданина дали те подкрепят удължената програма. 50% казват-Да и 50-Не. Изследователят смята, че работещите майки предимно подкрепят удължената програма, а мъжете-не.Тази хипотеза може ли да бъде тествана и да се разбере дали това е вероятно или не?
Пример: Изследователят е анкетирал 54 мъже и 46 жени. Разпределението на отговорите изглежда така:






ЖЕНИ

МЪЖЕ

ОБЩО

ЗА

Клетка а

Клетка в

50

ПРОТИВ

Клетка с

Клетка d

50

ОБЩО

46

54

100

Ако връзката между половете и поддръжката на програмата бяха произволни, тогава човек трябва да очаква следното разпределение относно подкрепата на програмата.






ЖЕНИ

МЪЖЕ

ОБЩО

ЗА

23 (46%)

27 (54%)

50

ПРОТИВ

23 (46%)

27 (54%)

50

ОБЩО

46

54

100

Един обикновен статистически тест за 2 X 2 chart (т.е. кръстосана таблица) е a Yule Q. Това предполага, че Q= ad –bc/ad+bc и показва вероятността от взаимовръзката. Значителна взаимовръзка има тогава, както е в случая. 60 или повече. 23X27–23 X27/ (23X27 + 23X27)= 0/1242 = 0. Това означава, че информация за пола на анкетираните не подсказва нищо относно тяхната подкрепа на програмата. В горната таблица връзката относно пола е произволна.


Въпреки това, когато изследователят погледне данните, действителното разпределение изглежда така:




ЖЕНИ

МЪЖЕ

ОБЩО

ЗА


42 (84%) a

08 (16%) b

50

ПРОТИВ

04 (08%) c

46 (92%) d

50

ОБЩО

46

54

100

Това не е чисто произволно, но дали е съществено? В социалните науки изследователите обикновено заявяват, че връзката е статистически съществена ако нейното поле на грешки е 05 (5%) или по-малко..






Друг анкетиращ изследва процента на гласувалите, които подкрепят програмата и средния доход на избирателния район. Тези данни са интервално/пропорционални и са организирани в пропорционална система с Х-абциса, показваща дохода и У-ордината, показваща % на гласувалите, които подкрепят програмата.

    1. Доход и У-ордината представя % на гласувалите, които подкрепят програмата.

Y-ордината


подръжка

на гласувалите +

60 + +

40 ++++

20 +++++

++++

05 10 20 30 40 50 60 70 (000)



семеен доход X абциса



Интервално/

Пропорционален

Анализ на данни


Интервално/пропорционалните данни са най-прецизното ниво на оценяване. Това е най-продуктивният от статистическите анализи, които могат да бъдат използвани.
[Уебстер-сайт тест, описан по-долу ще демонстрира тези тестове. Изберете “опитните данни” и след това всеки един от тези статистически тестове. Това ще бъде демонстрирано в клас]

T-Tест
[Уебстер демонстративен

сайт]


Този тест е използван да сравни 2 групи (зависимите променливи величини са интервално-пропорционални данни)
Т.напр. (Т-Тест Двойки) изследват дали резултатите преди представянето на независимите променливи величини изглеждат като резултатите от:
O1 X O2
Т.напр. Сравнете две групи след намеса, за да видите дали някои печелят, а други не.
X O1

_ O2


ANOVA Уебстер демонстративен

сайт]


Понякога изследователят има повече от две групи.
T-Тестът е много малък и изследователят използва ANOVA.
Тази форма на данни би могла да изглежда като Соломон 4, или изследователят може да наблюдава резултатите относно програмата за различни етнически групи като бели,Испаноидни, Афро-Американци.

Взаимна връзка на Пиърсън-Уебстер

Статистическите тестове са демонстрация на това, дали промени в тези независими променливи величини (интервално/пропорционални) водят до промени на зависимите.
Примерно, ако коефициентът е 38, това означава, че за всяка 1 величина, увеличението с единица в независимата променлива, води до увеличение 0,38 в зависимата променлива. ВЪПРЕКИ ТОВА, взаимовръзката не е от значителна важност.
С тази взаимовръзка изследователят приема най-големия номер като индикатор на фактори, които влияят на зависимата променлива величина.

Ако коефициентът на Пиърсън се умножи със себе си (примерно на квадрат), резултатът показва количеството на цялата вариация, обяснено от независимата променлива величина. Така, че коефициент от 0,80 ще обясни 0,64 или 64% от вариацията в зависимата променлива величина, но 38 ще обясни само 14%. В най-добрия случай, изследователят иска да обясни 100% от вариацията в зависимата променлива величина.



ПРОСТА

РЕГРЕСИЯ


[Webster demo site]

За да се тества връзката между независима и зависима променливи величини, които са интервални пропорции, се ползва проста или линейна регресия.
Регресията се приема за линейна. Докато това не е винаги вярно, това е главното предположение на този статистически тест. Когато се изчислява регресия, изследователят решава за:
Най-добре пасващият “наклон на линията”.
“У-пресечката” или където тази линия пресича У-ординатата.
Връзката на “линията, която най-добре пасва” и действителните точки на данните е от значение. Голяма регресия ще допринесе до струпване на точките около “линията,пасваща най-добре”. Резултатните грешки между въпросната линия и реалните точки варира произволно.
Графическата илюстрация, която обикновено се използва, за да покаже тази връзка е координатната система.
Колкото е по-голям квадратът на Пиърсън, толкова е по-малка грешката.(р<0,05 или по-малко) и колкото е по-малка стойността на “t-вариацията” между “линията” и точките, толкова е по-голяма вероятността изследователят да може да идентифицира, изчисли, обясни и прогнозира връзката между независимата и зависимата променливи величини.


СЛОЖНА

РЕГРЕСИЯ


[Уебстъп демонстративен сайт]

Сложната регресия (уебстер-демонстративната страница) е огледална на линейната регресия с едно изключение. Когато изчислява сложна регресия, изследователят използва повече от една независима променлива величина в прогнозирането на резултатите на зависимите променливи величини.




ТЕСТВАЙТЕ ВАШЕТО СТАТИСТИЧЕСКО ЗНАНИЕ. Ако зависимата величина е интервална пропорция, но независимата е ---


Променлива

величина


Ниво на оценка

Тест/резултат

Образование







Учи за







Пол







Съюз







Опит







Заплата







Възраст







Раса







Професия







Var 10







Var 11







(взето от Уебстър CPS файл за примерни данни за заплата)***


Интернет

Ресурси


Статистиката за идиоти на Антъни Паим (написал го е с насмешка) осигуряват лесно разбираем преглед. Отидете по-надолу за дедуктивни статистики. Дискусия на т-тест, Пиърсън и регресия.
Anova дискусия виж- Уил Хопкинс


1st Bulgarian version

2nd Bulgarian version

3rd Bulgarian version

4th Bulgarian version

5th Bulgarian version

6th Bulgarian version

7th Bulgarian version (pending)

8th Bulgarian version (pending)

9th Bulgarian version (pending)



10thBulgarian version (pending)

Project –Bulgarian version (pending)


Сподели с приятели:




©obuch.info 2024
отнасят до администрацията

    Начална страница