Лекция 11 - Планиране на клинични изпитания и епидемиологични изследвания. Оценяване на големината на извадката. Рандомизация
Планиране:
-
определяне на целите на проучването;
-
дефиниране на популацията;
-
избиране на зависими променливи;
-
избиране на метод за набиране на подходяща случайна извадка;
-
избиране на подходящ дизайн;
-
разработване на план за статистически анализ;
-
оценяване на големината на извадката, необходима за тестване на основните хипотези или построяване на съответните доверителни интервали.
Oценяване големината на извадката
Основни понятия: Мощност (power) е вероятността за отхвърляне на нулевата хипотеза, когато конкретна проста алтернативна хипотеза е вярна.
Всяко оценяване на големината на извадката (или еквивалентно анализ на мощността – power analysis) има четири компонента: вероятност за грешка от първи тип (ниво на съгласие, type I error, significance level), мощност (или вероятност за грешка от втори тип, type II error), големина на ефекта (effect size) и големина на извадката (sample size). Всеки набор от кои да е три от тези компоненти еднозначно определят четвъртия. Обикновено нивото на съгласие, желаната мощност и желаната големина на ефекта са предварително определени, а се търси големината на извадката. Но понякога етични или други ограничения налагат да се фиксира максималната възможна големина на извадката и тогава мощността се определя от останалите три компонента и въз основа на тези изчисления се решава дали да се предприеме съответното проучване.
1. Сравнение на средните на две независими групи чрез т-тест:
H0: m1= m2 срещу Hа: m1> m2
Колко големи извадки са ни необходими, за да отхвърлим H0 с 80% мощност при ниво на съгласие 5% и ако действителната стандартизирана разлика между двете средни е d=m/σ? Да допуснем, че знаем дисперсията (σ), че разпределенията са нормални и че размерите на двете извадки са еднакви.
Обща формула за двустранен тест:
Най-често използвани стойности:
Когато дисперсията е неизвестна, се използва t-разпределение.
Домашно: Имаме две групи мишки: едните получават плацебо, а другите селен. Искаме да намерим 0.16 mol/ml разлика в нивата на хормона GSH между двете групи. Средното и стандартното отклонение на контролната група са оценени от предишни опити на 0.88 и 0.4 mol/ml съответно.
А. Колко голяма извадка ни е необходима, за да намерим такава разлика между средните с 80% мощност при ниво на съгласие 5%?
Б. Как се променя отговора в А, ако увеличим мощността на 90%?
В. Каква е мощността, ако извадките не могат да бъдат по-големи от 10 мишки във всяка група? Заслужава ли си да направим такъв експеримент?
Най-силно въздействащ компонент при оценяване на големината на извадката е големината на ефекта. В медицински изследвания това е най-малката разлика, която е клинично значима.
Коен (Cohen) предлага конвенция за малки (small), средни (medium) и големи (large) ефекти:
Примери:
- Разлика между две средни: стандартизирана разлика между средни
“small”: d = 0.20, “medium”: d = 0.50, “large”: d = 0.80.
- Разлика между пропорции:
“small”: 40% vs 50%, “medium”: 40% vs 65%, “large”: 40% vs 78%.
- Тестове на основни и интеракционни ефекти в дисперсионен анализ:
“small”: f = 0.10, “medium”: f = 0.25, “large”: f = 0.40 { }
Връзка между размер на ефекта и големина на извадката при т-тест за две независими групи:
2. Сравнение на средните на две зависими групи въз основа на сдвоен т-тест (paired t-test)
Обща формула за двустранен тест:
r – корелация между наблюденията в двете извадки
Домашно: Ако в примера от домашното по-горе може да използваме едни и същи мишки, т.е. дизайн с повторни наблюдения над всяка мишка, колко мишки са ни необходими, за да намерим същия размер на ефекта, със същата мощност при същото ниво на съгласие като в точка А? Направете изчисленията при корелация между повторни наблюдения над едни и въщи мишки от 0, 0.3, 0.5 и 0.8. Какво можете да заключите за ефективността на двата дизайна?
Важни похвати при планиране на експерименти:
Редуциране на дисперсията на данните:
-
хомогенна популация;
-
стратификация (пропорционален брой хора във всяка група на лечение за всеки слой, определен от различните фактори);
-
стабилни и прецизни зависими променливи;
-
прецизни инструменти и мерки;
- повторни наблюдения.
Рандомизацията е изключително важен компонент при клинични изпитания и други експерименти. Рандомизацията е начинът на определяне кой индивид какво лечение ще получи по случаен признак.
Тя трябва да осигури баланс както на леченията (приблизително еднакъв брой пациенти получават всяко лечение – balance of treatment assignments), така и на характеристиките на индивидите между различните лечения (covariate balance). В рандомизирани изследвания може да се правят изводи за причинно-следствени връзки.
Видове рандомизации:
-
стационарни и адаптивни;
-
напълно неограничени и с ограничения.
Примери:
-
simple randomization (проста рандомизация);
-
block randomization (блокова рандомизация);
-
stratified randomization (стратифицирана рандомизация);
-
biased-coin randomization (рандомизация с „нечестна” монета);
-
urn randomization (урнова рандомизация);
...
Рандомизационна програма (безплатна!!!):
http://mahmoodsaghaei.tripod.com/Softwares/randalloc.html
Сподели с приятели: |