Търсене в този блог

неделя, 29 ноември 2009 г.

Лекция по Статистика - 13.11

Проверка на статистически хипотези

Статистическо оценяване – индуктивен подход

При проверка на хипотези имаме хипотеза за ГС и се основава на дедуктивния подход за изучаване на статистическите съвкупности.

Статистическа хипотеза
- предположение за параметър или за функцията на разпределение на ГС или съвкупности
- параметър – средна величина или относителен дял
- статистическата проверка на хипотези се определя въз основа на резултатите, получени от извадка или извадки, доколкото е вероятно те да бъдат излъчени от ГС или съвкупности с определени параметри или имащи определено разпределение
- при вероятност, по-малка от зададеното равнище на значимост, хипотезата се отхвърля. В противен случай хипотезата се приема, което означава че резултатите от извадката не позволяват нулевата хипотеза да бъде отхвърлена
- проверяваната хипотеза с е нарича нулева и се означава с Н0. ако тя се отхвърли, то тогава се нарича алтернативна и се обозначава с Н1.

Риск от грешка първи род (алфа грешка) – равнище на значимост – вероятност да отхвърлим нулевата хипотеза, когато е вярна/ Алфа вероятността да отхвърлим нулевата хипотеза, когато е вярна
. Рискът за допускане на такава грешка се означава с алфа

Риск от грешка втори род (бета грешка)
- допуска се при приемане на нулевата хипотеза, когато не е вярно.
- Рискът за допускане на такава грешка се означава с „бета”

Статистическата проверка на хипотези се извършва на основата на статистически критерий
- случайна величина, която е доказано че има определено известно разпределение при условие че нулевата хипотеза е вярна
- емпиричната характеристика на статистическия критерий се изчислява като се използват данни от извадката/ -те и хипотетичните стойности на величините, отнасящите се за ГС/ -ти
- емпиричната характеристика е една конкретна реализация на статистически критерий. Колкото е по-малко вероятна тази реализация, толкова по-вероятно е нулевата хипотеза да бъде отхвърлена и обратното – колкото е по-вероятна тази реализация, толкова по-вероятно е нулевата хипотеза да бъде приета

областта на приемане на нулевата хипотеза обхваща по-вероятните реализации на статистическия критерий. Вероятността за тези реализации е . Критична област (областта на отхвърляне на нулевата хипотеза) обхваща по-малко вероятните реализации на статистическия критерий. Вероятността за тези реализации е алфа.

Етапи на проверка на статистически хипотези
1) формулиране на нулевата и алтернативната хипотези
a. θ – параметър на ГС
b.
2) Определяне на допустимия риск за грешка алфа (задаване на равнище на значимост алфа)
3) Определяне на подходящ статистически критерий и на неговото вероятностно разпределение при валидна нулева хипотеза
4) Определяне на критичната област, т.е. установяване на границите ба областта на отхвърляне на нулевата хипотеза на основата на вероятностното разпределение статистическия критерий и избраното равнище на значимост алфа
a. Критична област
b.
5) Изчисляване на емпиричната характеристика на теста
6) Заключение относно приемането или отхвърлянето на нулевата хипотеза

Ако емпиричната характеристика попада в критичната област, нулевата хипотеза се отхвърля и се приема алтернативната, с риск за грешка алфа. В противен случай нулевата хипотеза се приема, т.е. Н0 не може да бъде отхвърлена при избраното равнище на значимост.

Проверка на статистическите хипотези за средната на ГС
1) формулиране на нулевата и алтернативната хипотези
a.
2) Задаване равнище на значимост алфа
3) Избор на подходящ статистически критерий за проверка на хипотезата
a. При известна дисперсия на ГС статистическият критерий е случайна величина , която има стандартно нормално разпределние при условие че нулевата хипотеза е вярна
b. При неизвестна дисперсия на ГС и малка извадка (n<=30), ако ГС има нормално разпределение, статистическият критерий е . Това е случайна величина, която има t-разпределение със степени на свобода n – 1, при условие че нулевата хипотеза е вярна
c. При неизвестна дисперсия на ГС и голяма извадка, статистическият критерий е . Това е случайна величина, чието разпределение може да се апроксимира от стандартното нормално разпределение при условие че нулевата хипотеза е вярна
4) Определяне на критичната област
a. Формули (интервали)... има ги в упражненията...
5) Определяне на емпиричната характеристика
a. Случай 1
b. Случай 2:
c. Случай 3:
6) Заключение относно приемането или отхвърлянето на нулевата хипотеза
a. Ако емпиричната характеристика попада в критичната област, нулевата хипотеза се отхвърля и се приема алтернативната, с риск за грешка алфа. В противен случай нулевата хипотеза се приема, т.е. Н0 не може да бъде отхвърлена при избраното равнище на значимост.



Проверка на хипотези за относителен дял от ГС
1) формулиране на нулевата хипотеза и алтернативната хипотеза
a.
2) ЗАДАВАНЕ РАВНИЩЕ НА ЗНАЧИМОСТ НА АЛФА
3) ИЗБор на подходящ статистически критерий за проверка на хипотезите
a. При статистическият критерий е случайна величина
b. , която има приблизително стандартно нормално разпределение при условие че нулевата хипотеза е вярна
4) Определяне на критичната област
a. Също формули и интервали на стойности но вместо μ има Р
5) Определяне на емпиричната характеристика
6) Заключение относно приемането или отхвърлянето на нулевата хипотеза
a. Ако емпиричната характеристика попада в критичната област, нулевата хипотеза се отхвърля и се приема алтернативната, с риск за грешка алфа. В противен случай нулевата хипотеза се приема, т.е. Н0 не може да бъде отхвърлена при избраното равнище на значимост
Проверка на хипотези за разлика между средни от две ГС – независими извадки
1) формулиране на нулевата и алтернативната хипотези
a.
b. При d0=0,
2) Zadawane na rawni]e na zna`imost
3) Избор на подходящ статистически критерий за проверка
a. При известни дисперсии на ГС, статистическият критерий е случайна величина
b. Ако са изпълнени следните условия:
i. Дисперсиите на ГС са неизвестни, но се предполага че са различни
ii. Поне една от двете извадки е малка
iii. Нормално разпределение на ГС,
iv. , като степените на свобода са ... дълга формула от края на упражнението на 12.11
c. Ако са едновременно изпълнени следните условия
i. Дисперсиите на ГС са неизвестни, но се предполага че са равни
ii. Поне една от двете извадки е малка
iii. Нормално разпределени ГС, то ...формула много дълга..., случайна величина, която има t-разпределение със степени на свобода
d. При неизвестни дисперсии на ГС и големи извадки, статистическия критерий е: , като е случайна величина, която има приблизително стандартно нормално разпределение
4) Определяне на критичната област
a. Дълги формули...с интервали
5) Определяне на емпирични характеристики
a. и още три формули, които изчезнаха нейде в небитието...
6) Заключение относно приемането или отхвърлянето на нулевата хипотеза...





Проверка на хипотези на разликата между средни от две ГС: взаимнозависими извадки
- едната извадка се извлича чрез случаен подбор, а другата се образува автоматично от нея
- пример: значенията на едни и същи единици се регистрират два пъти – преди и след промяна на определени условия, т.е. една извадка се наблюдава два пъти
- Предимство: изключва се влиянието н индивидуалните различия на единиците, което е налице в случаите на независими извадки

1) формулировка на нулевата и алтернативните хипотези
a.
2) Задаване на равнище....
3) Избор на подходящ статистически критерий за проверка
a. , случайна величина, която има t-разпределение със степени на свобода n – 1, при условие че нулевата хипотеза е вярна
b. При големи извадки, t-разпределение може да бъде апроксимирано от стандартното нормално разпределение
4) Определяне на критичната област
a. Дълги формули и интервали....
5) Определяне на емпиричната характеристика
a. Дълга формула с t=… и в знаменател сума на d дрън дрън...
6) Заключение.....

Проверка на хипотези, между относителни дялове от две генерални съвкупности на базата на независими извадки

1) формулиране на нулевата и алтернативните хипотези
a.
2) .....
3) Избор на .....
a. и
b. Дълга формула за Z...
4) Определяне на критична област
a. Таблица с формули и интервали при едностранни и двустранни значения
5) Определяне на емпиричната характеристика....
a. Различия във формулите с учебника в означенията

Няма коментари:

Публикуване на коментар