6.1. Основни понятия

 

Голяма част от научните изследвания се отнасят до сравняване на разпределението на две или повече променливи величини. Така например типични за изследванията в областта на физическото възпитание са проблемите за сравняване на нивото на двигателните качества на различни категории подрастващи, за съпоставяне на ефективността на различни методики на подготовка и др.

Особеното на тези сравнения е, че изводите, които се правят, трябва да се отнасят до целите съвкупности, а данните, с които разполага изследователят, обхващат само извадката. Поради това първоначално се формулират предположения (хипотези) и се прави проверка дали данните от извадката ги потвърждават или отхвърлят. 

·  Нулевата или работна (Н0) - тя твърди, че няма статистически достоверна разлика в сравняваните статистически показатели в генералните съвкупности. Въпреки, че в извадките може да се наблюдава известна разлика, тя се дължи на случайни  фактори и не може да бъде обобщена за генералните съвкупностите.

·  Алтернативна хипотеза (Н1), която твърди, че констатираната разлика в извадките е статистически достоверна и може да бъде обобщена за генералните съвкупности.

 

Решенията, които се вземат при проверката на статистически хипотези, имат вероятностен характер. Това се дължи на факта, че изследванията са репрезентативни, т.е. изводите за съвкупността се правят въз основа на изследване на относително малка част от нея. Приемането или отхвърлянето на нулевата хипотеза се прави с определена степен на сигурност, като в същото време се допуска възможността за грешка на статистическите изводи.

 

Степента на сигурност, с която се приема за вярна алтернативната хипотеза, се нарича гаранционна вероятност (Р).

Рискът да се допусне грешка, като се приеме за вярна алтернативната хипотеза се нарича равнище на значимост (a).

 

В практиката се използват следните стойности за гаранционната вероятност (Р) и равнище на значимост (a):

·   Р= 95%, на която съответства a = 0,05 (5% възможност за грешка).

·   Р= 99%, на която съответства a = 0,01 (1% възможност за грешка).

·   Р=99,9%, на която съответства a=0,001 (0,1% възможност за грешка).

 

6.2. Алгоритъм  за проверка на хипотези

 

Общата процедура за проверка на статистически хипотези предполага преминаването през няколко поредни стъпки:

 

І стъпка - Формулиране на нулевата и алтернативната хипотеза.

Както вече бе споменато, нулевата (Ho) хипотеза е предположение за нулева разлика, нулев ефект. Ако емпиричните данни сочат известни различия, то те се дължат на случайни фактори. Противоположно е твърдението на алтернативната хипотеза (Н1), според която наблюдаваните в емпиричните данни различия (ефект, зависимост) са резултат на закономерно действащи фактори.

 

ІІ стъпка - Избор на подходящ критерий за проверка на хипотезата.

Хипотезите се проверяват със специфични критерии. За целта е необходимо да се познават условията, на които трябва да отговарят променливите величини, естеството на извадките и някои други особености, които са разгледани в следващия раздел.

 

ІІІ стъпка - Изчисляване на емпиричната стойност на критерия (Критерийemp).

За всеки един критерий има разработена процедура за изчисляването му по данни от извадката.

 

ІV стъпка – Определяне на табличната стойност на критерия (Критерий a).

Тя се взема от приложение, в зависимост от степените на свобода (k) и равнището на значимост (a). Към статистическата литература има приложени таблици с критични стойности на критериите. В настоящото ръководство тези таблици се намират, приложени към съответната тема.

 

V стъпка – Вземане на решение.

За целта табличната (критичната) стойност на критерия се сравнява с емпиричната (изчислената по данни от извадката). Именно това сравнение дава основание за формулиране на извод коя от хипотезите (нулевата или алтернативната) е вярна. Възможностите са две:

·   Емпиричният критерий да е по-малък от критичния. В такива случаи за правдоподобна се приема нулевата хипотеза (Но).

·   Емпиричният критерий да е по-голям или равен на от критичния. В такива случаи нулевата хипотеза (Но) се отхвърля и за вярна се приема алтернативната хипотеза (Н1).

Вземането на решение може да стане и въз основа на равнището на значимост (a), което съответства на емпиричната стойност на критерия. Тя се изписва в разпечатките на SPSS: 

·   Равнището на значимост (a) да е по-голямо от възприетото (a > 0,05 (0,01 или 0,001). В такъв случай няма основание за отхвърляне на нулевата хипотеза (Но).

·   Равнището на значимост (a) да е по-малко или равно на възприетото (a ≤ 0,05 (0,01 или 0,001). Това означава, че нулевата хипотеза (Но) се отхвърля в полза на алтернативната.

Както вече бе споменато, аналогична информация носи гаранционната вероятност P/t/, която при известно равнище на значимост се изчислява по формулата:

P/t/= (1 - a )*100

 

Възможностите придобиват следния вид:

·   Гаранционната вероятност да е по-малка от възприетата (95% или 99%).  В такъв случай  за вярна се приема нулевата хипотеза (Но).

·   Гаранционната вероятност да е равна или по-голяма от 95% (99%). В такъв случай се отхвърля нулевата и за вярна се приема алтернативната хипотеза.

 

 Обобщение на начините за вземане на решение е представено в таблица 6.1.

Таблица 6.1

Хипотеза

Решение, основано на стойността на критериите за проверка на хипотези

Решение, основано на достигнатото равнище на значимост

Решение, основано на гаранционната вероятност

Приемане на Ho temp<ta a>0,05 (0,001;0,001) P<95% (99%;99,9%)
Приемане на H1 tempta a0,05 (0,001;0,001) P95% (99%;99,9%)

 

Въпреки голямото разнообразие от статистически критерии за проверка на хипотези тази обща принципна схема се спазва винаги. Особено важен момент в процедурата е изборът на критерия. Непознаването на вида на променливите, вида на извадките, както и случаите, в които се прилага съответният критерий, може да доведе до некоректно ползване на статистическите методи, а оттам до утвърждаване на неверни научни изводи.

 

6.3. Критерии за проверка на хипотези

 

Изборът на коректен критерий за проверка на дадена хипотезата зависи от:

1. Използвания статистически метод и показатели, които се сравняват (за сравняване на средни аритметични, дисперсии, относителни дялове и др. се ползват различни критерии).

2. Естеството на променливите величини, които подлежат на обработка – на първо място е важно дали променливите са количествени или категорийни (качествени). Вторият фактор е нормално ли е разпределението на признака или не. От тази гледна точка са разработени две големи групи от статистически критерии:

 

·  Параметрични – прилагат се при количествени (интервално и пропорционално скалирани) признаци, когато предварително е доказано, че разпределението на признака е нормално.

·  Непараметрични – прилагат се при качествени (номинално и рангово) скалирани признаци, а така също, когато разпределението на количествен признак не е известно или не е нормално.

 

3. Вида на извадките, които подлежат на сравнение. От гледна точка на начина, по който са съставени, те биват:

·  Независими - когато изборът на единиците в едната извадка не е предопределен от избора на единиците в другата извадка (с други думи изследваните лица от двете извадки са различни и няма никаква връзка между тях). Експерименти за сравняване на експериментална и контролна група са типичен пример за независими извадки.

·  Зависими са извадките, когато единиците от едната извадка предопределят тези във втората. Типичен случай са изследванията за сравняване на променливи преди и след някакво въздействие. Очевидно е, че експерименти от такова естество са коректни само в случай, че изследваните лица (единици) от първото и второто изследване са едни и същи.

 

4. Броя на извадките, които се сравняват.

В таблица 6.2 е направена систематизация на основите критерии, които се ползват при научни изследвания в спорта.

 

Таблица 6.2

Променливи величини

Брой на извадките

Вид на извадките

Критерии за проверка на хипотези

Количествени,  които имат нормално разпределение

Две

Независими

t-критерий на Стюдънт за независими извадки

Зависими

t -критерий на Стюдънт за зависими извадки

Три и повече

Независими

F-критерий на Фишер (дисперсионен анализ)

Зависими

Дисперсионен анализ за повтарящи се наблюдения

Алтернативни

Две

Независими

U-критерий на Стюдънт

Зависими

c2-критерий на Мак Немар

Номинални

Две и повече

-

c2-критерий на Пирсън

Рангови  и количествени, които имат ненормално разпределение

Две

Независими

U-критерий на Ман Уитни

Зависими

T-критерий на Уилкоксън

Три и повече

Независими

Критерий на Кръскал Уолис

Зависими

c2- критерий на Фридман

 

t-критерият на Стюдънт за независими извадки  се прилага за проверка на нулевата хипотеза за сравняване на средни аритметични величини , когато:

·         Променливите са количествени и имат нормално разпределение;

·         Извадките са две и са независими.

Емпиричната стойност на критерия се изчислява  (temp) по формула 6.1, а табличната му стойност се отчита от приложение 7:

 

 

(6.1)

където:

и - ср. аритметични в извадките

S12 и S22–  дисперсии в извадките

п1 и п2 – обем на извадките

 

 

t-критерирят на Стюдънт за зависими извадки се  използва за сравняване на средни аритметични величини, когато:

Емпиричната му стойност е изчислява по формула 6.2 а табличната се отчита от приложение 8.

 

(6.2)

където:

d – разлика между І и ІІ изследване за всяко изследвано лице

`d - средна аритметична на тези разлики

п – обем на извадката