Hipotez Test

Python-dan istifadə edərək hipotez sınağı ilə bağlı sadə və qısa bir dərslik

Şəkil: http://www.advanceinnovationgroup.com/blog/median-based-hypothesis-testing

Bu blogda Pythonda Statistik metodlardan istifadə edərək Hipotez Testinin qısa bir dərsliyini verəcəyəm. Hipotez Test, hamımızın tanış olduğumuz Elmi Metodun bir hissəsidir, ehtimal ki, erkən təhsil illərində öyrəndiklərimizdir. Ancaq statistikada bir populyasiya nümunəsi üzərində bir çox təcrübə aparılır.

"Nümunə müşahidələr toplusunun təklif olunan izahat barədə nə dediyini müəyyənləşdirmək, ümumiyyətlə, bizdən imtina etməyimizi tələb edir və ya statistiklərin dediyimiz kimi, Qeyri-müəyyənliyə səbəb olur. Qeyri-müəyyənliklə əsaslandırma statistik nəticənin əsasını təşkil edir və adətən Null Hipotezanın Əhəmiyyətliliyi Testi adlanan bir metoddan istifadə etməklə aparılır. " -Oşlar.

Bu bloq üçün bir nümunə olaraq Kaggle’də tapılmış Avropa Futbol Məlumatları dəstindən istifadə edəcəyəm və fərziyyə testi aparacağam. Məlumat toplusunu burada tapa bilərsiniz.

Addım 1

Bir müşahidə aparın

İlk addım hadisələri müşahidə etməkdir. Bu vəziyyətdə olacaq: Müdafiə təcavüzünün ortalama icazə verilən hədəflərə təsiri varmı?

2-ci addım

Tədqiqatı araşdırın

Getmək üçün yaxşı bir zehniyyət daha çətin iş deyil. Etdiyiniz yaxşı bir şey, müşahidənizlə əlaqəli tədqiqatın artıq olub olmadığını görməkdir. Əgər belədirsə, sualımızı cavablandırmağa kömək edə bilər. Artıq mövcud tədqiqat və ya təcrübələrdən xəbərdar olduğumuz təcrübəmizi daha yaxşı quruluşlamağımıza kömək edəcək və ya bəlkə də sualımızı cavablandıra bilərik və ilk növbədə təcrübəni aparmalı deyilik.

3-cü addım

Null hipotezi və alternativ bir hipotez formalaşdırın

Alternativ bir fərziyyə təhsilli tahminimizdir və boş bir fərziyyə tamamilə əksinədir. Alternativ fərziyyə iki dəyişən arasında əhəmiyyətli bir əlaqənin olduğunu bildirərsə, null hipotezdə əhəmiyyətli bir əlaqənin olmadığı bildirilir.

Null hipotezimiz olacaq: Müdafiə təcavüzü reytinqi 65-dən aşağı olan komandalarla müqayisədə 65-dən yuxarı və ya bərabər olan komandalarda icazə verilən qollarda statistik fərq yoxdur.

Alternativ Fərziyyə: Müdafiə təcavüzü reytinqi 65-dən aşağı olan komandalarla müqayisədə 65-dən çox olan və ya bərabər olan komandalarda icazə verilən qollarda statistik bir fərq var.

Addım 4

Fərziyyəmizin bir təkərli bir test və ya iki quyruqlu bir test olub olmadığını müəyyənləşdirin.

Birtərəfli Test

"0.05 bir əhəmiyyətsizlik səviyyəsindən istifadə edirsinizsə, birtərəfli bir test bütün alfa'larınızın statistik əhəmiyyətini bir istiqamətdə sınamağa imkan verir." Bir tərəfli bir test nümunəsi "65-dən aşağı bir təcavüz reytinqi olan futbol komandaları, reytinqi 65-dən aşağı olan komandalara görə statistik baxımdan daha çox qol imkan verir."

İkiqat Test

"0.05 bir əhəmiyyətsizlik səviyyəsindən istifadə edirsinizsə, iki tərəfli bir test, alfa'nızın yarısının statistik əhəmiyyətini bir istiqamətdə və alfa'nızın yarısını digər istiqamətdə test etməsinə imkan verir. Bu o deməkdir ki, test statistikanızın paylanmasının hər quyruğunda 0.025 var. "

İki quyruqlu bir test ilə hər iki istiqamətdə statistik əhəmiyyətini sınayırsınız. Bizim vəziyyətimizdə hər iki istiqamətdə statistik əhəmiyyətini sınayırıq.

5-ci addım

Bir eşik əhəmiyyəti səviyyəsini təyin edin (alfa)

(alfa dəyəri): Nöqtəli fərziyyəni rədd edərək tamam olduğumuz hədd. Bir alfa dəyəri 0 ilə 1 arasında təyin etdiyimiz hər hansı bir dəyər ola bilər. Ancaq elmdə ən çox görülən alfa dəyəri 0.05-dir. 0.05 səviyyəsinə qoyulmuş bir alfa nəticələrin təsadüfi olduğuna görə 5% və ya daha az bir şans olmasına baxmayaraq, null fərziyyəsini rədd etməklə tamam olduğumuzu bildirir.

P-dəyər: Təsadüfi olaraq bu məlumatlara gəlmək üçün hesablanmış ehtimal.

Bir p-dəyəri hesablasaq və 0.03-ə çıxsaq, bunu "Mən gördüyüm nəticələrin təsadüfi və ya təmiz şansdan qaynaqlandığı 3% şans var" deyərək şərh edə bilərik.

Learn.co-dan şəkil

Məqsədimiz p dəyərini hesablamaq və alfa ilə müqayisə etməkdir. Alfa nə qədər aşağı olsa, test daha sərt olur.

6-cı addım

Nümunə seçimini həyata keçirin

Burada futbol adlı məlumat bazamız var. Testimiz üçün məlumat dəstimizdə yalnız iki sütuna ehtiyacımız var: team_def_aggr_rating və qollar_allowed. Bu iki sütuna süzgəcdən keçirəcəyik, sonra müdafiə təcavüzü reytinqi 65-dən çox və ya bərabər olan və müdafiə təcavüzü reytinqi 65-dən aşağı olan komandalar üçün iki altlıq yaradacağıq.

Yalnız hipotez testimizi toplamaq üçün:

Müdafiə təcavüzünün orta icazə verilən hədəflərə təsiri. Null Hipoteza: Müdafiə təcavüzü reytinqi 65-dən aşağı olan komandalarla müqayisədə 65-dən çox və ya bərabər olan komandalarda icazə verilən qollarda statistik fərq yoxdur. Alternativ hipotez: Müdafiə təcavüzü reytinqi daha yüksək olan komandalarda icazə verilən qollarda statistik fərq var. 65-dən aşağı olan komandalarla müqayisədə 65-ə bərabərdir. İkiqatlı Test Alpha: 0.05

İndi statistik testlər apara biləcəyimiz iki nümunə siyahısı var. Bu addımdan əvvəl, vizual əldə etmək üçün iki paylamanı planlaşdıracağam.

7-ci addım

İki Nümunə T-testini həyata keçirin

İki nümunə t-testi iki populyasiya mənasının bərabər olub olmadığını müəyyən etmək üçün istifadə olunur. Bunun üçün statsmodel adlanan Python modulundan istifadə edəcəyik. Statsmodellər haqqında çox detala girməyəcəyəm, ancaq sənədləri burada görə bilərsiniz.

8-ci addım

Qiymətləndirin və Nəticə Verin

Xatırladaq ki, qoyduğumuz alfa a = 0.05 idi. Test nəticələrimizdən göründüyü kimi p-dəyəri alfamızdan azdır. Null hipotezimizi rədd edə bilərik və alternativ hipotezimizi 95% inamla qəbul edə bilərik.

Oxuduğunuz üçün təşəkkür edirəm! Hipotezanın sınanması ilə bağlı daha ətraflı məlumat üçün, bu qrup proyektini burada hipotez sınağında iştirak etdiyim GitHub-da öyrənə bilərsiniz.

Resurslar:

Ocaqlar, Metyu. "Statistika və" Elmi metod "YourStatsGuru-dan əldə edilmişdir. https://www.yourstatsguru.com/secrets/scimethod-stats/?v=4442e4af0916

SAS-a giriş. UCLA: Statistik Məsləhət Qrupu. https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-are-the-d fərqlər-bütün-one-tail-and-two-tail-tests/ (Maydan əldə 16, 2019).

Mühəndislik statistikası kitabçası. https://www.itl.nist.gov/div898/handbook/eda/section3/eda353.htm