Please download to get full document.

View again

of 30
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.

Test d ipotesi sulla media

Category:

Funny & Jokes

Publish on:

Views: 18 | Pages: 30

Extension: PDF | Download: 0

Share
Related documents
Description
Test d ipotesi sulla media Silvia Parolo 12 December 2014 Riassumendo l esercitazione precedente Nella lezione precedente abbiamo visto che la media campionaria può essere un buon stimatore del valore
Transcript
Test d ipotesi sulla media Silvia Parolo 12 December 2014 Riassumendo l esercitazione precedente Nella lezione precedente abbiamo visto che la media campionaria può essere un buon stimatore del valore atteso nella popolazione da cui provengono i dati. Inoltre possiamo anche misurare la variabilità del nostro stimatore attraverso gli intervalli di confidenza. Verifica di ipotesi Si fanno delle ipotesi su una caratteristica di una popolazione oggetto di studio e si verificano sulla base di osservazioni campionarie. H 0 ipotesi nulla H 1 ipotesi alternativa Test d ipotesi sulla media con varianza nota L ipotesi nulla di un test d ipotesi a due code sulla media può essere formulata nel modo seguente: µ = µ 0 dove µ 0 è un valore ipotizzato della vera media della popolazione µ. L ipotesi alternativa è: µ µ 0 La statistica test z Il test per saggiare H 0 è: z = x µ 0 σ n Problema Supponiamo che il peso medio dei bambini alla nascita nel 2013 sia stato 3.3 kg. In un campione di 35 nati in un ospedale quest anno il peso medio dei bambini è 3.0 kg. Assumendo che la deviazione standard della popolazione sia 1 kg, a livello di significatività dello 0.05 si può rifiutare l ipotesi nulla che la media del peso dei bambini nati nel 2014 non differisce da quella dell anno scorso? L ipotesi nulla è che la media µ sia 3.3 Inseriamo i dati in R e calcoliamo z xbar - 3 mu0 - 3.3 sigma - 1 n - 35 z - (xbar - mu0)/(sigma/sqrt(n)) z ## [1] Calcoliamo i valori critici z a livello di significatività del 5% alpha z_cr - qnorm(1-alpha/2) c(-z_cr, z_cr) ## [1] Rappresentazione grafica del risultato x - seq(-5,5,by=0.1) plot(x,dnorm(x),xlab= z distribution , ylab= ,type= l ) abline(v=z,lty=2,col= blue ) abline(v=c(-z_cr, z_cr),col= red ) z distribution Invece di utilizzare il valore critico z possiamo anche calcolare il pvalue. Siccome il pvalue risulta = 0.05 non possiamo rifiutare l ipotesi nulla. pval - 2 * pnorm(z) #moltiplichiamo per 2 per tenere conto delle due code pval ## [1] In conclusione non possiamo rifiutare l ipotei nulla. La media del peso dei nati di quest anno è uguale all anno scorso. Test d ipotesi sulla media con varianza non nota: test t R ha una funzione per il calcolo del test t: t.test. Esempio Consideriamo un dataset con i valori di espressione di 40 geni. Testiamo l ipotesi che il valore medio di espressione dei geni sia 2000. Leggiamo i dati setwd( ~/google Drive/bio/lab_statistica_cavagna/esercitazi dati - read.csv( expression.csv ) head(dati) ## gene esp ## 1 Gene ## 2 Gene ## 3 Gene ## 4 Gene ## 5 Gene ## 6 Gene6 1599 t test per singolo campione t.test(dati$esp, mu=2000) ## ## One Sample t-test ## ## data: dati$esp ## t = , df = 39, p-value = ## alternative hypothesis: true mean is not equal to 2000 ## 95 percent confidence interval: ## ## sample estimates: ## mean of x ## 1852 Il pvalue 0.05 ci fa rifiutare l ipotesi nulla ad un livello alfa di 0.05. Passiamo ora al confronto fra due gruppi Spesso negli esperimenti si ha come scopo quello di confrontare due gruppi. I risultatati posso essere riassunti sotto forma di medie per gruppo. Ma come facciamo a decidere se le differenze sono reali o solo dovute al caso? Per confrontare le medie di due gruppi si utilizzano: t test per gruppi indipendenti t test per dati accoppiati ragionando sull ipotesi nulla: H 0 : le medie dei due campioni sono uguali o ugualmente che la differenza delle medie è zero H 1 : le medie dei due campioni sono diverse t test per gruppi indipendenti Supponiamo di essere interessati al variare del colesterolo in funzione del sesso. Utilizziamo i dati nel file esami_sangue.txt sangue - read.table(file= esami_sangue.txt , header=t, sep= \t , dec= . ) C è una differenza nel valore medio di Colesterolo tra maschi e femmine? H 0 : µ d = 0 H 1 : µ d 0 Varianza dei due campioni Effettuiamo un test f per vedere se le varianze dei due gruppi sono uguali o diverse. var.test(data=sangue, Colesterolo~sesso) ## ## F test to compare two variances ## ## data: Colesterolo by sesso ## F = 2.613, num df = 23, denom df = 5, p-value = ## alternative hypothesis: true ratio of variances is not e ## 95 percent confidence interval: ## ## sample estimates: ## ratio of variances ## il pvalue non è significativo quindi le varianze sono uguali t.test t.test(data=sangue, Colesterolo~sesso, var.equal = T) ## ## Two Sample t-test ## ## data: Colesterolo by sesso ## t = 2.049, df = 28, p-value = ## alternative hypothesis: true difference in means is not ## 95 percent confidence interval: ## ## sample estimates: ## mean in group F mean in group M ## nuovo esempio Un ricercatore sta studiando l infarto miocardico ed ha ipotizzato che l età media al verificarsi della malattia nei maschi sia inferiore alle femmine. Ha quindi raccolto un campione di 50 malati maschi e femmine e ha registrato l età all insorgere della malattia. Dai dati in suo possesso cosa può dire il ricercatore? Formalizziamo il problema H 0 : la media dell età dei maschi è uguale o maggiore a quella delle femmine (M -F = 0) H 1 : la media dell età dei maschi è inferiore a quella delle femmine (M - F 0) Leggiamo i dati I dati sono nel dataset infarto.csv infarto - read.csv( infarto.csv ,header=f,sep= , ) str(infarto) ## 'data.frame': 50 obs. of 3 variables: ## $ V1: int ## $ V2: Factor w/ 2 levels F , M : ## $ V3: int Aggiungiamo un nome alle variabili colnames(infarto) - c( id , sex , age ) aggregate( formula = age~sex, data = infarto, FUN = mean ) ## sex age ## 1 F ## 2 M 65.00 Il fattore sex ordiniamolo per avere prima i maschi e poi le femmine infarto$sex - factor(infarto$sex, levels=c( m , f )) str(infarto$sex) ## Factor w/ 2 levels M , F : Effettuiamo adesso il test f var.test(data=infarto, age~sex) ## ## F test to compare two variances ## ## data: age by sex ## F = , num df = 24, denom df = 24, p-value = ## alternative hypothesis: true ratio of variances is not e ## 95 percent confidence interval: ## ## sample estimates: ## ratio of variances ## Le varianze risulatno uguali Effettuiamo adesso il t test t.test(data=infarto, age~sex, var.equal =T, alternative= less ) ## ## Two Sample t-test ## ## data: age by sex ## t = , df = 48, p-value = ## alternative hypothesis: true difference in means is less ## 95 percent confidence interval: ## -Inf ## sample estimates: ## mean in group M mean in group F ## t test per dati accoppiati Esempio modificato da http: // cnx. org/ content/ col10522/ 1. 40/. é stato effettuato uno studio per testare l efficacia dell ipnotismo per ridurre il dolore. Il dolore è stato riportato per 8 soggetti prima e dopo trattamento attraverso una scala numerica. Si può dire che dopo l ipnotismo il dolore è minore? Fai un test al 5%. H 0 : µ d 0 H 1 : µ d 0 Leggiamo i dati il file si chiama pain.txt dati - read.table( pain.txt , header=t, sep= \t ,dec= . ) dati ## Subject Before After ## 1 A ## 2 B ## 3 C ## 4 D ## 5 E ## 6 F ## 7 G ## 8 H Effettuiamo il t test res - t.test(dati$after, dati$before, paired =T, alternative = less , conf.level = 0.95) Vediamo il risultato res ## ## Paired t-test ## ## data: dati$after and dati$before ## t = , df = 7, p-value = ## alternative hypothesis: true difference in means is less ## 95 percent confidence interval: ## -Inf ## sample estimates: ## mean of the differences ## Quindi rifiuto H 0. Questo significa che µ d 0 e che c è un miglioramento.
Similar documents
View more...
Search Related
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks