Il p-value è un numero che ci aiuta a capire se un risultato è significativo o se potrebbe essere dovuto al caso. Il p-value è un concetto chiave della statistica inferenziale, usato nei test di verifica delle ipotesi per misurare quanto un risultato sia compatibile con un’ipotesi di partenza (chiamata ipotesi nulla). In altri termini indica la probabilità di ottenere dati uguali o più estremi di quelli osservati, assumendo che l’ipotesi nulla sia vera.
Cos’è un’ipotesi nulla?
Immaginiamo che una casa farmaceutica stia testando un nuovo farmaco per il mal di testa. Vogliono sapere se il farmaco funziona meglio di una semplice pillola di zucchero (placebo).
- Ipotesi nulla (H₀): Il nuovo farmaco non ha effetti migliori del placebo.
- Ipotesi alternativa (H₁): Il nuovo farmaco ha un effetto migliore del placebo.
Per testare questa ipotesi, un gruppo di pazienti riceve il farmaco, mentre un altro gruppo riceve il placebo. Dopo qualche tempo, si misura la riduzione del mal di testa in entrambi i gruppi.
L’ipotesi nulla (H₀) è pertanto un’affermazione che supponiamo vera fino a prova contraria. In statistica, viene usata per testare se c’è una differenza significativa tra due gruppi o se un certo effetto esiste davvero, oppure se i risultati ottenuti potrebbero essere dovuti al caso.
Come entra in gioco il p-value?
Dopo aver raccolto i dati, supponiamo di trovare che il gruppo che ha preso il farmaco ha avuto un miglioramento maggiore rispetto al gruppo placebo. A questo punto, il p-value ci aiuta a rispondere alla domanda:
“Se l’ipotesi nulla fosse vera (cioè se il farmaco fosse inutile), quanto sarebbe probabile ottenere un risultato simile o ancora più estremo solo per caso?”
- Se il p-value è alto (es. 0.30 → 30%), significa che ottenere questa differenza per puro caso è abbastanza probabile. Quindi, non possiamo concludere che il farmaco sia efficace, perché i dati non forniscono abbastanza evidenza contro H₀.
- Se il p-value è basso (es. 0.01 → 1%), significa che sarebbe molto raro ottenere un miglioramento così evidente solo per caso. Quindi, abbiamo buone ragioni per rifiutare H₀ e concludere che il farmaco ha un effetto reale.
Riassumendo, quindi:
✅ L’ipotesi nulla (H₀) è l’idea di base che vogliamo testare (es. “Il farmaco non funziona”).
✅ Il p-value misura quanto il risultato osservato sia compatibile con H₀.
✅ Se il p-value è basso, significa che i dati sono difficili da spiegare con H₀, quindi possiamo rifiutarla e dire che il farmaco probabilmente funziona.
✅ Se il p-value è alto, i dati non ci danno abbastanza motivo per rifiutare H₀, quindi non possiamo dire che il farmaco sia efficace.
Il p-value, quindi, non dimostra mai che H₀ sia vera o falsa, ma ci aiuta a decidere se i dati forniscono abbastanza evidenza per metterla in discussione. Se il p-value è molto basso, significa che il risultato è così improbabile da far sospettare che l’ipotesi iniziale non regga. Al contrario, un p-value alto suggerisce che la variazione nei dati potrebbe essere dovuta semplicemente al caso.
Questo strumento è ampiamente utilizzato in diversi campi, dalla medicina alla finanza, dalla biologia alla psicologia, aiutando i ricercatori a distinguere tra coincidenze e risultati statisticamente significativi. In sostanza, il p-value è un alleato fondamentale per capire se ciò che osserviamo è davvero un fenomeno rilevante o solo il frutto della casualità.
Esempio semplificato
Immagina di lanciare una moneta e vuoi verificare se è truccata. Se lanci la moneta 10 volte e ottieni 9 teste, potresti chiederti:
“Questo risultato è strano o potrebbe succedere anche con una moneta normale?” Il p-value risponde proprio a questa domanda: ci dice quanto è probabile ottenere un risultato uguale o più estremo, se l’ipotesi di partenza fosse vera (cioè se la moneta fosse normale).
- Se il p-value è molto basso (es. 0.01, cioè 1% di probabilità), significa che un risultato come il tuo è molto raro con una moneta normale → quindi forse la moneta è truccata.
- Se il p-value è alto (es. 0.4, cioè 40% di probabilità), allora il risultato potrebbe essere normale e non c’è motivo di pensare che la moneta sia truccata.
Soglia di significatività del p value
Di solito, si usa una soglia di 0.05 (5%):
- Se p < 0.05, il risultato è considerato significativo → c’è un motivo per dubitare dell’ipotesi iniziale.
- Se p ≥ 0.05, non c’è abbastanza evidenza per rifiutare l’ipotesi iniziale.
In breve: il p-value ci dice quanto un risultato è compatibile con l’ipotesi di partenza. Un valore basso suggerisce che potrebbe esserci qualcosa di speciale nei dati, mentre un valore alto indica che il risultato non è poi così strano.
Miti da sfatare
Questi sono alcuni degli errori più comuni nell’interpretazione del p-value, che spesso portano a conclusioni errate. Vediamoli in modo chiaro:
- Il p-value non indica la probabilità che l’ipotesi nulla sia vera o falsa.
→ Il p-value misura solo quanto i dati osservati siano compatibili con l’ipotesi nulla, ma non ci dice nulla sulla sua verità. - Non è la probabilità che un’osservazione sia “dovuta al caso”.
→ Il p-value si basa già sull’idea che i dati siano frutto di un processo casuale. Dire che “un risultato è dovuto al caso” significa solo che non c’è abbastanza evidenza per rifiutare l’ipotesi nulla, non che questa sia vera. - Non è la probabilità di fare un errore rifiutando l’ipotesi nulla.
→ Il p-value indica quanto un risultato estremo sia raro sotto l’ipotesi nulla, ma non fornisce direttamente il rischio di sbagliare nel rifiutarla. - Non garantisce che replicando l’esperimento si otterrà la stessa conclusione.
→ La replicabilità dipende da molteplici fattori, come la dimensione del campione e la variabilità dei dati. Esiste un altro concetto, chiamato p-rep, pensato per quantificare la probabilità di ottenere risultati simili in una replica. - Il livello di significatività (α) non è determinato dal p-value.
→ Il livello α (es. 0.05) viene stabilito prima dell’analisi e rappresenta la soglia oltre la quale si decide di rifiutare l’ipotesi nulla. Il p-value è invece un valore calcolato sui dati raccolti.
In breve:
Il p-value non misura la verità di un’ipotesi, né il rischio di sbagliare. È solo un indicatore di quanto i dati osservati siano coerenti con l’ipotesi nulla. Interpretarlo correttamente è fondamentale per evitare conclusioni errate!
👇 Contenuti da non perdere 👇
- Informatica 🖥
- Marketing & SEO 🌪
- monitoraggio servizi online 📈
- Sicurezza & Privacy 👁
- Svago 🎈
- 💬 Il nostro canale Telegram: iscriviti
- 🔵 Come rinnovare o installare HTTPS via terminale SSH [Let’s Encrypt]
- 🔵 Bad Request SPID, da cosa è causato (come risolvere)
- 🔵 Cos’è una PBN (Private Blog Network)