1.2 La probabilità di un evento e l'uso di metodi statistici
E' ovvio che a tali dadi non è applicabile il criterio classico, poiché le varie facce non hanno la stessa probabilità. Un accanito giocatore iniziò allora a registrare migliaia di esiti, ricavandone rapporti su cui basare le proprie valutazioni circa la maggiore o minore probabilità di alcuni eventi rispetto ad altri. Di che rapporti si tratta? Sono quelli che si ottengono mettendo al numeratore il numero di casi in cui un certo evento si verifica e al denominatore il numero totale di casi analizzati. E' ciò che in Statistica si chiama frequenza relativa di un evento. Spesso si precisa che i dati debbono essere raccolti in una serie di esperimenti realizzati sempre nelle stesse condizioni. Che significa "stesse condizioni "? Come si può lanciare un dado sempre nelle stesse condizioni? Dalla stessa persona, con la stessa mano, con la stessa forza, nella stessa direzione, sulla stessa superficie? Occorre fissare anche la posizione iniziale del dado, la pressione e la temperatura dell'aria o che altro ancora? E' evidente che una situazione in cui tutte le condizioni rimangono invariate sarà impossibile da realizzare e, se per assurdo fosse possibile, allora l'evento darebbe sempre lo stesso esito. L'importante è allora che i vari esiti si siano verificati in condizioni d'indipendenza l'uno dall'altro (vedremo meglio in seguito il concetto di indipendenza) e che non ci si siano state situazioni che abbiano favorito il verificarsi di qualche evento rispetto agli altri. Occorrerà in ogni caso avere ben chiaro che l'uso dei rapporti basati su dati statistici, non rappresenta una misura della probabilità, ma soltanto una sua stima, allo stesso modo che l'uso della bilancia idrostatica può aiutarci a stimare il volume di un solido, ma non rappresenta una sua misura in senso stretto, poiché risente di tutti gli errori connessi all'uso di metodi empirici.
In un esperimento in cui sono state lanciate 4.750 puntine, quelle con la punta in su sono risultate 2.641 e quelle con la punta in giù 2.109. Sulla base di tali dati, la probabilità si può stimare intorno a 0,556 per le puntine con la punta in su e 0,444 per quelle con la punta in giù. Ovviamente tali dati si riferiscono al tipo di puntine usate nell'esperimento. Cambiando marca e modello i risultati potrebbero essere diversi. I risultati ottenuti dipendono dal numero di osservazioni fatte. Con 4.750 osservazioni si può avere una sufficiente fiducia nell'attendibilità del risultato fino alla prima cifra decimale. Per avere un maggior grado di affidabilità occorrerebbe qualche decina di migliaia di dati, come sarà meglio precisato più avanti. La raccolta diretta dei dati può risultare faticosa ed anche noiosa. Allora si può ricorrere a dati acquisiti da altri. E' possibile ad esempio consultare le pubblicazioni ISTAT, o di altri centri di ricerche statistiche, cercando in Internet i relativi siti e elaborando i dati in essi contenuti. Si può così scoprire, ad esempio, che tra i neonati il numero di maschi e di femmine non dà una frequenza di 1/2 per ciascuno dei casi. Nascono (sarebbe meglio dire che vengono registrati all'anagrafe...) in media un po' più di maschi (tra 102 e 103 per ogni 100 femmine). Dalle statistiche mediche si ricava il dato sul rischio d'infarto, che non è lo stesso nelle varie fasce di età e per i due sessi. Un altro modo per procurarsi con facilità quanti dati si vogliono è quello di utilizzare il laboratorio di informatica per simulare fenomeni aleatori con il computer e ricavare le frequenze relative degli eventi considerati. Si potrà facilmente verificare che, se si aumenta il numero di casi osservati nella simulazione (fino a qualche decina di migliaia), si ha una sempre migliore rispondenza delle frequenze relative con le probabilità di eventi di cui si conosca già la misura teorica (lancio di dadi o di monete), scoprendo così la legge dei grandi numeri, o legge empirica del caso, che ovviamente si applica anche ad eventi di cui non si conosca la probabilità, la cui stima sarà più attendibile, se ottenuta da un gran numero di osservazioni. Gli alunni sono stati abituati a considerare equivalenti le frazioni i cui termini siano rispettivamente multipli o sottomultipli secondo uno stesso fattore. Nella statistica, invece le frazioni 3/4, 300/400, 3000/4000, 30000/40000 non sono per nulla "equivalenti". Il grado di fiducia nella bontà della stima ottenuta dalle frequenze relative rispetto alla probabilità è progressivamente crescente, man mano che aumentano i valori assoluti dei due termini della frazione, pur rimanendo invariato il valore di ciascun rapporto. Tutto ciò può essere dimostrato, ma l'argomento è un po' troppo al di sopra delle possibilità di alunni di scuola media. L'uso del computer per la simulazione degli eventi aleatori e l'elaborazione dei dati con metodi statistici costituiscono il cosiddetto Metodo Monte Carlo, di cui si parla in altre pagine di questo stesso sito, assai usato per stimare la probabilità nei casi in cui sia molto difficile ottenerne i valori con il calcolo combinatorio. |