3 - Ordinamento dei dati. Campo di variazione e moda
Da un elenco di circa 400 dati disposti alla rinfusa, è difficile ricavare informazioni significative sulla nostra "popolazione" di foglie. L'uomo, ma anche alcuni animali, riescono sì e no a padroneggiare un insieme di non più di 5-6 elementi. La statistica ci aiuterà non poco a ricavare informazioni utili dall'insieme dei dati raccolti. Come prima informazione, potremmo contarli per sapere almeno quanti dati abbiamo. Il foglio elettronico ci permette di contarli con facilità: basta scorrere l'indice che appare a lato. Le foglie misurate sono in tutto 426. Anche questo dato, tuttavia, non ha molto significato, poiché non rappresenta tutte le foglie di quella specie presenti nel parco ("censimento"), ma solo una parte di esse scelta in modo casuale ("campione"). Il fatto di sapere che il campione è di 426 unità non è di grande utilità, non potendolo raffrontare con l'intera popolazione di foglie. Tuttavia il dato ci tornerà utile in seguito, per alcune operazioni da compiere sul nostro campione. Andiamo avanti: un'operazione molto importante è procedere all'ordinamento dei dati raccolti. Ci sarà di grande aiuto il computer, che non a caso i francesi chiamano ordinateur. I nostri dati sono stati riportati su un foglio elettronico che permetterà di procedere al loro ordinamento. Ecco come si presentano i dati, al termine dell'operazione:
Avere i dati disposti in modo ordinato, ci consente di raccogliere rapidamente alcune informazioni. Osserviamo che le foglie più piccole sono lunghe 35 mm e le più grandi non superano i 74 mm. Già questo dato è significativo, dal punto di vista statistico. Esso rappresenta il "campo di variazione" dei valori raccolti sulla nostra popolazione. Si nota subito che i valori estremi sono anche piuttosto rari, mentre ci sono valori di gran lunga più frequenti. Il più frequente in assoluto è il valore è 54, che si presenta 29 volte. È un dato importante da punto di vista statistico: rappresenta infatti la cosiddetta moda, cioè il valore riscontrato con maggiore frequenza all'interno di una data popolazione. Nel linguaggio comune si dice ad esempio che i jeans con la vita bassa sono di moda tra le nostre ragazze, a significare che la maggior parte di loro indossano tale tipo di abbigliamento. Nel nostro caso, potremmo dire che la "tipica" foglia del nostro albero è lunga 54 mm. Il campo di variazione ci dice che al massimo le foglie più grandi e quelle più piccole si discostano da tale valore al massimo di 20 mm. Con soli tre valori (35, 54 e 74), possiamo dire di avere già una certa conoscenza della nostra popolazione di foglie. Ecco la magia della statistica: con pochi dati ci fornisce sui fenomeni da essa trattati molte più informazioni di quante ce ne avrebbe fornito l'intera raccolta, dalla quale viceversa non avremmo potuto ricavare alcunché. Si dice infatti che l'eccesso di informazioni distrugge l'informazione. La statistica, riducendo le informazioni a pochi, ma significativi dati, ci aiuta ad interpretare la realtà, per quanto complessa essa sia. Il nostro lavoro è appena agli inizi. |