CALCOLO DELLA "RUNNING MEAN" (KNUTH)


L'utilizzo di un algoritmo per il calcolo della media e della varianza è utile nel caso queste statistiche si vogliano calcolare per dati sequenziali.

Considerare la media aritmetica tipicamente usata, ovvero:


comporterebbe incorrere in diverse anomalie quando viene posta in forma di algoritmo per eseguirla con un software apposito. Infatti, se i dati osservati sono particolarmente numerosi,  il calcolo della media semplice porta a risultati inefficienti con tempi di calcolo e memoria abbastanza elevati e, a lungo andare, i risultati possono rivelarsi totalmente sbagliati. 

Quindi, per il calcolo di una media di un dataset utilizziamo l' Algoritmo di Knuth.
E' un algoritmo di tipo incrementale, ovvero la media al passo n, relativa a n osservazioni, viene ottenuta dalla media al passo precedente, quindi relativa a n-1 osservazioni e aggiornando il risultato ottenuto ad ogni passo e aggiungendo ogni volta una nuova osservazione (da qui il termine running).

Questo procedimento ci permette di costruire un algoritmo stabile che non abbia problemi di overflow e si dimostra essere più accurato rispetto all'utilizzo della media tradizionale. 

Commenti

Post popolari in questo blog