Eu saín da Facultade de Matemáticas no ano 1990. O plan de estudos vixente naquela altura consistía en cursar 4 materias anuais Das que 3 eran fixas: Álxebra, Análise e Topoloxía/Xeometría. A cuarta materia, que para min significou sempre un horror, era Física (en 1º), Cálculo Numérico (en 2º) e Estatística (en 3º). A partir de aquí había dúas vías para os dous últimos cursos, unha delas era Estatística e a outra Matemáticas Xerais. Esta última consistía nunha longa lista de materias con distintos niveis de optatividade.
Sendo así as cousas eu só tiven unha materia de Estatística en toda a carreira,..e non a aproveitei moito. Creo recordar que no departamento axustaban a nota en función dos resultados. Como normalmente as notas eran bastante malas, o aprobado acababa baixando a un valor arredor do 4. Eu agarrábame a iso para transitar pola materia co menor dano posible. O triste do conto foi cando me chegou o momento de ter que explicar o teorema central do límite... e claro, eu non tiña nin idea de que trataba o asunto.
A cousa non acabou en desastre total grazas a un libro, Matemática moderna aplicada. Probabilidades, estadística e investigación operativa (Alianza Universidad 1993), de J. C. Turner. A partir de aquí vou seguir a Turner, case letra a letra. Nun dos capítulos explica o que son as distribucións mostrais. Comeza co seguinte exemplo:Tíranse 50 veces catro dados equilibrados. Apúntanse de cada vez os números obtidos. Despois calcúlase a media de cada mostra deses catro números. Un exemplo dun deses resultados sería:
Mostra: 1, 5, 6, 4
Media: $\overline{X}=4$
Antes de comezar a estudar a proposta, lembremos en que consiste a distribución orixinal, a do lanzamento dun dado. É ben simple, hai 6 posibles resultados e cada un deles ten a mesma probabilidade $\frac{1}{6}$. A media desta variable aleatoria discreta é $\mu=3'5$ e o seu desvío padrón é $\sigma=1'7078$. Por suposto, este estudo xa o temos feito na clase desde hai tempo.
A función $\overline{X}=\frac{X_{1}+X_{2}+X_{3}+X_{4}}{4}$ é un estatístico mostral. Cada vez que tomamos unha mostra podemos calcular o seu valor. Pero $\overline{X}$ é tamén unha variable aleatoria. A cuestión consiste en deducir como é a distribución mostral das medias $\overline{X}$ a partir dos valores mostrais. Agora é cando cobra sentido realizar o experimento moitas veces (50 no noso exemplo). Que é o que observamos?
Como na entrada anterior, podemos xogar coa seguinte folla de cálculo que simula o proceso. Hai dúas alternativas para traballar coa seguinte ferramenta. Marcadas en amarelo aparecen as medias de cada lanzamento de catro dados.
- A mellor é descargar a folla de cálculo. Se queremos recalcular os datos basta premer F9
- Podemos facelo on-line. Nese caso debemos recargar de novo a páxina ou, o que é o mesmo premer Maíuscula+F5
Teorema Central do Límite. Dada unha variable aleatoria $X$ calquera, consideremos mostras de tamaño $n$ desta distribución $\left( X_{1},X_{2},...,X_{n} \right)$. A distribución mostral das medias $\overline{X}=\frac{\sum_{i=1}^{n}X_{i}}{n}$ aproxímase a unha variable aleatoria normal $N\left( \mu,\frac{\sigma}{\sqrt{n}} \right)$
Ningún comentario:
Publicar un comentario