luns, 12 de maio de 2025

Os logaritmos

Introdución aos logaritmos

Vou facer unha confesión terrible. Eu fixen a carreira de Matemáticas sen saber o que eran os logaritmos. Así aprendín que non hai que botar as mans á cabeza cando alguén descoñece un concepto fundamental, sempre e cando teña ferramentas que lle permitan esquivar esta eiva. En efecto, tiña que ter estudado os logaritmos cando cursei 2º de BUP. O profesor explicáranolos pero como foi a final de curso decidiu non facer exame. A pesar de que daquela tiña xa certa querencia pola materia, non mirei nin a primeira vez os apuntes. Así aprendín que se un quer forzar o estudo dun tema, debe telo en conta á hora de avalialo. 

Ao ano seguinte tiven outro profesor que supuxo que todos tiñamos adquiridos os fundamentos dos logaritmos así que cando lle tocou presentarnos a función logarítmica fíxoo de súpeto. Con todo, tivo a boa idea de escribir no encerado as propiedades fundamentais dos logaritmos. A partir dese momento para min os logaritmos eran iso, unha función que verificaba unhas curiosas propiedades.

Con estes antecedentes o día que me tocou a min explicar o que eran os logaritmos enfronteime a un gran problema; antes tiña que sabelo eu. Así que tiven que estudalo por vez primeira. Todas estas circunstancias leváronme a ter que reflexionar moito sobre o seu concepto. Tiña a man moitos libros de texto, pero nunca cheguei a usalos na aula, entre outras razóns porque normalmente os libros de texto non viñan escritos en galego. En todo caso, incluso no breve lapso de tempo no que dispoñiamos de textos de Matemáticas en galego, nunca fun quen de adaptarme á súa prosodia. Pode que sexa defecto meu, non o nego. Con todo prefiro contar as cousas da mesma maneira que me gustaría que mas contaran a min. Sempre perdín moito tempo en intentar ser o máis coidadoso na escolla das palabras e as ideas para as explicacións. De seguido conto como explico en que consisten os logaritmos. Normalmente fágoo en 4º da ESO, aínda que dependendo das circunstancias, pode que teña que adiar o relato para o curso seguinte. 

En primeiro lugar presento unha táboa de potencias de 2 como a seguinte

$n$ $2^{n}$$n$ $2^{n}$$n$ $2^{n}$$n$ $2^{n}$
$0$ $1$ $8$ $256$ $16$ $65.536$ $24$ $16.777.216$
$1$ $2$ $9$ $512$ $17$ $131.072$ $25$ $33.554.432$
$2$ $4$ $10$ $1.024$ $18$ $262.144$ $26$ $67.108.864$
$3$ $8$ $11$ $2.048$ $19$ $524.288$ $27$ $134.217.728$
$4$ $16$ $12$ $4.096$ $20$ $1.048.576$ $28$ $268.435.456$
$5$ $32$ $13$ $8.192$ $21$ $2.097.152$ $29$ $536.870.912$
$6$ $64$ $14$ $16.384$ $22$ $4.194.304$ $30$ $1.073.741.824$
$7$ $128$ $15$ $32.768$ $23$ $8.388.608$ $31$ $2.147.483.648$
$n=log_{2}N$ $N=2^{n}$$n=log_{2}N$ $N=2^{n}$$n=log_{2}N$ $N=2^{n}$$n=log_{2}N$ $N=2^{n}$

Nesta táboa hai que ler as columnas de dúas en dúas. Na columna da esquerda aparece un número $n$ e na segunda o resultado de elevar 2 a ese número, $2^{n}$. Pero tamén podemos ler as columas de dereita a esquerda, así os números da columna da esquerda son os logaritmos en base 2 dos da  correspondente columna da dereita. 

Por exemplo, como $2^{5}=32$ diremos tamén que o $log_2{32}=5$ (o logaritmo en base $2$ de $32$ é $5$).

Cálculo de produtos

Por unha vez imos ter unha clase sen calculadora. Pensemos, por poñernos en situación, que estamos no século XVI. A pesar de non ter calculadora vémonos na obriga de calcular un produto. Non é difícil pero é bastante pesado. Por iso imos intentar simplificar os cálculos facendo uso da táboa das potencias de 2 (ou dos logaritmos en base 2). Queremos calcular o produto $512\cdot8.192$. Para iso debemos buscar na táboa os seus logaritmos. Neste caso o $log_{2}812=9$ e o $log_{2}8.192=13$. Estamos vendo que os logaritmos non son outra cousa que os expoñentes. Agora vén o truquiño. Sumamos os logaritmos $9+13=22$ (se prefires podemos dicir que sumamos os expoñentes) e agora miramos na táboa buscando nas columnas de esquerda o valor $n=22$, daquela o produto é xusto o seu compañeiro da columna da dereita: $512\cdot8.192=4.194.304$. A razón é ben simple:

$$512\cdot8.192=2^{9}\cdot 2^{13}=2^{9+13}=2^{22}=4.194.304$$

Acabamos de ver que os logaritmos transforman os produtos en sumas. Isto é lóxico porque os logaritmos son expoñentes e para calcular o produto de dous números coa mesma base, sumamos os expoñentes. Escrito máis estritamente

$$log_{2}\left( M\cdot N \right)=log_{2}M+log_{2}N$$

No noso caso: $$log_{2}\left( 512\cdot 8.192 \right)=log_{2}512+log_{2}8.192$$

ou $$9+13=22$$


Cálculo de divisións

Continuamos no século XVI (sen calculadoras). Se o procedemento do cálculo de divisións é bastante tedioso e pesado, a realización de divisións a man consiste nun algoritmo que multiplica estas dificultades. Estamos pensando en facer unha división usando números bastante grandes. Os logaritmos, isto é, os expoñentes, volverán a simplificarnos as cousas. Se o cálculo de produtos (complicados) se reduciu ao de sumas (fáciles) é lóxico que o cálculo de divisións (moi complicadas) se reduza a unha (simple) resta. Por exemplo, para facer a división $8.192: 512 $ chega con restar os logaritmos destes números. Vexámolo: $13-9=4$. Velaí que o resultado da división será o número que na táboa lle asignamos ao $4$, isto é $16$. Repasemos as razóns de que isto sexa así:

$$\frac{8.192}{512}=\frac{2^{13}}{2^{9}}=2^{13-9}=2^{4}=16$$

Escribamos estas ideas en forma de logaritmos:

$$log_{2}\left( \frac{M}{N} \right)=log_{2}M-log_{2}N$$

$$log_{2}\left( \frac{8.192}{512} \right)=log_{2}8.192-log_{2}512$$

$$13-9=4$$

Isto é, os logaritmos transforman as divisións en restas.

Chegou o momento de facer uns exercicios para practicar o cálculo de produtos e divisións mediante o uso de logaritmos. Axudarémonos da táboa (de logaritmos) que presentamos máis arriba.

1. Calcula $128\cdot 131.072$

2. Calcula $2.048\cdot 4.096$

3. Calcula $2.097.152 : 131.072$

4. Calcula $262.144 : 256$

5. Calcula $ 129 \cdot 127$ 

6. Calcula $154 \cdot 8744$ 

Non, non me equivoquei no último. Xa o explicarei noutra entrada.

venres, 2 de maio de 2025

Relación entre series infinitas, fraccións continuas teito e constantes. Parte 2: Conxectura de Erdős-Straus.

 

por Andrés Ventas

$\newcommand{\Mod}[2]{\equiv #1\ (\mathrm{mod}\ #2)}$ A conxectura de Erdős-Straus é un problema sen resolver en Teoría de números. A conxectura consiste en que, por cada enteiro $n$ igual ou maior que 2, existen enteiros positivos $x$, $y$, e $z$ para os que

$\dfrac{4}{n}=\dfrac{1}{x}+\dfrac{1}{y}+\dfrac{1}{z}.$

Noutras palabras, o número $4/n$ pode ser escrito como a suma de tres fraccións unitarias.

O nome da conxectura débese a Paul Erdős e Ernst G. Straus, quen a formularon en 1948. As sumas de fraccións unitarias, como a deste problema, coñécense como fracción exipcia , polo seu uso nas matemáticas do antigo Exipto.

Existen varios algoritmos para obter fraccións exipcias, o documento de D. Eppstein ( D. Eppstein,Ten Algorithms for Egyptian Fractions ) mostra 10, o máis famoso deles o algoritmo cobizoso e nós mediante aplicación directa do teorema da suma por pares (visto na parte 1) temos un novo algoritmo que imos comparar co algoritmo cobizoso.

Para a comparación imos usar a fracción $\tfrac{4}{1009}$ onde o denominador é un dos famosos denominadores de Mordell . Mordell mediante unha serie de congruencias obtivo que os únicos denominadores da conxectura de Erdős-Straus que podían non ter solución eran os números primos da forma $840k + (1, 121, 169, 289, 361, 529) $, para $k$ natural. O primeiro primo desa secuencia sería o $840 + 169=1009$.

algoritmo cobizoso consiste en ir ficando cada vez coa fracción unitaria que máis se aproxima á fracción orixinal, restar e repetir o proceso coa seguinte mellor aproximación. O algoritmo das sumas por pares consiste en calcular a fracción continua teito mediante o algoritmo de Euclides e despois usar directamente a suma por pares dos numeradores dos converxentes. Vexamos un exemplo comparativo.

ALGORITMO COBIZOSO

numdenomcociente teitofracción restante
$1009$4$253$$\dfrac{4}{1009}-\dfrac{1}{253} = \dfrac{3}{255277} $
$255277$3$85093$$\dfrac{3}{255277}-\dfrac{1}{85093} = \dfrac{2}{21722285761} $
$21722285761$2$10861142881$$\dfrac{2}{21722285761}-\dfrac{1}{10861142881}$
$= \dfrac{1}{235928849352132817441} $

Resultado $\dfrac{4}{1009} = \dfrac{1}{253} + \dfrac{1}{85093} + \dfrac{1}{10861142881} + \dfrac{1}{235928849352132817441}$

Aparte do algoritmo cobizoso, para obter todas as solucións teríamos que principiar polo denominador $x$ do algoritmo cobizoso e despois escoller un denominador $y$ unha unidade maior e facer ese bucle ata que o denominador cubrise a metade do restante e se non damos atopado solución voltar ao bucle principal e aumentar nunha unidade o denominador $x$. Se chegamos a un denominador inferior a un terzo do valor da fracción sen atopar solución daquela non a hai.

ALGORITMO DAS SUMAS POR PARES

Primeiro aplicamos Euclides teito

numdenomcociente teito $(c_i)$resto
$1009$42533
$4$322
$3$221
$2$120

E agora a fracción continua teito

$c_i$253222
$p_i$2535057571009
$q_i$1234

(os denominadores $q_i$ non son necesarios mais móstranse por completar)

Resultado $\dfrac{4}{1009} = \dfrac{1}{253} + \dfrac{1}{253 \cdot 505} + \dfrac{1}{505 \cdot 757} + \dfrac{1}{757 \cdot 1009}$
$= \dfrac{1}{253} + \dfrac{1}{127765} + \dfrac{1}{382285} + \dfrac{1}{763813}$

Debido a que se temos $\dfrac{4k}{n}=\dfrac{1}{x}+\dfrac{1}{y}+\dfrac{1}{z}$ como suma de tres fraccións unitarias tamén temos $\dfrac{4}{n}=\dfrac{1}{kx}+\dfrac{1}{ky}+\dfrac{1}{kz}$ como suma de tres fraccións unitarias, con este algoritmo só temos que procurar numeradores múltiplos de 4 (para todo $4k \le 2n$). Por exemplo temos:

numdenomcociente teito $(c_i)$resto
$1009$$44=4\cdot 11$233
$44$3151
$3$130

E agora a fct

$c_i$23153
$p_i$233441009
$q_i$11544

Solución $\dfrac{4}{1009} = \dfrac{1}{11 \cdot 23} + \dfrac{1}{11 \cdot 23 \cdot 344} + \dfrac{1}{11 \cdot 344 \cdot 1009}$
$\dfrac{4}{1009} = \dfrac{1}{253} + \dfrac{1}{87032} + \dfrac{1}{3818056}$

PEQUENAS CONCLUSIÓNS

  1. O algoritmo por pares demostra que para un numerador calquera $t$ e fracción $\dfrac{t}{n}$ temos un máximo de $t$ fraccións unitarias e sempre ten solución.
  2. As solucións máis longas son para $1 \equiv n \mod{t}$
  3. A conxectura cúmprese se para calquera $p$ primo impar, existe alomenos un $4k, k \in \mathbb{Z}$ para o que
    $p \Mod{-r_0}{4k}.$
    $4k \Mod{-1}{r_0}.$
  4. Nas probras con ordenador na casa dá que existe solución dada polo algoritmo por pares até $n=10^{9}$, canto máis grande é o denominador máis solucións existen.
  5. Mentres que no caso da conxectura de Erdős-Straus as $fct$ de 3 elementos solucionan todos os denominadores primos, para a variante de Sierpiński hai dous valores de tipo $60k+1$, que non dá solucionado, $\{541, 1381\}$, para denominadors superiores hai varias solucións para cada $n$ tamén máis abundantes canto maior é o denominador $n$.
  6. Unha demostración supoño que chegará da man da teoría de números analítica (tipo Conxectura de Goldbach, ver bibliografia documento de Harald Andres Helfgott), tendo en conta que as solucións son cada vez máis numerosas cando o denominador aumenta, mais as miñas matemáticas non chegan a ese nivel.

Bibliografia

  1. D. Eppstein,Ten Algorithms for Egyptian Fractions
  2. Harald Andres Helfgott The ternary Goldbach problem

luns, 14 de abril de 2025

Relación entre series infinitas, fraccións continuas teito e constantes. Aplicacións (Parte I)

por Andrés Ventas

$ \newcommand{\tei}[1]{\lceil #1 \rceil} \newcommand{\teib}[1]{\Big\lceil #1 \Big\rceil} \newcommand{\R}{{\mathbb R}} $

As fraccións continuas teito (que podemos abreviar como fct) son fraccións continuas que se obteñen aplicando o algoritmo de Euclides usando a función teito en vez da función chan, que é o habitual. Isto produce unha fracción continua onde cada nova fracción da fracción continua resta da anterior.

A propiedade útil é que dela pódese obter sinxeliñamente para un número irracional unha suma de infinitos recíprocos e viceversa, dada unha suma de infinitos recíprocos obtemos unha fracción continua e o seu valor ou os seus converxentes.

Deste modo temos unha terna que se transforma de xeito doado entre si: fraccións continuas, series e constantes irracionais.

A parte onde comento que "dada unha serie de recíprocos obtemos o seu valor pasando pola fracción continua" non é tan feituco como parece porque o cálculo do valor, salvo que a fracción continua sexa periódica dalgún xeito, é un cálculo tan longo como o propio de ir sumando as fraccións unitarias da serie. Non se dá conseguido unha forma pechada salvo de raro en raro.

Entre as aplicacións veremos:

  1. Un uso en modo finito para a conxectura de Erdős-Straus como un novo algoritmo para obter fraccións exipcias (Vaia por diante que aplicación non quere dicir solución, e só outro xeito de afrontar o problema)
  2. Fraccións continuas de series de potencias
  3. Un método directo de obtención de fraccións continuas para as series hiperxeométricas
  4. Obtención de novas series e fraccións continuas de constantes irracionais
  5. Expansión de Engel (ver Advanced problems H-936 Fibonacci Quarterly. 62-2 (2024) p-181 )

Base teórica do algoritmo

Definición $\label{fctdef}$ Unha fracción continua teito, $\tei{c_0, c_1, c_2, c_3, \cdots } = c_0 - \cfrac{1}{c_1 - \cfrac{1}{c_2 - \cfrac{1}{c_3 - {}\ddots}}} $, é unha fracción continua obtida co algoritmo de Euclides usando a función teito, e ten converxentes con fraccións $\dfrac{p_i}{q_i}$ cuxos numeradores $p_i$ e denominadores $q_i$ satisfán unha recorrencia de resta,

$p_i = c_i p_{i-1} - p_{i-2}; \ p_0=c_0; \ p_{-1}=1$.

$q_i = c_i q_{i-1} - q_{i-2}; \ q_0=1; \ q_{-1}=0$.

Escribiremos unha $fct$ como unha enumeración dos seus coeficientes entre os símbolos da función teito, $\tei{c_0, c_1, c_2, c_3, \cdots }$.

Pode ser tentador escribir unha $fct$ do mesmo xeito que unha fracción continua regular con coeficientes negativos, mais é fácil comprobar que non representan o mesmo valor.

Nota: ás veces escribiremos a fracción continua mediante unha forma de tamaño intermedio $x = c_0 - \frac{1}{c_1}{{}\atop-}\frac{1}{c_2}{{}\atop-}\frac{1}{c_3}{{}\atop\!{}-\cdots}$

Teorema: Suma por pares $\label{fct}$ Sexa $\dfrac{1}{x} \in \R$ un número con unha fracción continua teito $\dfrac{1}{x} = \tei{ c_0, c_1, c_2, \dots }$, entón o seu recíproco $x$ é a suma dos recíprocos da multiplicación de pares sucesivos de numeraderes $p_i$ dos seus converxentes, $\begin{equation} \label{Theorem} \begin{aligned} x=\frac{1}{p_0}+\sum_{i=0}^{\infty}{\dfrac{1}{p_i\cdot p_{i+1}}}. \end{aligned} \end{equation}$
Proba:

Dada a suma de Euler $x = a_{0} + a_{0}a_{1} + a_{0}a_{1}a_{2} + \dots $ e a súa fracción continua [p.159, Khrushchev] $x = a_0 - \frac{a_1}{1+a_1}{{}\atop-} \frac{a_2}{1+a_2}{{}\atop-} \frac{a_3}{a+a_3}{{}\atop\!{}-\cdots}$

transformámola para que os numeradores sexan $1$,

$\begin{equation*} \begin{aligned} x &= \dfrac{1}{\frac{1}{a_0}}{{}\atop-}\frac{1}{\frac{(1+a_1)a_0}{a_1}}{{}\atop-}\frac{1}{\frac{(1+a_2)a_1}{a_2 a_0}}{{}\atop-}\frac{1}{\frac{(1+a_3)a_2 a_0}{a_3 a_1}}{{}\atop\!{}-\cdots} \\ & \text{e por definición de $fct$}\\ \dfrac{1}{x} &= \teib {\dfrac{1}{a_0}, \dfrac{(1+a_1)a_0}{a_1}, \cdots, \dfrac{(1+a_i)a_{i-1}a_{i-3}\cdots}{a_i a_{i-2} a_{i-4} \cdots}, \cdots }. \end{aligned} \end{equation*} $

Denotamos esta fracción continua como $\dfrac{1}{x}=\tei{c_0, c_1, \cdots, c_i, \cdots }$, igualamos os coeficientes e resolvemos para os $a_i$,
$\begin{equation*} \begin{aligned} & a_0 = \frac{1}{c_{0}},\ a_1 = \frac{a_0}{c_{1}-a_0}, \ a_2 = \frac{a_1}{c_{2}a_{0}-a_1}, \ a_3 = \frac{a_{2}a_{0}}{c_{3}a_{1}-a_{2}a_{0}}, \cdots \\ & a_i = \frac{a_{i-1}a_{i-3}\cdots}{c_{i}a_{i-2}a_{i-4}...-a_{i-1}a_{i-3}\cdots}. \end{aligned} \end{equation*}$

Usando a identidade dos numeradores dos converxentes $p_i = c_i p_{i-1} - p_{i-2}$, temos $\begin{equation*} \begin{aligned} a_0 &= \dfrac{1}{c_0} = \dfrac{1}{p_0}. \\ p_1 &= c_{1}p_{0}-1, \ a_1 = \frac{a_0}{c_{1}-a_0} = \dfrac{1/c_0}{c_{1}-(1/c_{0})} = \dfrac{1}{c_{1}c_{0}-1} = \frac{1}{c_{1}p_{0}-1} = \dfrac{p_{-1}}{p_1}.\\ a_i &= \frac{a_{i-1}a_{i-3}...}{c_{i}a_{i-2}a_{i-4}...-a_{i-1}a_{i-3}...} =\frac{p_{i-2}}{p_{i}}. \end{aligned} \end{equation*} $

Agora substituimos en $x$ e usamos suma telescópica

$ \begin{equation*} \begin{aligned} x &= a_{0} + a_{0}a_{1} + a_{0}a_{1}a_{2} + a_{0}a_{1}a_{2}a_{3} + \cdots\\ &=\dfrac{1}{p_0} + \dfrac{1}{p_0}\dfrac{1}{p_1} + \dfrac{1}{p_0}\dfrac{1}{p_1}\dfrac{p_0}{p_2} + \dfrac{1}{p_0}\dfrac{1}{p_1}\dfrac{p_0}{p_2}\dfrac{p_1}{p_3} + \cdots\\ &=\frac{1}{p_0} + \frac{1}{p_0}\dfrac{1}{p_1} + \dfrac{1}{p_1}\frac{1}{p_2} + \dfrac{1}{p_2}\dfrac{1}{p_3}+\cdots \\ &=\dfrac{1}{p_0} + \sum_{i=0}^{\infty} \dfrac{1}{p_i}\dfrac{1}{p_{i+1}}. \end{aligned} \end{equation*} $

Fin da proba.

Nota: Oskar Perron (1957) e Gautam Gopal (2016) mostran unha fórmula similar para series alternas tendo en conta os denominadores dos converxentes dunha fracción continua regular (recorrencia dos converxente con signo positivo): $x = [a_0, a_1, a_2, \ldots ] = a_0 + \sum_{n=0}^\infty \dfrac{ (-1)^n }{q_{n}q_{n+1}}.$

Vese ben a partir do teorema da suma por pares que dada unha serie infinita podemos obter mediante o reverso deste método unha fracción continua co valor recíproco da suma.

Corolario 1: Dado $S = \dfrac{1}{a_0} + \dfrac{1}{a_0 a_1} + \dfrac{1}{a_1 a_2} + \dfrac{1}{a_2a_3} + \cdots$, temos $p_i = \{a_0, a_1, a_2, a_3 \ldots \}$

e por tanto temos a $fct$: $\dfrac{1}{S}=\teib{a_0, \dfrac{a_1 + 1}{a_0}, \dfrac{a_2 + a_0}{a_1}, \dfrac{a_3 + a_1}{a_2}, \dfrac{a_4 + a_2}{a_3}, \cdots }$

Se os denominadores non van multiplicados en cadea sempre se pode forzar do seguinte xeito

Corolario 2: Dado $S = \dfrac{1}{a_0} + \dfrac{1}{a_1} + \dfrac{1}{a_2} + \dfrac{1}{a_3} + \cdots$, temos $p_i = \{a_0, \dfrac{a_1}{a_0}, \dfrac{a_2 a_0}{a_1}, \dfrac{a_3 a_1}{a_2 a_0}, \ldots \}$

e por tanto temos a $fct$: $\dfrac{1}{S}=\teib{a_0,\dfrac{\tfrac{a_1}{a_0}+ 1}{a_0}, \dfrac{a_0+\tfrac{a_2 a_0}{a_1}}{\tfrac{a_1}{a_0}}, \dfrac{\tfrac{a_1}{a_0}+\tfrac{a_3 a_1}{a_2 a_0}}{\tfrac{a_2a_0}{a_1}}, \cdots }$

Para as series de potencias imos definir unha nomenclatura similar ao duplo factorial que se aplique aos índices. Imos denotar $a_{i!!}=a_i a_{i-2} a_{i-4} a_{i-6} \ldots $ sendo $a_{-1}=1$ e para o resto $i \ge 0$.

Se temos unha serie que sexa de tipo Taylor ou Maclaurin con factoriais no denominador e coeficientes e potencias de $x$ no numerador. teríamos:

Corolario 3: Dado $S_T = \dfrac{a_0}{0!} + \dfrac{a_1 x}{1!} + \dfrac{a_2 x^2}{2!} + \dfrac{a_3 x^3}{3!} + \cdots$, temos $p_i = \Big\{\dfrac{1}{a_0}, \dfrac{a_0}{a_1 x}, \dfrac{2!! a_1}{a_2 a_0 x}, \dfrac{3!!a_2 a_0}{a_3 a_1 x^2}, \ldots \Big\} = \Big\{ \dfrac{n!! a_{(n-1)!!}}{a_{n!!} x^{\lceil n/2 \rceil}} ,\ldots \Big\}$

e coma sempre temos a $fct$: $\dfrac{1}{S_T}=\teib{p_0, \dfrac{p_i + p_{i-2}}{p_{i-1}}, \cdots }$ con $p_{-1}=1$.

Nota: veremos en publicacións posteriores unha expresión máis simple destas últimas fórmulas na forma de fracción continua xeneralizada )

Exemplos

Exemplo 1. Serie a partir de fracción continua.

Como primeiro exemplo usaremos a miña constante favorita, a constante Pena Trevinca, $\tau=\tei{3, 3, 3, 3, \cdots}$, que ten valor $2.618033\ldots = \phi +1 = \phi^2$ (ver Mathematical Student problema 8). Así temos os converxentes $p_i/q_i$

$c_i$ 3 3 3 3 $\cdots$
$p_i$ 1382155$\cdots$
$q_i$ 013821$\cdots$

Aplicando o Teorema de suma por pares

$\dfrac{1}{\tau} = (\tei{3,3,3, \ldots})^{-1} = \dfrac{1}{3}+\dfrac{1}{3 \cdot 8}+\dfrac{1}{8 \cdot 21}+\dfrac{1}{21 \cdot 55}+ \cdots $.

(non sería necesario calcular os denominadores dos converxentes, pero facémolo por completar)

$\dfrac{1}{\tau} = 0.38196\ldots $ e truncando a suma infinita no cuarto sumando temos $\dfrac{1}{\tau} = \dfrac{21}{55} = 0.3818 \ldots$

Exemplo 2. Fracción continua a partir de serie.

Como segundo exemplo imos calcular unha fracción continua para $\dfrac{1}{e^x}$ e concretando para $\dfrac{1}{\sqrt{e}}$ Temos que $e^x=\dfrac{1}{0!}+\dfrac{x}{1!}+\dfrac{x^2}{2!}+\dfrac{x^3}{3!}+ \cdots$

Que seguindo o corolario 3, os numeradores dos converxentes son $p_i=\Big\{1, \dfrac{1}{x} , \dfrac{2}{x} , \dfrac{3}{x^2} , \dfrac{2\cdot 4}{x^2}, \dfrac{3\cdot 5}{x^3}, \dfrac{2\cdot 4\cdot 6}{x^3}, \ldots \Big\} $

E igualmente polo corolario 3 obtemos os coeficientes da $fct$ sumando alternos e dividindo polo do medio, $\dfrac{1}{e^x}=\teib{1, \dfrac{1}{x}+1, x+2, \dfrac{x+3}{2x}, \dfrac{2x+4\cdot 2}{3}, \cdots}$

Imos mostrar unha táboa completa para $e^{-1/2}=0.60653\ldots$

$c_i$ de $e^{-1/2}$ 1 3$\dfrac{5}{2}$ $\dfrac{7}{2}$3 $\cdots$
$p_i$11241232$\cdots$
$q_i$ 013$\dfrac{13}{2}$$\dfrac{79}{4}$$\dfrac{211}{4}$$\cdots$
converxentes 1$\dfrac{2}{3}$$\dfrac{8}{13}$$\dfrac{48}{79}$$\dfrac{128}{211}$$\cdots$
valor 1$0.66\ldots$$0.61\ldots$$0.607\ldots$$0.60663\ldots$$\cdots$

Os converxentes das fraccións continuas teito aproximan o valor só por un lado ao contrario que as fraccións continuas regulares que o aproximan alternativamente por valores superiores decrecentes e valores inferiores crecentes.

Exemplo 3. Valor da suma a partir da fracción continua.

Existen moitas probas de que a suma dos recíprocos dos números oblongos (o duplo dos triangulares) vale 1 (ver A002378 Oblong (or promic, pronic, or heteromecic) numbers: a(n) = n*(n+1).. )

Imos dar unha nova proba:

$S_{ob}=\sum_{n=1}^{\infty}\dfrac{1}{n(n+1)}=\dfrac{1}{2}+\dfrac{1}{6}+\dfrac{1}{12}+\dfrac{1}{20} + \cdots$

$p_i=\{2, 3, 4, 5, \ldots \}$

$c_i=\{2, (3+1)/2=2, (4+2)/3=2, (5+3)/4=2, \ldots \}$ e por tanto $S_{ob}=(\tei{2,2,2,2, \ldots})^{-1}$

$c_i$ 2 22 22 $\cdots$
$p_i$123456$\cdots$
$q_i$ 012345$\cdots$

Dai temos, polos converxentes, que $S_{ob}=\lim_{n \to \infty} \dfrac{q_i}{p_i}=\lim_{n \to \infty}\dfrac{n}{n+1}=1$.

Exemplo 4. Unha serie para $4-\pi$.

A serie de Leibniz para $\frac{\pi}{4}$ é

a serie alternada $\dfrac{\pi}{4}=\dfrac{1}{1}-\dfrac{1}{3}+\dfrac{1}{5}-\dfrac{1}{7}+\cdots-\cdots$.

Se sumamos de dous en dous temos a serie non alternada $\dfrac{\pi}{4}=\dfrac{2}{1\cdot 3}+\dfrac{2}{5\cdot 7}+\cdots=\sum_{n=0}^{\infty}\dfrac{2}{(4n+1)(4n+3)}$.

Se o levamos ao noso terreno podemos construír a serie con multiplicación por pares $S_{imp}=\dfrac{1}{1\cdot 3}+\dfrac{1}{3\cdot 5}+\cdots$ que ten $p_i=\{3, 5, 7, 9, 11, \ldots \}$ e por tanto $c_i=\tei{3,2,2,2,2,2, \ldots}$ agora se calculamos os converxentes:

$c_i$ 3 22 22 $\cdots$
$p_i$1357911$\cdots$
$q_i$ 012345$\cdots$

E con isto temos que $S_{imp}=\lim_{n \to \infty} \dfrac{q_i}{p_i}=\lim_{n \to \infty}\dfrac{n}{2n+1}=\dfrac{1}{2}$.

Como puxemos numerador $1$ dividimos por $2$ e restamos no lado esquerdo os valores e restamos no dereito as series

$\dfrac{1}{2}-\dfrac{\pi}{8} = \dfrac{4 - \pi}{8} = \dfrac{1}{3\cdot 5}+\dfrac{1}{7\cdot 9}+\dfrac{1}{11\cdot 13}+\cdots$.

E finalmente multiplicando por $8$ temos $4-\pi = \sum_{n=0}^{\infty}\dfrac{8}{(4n+3)(4n+5)}$.

P.E: Non teño atopado moita literatura sobre este tipo de fraccións continuas mais parece ser que nalgures refírense a elas como "slow continued fractions". Usualmente aproximan ao número máis lentamente que as fraccións continuas regulares, cando relamente debería ser ao revés pois só aproximan por un lado. Na miña experiencia isto ven sendo debido a que se atoan moitas veces no número $2$ como coeficiente. Iso tamén implica que non cumpran coa constante de Khinchin .

Bibliografia

  1. Gautam Gopal, Continued Fractions, Theorem 4.7 p-17
  2. Sergey Khrushchev, Orthogonal Polynomials and Continued Fractions Encyclopedia of Mathematics and its Applications. Cambridge University Press 122 (2008), 159
  3. Perron, Oskar, Die Lehre von den Kettenbrüchen.Teubner Verlag. 2 (1957) p-17.
  4. Ventas, A., Advanced problems H-936 Fibonacci Quarterly. 62-2 (2024) p-181
  5. Ventas, A., Mathematical Student. 93 (3-4) (2024) Problem 8. p-213

martes, 25 de marzo de 2025

A derivada e a inversa. Unha conexión dourada

Entre os meus terrores didácticos está esa famosa táboa de derivadas. Nunca entreguei aos meus alumnos un espanto dese tipo. Seguramente non o fixen porque tiven a sorte de que a min, como alumno, tampouco ma entregaran. Unha das aberracións que son consecuencia desta práctica consiste en expulsar a regra da cadea do ensino. Así convertemos o cálculo de derivadas nun algoritmo sen sentido, cunhas regras tan arbritarias que se pode calcular a derivada dunha composición de funcións sen ter nin a máis mínima idea do que é a composición de funcións. Elimínase así a dedución das propiedades e das fórmulas de derivación. Algúns pensarán que é un alivio pois así non perderemos un tempo que sempre anda escaso pola sobredimensión dos currículos. Daquela, para que estudar os límites? Quizais para outro cálculo absurdo con outras regras absurdas. 

Xa que a mencionamos anteriormente, enunciarémola:

A regra da cadea. Dadas dúas funcións $f$ e $g$ a derivada da composición $ g_{\circ } f$ será 

$$\left ( g_{\circ }f \right )'(x)=g'\left [ f\left ( x \right ) \right ]\cdot f'(x)$$

Unha consecuencia inmediata deste mesmo resultado é a derivación da inversa dunha función. 

Teorema da derivada da función inversa. $$\left (f^{-1}  \right )'(x)=\frac{1}{f'\left [ f^{-1} \left ( x \right )\right ]}$$

Noutra ocasión, abordando o tema dos erros achegáramonos a este teorema pois dá lugar a que a súa compresión sexa dificultosa por usarmos o termo inversa, un termo que pode ter outras acepcións. A isto engádeselle que a notación de derivada dunha función $f'$ e o de inversa dunha función $f^{-1}$ son tipograficamente moi semellantes. 

A demostración deste ultimo resultado aséntase, necesariamente, no concepto de función inversa. Lembremos que a inversa dunha función $f$, que denotaremos por $f^{-1}$ é aquela función que composta con $f$ nos dá a función identidade $I(x)=x$. Poderemos escribir, xa que logo, $f^{-1}_{\circ}f=f_{\circ}f^{-1}=I$. Non teño claro que procedo ben, pero atendendo ás anteriores consideracións, para demostrar na clase este resultado, renomeo a función inversa coa letra grega $\varphi=f^{-1} $. Así a propiedade definitoria da función inversa transcribiriamola agora $\varphi{\circ}f=f_{\circ}\varphi=I$. Aplicándolle a regra da cadea á igualdade $(\varphi_{\circ}f)(x)=I(x)$ teremos:

$$(\varphi_{\circ}f)'(x)=f'\left[ \varphi\left( x \right) \right]\cdot\varphi'\left( x \right)=1$$

$$\varphi'\left( x \right)=\frac{1}{f'\left[ \varphi\left( x \right) \right]}$$

Volvendo á notación orixinal para a inversa temos o resultado buscado:

$$\left (f^{-1}  \right )'(x)=\frac{1}{f'\left [ f^{-1} \left ( x \right )\right ]}$$

Quixo a azarosa casualidade da navegación pola arañeira de internet que todas estas consideracións ás que me achegara en moitas ocasións, se conectaran dunha forma realmente brillante mediante a seguinte cuestión:

Problema. Achar a función $f$ tal que $f'$=$f^{-1} $

A azarosa casualidade foi este vídeo de Michael Penn que vou seguir de aquí en diante para dar a solución. 

Algo de traballo sumado a un todo e nada de intuición pode levarnos polo bo camiño se conxecturamos que a solución ten a forma $f\left( x \right)=ax^{n}$.

Escribamos a función da forma $y=ax^{n}$ e intercambiemos $x$ con $y$ para calcular a inversa. Obtemos $x=ay^n$. Despexando $y$: $f^{-1}(x)=y=\sqrt[n]{\frac{x}{a}}$

Por outra banda, calculemos a derivada: $f'\left( x \right)=a\cdot nx^{n-1}$

Igualamos $f'$ a $f^{-1}$: 

$$a\cdot nx^{n-1}=\sqrt[n]{\frac{x}{a}}$$

Elevando a $n$ os dous membros e operando:

$$a^{n} n^{n}x^{n^{2}-n}=\frac{x}{a}$$

$$a^{n+1} n^{n}x^{n^{2}-n-1}=1\quad\quad [1]$$

$$x^{n^{2}-n-1}=\frac{1}{n^{n}a^{n+1}}$$

O segundo membro é unha constante, de aí que o expoñente da variable $x$ teña que ser $0$, isto é $n^{2}-n-1=0$. Pero esta é unha ecuación moi famosa, que ten como solucións o número áureo e o seu inverso cambiado de signo:

$$n_{1}=\frac{1+\sqrt{5}}{2}=\phi\quad\quad\quad n_{2}=\frac{1-\sqrt{5}}{2}=-\frac{1}{\phi}$$

Quizais, pecando de pesado, vou volver a lembrar algunhas das propiedades básicas do número $\phi$ e que poderemos usar en calquera momento, sen outro aviso engadido.

$$\phi^{2}=\phi+1\quad\quad \phi=1+\frac{1}{\phi}\quad\quad \phi-1=\frac{1}{\phi}$$

Con todo o deducido nas últimas liñas e escollendo a primeira solución $n_{1}$ podemos volver a reescribir a expresión [1] con esta nova fasquía:

$$\phi^{\phi}a^{\phi+1}\cdot1=1$$

$$\phi^{\phi}a^{\phi^{2}}=1$$

Tomando a raíz $\phi$-ésima nos dous membros:

$$\phi a^{\phi}=1$$

$$a=\left( \frac{1}{\phi} \right)^{\frac{1}{\phi}}$$

Velaí que a función buscada é $f\left( x \right)=\left( \frac{1}{\phi} \right)^{\frac{1}{\phi}}x^{\phi}=\left( \phi-1 \right)^{\phi-1}x^{\phi}$

A expresión da función brilla con luz propia.

Outro método

Sempre resulta agradable resolver un problema seguindo camiños distintos. Xa que tratamos un pouco antes o teorema da función inversa, quizais non sería mala idea empregalo. De facérmolo así, escribindo na fórmula que nos dá o teorema da función inversa $f'$ no canto de $f^{-1}$ teremos:

$$\left( f' \right)'(x)=\frac{1}{f'\left[ f'\left( x \right) \right]}$$

Agora ben, se por unha banda o que nos aparece no primeiro membro é a segunda derivada, $\left( f' \right)'(x)=f''(x)$, a expresión do segundo membro non o é. Aclarámolo todo nas seguintes liñas.

Como no caso anterior, partimos de que $f\left( x \right)=ax^{n}$ polo que $f'(x)=nax^{n-1}$

$$f''(x)=n\left( n-1 \right)ax^{n-2}$$

$$f'\left[ f'(x) \right]=na\left( f'(x) \right)^{n-1}=na\left( nax^{n-1} \right)^{n-1}=n^{n}a^{n}x^{(n-1)^{2}}$$

O produto das anteriores expresións ten que dar $1$

$$n^{n+1}a^{n+1}\left( n-1\right)x^{n^{2}-n+1}=1$$

As mesmas consideracións feitas na anterior dedución implican que o expoñente da variable debe ser $0$ e así obtemos a mesma ecuación cuadrática para $n$. Ademais así eliminamos a variabe na anterior expresión e quédannos unicamente as constantes. Tomando $n_{1}=\phi$ teremos:

$$\phi^{\phi+1}a^{\phi+1}\left( \phi-1 \right)=1$$

$$\phi^{\phi+1}a^{\phi+1}\frac{1}{\phi}=1$$

$$\phi^{\phi}a^{\phi+1}=1$$

$$\phi^{\phi}a^{\phi}a=1$$

Tomando a raíz $\phi$-ésima e despexando:

$$\phi aa^{\frac{1}{\phi}}=1$$

$$\phi a^{1+\frac{1}{\phi}}=\phi a^{\phi}=1$$

E así, outra vez

$$a=\left( \frac{1}{\phi} \right)^{\frac{1}{\phi}}$$

Un último apuntamento

Nos cálculos anteriores estivemos usando sempre o valor $n_{1}=\phi$ pero resulta que a ecuación da que o obtivemos ese valor tiña outra solución: $ n_{2}=-\frac{1}{\phi}$. Neste caso chegaremos a outra función que tamén é solución do problema, $f\left( x \right)=\left( 1-\phi \right)^{\phi}x^{1-\phi}$. Reto ao lector, se o houber, a que faga el mesmo a dedución.

mércores, 5 de marzo de 2025

A outra fórmula do outro Bhaskara

Cando escoito o nome de Bhaskara inmediatamente penso na súa filla, a súa curiosa lenda e o libro que Bhaskara lle adicou e co que comparte nome, Lilavati. O libro foi editado pola RSME-SM dentro da colección Biblioteca de Estímulos Matemáticos. De aí recollo o seguinte problema e a súa resolución.

LXXVIII. A raíz da metade dun enxamio de abellas liba néctar de xasmíns, outras oito novenas partes o mesmo van facer. Faltan dúas, das que unha é cautiva dos lotos, prendida polo seu recendo. Dime miña querida, cantas zoantes abellas conforman ese panal.

Se identificamos o total de abellas con $2x^{2}$ poderemos establecer a seguinte ecuación 

$x-\frac{8}{9}\left( 2x^{2} \right)+2=2x^{2}$. Resolvéndoa veremos que $x=6$ e polo tanto o enxamio estará conformado por un total de $2x^{2}=72$ abellas.

Tanto no Lilavati  como noutra obra súa,  Bijaganita, Bhaskara estuda problemas cuadráticos. Quizais por esta razón André Pérez y Marín comentou nunha nota a pé de páxina no libro Lições de algebra publicado no 1909 que o método de resolución dunha ecuación cuadrática $ax^{2}+bx+c=0$ dado pola coñecida fórmula que vén a continuación debémosllo a Bhaskara.

$$x=\frac{-b\pm \sqrt{b^{2}-4ac}}{2a}$$



André Pérez y Marín
 André Pérez y Marín (1858-1928), nacido en Logroño (España), estuda en Madrid e comeza a impartir clase aos 18 anos. Aos 35 anos chega a Brasil onde durante un tempo  exerce de profesor particular. Co comezo do século XX accede a unha praza no Ginásio de Campinas, onde desenvolve o seu traballo docente ata o seu pasamento. Escribe dez libros de matemática escolar que tiveron moitas edicións. En varios deles repite a referida anotación de que a resolución das ecuacións cuadráticas se debe a Bhaskara. Este apuntamento sería reproducido por autores brasileiros posteriores e acabaría tendo certo éxito ata o punto de que hoxe en día a "fórmula de Bhaskara" non só se utiliza en Brasil, senón que ten certa sona internacional. Basta con facer unha búsqueda pola rede para comprobalo.


O outro Bhaskara e a outra fórmula

Pero desta volta non me vou referir a este matemático do século XII, tamén identificado como Bhaskara II, senón que trataremos sobre unha contribución de Bhaskara I, que viviu uns 500 anos antes, no século VII. 

Antes de nada, incluso antes de introducila, enmarquemos historicamente a achega de Bhaskara I. Para iso temos que ir ao século anterior, o VI, onde encontramos os primeiros tratados astronómicos hindúes. Os seus autores, Ariabata e Varahamihira curiosamente xa usaban o seno, no canto da corda dun ángulo. Eles e outros moitos continuaron o proxecto heleno de elaborar táboas trigonométricas. Segundo o que acabamos de dicir, na época grega esta táboas eran táboas de cordas, a partir da revisión hindú, comezaron a ser táboas de senos. Para aclarar do que estamos a falar, consideremos unha circunferencia de raio 1. Con vértice o centro $O$ trazamos un ángulo $\widehat{AOB}=2\theta$  que determinará unha corda da circunferencia $\overline{AB}$. A este valor denominámolo corda de $2\theta$ que escribiremos $crd(2\theta)=\overline{AB}$. De todos é sabido que o seno de $\theta$ é $sen\theta=\overline{AM}$. Basta con observar a seguinte imaxe para decatarse de que $crd\left(2 \theta\ \right) =2\cdot sen\theta$


A aportación de Bhaskara I foi realmente insólita. Hoxe diriamos que para ángulos de entre 0 e 180 graos ofreceu unha aproximación da función sinusoidal mediante unha función racional

$$sen\theta = R\cdot\frac{4\theta\left( 180-\theta \right)}{40500-\theta\left( 180-\theta \right)}$$

Velaquí as dúas funcións, a do seno e a súa aproximación, xunto co erro que cometemos. Tomamos, como é habitual hoxe en día $R=1$. O máis divertido é facer zoom ata poder ver ese erro.

De onde sacou Bhaskara I esa fórmula? Gen van Brummelen no seu libro The Mathematics of the Heavens and The Earth. The Early History of Trigonometry (Princenton University Press 2009) propón unha resposta con bastante cautela pois segue considerendo todavía un enigma a verdadeira liña de razoamento de Bhaskara. O argumento iníciase a partir da seguinte figura. Calculamos a área do triángulo $ABC$ de dúas formas distintas:

$área ABC=\frac{1}{2}AB\cdot BC=\frac{1}{2} BD\cdot AC$ De aí que $AB\cdot BC= BD\cdot AC$

$$sen\theta=R\cdot BD=\frac{R\cdot AB\cdot BC}{AC}\lt \frac{R \cdot \overset{\LARGE\frown}{AB}\cdot \overset{\LARGE\frown}{BC}}{2R}=\frac{\theta\left( 180-\theta \right)}{2}$$

Invertendo os termos teremos esta desigualdade:

$$\frac{1}{sen\theta}\gt \frac{2}{\theta\left( 180-\theta \right)}$$

Agora usaremos un método habitual entre os matemáticos hindús insertando un par de parámetros $x$ e $y$ que nos permitirían establecer a igualdade: $$\frac{1}{sen\theta}=x\cdot\frac{2}{\theta\left( 180-\theta \right)}+y\quad\quad [1]$$

Para os ángulos de $30$ e $90$ teremos que $sen30=\frac{R}{2}$ e $sen90=R$. Disto deducimos un sistema que resolvemos:

$$\left.\begin{matrix} \frac{2}{R}=\frac{2x}{30\cdot 150}+y \\\frac{1}{R}=\frac{2x}{90\cdot 90}+y \end{matrix}\right\} \left.\begin{matrix} \frac{2}{R}=\frac{2x}{4500}+y \\\frac{1}{R}=\frac{2x}{8100}+y \end{matrix}\right\} \left.\begin{matrix} 9000=2Rx+4500Ry \\8100=2Rx+8100Ry \end{matrix}\right\} \left.\begin{matrix} 2Rx=9000-4500Ry\\2Rx=8100-8100Ry \end{matrix}\right\}$$
$9000-4500Ry=8100-8100Ry$
$y=\frac{-900}{3600R}=\frac{-1}{4R}$
Substituíndo na primeira das ecuacións do sistema:
$2Rx=9000-4500R\cdot\frac{-1}{4R}=10125$
$2x=\frac{10125}{R}$
Finalmente substituímos os valores destes parámetros en [1]
$$\frac{1}{sen\theta}=\frac{10125}{R}\frac{1}{\theta\left( 180-\theta \right)}-\frac{1}{4R}=\frac{1}{R}\frac{40500-\theta\left( 180-\theta \right)}{4\theta\left( 180-\theta \right)}$$
Volvendo a inverter os dous membros da igualdade chegamos ao resultado desexado:
$$sen\theta = R\cdot\frac{4\theta\left( 180-\theta \right)}{40500-\theta\left( 180-\theta \right)}$$
Por último unha aclaración e un dato curioso. Co fin de adptar as anteriores consideracións ao punto de vista actual, tomáronse sempre circunferencias de raio 1, porén en cada época, incluso en cada autor teremos distintos valores do raio. Por exemplo Ptolomeo fixo as súas táboas para $R=60$ e utilizou un sistema numérico sexaxesimal. Bhaskara I e os seus predecesores Ariabata e Varahamihira utilizaban un valor realmente chamativo: $R=3438$$. Que sentido tiña escoller ese número?
Nunha circunferencia hai 360º, polo tanto $360 \cdot 60=21600'$, Se igualamos esta cantidade á lonxitude dunha circunferencia $2\pi R=21600$ e despexamos: $R=\frac{21600}{2\pi}=3438$

venres, 14 de febreiro de 2025

Xogando co teorema central do límite

Eu saín da Facultade de Matemáticas no ano 1990. O plan de estudos vixente naquela altura consistía en cursar 4 materias anuais Das que 3 eran fixas: Álxebra, Análise e Topoloxía/Xeometría. A cuarta materia, que para min significou sempre un horror,  era Física (en 1º), Cálculo Numérico (en 2º) e Estatística (en 3º). A partir de aquí había dúas vías para os dous últimos cursos, unha delas era Estatística e a outra Matemáticas Xerais. Esta última consistía nunha longa lista de materias con distintos niveis de optatividade. 

Sendo así as cousas eu só tiven unha materia de Estatística en toda a carreira,..e non a aproveitei moito. Creo recordar que no departamento axustaban a nota en función dos resultados. Como normalmente as notas eran bastante malas, o aprobado acababa baixando a un valor arredor do 4. Eu agarrábame a iso para transitar pola materia co menor dano posible. O triste do conto foi cando me chegou o momento de ter que explicar o teorema central do límite... e claro, eu non tiña nin idea de que trataba o asunto. 

A cousa non acabou en desastre total grazas a un libro, Matemática moderna aplicada. Probabilidades, estadística e investigación operativa (Alianza Universidad 1993), de J. C. Turner. A partir de aquí vou seguir a Turner, case letra a letra. Nun dos capítulos explica o que son as distribucións mostrais. Comeza co seguinte exemplo:

Tíranse 50 veces catro dados equilibrados. Apúntanse de cada vez os números obtidos. Despois calcúlase a media de cada mostra deses catro números. Un exemplo dun deses resultados sería:

Mostra: 1, 5, 6, 4

Media: $\overline{X}=4$

Antes de comezar a estudar a proposta, lembremos en que consiste a distribución orixinal, a do lanzamento dun dado. É ben simple, hai 6 posibles resultados e cada un deles ten a mesma probabilidade $\frac{1}{6}$. A media desta variable aleatoria discreta é $\mu=3'5$ e o seu desvío padrón é $\sigma=1'7078$. Por suposto, este estudo xa o temos feito na clase desde hai tempo.

A función $\overline{X}=\frac{X_{1}+X_{2}+X_{3}+X_{4}}{4}$ é un estatístico mostral. Cada vez que tomamos unha mostra podemos calcular o seu valor. Pero $\overline{X}$ é tamén unha variable aleatoria. A cuestión consiste en deducir como é a distribución mostral das medias $\overline{X}$ a partir dos valores mostrais. Agora é cando cobra sentido realizar o experimento moitas veces (50 no noso exemplo). Que é o que observamos?

Como na entrada anterior, podemos xogar coa seguinte folla de cálculo que simula o proceso. Hai dúas alternativas para traballar coa seguinte ferramenta. Marcadas en amarelo aparecen as medias de cada lanzamento de catro dados.

  • A mellor é descargar a folla de cálculo. Se queremos recalcular os datos basta premer F9
  • Podemos facelo on-line. Nese caso debemos recargar de novo a páxina ou, o que é o mesmo premer Maíuscula+F5



A distribución mostral das medias, $\overline{X}$, é moi diferente á poboación orixinal (lanzamento dun dado). Pensemos que resultará moi improbable obter resultados extremos para $\overline{X}$. Para que $\overline{X}$ tome o valor $1$ só hai unha mostra posible: $(1,1,1,1)$. Porén para obter un resultado intermedio para $\overline{X}$ como $3$ temos moitas posibilidades: $(3,3,3,3)$, $(2,3,4,3)$, $(3,1,6,2)$, $(3,1,2,6)$,... (Unha boa cuestión sería averiguar cantas tiradas distintas terán $3$ de media). Por esta razón a distribución $\overline{X}$ tomará valores no centro da distribución orixinal con máis frecuencia. Ademáis é bastante plausible que o centro da distribución $\overline{X}$ coincida coa media da distribución base, $\mu=3'5$, que é unha distribución discreta que xa estudamos máis arriba, na que a cada un dos posibles resultados lle asignamos unha probabilidade de $1/6$. Se pensamos o que sucedería se no canto de lanzar catro dados, lanzamos seis, pronto nos convenceriamos de que aumentaría a concentración de $\overline{X}$ arredor do centro. A dispersión de $\overline{X}$ diminuirá ao aumentar o tamaño da mostra $n$. 
Que máis podemos dicir sobre a relación entre a distribución orixinal e a distribución mostral das medias? Se observamos o diagrama obtido nas mostras de catro datos (e podemos facelo repetidamente varias veces usando a folla de cálculo) veremos que as frecuencias relativas caen rapidamente a ambos lados da media $\mu$. Aínda que feblemente, a gráfica ten un aire coa curva normal teórica coa mesma media e cun desvío padron $\frac{\sigma}{\sqrt{n}}$. Se $n$ é o suficientemente grande a distribución $\overline{X}$ pódese axustar por esta curva normal. Convén fixarse en que a distribución orixinal é un rectángulo, moi distinta da forma da distribución $\overline{X}$. Isto que acabamos de explicar é o teorema central do límite. Podémolo enunciar, con algo máis de pompa, deste xeito:

Teorema Central do Límite. Dada unha variable aleatoria $X$ calquera, consideremos mostras de tamaño $n$ desta distribución $\left( X_{1},X_{2},...,X_{n} \right)$. A distribución mostral das medias $\overline{X}=\frac{\sum_{i=1}^{n}X_{i}}{n}$ aproxímase a unha variable aleatoria normal $N\left( \mu,\frac{\sigma}{\sqrt{n}} \right)$

É difícil determinar cal debe ser o valor de $n$ para ter un bo axuste. Con todo, para mostras ben pequenas, de tamaño 4, xa vimos que $\overline{X}$ vai collendo un aire. Para mostras de tamaño $n\ge 30$ poderemos aplicar o teorema sen medo.

venres, 7 de febreiro de 2025

Xogando coa lei dos grandes números

Lembro que desde bastante novo tiven a ilusión de ser profesor de matemáticas. Quizais por esa razón recordo moi vívidamente as clases de matemáticas que me impartiron, sobre todo durante a época do instituto. Daquela a probabilidade e a estatística apenas estaba presente no temario que se impartía. En consecuencia, nos meus tempos de estudante só recibín unha definición de probabilidade e precisamente por iso resultaba algo estraña. Era a chamada definición de probabilidade de Laplace: se A é un suceso a súa probabilidade $P(A)$ vén dada por $$P(A)=\frac{número\quad de\quad casos\quad favorables\quad a\quad A }{número\quad de\quad casos\quad posibles}$$

Evidentemente, se recibía esa denominación é que tiña que haber outras definicións. E se as había era por que a dada por Laplace tiña un problema: só tiña sentido cando se trataba de sucesos equiprobables. Esta definición non é aplicable ao caso dun dado trucado ou ao lanzamento dunha determinada clase de chinchetas (aquí os sucesos serían caer punta arriba ou coa punta apoiada na mesa). Hoxe en día, nas aulas de Secundaria, ofrécense normalmente dúas alternativas para definir a probabilidade. Unha delas é difícil de explicar. É a definición hilbertiana, a axiomática, atribuída a Kolmogorov. Para entendela en profundidade cómpre saber en que consiste un sistema axiomático e, nesa altura o alumnado non está afeito a ese tipo de referentes. Diremos que $P$ é unha medida de probabilidade se verifica os seguintes axiomas aplicados a un espazo mostral $E$ no que consideraremos sucesos $A$ e $B$:

1. $P\left( A \right)\ge 0$

2. $P\left( E \right)=1$

3. Se $A$ e $B$ son incompatibles ($A\cap B=\emptyset $), entón $P\left( A\cup B \right)=p\left( A \right)+P\left( B \right)$

Aínda hai unha terceira alternativa para explicar en que consiste a probabilidade. Xurdida dos traballos de Jacob Bernouilli, é a coñecida como lei dos grandes números. Neste caso a idea é bastante intuitiva e non cómpre ningunha bagaxe cultural. Se realizamos un experimento moitas veces a probabilidade dun determinado suceso poderá aproximarse pola súa frecuencia relativa. Cantas máis veces fagamos o experimento mellor. De aí que se lle chamamos $n$ ao número de veces que realizamos o experimento, a probabilidade dun suceso $A$ virá dada por

$P(A)=\displaystyle\lim_{n \to \infty } \frac{nº\  de\  veces\ que\  sucede\ A}{n}$

Con todo, esta explicación non está exenta de dificultades. Teño comprobado, unha e outra vez, que tan pronto se lle presenta ao alumnado esta última liña, toda a claridade expositiva anterior parece esvaerse. Por iso intentei buscar unha alternativa para que lles permitira practicar coa lei. Acheina en Teching Statistics (Cambridge Uneversity Press 2018) de Darren Macey e Will Hornby. O único que fixen foi seguir as súas indicacións, paso a paso. Trátase de elaborar unha folla de cálculo que simule o lanzamento dunha moeda. Para iso xeramos unha restra de números aleatorios, 0s ou 1s, onde identificaremos o 1 con "sacar cara". Na seguinte folla de cálculo fanse simulacións de 15, 150 e 1500 lanzamentos. O mellor é xogar con ela para observar o que pasa. Ao final de cada experimento obtemos un valor aproximado para a probabilidade. 

Hai dúas alternativas para traballar coa seguinte ferramenta.

  • A mellor é descargar a folla de cálculo. Se queremos recalcular os datos basta premer F9
  • Podemos facelo on-line. Nese caso debemos recargar de novo a páxina ou, o que é o mesmo premer Maíuscula+F5
O efecto paréceme hipnótico