luns, 2 de xuño de 2025

Relación entre series infinitas, fraccións continuas teito e constantes. Series hiperxeométricas. Final.

por Andrés Ventas

 $ \newcommand{\tei}[1]{\lceil #1 \rceil} \newcommand{\teib}[1]{\Big\lceil #1 \Big\rceil} \newcommand{\teig}[1]{\Bigg\lceil #1 \Bigg\rceil} \newcommand{\R}{{\mathbb R}} $ Unha fracción continua teito xeneralizada ($fctx$), $\teib{\begin{matrix} - & a_1 & a_2 & a_3 & \ldots\\ b_0 & b_1 & b_2 & b_3 & \ldots \end{matrix}} = b_0 - \cfrac{a_1}{b_1 - \cfrac{a_2}{b_2 - \cfrac{a_3}{b_3 - {}\ddots}}} $, é unha fracción continua teito onde os numeradores poden ser distintos de 1, e ten converxentes con fraccións $\dfrac{A_i}{B_i}$ cuxos continuantes $A_i$ e $B_i$ (numeradores e denominadores) satisfán unha recorrencia de resta da forma:

$A_i = b_i A_{i-1} - a_i A_{i-2}; \ A_0=b_0; \ A_{-1}=1$.

$B_i = b_i B_{i-1} - a_i B_{i-2}; \ B_0=1; \ B_{-1}=0$.

Escribiremos unha $fctx$ como unha enumeración dos seus coeficientes entre os símbolos da función teito, $\teib{\begin{matrix} - & a_1 & a_2 & a_3 & \ldots\\ b_0 & b_1 & b_2 & b_3 & \ldots \end{matrix} }$.

Para transformar unha $fctx$ noutra equivalente pode verse que unha operación sobre $a_i$ ou $b_i$ afecta aos coeficientes $a_i$, $b_i$ e $a_{i+1}$.

(Pódese consultar fracción continua xeneralizada )

Agora co algoritmo da suma por pares podemos transformar calquera serie nunha fracción continua mediante algunha transformación simple, aínda que de escrita engorrosa:

$S= \sum_{i=0}^{\infty} \frac{1}{u_i} = \frac{1}{u_0} + \frac{1}{u_1} + \frac{1}{u_2} + \frac{1}{u_3} + \cdots = \frac{1}{u_0} + \frac{1}{u_0 \frac{u_1}{u_0}} + \frac{1}{\frac{u_1}{u_0}u_2\frac{u_0}{u_1}} + \frac{1}{\frac{u_2 u_0}{u_1}u_3\frac{u_1}{u_2 u_0}} + \cdots $

E por tanto aplicando o algoritmo por pares (ver Relación entre series infinitas, fraccións continuas teito e constantes. Aplicacións (Parte I) ) temos

$S^{-1}= \teig{ \begin{matrix} - & 1 & 1 & 1 & \ldots\\ u_0 & \tfrac{\tfrac{u_1}{u_0}+ 1}{u_0} & \tfrac{u_0+\tfrac{u_2 u_0}{u_1}}{\tfrac{u_1}{u_0}} & \tfrac{\tfrac{u_1}{u_0}+\tfrac{u_3 u_1}{u_2 u_0}}{\tfrac{u_2u_0}{u_1}} & \ldots \end{matrix} } = \teig{ \begin{matrix} - & u_0^2 & u_1^2 & u_2^2 & \ldots\\ u_0 & u_1 + u_0 & u_2 + u_1 & u_3 + u_2 & \ldots \end{matrix} }$

E esta fracción continua xa foi descuberta por Euler, subpoño que por outro camiño.

Como exemplo podemos ver $\zeta(2)^{-1}= \dfrac{6}{\pi^2} = \teig{ \begin{matrix} - & 1 & 2^4 & 3^4 & \ldots\\ 1 & 2^2 + 1^2 & 3^2 + 2^2 & 4^2 + 3^2& \ldots \end{matrix}} = \teig{ \begin{matrix} - & 1 & 2^4 & 3^4 & \ldots\\ 1 & 5 & 13 & 25& \ldots \end{matrix} }$

Así temos os converxentes $A_i/B_i$

$a_i$$1^4$$2^4$$3^4$$\cdots$
$b_i$151325$\cdots$
$A_i$11436576$\cdots$$(n!)^2$
$B_i$01549820$\cdots$secuencia A001819 na OEIS

Se sumamos $\dfrac{1}{1^2} + \dfrac{1}{2^2} + \dfrac{1}{3^2} + \dfrac{1}{4^2}$ do xeito tradicional vemos que dá $\dfrac{205}{144}$ e temos que $\dfrac{820}{576}=\dfrac{205}{144}$, así que simplemente estamos a transformar unha suma de fraccións en dúas sumas de recorrencias.

Se procuramos as fórmulas do numerador e do denominador dos converxentes temos para o numerador $(n!)^2$, e para o denominador a fórmula da OEIS $a_n=s(n+1,2)^2 - 2 s(n+1,1)s(n+1,3)$, onde $s(n,k)$ son os números de Stirling do primeiro tipo.

Se calculamos $\zeta(3)$ podemos ver que os numeradores son $(n!)^3$ e que os denominadores son secuencia A066989 na OEIS que podemos comprobar que coinciden con $a_n=s(n+1,2)^3 - 3 s(n+1,1)s(n+1,2)s(n+1,3)+3s(n+1,1)^2s(n+1,4)$ (ver Stirling numbers of the first kind ).

Isto parece indicar que $\zeta(s)$ pode expresarse como o límite de $(n!)^s$ partido por unha pequena fórmula dos números de Stirling. Apunto este tema para investigar e se dou atopado algunha cousiña interesante farei outra entrada. De momento anoto meter a fórmula cos números de Stirling na A066989 da OEIS.

Series de potencias

Imos ver un exemplo con unha serie de Maclaurin ( Serie de Taylor):

$\ln{(1+x)}= \sum_{i=1}^{\infty} \dfrac{(-1)^{n+1}}{n}x^n = \dfrac{x}{1} - \dfrac{x^2}{2} + \dfrac{x^3}{3} - \dfrac{x^4}{4} + \cdots $ e así para $x=\dfrac{1}{2}, \ln{1.5} \approx 0.40 = \dfrac{77}{192} = \dfrac{1}{2} - \dfrac{1}{8} + \dfrac{1}{24} - \dfrac{1}{64} + \cdots $

Calculamos os converxentes $A_i/B_i$

$a_i$$2^2=4$$8^2=64$$24^2=576$$\cdots$
$b_i$2-8+2=-624-8= 16-64 + 24= -40$\cdots$
$A_i$12-16-38424576$\cdots$
$B_i$01-6-1609856$\cdots$

Non sae un cálculo moi eficiente pois saen cifras moi grandes para unha fracción equivalente $\dfrac{24576}{9856} = \dfrac{192}{77} $.

Expansión de Engel

A expansión de Engel dun número real positivo $x$ é a única secuencia non decrecente de números enteiros positivos $(a_0,a_1,a_2,a_3,\dots)$ tal que $x=\frac{1}{a_0}+\frac{1}{a_0 a_1}+\frac{1}{a_0 a_1 a_2}+\cdots $

Por exemplo, o número $e$ ten unha expansión de Engel $1, 1, 2, 3, 4, 5, 6, 7, 8, \ldots$ correspondente á serie infinita $e=\frac{1}{1}+\frac{1}{1}+\frac{1}{1\cdot 2}+\frac{1}{1\cdot 2\cdot 3}+\frac{1}{1\cdot 2\cdot 3\cdot 4}+\cdots$ (ver Expansión de Engel)

O cálculo da expansión dun número $x$ sería da forma: $u_1 = x, a_k = \left \lceil \frac{1}{u_k} \right \rceil$ e iterar $u_{k+1} = u_k a_k - 1$ onde $\left \lceil r \right \rceil$ é a función teito (o número enteiro máis pequeno maior ou igual a $r$).

Con esa expansión temos na suma por pares $p_i= \{ a_0, a_1, a_0 a_2, a_1 a_3, a_0 a_2 a_4, a_1 a_3 a_4, \ldots \}$ e os coeficientes da $fct$ simple $c_i= \{a_0, \dfrac{a_0+1}{a_0}, \dfrac{a_0(a_2+1)}{a_1}, \dfrac{a_1(a_3+1)}{a_0 a_2} , \dfrac{a_0 a_2(a_4+1)}{a_1 a_3}, \dfrac{a_1 a_3(a_5+1)}{a_0 a_2 a_4}, \ldots \}$

Se pasamos a unha $fctx$ temos: $S^{-1}= \teig{ \begin{matrix} - & a_0 & a_0 a_1 & a_0 a_1 a_2 & & a_0 a_1 a_2 a_3&\ldots \\ a_0 & a_1 + 1 & a_0 (a_2 + 1) & a_1 (a_3 +1) & a_0 a_2 (a_4 +1) & \ldots \end{matrix} } = $

$\teig{ \begin{matrix} - & a_0 & a_1 & a_2 & a_3 &\ldots\\ a_0 & a_1 + 1 & a_2 + 1 & a_3 + 1 & a_4 + 1 & \ldots \end{matrix} }$

Un exemplo para a expansión de Engel do número $e$ vista anteriormente:

Calculamos os converxentes $A_i/B_i$

$a_i$$1$$1$$2$$3$$4$$5$$\cdots$
$b_i$1234567$\cdots$
$A_i$1112624120$\cdots$n!
$B_i$01251665326$\cdots$secuencia A00522 na OEIS

así temos que $\dfrac{326}{120} = 2.71$

e como curiosidade os denominadores forman a recorrencia $B_i = n B_{i-1} +1$ que se a metemos en Wolframalpha ( Wolframalpha ) devolve como solución $B_n = e \Gamma (n+1)$ que ten sentido no límite pois $\dfrac{B_n}{A_n} = \dfrac{e \Gamma (n+1)}{n!}=e$.

Series hiperxeométricas

A función hiperxeométrica está definida para $|z| \lt 1$ pola serie de potencias ${}_2F_1(a,b;c;z) = \sum_{n=0}^\infty \dfrac{(a)_n (b)_n}{(c)_n} \dfrac{z^n}{n!} = 1 + \dfrac{ab}{c}\frac{z}{1!} + \dfrac{a(a+1)b(b+1)}{c(c+1)}\dfrac{z^2}{2!} + \cdots.$

Aquí $(q)_n$ é o Factorial ascendente (símbolo de Pochhammer ascendente), que se define por: $(q)_n = \begin{cases} 1 & n = 0 \\ q(q+1) \cdots (q+n-1) & n > 0 \end{cases}$ (ver Función hiperxeométrica )

Como temos termos con produtos consecutivos é doado aplicar a suma por pares, de feito aplicando o mesmo criterio da expansión de Engel temos $a_0=1, a_1=\dfrac{c}{abz},a_2=\dfrac{2(c+1)}{(a+1)(b+1)z},a_3=\dfrac{3(c+2)}{(a+2)(b+2)z}, \ldots$ e por tanto a $fctx$:

$\teig{ \begin{matrix} - & 1 & \frac{c}{abz} & \frac{2(c+1)}{(a+1)(b+1)z} & \frac{3(c+2)}{(a+2)(b+2)z} &\ldots\\ 1 & \frac{c}{abz} + 1 & \frac{2(c+1)}{(a+1)(b+1)z} + 1 & \frac{3(c+2)}{(a+2)(b+2)z} + 1 & \frac{4(c+3)}{(a+3)(b+3)z} + 1 & \ldots \end{matrix} }$

Podemos ver como exemplo ${}_2F_1(1,1;2; -z=-1) = \dfrac{\ln(1+z)}{z} \mbox{ para } z=1, \ln(2)$.

$\teig{ \begin{matrix} - & 1 & -2 & -\frac{3}{2} & -\frac{4}{3}&\ldots\\ 1 & -1 & -\frac{1}{2} & -\frac{1}{3} & -\frac{1}{4} & \ldots \end{matrix} } = \teig{ \begin{matrix} - & 1 & -2^2 & - 3^2 & -4^2& -5^2& \ldots\\ 1 & -1 & -1 & -1 & -1 & -1 & \ldots \end{matrix} }$

Lembrando que para simplificar termos están afectados $a_i, b_i, a_{i+1}$.

E agora calculamos os converxentes

$a_i$$1$$-2^2$$-3^2$$-4^2$$-5^2$$-6^2$$\cdots$
$b_i$1-1-1-1-1-1-1$\cdots$
$A_i$11-26-24120-720$\cdots$n!
$B_i$01-15-1494-444$\cdots$secuencia A00522 na OEIS

no quinto termo temos $\dfrac{-444}{-720} = 0.61$ unha converxencia lenta cara a $\ln(2)\approx 0.69$.

Series hiperxeométricas e fracción continua de Gauss

Un resultado relacionado co Teorema da suma por pares para as $fct$ (ver Relación entre series infinitas, fraccións continuas teito e constantes. Aplicacións (Parte I)) é a fracción continua de Gauss que estabelece unha fracción continua para a división de dúas series hiperxeométricas.( ver Gauss's continued fraction))

Aquí hai que mencionar que as funcións hiperxeométricas xeneralízanse para calquera número de parámetros e así por exemplo a función ${}_0F_1(c; z)$ tería só un parámetro no denominador "c" e non tería os dous do numerador (nen "a" nen "b") o número á esquerda embaixo na $F$ serían os parámetros de factorial ascendente do numerador e o de embaixo na dereita serían os do denominador.

Como un exemplo da fracción continua de Gauss podemos ver o caso típico entre dúas de tipo ${}_2F_1(a,b;c;z)$:

$ \dfrac{ {}_2F_1(a+1,b;c+1;z)} { {}_2F_1(a+1,b;c+1;z)} = $ $ \bigg[ \begin{matrix} + & \frac{(a-c)b}{c(c+1)}z&\frac{(b-c-1)(a+1)}{(c+1)(c+2)}z) &\frac{(a-c-1)(b+1)}{(c+2)(c+3)}z & \frac{(b-c-2)(a+2)}{(c+3)(c+4)}z& \ldots\\ 1 & 1 & 1 & 1 & \ldots \end{matrix} \bigg]^{-1} $

Apuntamos que esta fracción continua xeneralizada é a ordinaria, ten o signo máis entre as súas fraccións (non é teito). E tamén que o resultado é unha recíproca (elevado a $-1$). (en Mathworld Mathworld Gauss's continued fraction dan a solución con recorrencia negativa, isto é, como fracción continua teito)

Para finalizar unha integral

función erro definida como integral e con solución como función hiperxeométrica sería:

$\operatorname{erf(z)} = \dfrac{2}{\sqrt{\pi}}\displaystyle\int_{0}^{z}e^{-t^2} dt = \dfrac{2}{\sqrt{\pi}} M\big(\dfrac{1}{2}, \dfrac{3}{2},-z^2 \big)$

onde $M \big(\dfrac{1}{2}, \dfrac{3}{2},-z^2 \big)$ é a función hiperxeométrica confluente , que é igual a unha función ${}_1F_1$ que só ten un parámetro no numerador e outro no denominador, neste caso ${}_1F_1\big(\dfrac{1}{2}, \dfrac{3}{2},-z^2 \big)$.

Coa fracción continua dada pola suma por pares temos $a_0=1, a_1=\frac{3}{-z^2}, a_2=\frac{2\cdot 5}{-3z^2}, a_3=\frac{3\cdot 7}{-5z^2}, \ldots$ e por tanto:

$\displaystyle\int_{0}^{z}e^{-t^2} dt = \teig{ \begin{matrix} - & 1 & \frac{3}{-z^2} & \frac{2\cdot 5}{-3z^2} & \frac{3\cdot 7}{-5z^2}& \frac{4\cdot 9}{-7z^2}\ldots & \\ 1 & \frac{3-z^2}{-z^2} & \frac{2\cdot 5 - 3z^2}{-3z^2} & \frac{3\cdot 7- 5z^2}{-5z^2} & \frac{4\cdot 9- 7z^2}{-7z^2} & \ldots \end{matrix} }^{-1} = $

$\teig{ \begin{matrix} - & -z^2 & -3^2 z^2 & - 2\cdot 5^2 z^2& - 3\cdot 7^2 z^2 & - 4\cdot 9^2 z^2 & \ldots\\ 1 & 3-z^2 & 2\cdot 5 - 3z^2 & 3\cdot 7 - 5z^2 & 4\cdot 9 - 7z^2 & 5\cdot 11 - 9z^2 & \ldots \end{matrix} }^{-1} $.

Onde a segunda expresión da $fctx$ é máis simple pero dá números máis grandes nos valores dos converxentes.

Un exemplo numérico por exemplo para $z=1$ temos:

$a_i$$-1$$-9$$-50$$-147$$\cdots$
$b_i$1271629$\cdots$
$A_i$1133063022680$\cdots$$\dfrac{(2n+1)!}{2^n}$ (A007019 na OEIS)
$B_i$0122346816953$\cdots$

$ \displaystyle\int_{0}^{1}e^{-t^2} \approx \dfrac{16953}{22680} \approx 0.747486$.

mércores, 28 de maio de 2025

Criptografía e maxia no Losada

Algún día tería que relatar as miñas desventuras no CAP (Curso de Adaptación Pedagóxiga), un curso que xogaba aproximadamente o mesmo papel que o Máster de Profesorado actual. Só comentarei que, cando me faltaba só unha sesión para rematalo, abandoneino, farto.  Efectivamente, estaba farto de ver como quen presumiblemente tiña que dar directrices sobre orientacións didácticas actuaba como un terrorista pedagóxico. Recordo unha materia levada por dous profesores, un home gordo e unha muller fraca. Impartían clase xuntos. Pasaban todo o tempo discutindo. Iso podería estar ben se fose algo pensado e preparado. Non era o caso.  Nunha ocasión pasaran toda a sesión dándolle voltas a como tratar aos rapaces zurdos. Se conviña, ou non, forzalos a escribir coa man dereita. Non era esta un tema que houbese que tratar no CAP, só foi unha ocorrencia máis desa parella infame de profesores. Desde aquela quedoume a impresión que unha clase levada en parella tiña que ser necesariamente un fracaso. Non é así. Isto demostráronolo Nicanor Alonso e Miguel Mirás o pasado venres 16/05/2025 na charla que viñeron impartir ao IES Antón Losada Diéguez ao alumnado de 1º de Bacharelato. O segredo do éxito dunha clase en tándem? O mesmo que o dunha clase impartida por unha persoa soa: traballo e preparación. 

O título da charla era "Historias e segredos da criptografía". Trataron temas como o da escritura xeroglífica, a reixa de Cardano, os acrósticos, a escítala espartana, o cifrado César ou o máis sofisticado de Vigenére,  sempre solicitando a participación e complidade do alumnado. Nicanor e Miguel repartiron unha roda como a da imaxe, que nos permitiu encriptar unha mensaxe seguindo as directrices dos dous últimos sistemas de cifrado. 

Examinaron moitos máis tópicos e sempre dunha forma clara e coordinada. Claro que, no canto de ser explicados en parella, tal e como o fixeron eles, case todos podían ter sido tratados por un só conferenciante. Comento isto porque un dos capítulos necesitaba de dúas persoas para poder desenvolvelo. A min foi o que máis me sorprendeu e agradou. Trátase do truco das 5 cartas de Cheney, asunto do que, por certo, xa se ocupara no seu día Jota nesta entrada, O mellor truco de cartas. O enunciado promete. Vexamos como se desenvolveu.

As cinco cartas de Cheney

Un dos dous conferenciantes marchou da sala; chamémoslle  mago. O outro, chamémoslle axudante,  pediu a un voluntario que escollera cinco cartas dunha baralla francesa completa (52 cartas, 13 de cada un dos paus, a saber: corazóns ♡ , diamantes ♢, picas ♠ e trevos ♣). Entón o axudante colocou catro desas cartas sobre unha mesa e deixou a quinta ao final, virada cara abaixo.



Cando volveu o mago e veu esas cartas sobre a mesa, concentrouse un momento e adiviñou cal era a carta que estaba boca abaixo.

Estaba claro que elaboraran un código para identificar as cartas pois diso trataba a conferencia. Pero teñamos presente que non poden saber previamente cales son as cartas que se van escoller polo que o código debería estar montado sobre a ordenación das cartas. Está claro que podemos establecer unha orde entre todas elas. En primeiro lugar, os números (do 1 ao 13) axudan moito. E que pasa se dúas cartas teñen o mesmo valor numérico? Daquela basta con que o mago e o seu axudante establezan unha orde dos paus. Podería ser, por exemplo, a orde do abecedario pola primeira letra: corazóns ♡ < diamantes ♢< picas ♠ < trevos ♣. Con todo, hai un problema, as $4$ cartas que quedan visibles só poden ordenarse de $4!=24$ formas distintas. 

Para salvar esta dificultade hai que aproveitar todas as vantaxes que nos dá o desenvolvemento do truco. Teñamos presente que é o axudante quen escolle a carta que se coloca boca abaixo. Polo principio do pombal, dadas $5$ cartas, é seguro que vai haber polo menos dúas do mesmo pau. Isto permite que o axudante escolla dúas cartas do mesmo pau e coloque unha cara abaixo e a outra pode colocala na primeira posición. No noso exemplo a primeira carta era o rei de trevos, velaí que a carta a adiviñar será tamén un trevo. Agora quédannos outras tres cartas visibles que nos deben permitir identificar o número da carta oculta. Outra vez, se ordenamos esas tres cartas termos un total de só $3!=6$ posibilidades e nós necesitamos 13. Aquí é onde entra en xogo a aritmética modular. 


Facemos unha identificación do valor da carta cos números das congruencias de $\mathbb{Z}_{13}$. A diferenza entre dous destes valores nunca é maior que $6$. As cartas que escolleu o axudante eran a $J$ e o $2$ de trevos. A súa diferenza é de $4$ unidades. Ocultando o $2$ só lle ten que dicir ao seu compañeiro que debe sumarlle $4$ unidades á $J$. En aritmética modular $11+4\equiv 2 (mód 13)$. O código utilizado para indicar o número a sumar é o que explicamos de seguido. Vou identificar o $1$ co valor máis baixo das tres cartas, o $2$ co intermedio e o $3$ co maior. Daquela establezo a seguinte relación entre as $6$ ordenacións e o $6$ números que debo sumar (módulo 13) ao valor da primeira carta:

$$\begin{pmatrix} 1,2,3 & \longrightarrow 1 \\ 1,3,2 &\longrightarrow 2 \\ 2,1,3& \longrightarrow 3 \\ 2,3,1 & \longrightarrow 4 \\ 3,1,2& \longrightarrow 5 \\ 3,2,1 & \longrightarrow 6 \\ \end{pmatrix}$$
Como as tres cartas centrais son: $J$♢, $3$♠, $5$♠ vemos que a orde das cartas é: maior,  menor, intermedia que identificamos coa permutación $3,2,1$, de aí que o número a sumar é o $4$. Polo tanto o mago adiviña a carta oculta:

Principio do pombal, combinatoria e aritmética modular, todo dentro dun truco de maxia. 

Charlas científico-divulgativas
A Universidade de Vigo ofrece cada ano charlas científico-divulgativas. No seu folleto divulgativo acharemos epígrafes como os de "Ciencias da natureza", "Física e Química" ou "Economía". Aparentemente non se oferta ningunha charla de "Matemáticas". Eu aconsellaría aos centros de ensino de Secundaria buscar nese folleto os nomes de Nicanor Alonso e Miguel A. Mirás e concertar con eles unha actividade.

luns, 19 de maio de 2025

Buscando unha base para os logaritmos

Na anterior entrada falaramos de logaritmos en base 2, e fixéramolo introducindo a seguinte táboa:

$n$ $2^{n}$$n$ $2^{n}$$n$ $2^{n}$$n$ $2^{n}$
$0$ $1$ $8$ $256$ $16$ $65\,536$ $24$ $16\,777\,216$
$1$ $2$ $9$ $512$ $17$ $131\,072$ $25$ $33\,554\,432$
$2$ $4$ $10$ $1\, 024$ $18$ $262\,144$ $26$ $67\,108\,864$
$3$ $8$ $11$ $2\, 048$ $19$ $524\,288$ $27$ $134\,217\,728$
$4$ $16$ $12$ $4\,096$ $20$ $1\,048\,576$ $28$ $268\,435\,456$
$5$ $32$ $13$ $8\,192$ $21$ $2\,097\,152$ $29$ $536\,870\,912$
$6$ $64$ $14$ $16\,384$ $22$ $4\,194\,304$ $30$ $1\,073\,741\,824$
$7$ $128$ $15$ $32\,768$ $23$ $8\,388\,608$ $31$ $2\,147\,483\,648$
$n=log_{2}N$ $N=2^{n}$$n=log_{2}N$ $N=2^{n}$$n=log_{2}N$ $N=2^{n}$$n=log_{2}N$ $N=2^{n}$

Para afacernos ao concepto de logaritmo propuxeramos algúns problemas introdutorios. Vou resolver os dous últimos pois son os únicos nos que hai que traballar con números que non aparecen nesta táboa. Lembremos os seus enunciados:

5. Calcula $ 129 \cdot 127$ 

6. Calcula $154 \cdot 8\,744$ 

Para abordar o exercicio 5 basta decatarse de que $129\cdot 127=\left( 128+1 \right)\left( 128-1 \right)=128^{2}-1$

Como o $log_{2}128=7$ temos que $log_{2}128^{2}=log_{2}\left( 128\cdot 128 \right)=log_{2}128+log_{2}128=2\cdot log_{2}128=2\cdot 7=14$. 

Noutras palabras: $128^{2}=\left( 2^{7} \right)^{2}=2^{2\cdot 7}=2^{14}=16\,384$. De aí que  $129\cdot 127=128^{2}-1=16\,384-1=16\,383$

Ademais, nesta resolución enxergamos outra propiedade dos logaritmos, a que nos indica cal é o logaritmo dunha potencia, e que podemos enunciar así:$$log_{2}M^{k}=k\cdot log_{2}M$$

Centrémonos agora no exercicio 6, que consiste en calcular o produto $154\cdot 8\,744$ facendo uso dos logaritmos en base 2. A pouco que reflexionemos no problema decatarémonos de que non se lle ve forma de reducir estes números aos que aparecen na táboa. Teñamos presente que a potencias de 2 máis próximas a 154 é $2^{7}=128$ pero $2^{8}$ xa é 256. Algo semellante sucede co outro factor, $8.744$. Resulta que $2^{13}=8\,192$ pero $2^{14}=16\,384$. Fica claro que se queremos usar os logaritmos para simplificar o cálculo de produtos e divisións, temos que procurar que a táboa de logaritmos non presente eses ocos tan grandes. Pero no canto de ir na dirección que marcaría a resolución deste problema, imos dirixirnos antes en dirección contraria. 

Os logaritmos decimais

Tal e como dixemos, comezaramos presentando a táboa cos logaritmos en base 2. Porén podiamos ter escollido calquera outro número como base. Quizais unha das primeiras ideas que se nos veña á cabeza sería elaborar unha táboa logarítmica en base 10 pois esta é a base do noso sistema de numeración. Neste caso, o resultado sería o seguinte:

$n$ $10^{n}$
$0$ $1$
$1$ $10$
$2$ $100$
$3$ $1\,000$
$4$ $10\,000$
$5$ $100\,000$
$6$ $1\,000\,000$
$n=log_{10}N$ $N=10^{n}$

Entre as primeiras táboas de logaritmos publicadas xa comezou a destacar a tendencia a usar a base 10. Así o fixo Henry Briggs no 1617, 1624 e 1633. Tamén foi o caso de Edmund Gunter no 1620 e 1624 e de Adriaan Vlacq no 1628. Tanto é así que cando se usa esta base normalmente non se indica na notación do logaritmo. Deste xeito o $log_{10}M$ escribirase simplemente $log M$.

Resulta case inmediato comprobar que as propiedades dos logaritmos se verifican independentemente da base. Recompilando o tratado ata agora teriamos as seguintes:

$$log_{a}\left( M\cdot N \right)=log_{a}M+log_{a}N$$  $$log_{a}\frac{M}{N}=log_{a}M-log_{a}N$$

$$ log_{a}M^{k}=k\cdot log_{a}M$$

A estas propiedades convennos engadir unha máis, a denominada fórmula do cambio de base, que relaciona o logaritmo dun número en calquera base co logaritmo decimal dese mesmo número: $$log_{a}M=\frac{log\, M}{log\, a}$$

Esta fórmula indícanos que ten pouca importancia a base escollida. Se quixeramos elaborar unha táboa dos logaritmos nunha base $a$ calquera, bastaría con multiplicar por $log\, a$ os logartimos da táboa anterior, a dos logartimos decimais. En conclusión, se temos os logaritmos nunha determinada base, obter os logaritmos noutra calquera é inmediato. 

Así e todo, despois de botarlle un ollo á táboa dos logaritmos en base 10,  decontado nos decatamos que tomar 10 como base foi moi mala idea porque os saltos entre os valores de $N$ son enormes. As diferenzas entre as potencias de $2$ eran moito menores. Polo tanto convén escoller unha base máis pequena. Claro que non debemos baixar ata o 1 porque todas as súas potencias son tamén $1$. Probemos cun número moi pouco maior, $1'1$. Velaquí a súa táboa:

$n$ $1'1^{n}$
$0$ $1$
$1$ $1'1$
$2$ $1'21$
$3$ $1'331$
$4$ $1'4641$
$5$ $1'61051$
$6$ $1'771561$
$n=log_{1'1}N$ $N=1'1^{n}$

A cousa ten mellor pinta. E se avanzamos neste sentido? Consideremos bases aínda menores, por exemplo $1'001=1+\frac{1}{1.000}$

$n$ $1'001^{n}$
$0$ $1$
$1$ $ 1'00\textbf{1}$
$2$ $1'00\textbf{2} 00\textbf{1}$
$3$ $1'00\textbf{3}00\textbf{3}00\textbf{1}$
$4$ $1'00\textbf{4}00\textbf{6}00\textbf{4}00\textbf{1}$
$5$ $1'00\textbf{5}0\textbf{10}0\textbf{10}00\textbf{5}00\textbf{1}$
$6$ $1'00\textbf{6}0\textbf{15}0\textbf{20}0\textbf{15}00\textbf{6}00\textbf{1}$
$n=log_{1'001}N$ $N=1'001^{n}$

Aquí teriamos unha sucesion bastante anódina de valores se non fose polos que aparecen destacados en grosa. Efectivamente son os números combinatorios. Sen facer os cálculos aventuraría que a seguinte cifra da columna da dereita estaría formada polos valores da séptima fila do triángulo de Pascal intercalando un $0$ entre eles e grafándoos sempre con dous caracteres, engadindo un $0$ cando sexa necesario como o $07$ neste caso : $1'00\mathbf{7}0\mathbf{21}0\mathbf{35}0\mathbf{35}0\mathbf{21}00\mathbf{7}00\mathbf{1}$

Agora o crecemento dos valores da columna da dereita é tan lento que os ocos intermedios son realmente pequenos. Claro que isto produce un desacompasamento entre os valores de $n$ (os da primeira columna) e os das correspondentes potencias $N$ (os da segunda columna). Por exemplo para alcanzar o valor $2$ na columna da dereita temos que darlle a $n$ o valor $694$. Podemos intentar corrixir este desacompasamento mediante a seguinte observación:

$$\left( 1'001^{1000} \right)^{\frac{a}{1000}}=1'001^{\frac{1000a}{1000}}=1'001^{a}$$

Así teremos a seguinte táboa que nos presentan os logartimos en base $1'001^{1000}$

$n$ $\left( 1'001^{1000} \right)^{n}$
$0$ $\left( 1'001^{1000} \right)^{0}=1$
$0'001$ $\left( 1'001^{1000} \right)^{0'001}=1'001^{1}=1'001$
$0'002$ $\left( 1'001^{1000} \right)^{0'002}=1'001^{2}=1'002001$
$0'003$ $\left( 1'001^{1000} \right)^{0'003}=1'001^{3}=1'003003001$
$0'004$ $\left( 1'001^{1000} \right)^{0'004}=1'001^{4}=1'004006004001$
$0'005$ $\left( 1'001^{1000} \right)^{0'005}=1'001^{5}=1'005010010005001$
$0'006$ $\left( 1'001^{1000} \right)^{0'006}=1'001^{6}=1'006015020015006001$
$n=log_{1'001^{1000}}N$ $N=\left( 1'001^{1000} \right)^{n}$

Agora os valores das dúas columnas van máis acompasados. Partindo nun principio da base $1'001$, conseguímolo tomando como nova base $1'001^{1000}$. Daquela, de collermos bases que nos permitan unha maior densidade de valores:

 $1'000\, 1$, $1'000\, 01$, $1'000\, 001$, .... deberiamos recorrrer á súas correspondentes melloras:

 $1'000\,1^{10\,000}=\left( 1+\frac{1}{10\,0000} \right)^{10\,000}$, $1'000\,01^{100\,000}=\left( 1+\frac{1}{100\,0000} \right)^{100\,000}$, $1'000\,001^{1000\,000}=\left( 1+\frac{1}{1000\,0000} \right)^{1000\,000}$...

En definitiva, a nosa base ideal virá dada polo límite destes valores:

$$\lim_{x \to \infty}\left( 1+\frac{1}{x} \right)^{x}=2, 718281828459...=e$$

Este número, $e$ é a base dos logaritmos neperianos. Denotarémolos $log_{e}M=lnM$. Trátase dun número irracional (non é unha fracción), aínda máis, é  trascendente (non é solución de ningunha ecuación polinomial con coeficientes enteiros). O raro é que partindo da idea de que os logaritmos en base 2 daban lugar a unha táboa con demasiados ocos (pouco densa) acabamos con logaritmos en base $e=2, 718281828459...$ que dá lugar a ocos aínda maiores. Quizais todo isto parte de que nunca nos atrevimos a mergullarnos en logaritmos de bases menores que $1$. A ver se o facemos na próxima ocasión.

luns, 12 de maio de 2025

Os logaritmos

Introdución aos logaritmos

Vou facer unha confesión terrible. Eu fixen a carreira de Matemáticas sen saber o que eran os logaritmos. Así aprendín que non hai que botar as mans á cabeza cando alguén descoñece un concepto fundamental, sempre e cando teña ferramentas que lle permitan esquivar esta eiva. En efecto, tiña que ter estudado os logaritmos cando cursei 2º de BUP. O profesor explicáranolos pero como foi a final de curso decidiu non facer exame. A pesar de que daquela tiña xa certa querencia pola materia, non mirei nin a primeira vez os apuntes. Así aprendín que se un quer forzar o estudo dun tema, debe telo en conta á hora de avalialo. 

Ao ano seguinte tiven outro profesor que supuxo que todos tiñamos adquiridos os fundamentos dos logaritmos así que cando lle tocou presentarnos a función logarítmica fíxoo de súpeto. Con todo, tivo a boa idea de escribir no encerado as propiedades fundamentais dos logaritmos. A partir dese momento para min os logaritmos eran iso, unha función que verificaba unhas curiosas propiedades.

Con estes antecedentes o día que me tocou a min explicar o que eran os logaritmos enfronteime a un gran problema; antes tiña que sabelo eu. Así que tiven que estudalo por vez primeira. Todas estas circunstancias leváronme a ter que reflexionar moito sobre o seu concepto. Tiña a man moitos libros de texto, pero nunca cheguei a usalos na aula, entre outras razóns porque normalmente os libros de texto non viñan escritos en galego. En todo caso, incluso no breve lapso de tempo no que dispoñiamos de textos de Matemáticas en galego, nunca fun quen de adaptarme á súa prosodia. Pode que sexa defecto meu, non o nego. Con todo prefiro contar as cousas da mesma maneira que me gustaría que mas contaran a min. Sempre perdín moito tempo en intentar ser o máis coidadoso na escolla das palabras e as ideas para as explicacións. De seguido conto como explico en que consisten os logaritmos. Normalmente fágoo en 4º da ESO, aínda que dependendo das circunstancias, pode que teña que adiar o relato para o curso seguinte. 

En primeiro lugar presento unha táboa de potencias de 2 como a seguinte

$n$ $2^{n}$$n$ $2^{n}$$n$ $2^{n}$$n$ $2^{n}$
$0$ $1$ $8$ $256$ $16$ $65.536$ $24$ $16.777.216$
$1$ $2$ $9$ $512$ $17$ $131.072$ $25$ $33.554.432$
$2$ $4$ $10$ $1.024$ $18$ $262.144$ $26$ $67.108.864$
$3$ $8$ $11$ $2.048$ $19$ $524.288$ $27$ $134.217.728$
$4$ $16$ $12$ $4.096$ $20$ $1.048.576$ $28$ $268.435.456$
$5$ $32$ $13$ $8.192$ $21$ $2.097.152$ $29$ $536.870.912$
$6$ $64$ $14$ $16.384$ $22$ $4.194.304$ $30$ $1.073.741.824$
$7$ $128$ $15$ $32.768$ $23$ $8.388.608$ $31$ $2.147.483.648$
$n=log_{2}N$ $N=2^{n}$$n=log_{2}N$ $N=2^{n}$$n=log_{2}N$ $N=2^{n}$$n=log_{2}N$ $N=2^{n}$

Nesta táboa hai que ler as columnas de dúas en dúas. Na columna da esquerda aparece un número $n$ e na segunda o resultado de elevar 2 a ese número, $2^{n}$. Pero tamén podemos ler as columas de dereita a esquerda, así os números da columna da esquerda son os logaritmos en base 2 dos da  correspondente columna da dereita. 

Por exemplo, como $2^{5}=32$ diremos tamén que o $log_2{32}=5$ (o logaritmo en base $2$ de $32$ é $5$).

Cálculo de produtos

Por unha vez imos ter unha clase sen calculadora. Pensemos, por poñernos en situación, que estamos no século XVI. A pesar de non ter calculadora vémonos na obriga de calcular un produto. Non é difícil pero é bastante pesado. Por iso imos intentar simplificar os cálculos facendo uso da táboa das potencias de 2 (ou dos logaritmos en base 2). Queremos calcular o produto $512\cdot8.192$. Para iso debemos buscar na táboa os seus logaritmos. Neste caso o $log_{2}812=9$ e o $log_{2}8.192=13$. Estamos vendo que os logaritmos non son outra cousa que os expoñentes. Agora vén o truquiño. Sumamos os logaritmos $9+13=22$ (se prefires podemos dicir que sumamos os expoñentes) e agora miramos na táboa buscando nas columnas de esquerda o valor $n=22$, daquela o produto é xusto o seu compañeiro da columna da dereita: $512\cdot8.192=4.194.304$. A razón é ben simple:

$$512\cdot8.192=2^{9}\cdot 2^{13}=2^{9+13}=2^{22}=4.194.304$$

Acabamos de ver que os logaritmos transforman os produtos en sumas. Isto é lóxico porque os logaritmos son expoñentes e para calcular o produto de dous números coa mesma base, sumamos os expoñentes. Escrito máis estritamente

$$log_{2}\left( M\cdot N \right)=log_{2}M+log_{2}N$$

No noso caso: $$log_{2}\left( 512\cdot 8.192 \right)=log_{2}512+log_{2}8.192$$

ou $$9+13=22$$


Cálculo de divisións

Continuamos no século XVI (sen calculadoras). Se o procedemento do cálculo de divisións é bastante tedioso e pesado, a realización de divisións a man consiste nun algoritmo que multiplica estas dificultades. Estamos pensando en facer unha división usando números bastante grandes. Os logaritmos, isto é, os expoñentes, volverán a simplificarnos as cousas. Se o cálculo de produtos (complicados) se reduciu ao de sumas (fáciles) é lóxico que o cálculo de divisións (moi complicadas) se reduza a unha (simple) resta. Por exemplo, para facer a división $8.192: 512 $ chega con restar os logaritmos destes números. Vexámolo: $13-9=4$. Velaí que o resultado da división será o número que na táboa lle asignamos ao $4$, isto é $16$. Repasemos as razóns de que isto sexa así:

$$\frac{8.192}{512}=\frac{2^{13}}{2^{9}}=2^{13-9}=2^{4}=16$$

Escribamos estas ideas en forma de logaritmos:

$$log_{2}\left( \frac{M}{N} \right)=log_{2}M-log_{2}N$$

$$log_{2}\left( \frac{8.192}{512} \right)=log_{2}8.192-log_{2}512$$

$$13-9=4$$

Isto é, os logaritmos transforman as divisións en restas.

Chegou o momento de facer uns exercicios para practicar o cálculo de produtos e divisións mediante o uso de logaritmos. Axudarémonos da táboa (de logaritmos) que presentamos máis arriba.

1. Calcula $128\cdot 131.072$

2. Calcula $2.048\cdot 4.096$

3. Calcula $2.097.152 : 131.072$

4. Calcula $262.144 : 256$

5. Calcula $ 129 \cdot 127$ 

6. Calcula $154 \cdot 8744$ 

Non, non me equivoquei no último. Xa o explicarei noutra entrada.

venres, 2 de maio de 2025

Relación entre series infinitas, fraccións continuas teito e constantes. Parte 2: Conxectura de Erdős-Straus.

 

por Andrés Ventas

$\newcommand{\Mod}[2]{\equiv #1\ (\mathrm{mod}\ #2)}$ A conxectura de Erdős-Straus é un problema sen resolver en Teoría de números. A conxectura consiste en que, por cada enteiro $n$ igual ou maior que 2, existen enteiros positivos $x$, $y$, e $z$ para os que

$\dfrac{4}{n}=\dfrac{1}{x}+\dfrac{1}{y}+\dfrac{1}{z}.$

Noutras palabras, o número $4/n$ pode ser escrito como a suma de tres fraccións unitarias.

O nome da conxectura débese a Paul Erdős e Ernst G. Straus, quen a formularon en 1948. As sumas de fraccións unitarias, como a deste problema, coñécense como fracción exipcia , polo seu uso nas matemáticas do antigo Exipto.

Existen varios algoritmos para obter fraccións exipcias, o documento de D. Eppstein ( D. Eppstein,Ten Algorithms for Egyptian Fractions ) mostra 10, o máis famoso deles o algoritmo cobizoso e nós mediante aplicación directa do teorema da suma por pares (visto na parte 1) temos un novo algoritmo que imos comparar co algoritmo cobizoso.

Para a comparación imos usar a fracción $\tfrac{4}{1009}$ onde o denominador é un dos famosos denominadores de Mordell . Mordell mediante unha serie de congruencias obtivo que os únicos denominadores da conxectura de Erdős-Straus que podían non ter solución eran os números primos da forma $840k + (1, 121, 169, 289, 361, 529) $, para $k$ natural. O primeiro primo desa secuencia sería o $840 + 169=1009$.

algoritmo cobizoso consiste en ir ficando cada vez coa fracción unitaria que máis se aproxima á fracción orixinal, restar e repetir o proceso coa seguinte mellor aproximación. O algoritmo das sumas por pares consiste en calcular a fracción continua teito mediante o algoritmo de Euclides e despois usar directamente a suma por pares dos numeradores dos converxentes. Vexamos un exemplo comparativo.

ALGORITMO COBIZOSO

numdenomcociente teitofracción restante
$1009$4$253$$\dfrac{4}{1009}-\dfrac{1}{253} = \dfrac{3}{255277} $
$255277$3$85093$$\dfrac{3}{255277}-\dfrac{1}{85093} = \dfrac{2}{21722285761} $
$21722285761$2$10861142881$$\dfrac{2}{21722285761}-\dfrac{1}{10861142881}$
$= \dfrac{1}{235928849352132817441} $

Resultado $\dfrac{4}{1009} = \dfrac{1}{253} + \dfrac{1}{85093} + \dfrac{1}{10861142881} + \dfrac{1}{235928849352132817441}$

Aparte do algoritmo cobizoso, para obter todas as solucións teríamos que principiar polo denominador $x$ do algoritmo cobizoso e despois escoller un denominador $y$ unha unidade maior e facer ese bucle ata que o denominador cubrise a metade do restante e se non damos atopado solución voltar ao bucle principal e aumentar nunha unidade o denominador $x$. Se chegamos a un denominador inferior a un terzo do valor da fracción sen atopar solución daquela non a hai.

ALGORITMO DAS SUMAS POR PARES

Primeiro aplicamos Euclides teito

numdenomcociente teito $(c_i)$resto
$1009$42533
$4$322
$3$221
$2$120

E agora a fracción continua teito

$c_i$253222
$p_i$2535057571009
$q_i$1234

(os denominadores $q_i$ non son necesarios mais móstranse por completar)

Resultado $\dfrac{4}{1009} = \dfrac{1}{253} + \dfrac{1}{253 \cdot 505} + \dfrac{1}{505 \cdot 757} + \dfrac{1}{757 \cdot 1009}$
$= \dfrac{1}{253} + \dfrac{1}{127765} + \dfrac{1}{382285} + \dfrac{1}{763813}$

Debido a que se temos $\dfrac{4k}{n}=\dfrac{1}{x}+\dfrac{1}{y}+\dfrac{1}{z}$ como suma de tres fraccións unitarias tamén temos $\dfrac{4}{n}=\dfrac{1}{kx}+\dfrac{1}{ky}+\dfrac{1}{kz}$ como suma de tres fraccións unitarias, con este algoritmo só temos que procurar numeradores múltiplos de 4 (para todo $4k \le 2n$). Por exemplo temos:

numdenomcociente teito $(c_i)$resto
$1009$$44=4\cdot 11$233
$44$3151
$3$130

E agora a fct

$c_i$23153
$p_i$233441009
$q_i$11544

Solución $\dfrac{4}{1009} = \dfrac{1}{11 \cdot 23} + \dfrac{1}{11 \cdot 23 \cdot 344} + \dfrac{1}{11 \cdot 344 \cdot 1009}$
$\dfrac{4}{1009} = \dfrac{1}{253} + \dfrac{1}{87032} + \dfrac{1}{3818056}$

PEQUENAS CONCLUSIÓNS

  1. O algoritmo por pares demostra que para un numerador calquera $t$ e fracción $\dfrac{t}{n}$ temos un máximo de $t$ fraccións unitarias e sempre ten solución.
  2. As solucións máis longas son para $1 \equiv n \mod{t}$
  3. A conxectura cúmprese se para calquera $p$ primo impar, existe alomenos un $4k, k \in \mathbb{Z}$ para o que
    $p \Mod{-r_0}{4k}.$
    $4k \Mod{-1}{r_0}.$
  4. Nas probras con ordenador na casa dá que existe solución dada polo algoritmo por pares até $n=10^{9}$, canto máis grande é o denominador máis solucións existen.
  5. Mentres que no caso da conxectura de Erdős-Straus as $fct$ de 3 elementos solucionan todos os denominadores primos, para a variante de Sierpiński hai dous valores de tipo $60k+1$, que non dá solucionado, $\{541, 1381\}$, para denominadors superiores hai varias solucións para cada $n$ tamén máis abundantes canto maior é o denominador $n$.
  6. Unha demostración supoño que chegará da man da teoría de números analítica (tipo Conxectura de Goldbach, ver bibliografia documento de Harald Andres Helfgott), tendo en conta que as solucións son cada vez máis numerosas cando o denominador aumenta, mais as miñas matemáticas non chegan a ese nivel.

Bibliografia

  1. D. Eppstein,Ten Algorithms for Egyptian Fractions
  2. Harald Andres Helfgott The ternary Goldbach problem

luns, 14 de abril de 2025

Relación entre series infinitas, fraccións continuas teito e constantes. Aplicacións (Parte I)

por Andrés Ventas

$ \newcommand{\tei}[1]{\lceil #1 \rceil} \newcommand{\teib}[1]{\Big\lceil #1 \Big\rceil} \newcommand{\R}{{\mathbb R}} $

As fraccións continuas teito (que podemos abreviar como fct) son fraccións continuas que se obteñen aplicando o algoritmo de Euclides usando a función teito en vez da función chan, que é o habitual. Isto produce unha fracción continua onde cada nova fracción da fracción continua resta da anterior.

A propiedade útil é que dela pódese obter sinxeliñamente para un número irracional unha suma de infinitos recíprocos e viceversa, dada unha suma de infinitos recíprocos obtemos unha fracción continua e o seu valor ou os seus converxentes.

Deste modo temos unha terna que se transforma de xeito doado entre si: fraccións continuas, series e constantes irracionais.

A parte onde comento que "dada unha serie de recíprocos obtemos o seu valor pasando pola fracción continua" non é tan feituco como parece porque o cálculo do valor, salvo que a fracción continua sexa periódica dalgún xeito, é un cálculo tan longo como o propio de ir sumando as fraccións unitarias da serie. Non se dá conseguido unha forma pechada salvo de raro en raro.

Entre as aplicacións veremos:

  1. Un uso en modo finito para a conxectura de Erdős-Straus como un novo algoritmo para obter fraccións exipcias (Vaia por diante que aplicación non quere dicir solución, e só outro xeito de afrontar o problema)
  2. Fraccións continuas de series de potencias
  3. Un método directo de obtención de fraccións continuas para as series hiperxeométricas
  4. Obtención de novas series e fraccións continuas de constantes irracionais
  5. Expansión de Engel (ver Advanced problems H-936 Fibonacci Quarterly. 62-2 (2024) p-181 )

Base teórica do algoritmo

Definición $\label{fctdef}$ Unha fracción continua teito, $\tei{c_0, c_1, c_2, c_3, \cdots } = c_0 - \cfrac{1}{c_1 - \cfrac{1}{c_2 - \cfrac{1}{c_3 - {}\ddots}}} $, é unha fracción continua obtida co algoritmo de Euclides usando a función teito, e ten converxentes con fraccións $\dfrac{p_i}{q_i}$ cuxos numeradores $p_i$ e denominadores $q_i$ satisfán unha recorrencia de resta,

$p_i = c_i p_{i-1} - p_{i-2}; \ p_0=c_0; \ p_{-1}=1$.

$q_i = c_i q_{i-1} - q_{i-2}; \ q_0=1; \ q_{-1}=0$.

Escribiremos unha $fct$ como unha enumeración dos seus coeficientes entre os símbolos da función teito, $\tei{c_0, c_1, c_2, c_3, \cdots }$.

Pode ser tentador escribir unha $fct$ do mesmo xeito que unha fracción continua regular con coeficientes negativos, mais é fácil comprobar que non representan o mesmo valor.

Nota: ás veces escribiremos a fracción continua mediante unha forma de tamaño intermedio $x = c_0 - \frac{1}{c_1}{{}\atop-}\frac{1}{c_2}{{}\atop-}\frac{1}{c_3}{{}\atop\!{}-\cdots}$

Teorema: Suma por pares $\label{fct}$ Sexa $\dfrac{1}{x} \in \R$ un número con unha fracción continua teito $\dfrac{1}{x} = \tei{ c_0, c_1, c_2, \dots }$, entón o seu recíproco $x$ é a suma dos recíprocos da multiplicación de pares sucesivos de numeraderes $p_i$ dos seus converxentes, $\begin{equation} \label{Theorem} \begin{aligned} x=\frac{1}{p_0}+\sum_{i=0}^{\infty}{\dfrac{1}{p_i\cdot p_{i+1}}}. \end{aligned} \end{equation}$
Proba:

Dada a suma de Euler $x = a_{0} + a_{0}a_{1} + a_{0}a_{1}a_{2} + \dots $ e a súa fracción continua [p.159, Khrushchev] $x = a_0 - \frac{a_1}{1+a_1}{{}\atop-} \frac{a_2}{1+a_2}{{}\atop-} \frac{a_3}{a+a_3}{{}\atop\!{}-\cdots}$

transformámola para que os numeradores sexan $1$,

$\begin{equation*} \begin{aligned} x &= \dfrac{1}{\frac{1}{a_0}}{{}\atop-}\frac{1}{\frac{(1+a_1)a_0}{a_1}}{{}\atop-}\frac{1}{\frac{(1+a_2)a_1}{a_2 a_0}}{{}\atop-}\frac{1}{\frac{(1+a_3)a_2 a_0}{a_3 a_1}}{{}\atop\!{}-\cdots} \\ & \text{e por definición de $fct$}\\ \dfrac{1}{x} &= \teib {\dfrac{1}{a_0}, \dfrac{(1+a_1)a_0}{a_1}, \cdots, \dfrac{(1+a_i)a_{i-1}a_{i-3}\cdots}{a_i a_{i-2} a_{i-4} \cdots}, \cdots }. \end{aligned} \end{equation*} $

Denotamos esta fracción continua como $\dfrac{1}{x}=\tei{c_0, c_1, \cdots, c_i, \cdots }$, igualamos os coeficientes e resolvemos para os $a_i$,
$\begin{equation*} \begin{aligned} & a_0 = \frac{1}{c_{0}},\ a_1 = \frac{a_0}{c_{1}-a_0}, \ a_2 = \frac{a_1}{c_{2}a_{0}-a_1}, \ a_3 = \frac{a_{2}a_{0}}{c_{3}a_{1}-a_{2}a_{0}}, \cdots \\ & a_i = \frac{a_{i-1}a_{i-3}\cdots}{c_{i}a_{i-2}a_{i-4}...-a_{i-1}a_{i-3}\cdots}. \end{aligned} \end{equation*}$

Usando a identidade dos numeradores dos converxentes $p_i = c_i p_{i-1} - p_{i-2}$, temos $\begin{equation*} \begin{aligned} a_0 &= \dfrac{1}{c_0} = \dfrac{1}{p_0}. \\ p_1 &= c_{1}p_{0}-1, \ a_1 = \frac{a_0}{c_{1}-a_0} = \dfrac{1/c_0}{c_{1}-(1/c_{0})} = \dfrac{1}{c_{1}c_{0}-1} = \frac{1}{c_{1}p_{0}-1} = \dfrac{p_{-1}}{p_1}.\\ a_i &= \frac{a_{i-1}a_{i-3}...}{c_{i}a_{i-2}a_{i-4}...-a_{i-1}a_{i-3}...} =\frac{p_{i-2}}{p_{i}}. \end{aligned} \end{equation*} $

Agora substituimos en $x$ e usamos suma telescópica

$ \begin{equation*} \begin{aligned} x &= a_{0} + a_{0}a_{1} + a_{0}a_{1}a_{2} + a_{0}a_{1}a_{2}a_{3} + \cdots\\ &=\dfrac{1}{p_0} + \dfrac{1}{p_0}\dfrac{1}{p_1} + \dfrac{1}{p_0}\dfrac{1}{p_1}\dfrac{p_0}{p_2} + \dfrac{1}{p_0}\dfrac{1}{p_1}\dfrac{p_0}{p_2}\dfrac{p_1}{p_3} + \cdots\\ &=\frac{1}{p_0} + \frac{1}{p_0}\dfrac{1}{p_1} + \dfrac{1}{p_1}\frac{1}{p_2} + \dfrac{1}{p_2}\dfrac{1}{p_3}+\cdots \\ &=\dfrac{1}{p_0} + \sum_{i=0}^{\infty} \dfrac{1}{p_i}\dfrac{1}{p_{i+1}}. \end{aligned} \end{equation*} $

Fin da proba.

Nota: Oskar Perron (1957) e Gautam Gopal (2016) mostran unha fórmula similar para series alternas tendo en conta os denominadores dos converxentes dunha fracción continua regular (recorrencia dos converxente con signo positivo): $x = [a_0, a_1, a_2, \ldots ] = a_0 + \sum_{n=0}^\infty \dfrac{ (-1)^n }{q_{n}q_{n+1}}.$

Vese ben a partir do teorema da suma por pares que dada unha serie infinita podemos obter mediante o reverso deste método unha fracción continua co valor recíproco da suma.

Corolario 1: Dado $S = \dfrac{1}{a_0} + \dfrac{1}{a_0 a_1} + \dfrac{1}{a_1 a_2} + \dfrac{1}{a_2a_3} + \cdots$, temos $p_i = \{a_0, a_1, a_2, a_3 \ldots \}$

e por tanto temos a $fct$: $\dfrac{1}{S}=\teib{a_0, \dfrac{a_1 + 1}{a_0}, \dfrac{a_2 + a_0}{a_1}, \dfrac{a_3 + a_1}{a_2}, \dfrac{a_4 + a_2}{a_3}, \cdots }$

Se os denominadores non van multiplicados en cadea sempre se pode forzar do seguinte xeito

Corolario 2: Dado $S = \dfrac{1}{a_0} + \dfrac{1}{a_1} + \dfrac{1}{a_2} + \dfrac{1}{a_3} + \cdots$, temos $p_i = \{a_0, \dfrac{a_1}{a_0}, \dfrac{a_2 a_0}{a_1}, \dfrac{a_3 a_1}{a_2 a_0}, \ldots \}$

e por tanto temos a $fct$: $\dfrac{1}{S}=\teib{a_0,\dfrac{\tfrac{a_1}{a_0}+ 1}{a_0}, \dfrac{a_0+\tfrac{a_2 a_0}{a_1}}{\tfrac{a_1}{a_0}}, \dfrac{\tfrac{a_1}{a_0}+\tfrac{a_3 a_1}{a_2 a_0}}{\tfrac{a_2a_0}{a_1}}, \cdots }$

Para as series de potencias imos definir unha nomenclatura similar ao duplo factorial que se aplique aos índices. Imos denotar $a_{i!!}=a_i a_{i-2} a_{i-4} a_{i-6} \ldots $ sendo $a_{-1}=1$ e para o resto $i \ge 0$.

Se temos unha serie que sexa de tipo Taylor ou Maclaurin con factoriais no denominador e coeficientes e potencias de $x$ no numerador. teríamos:

Corolario 3: Dado $S_T = \dfrac{a_0}{0!} + \dfrac{a_1 x}{1!} + \dfrac{a_2 x^2}{2!} + \dfrac{a_3 x^3}{3!} + \cdots$, temos $p_i = \Big\{\dfrac{1}{a_0}, \dfrac{a_0}{a_1 x}, \dfrac{2!! a_1}{a_2 a_0 x}, \dfrac{3!!a_2 a_0}{a_3 a_1 x^2}, \ldots \Big\} = \Big\{ \dfrac{n!! a_{(n-1)!!}}{a_{n!!} x^{\lceil n/2 \rceil}} ,\ldots \Big\}$

e coma sempre temos a $fct$: $\dfrac{1}{S_T}=\teib{p_0, \dfrac{p_i + p_{i-2}}{p_{i-1}}, \cdots }$ con $p_{-1}=1$.

Nota: veremos en publicacións posteriores unha expresión máis simple destas últimas fórmulas na forma de fracción continua xeneralizada )

Exemplos

Exemplo 1. Serie a partir de fracción continua.

Como primeiro exemplo usaremos a miña constante favorita, a constante Pena Trevinca, $\tau=\tei{3, 3, 3, 3, \cdots}$, que ten valor $2.618033\ldots = \phi +1 = \phi^2$ (ver Mathematical Student problema 8). Así temos os converxentes $p_i/q_i$

$c_i$ 3 3 3 3 $\cdots$
$p_i$ 1382155$\cdots$
$q_i$ 013821$\cdots$

Aplicando o Teorema de suma por pares

$\dfrac{1}{\tau} = (\tei{3,3,3, \ldots})^{-1} = \dfrac{1}{3}+\dfrac{1}{3 \cdot 8}+\dfrac{1}{8 \cdot 21}+\dfrac{1}{21 \cdot 55}+ \cdots $.

(non sería necesario calcular os denominadores dos converxentes, pero facémolo por completar)

$\dfrac{1}{\tau} = 0.38196\ldots $ e truncando a suma infinita no cuarto sumando temos $\dfrac{1}{\tau} = \dfrac{21}{55} = 0.3818 \ldots$

Exemplo 2. Fracción continua a partir de serie.

Como segundo exemplo imos calcular unha fracción continua para $\dfrac{1}{e^x}$ e concretando para $\dfrac{1}{\sqrt{e}}$ Temos que $e^x=\dfrac{1}{0!}+\dfrac{x}{1!}+\dfrac{x^2}{2!}+\dfrac{x^3}{3!}+ \cdots$

Que seguindo o corolario 3, os numeradores dos converxentes son $p_i=\Big\{1, \dfrac{1}{x} , \dfrac{2}{x} , \dfrac{3}{x^2} , \dfrac{2\cdot 4}{x^2}, \dfrac{3\cdot 5}{x^3}, \dfrac{2\cdot 4\cdot 6}{x^3}, \ldots \Big\} $

E igualmente polo corolario 3 obtemos os coeficientes da $fct$ sumando alternos e dividindo polo do medio, $\dfrac{1}{e^x}=\teib{1, \dfrac{1}{x}+1, x+2, \dfrac{x+3}{2x}, \dfrac{2x+4\cdot 2}{3}, \cdots}$

Imos mostrar unha táboa completa para $e^{-1/2}=0.60653\ldots$

$c_i$ de $e^{-1/2}$ 1 3$\dfrac{5}{2}$ $\dfrac{7}{2}$3 $\cdots$
$p_i$11241232$\cdots$
$q_i$ 013$\dfrac{13}{2}$$\dfrac{79}{4}$$\dfrac{211}{4}$$\cdots$
converxentes 1$\dfrac{2}{3}$$\dfrac{8}{13}$$\dfrac{48}{79}$$\dfrac{128}{211}$$\cdots$
valor 1$0.66\ldots$$0.61\ldots$$0.607\ldots$$0.60663\ldots$$\cdots$

Os converxentes das fraccións continuas teito aproximan o valor só por un lado ao contrario que as fraccións continuas regulares que o aproximan alternativamente por valores superiores decrecentes e valores inferiores crecentes.

Exemplo 3. Valor da suma a partir da fracción continua.

Existen moitas probas de que a suma dos recíprocos dos números oblongos (o duplo dos triangulares) vale 1 (ver A002378 Oblong (or promic, pronic, or heteromecic) numbers: a(n) = n*(n+1).. )

Imos dar unha nova proba:

$S_{ob}=\sum_{n=1}^{\infty}\dfrac{1}{n(n+1)}=\dfrac{1}{2}+\dfrac{1}{6}+\dfrac{1}{12}+\dfrac{1}{20} + \cdots$

$p_i=\{2, 3, 4, 5, \ldots \}$

$c_i=\{2, (3+1)/2=2, (4+2)/3=2, (5+3)/4=2, \ldots \}$ e por tanto $S_{ob}=(\tei{2,2,2,2, \ldots})^{-1}$

$c_i$ 2 22 22 $\cdots$
$p_i$123456$\cdots$
$q_i$ 012345$\cdots$

Dai temos, polos converxentes, que $S_{ob}=\lim_{n \to \infty} \dfrac{q_i}{p_i}=\lim_{n \to \infty}\dfrac{n}{n+1}=1$.

Exemplo 4. Unha serie para $4-\pi$.

A serie de Leibniz para $\frac{\pi}{4}$ é

a serie alternada $\dfrac{\pi}{4}=\dfrac{1}{1}-\dfrac{1}{3}+\dfrac{1}{5}-\dfrac{1}{7}+\cdots-\cdots$.

Se sumamos de dous en dous temos a serie non alternada $\dfrac{\pi}{4}=\dfrac{2}{1\cdot 3}+\dfrac{2}{5\cdot 7}+\cdots=\sum_{n=0}^{\infty}\dfrac{2}{(4n+1)(4n+3)}$.

Se o levamos ao noso terreno podemos construír a serie con multiplicación por pares $S_{imp}=\dfrac{1}{1\cdot 3}+\dfrac{1}{3\cdot 5}+\cdots$ que ten $p_i=\{3, 5, 7, 9, 11, \ldots \}$ e por tanto $c_i=\tei{3,2,2,2,2,2, \ldots}$ agora se calculamos os converxentes:

$c_i$ 3 22 22 $\cdots$
$p_i$1357911$\cdots$
$q_i$ 012345$\cdots$

E con isto temos que $S_{imp}=\lim_{n \to \infty} \dfrac{q_i}{p_i}=\lim_{n \to \infty}\dfrac{n}{2n+1}=\dfrac{1}{2}$.

Como puxemos numerador $1$ dividimos por $2$ e restamos no lado esquerdo os valores e restamos no dereito as series

$\dfrac{1}{2}-\dfrac{\pi}{8} = \dfrac{4 - \pi}{8} = \dfrac{1}{3\cdot 5}+\dfrac{1}{7\cdot 9}+\dfrac{1}{11\cdot 13}+\cdots$.

E finalmente multiplicando por $8$ temos $4-\pi = \sum_{n=0}^{\infty}\dfrac{8}{(4n+3)(4n+5)}$.

P.E: Non teño atopado moita literatura sobre este tipo de fraccións continuas mais parece ser que nalgures refírense a elas como "slow continued fractions". Usualmente aproximan ao número máis lentamente que as fraccións continuas regulares, cando relamente debería ser ao revés pois só aproximan por un lado. Na miña experiencia isto ven sendo debido a que se atoan moitas veces no número $2$ como coeficiente. Iso tamén implica que non cumpran coa constante de Khinchin .

Bibliografia

  1. Gautam Gopal, Continued Fractions, Theorem 4.7 p-17
  2. Sergey Khrushchev, Orthogonal Polynomials and Continued Fractions Encyclopedia of Mathematics and its Applications. Cambridge University Press 122 (2008), 159
  3. Perron, Oskar, Die Lehre von den Kettenbrüchen.Teubner Verlag. 2 (1957) p-17.
  4. Ventas, A., Advanced problems H-936 Fibonacci Quarterly. 62-2 (2024) p-181
  5. Ventas, A., Mathematical Student. 93 (3-4) (2024) Problem 8. p-213

martes, 25 de marzo de 2025

A derivada e a inversa. Unha conexión dourada

Entre os meus terrores didácticos está esa famosa táboa de derivadas. Nunca entreguei aos meus alumnos un espanto dese tipo. Seguramente non o fixen porque tiven a sorte de que a min, como alumno, tampouco ma entregaran. Unha das aberracións que son consecuencia desta práctica consiste en expulsar a regra da cadea do ensino. Así convertemos o cálculo de derivadas nun algoritmo sen sentido, cunhas regras tan arbritarias que se pode calcular a derivada dunha composición de funcións sen ter nin a máis mínima idea do que é a composición de funcións. Elimínase así a dedución das propiedades e das fórmulas de derivación. Algúns pensarán que é un alivio pois así non perderemos un tempo que sempre anda escaso pola sobredimensión dos currículos. Daquela, para que estudar os límites? Quizais para outro cálculo absurdo con outras regras absurdas. 

Xa que a mencionamos anteriormente, enunciarémola:

A regra da cadea. Dadas dúas funcións $f$ e $g$ a derivada da composición $ g_{\circ } f$ será 

$$\left ( g_{\circ }f \right )'(x)=g'\left [ f\left ( x \right ) \right ]\cdot f'(x)$$

Unha consecuencia inmediata deste mesmo resultado é a derivación da inversa dunha función. 

Teorema da derivada da función inversa. $$\left (f^{-1}  \right )'(x)=\frac{1}{f'\left [ f^{-1} \left ( x \right )\right ]}$$

Noutra ocasión, abordando o tema dos erros achegáramonos a este teorema pois dá lugar a que a súa compresión sexa dificultosa por usarmos o termo inversa, un termo que pode ter outras acepcións. A isto engádeselle que a notación de derivada dunha función $f'$ e o de inversa dunha función $f^{-1}$ son tipograficamente moi semellantes. 

A demostración deste ultimo resultado aséntase, necesariamente, no concepto de función inversa. Lembremos que a inversa dunha función $f$, que denotaremos por $f^{-1}$ é aquela función que composta con $f$ nos dá a función identidade $I(x)=x$. Poderemos escribir, xa que logo, $f^{-1}_{\circ}f=f_{\circ}f^{-1}=I$. Non teño claro que procedo ben, pero atendendo ás anteriores consideracións, para demostrar na clase este resultado, renomeo a función inversa coa letra grega $\varphi=f^{-1} $. Así a propiedade definitoria da función inversa transcribiriamola agora $\varphi{\circ}f=f_{\circ}\varphi=I$. Aplicándolle a regra da cadea á igualdade $(\varphi_{\circ}f)(x)=I(x)$ teremos:

$$(\varphi_{\circ}f)'(x)=f'\left[ \varphi\left( x \right) \right]\cdot\varphi'\left( x \right)=1$$

$$\varphi'\left( x \right)=\frac{1}{f'\left[ \varphi\left( x \right) \right]}$$

Volvendo á notación orixinal para a inversa temos o resultado buscado:

$$\left (f^{-1}  \right )'(x)=\frac{1}{f'\left [ f^{-1} \left ( x \right )\right ]}$$

Quixo a azarosa casualidade da navegación pola arañeira de internet que todas estas consideracións ás que me achegara en moitas ocasións, se conectaran dunha forma realmente brillante mediante a seguinte cuestión:

Problema. Achar a función $f$ tal que $f'$=$f^{-1} $

A azarosa casualidade foi este vídeo de Michael Penn que vou seguir de aquí en diante para dar a solución. 

Algo de traballo sumado a un todo e nada de intuición pode levarnos polo bo camiño se conxecturamos que a solución ten a forma $f\left( x \right)=ax^{n}$.

Escribamos a función da forma $y=ax^{n}$ e intercambiemos $x$ con $y$ para calcular a inversa. Obtemos $x=ay^n$. Despexando $y$: $f^{-1}(x)=y=\sqrt[n]{\frac{x}{a}}$

Por outra banda, calculemos a derivada: $f'\left( x \right)=a\cdot nx^{n-1}$

Igualamos $f'$ a $f^{-1}$: 

$$a\cdot nx^{n-1}=\sqrt[n]{\frac{x}{a}}$$

Elevando a $n$ os dous membros e operando:

$$a^{n} n^{n}x^{n^{2}-n}=\frac{x}{a}$$

$$a^{n+1} n^{n}x^{n^{2}-n-1}=1\quad\quad [1]$$

$$x^{n^{2}-n-1}=\frac{1}{n^{n}a^{n+1}}$$

O segundo membro é unha constante, de aí que o expoñente da variable $x$ teña que ser $0$, isto é $n^{2}-n-1=0$. Pero esta é unha ecuación moi famosa, que ten como solucións o número áureo e o seu inverso cambiado de signo:

$$n_{1}=\frac{1+\sqrt{5}}{2}=\phi\quad\quad\quad n_{2}=\frac{1-\sqrt{5}}{2}=-\frac{1}{\phi}$$

Quizais, pecando de pesado, vou volver a lembrar algunhas das propiedades básicas do número $\phi$ e que poderemos usar en calquera momento, sen outro aviso engadido.

$$\phi^{2}=\phi+1\quad\quad \phi=1+\frac{1}{\phi}\quad\quad \phi-1=\frac{1}{\phi}$$

Con todo o deducido nas últimas liñas e escollendo a primeira solución $n_{1}$ podemos volver a reescribir a expresión [1] con esta nova fasquía:

$$\phi^{\phi}a^{\phi+1}\cdot1=1$$

$$\phi^{\phi}a^{\phi^{2}}=1$$

Tomando a raíz $\phi$-ésima nos dous membros:

$$\phi a^{\phi}=1$$

$$a=\left( \frac{1}{\phi} \right)^{\frac{1}{\phi}}$$

Velaí que a función buscada é $f\left( x \right)=\left( \frac{1}{\phi} \right)^{\frac{1}{\phi}}x^{\phi}=\left( \phi-1 \right)^{\phi-1}x^{\phi}$

A expresión da función brilla con luz propia.

Outro método

Sempre resulta agradable resolver un problema seguindo camiños distintos. Xa que tratamos un pouco antes o teorema da función inversa, quizais non sería mala idea empregalo. De facérmolo así, escribindo na fórmula que nos dá o teorema da función inversa $f'$ no canto de $f^{-1}$ teremos:

$$\left( f' \right)'(x)=\frac{1}{f'\left[ f'\left( x \right) \right]}$$

Agora ben, se por unha banda o que nos aparece no primeiro membro é a segunda derivada, $\left( f' \right)'(x)=f''(x)$, a expresión do segundo membro non o é. Aclarámolo todo nas seguintes liñas.

Como no caso anterior, partimos de que $f\left( x \right)=ax^{n}$ polo que $f'(x)=nax^{n-1}$

$$f''(x)=n\left( n-1 \right)ax^{n-2}$$

$$f'\left[ f'(x) \right]=na\left( f'(x) \right)^{n-1}=na\left( nax^{n-1} \right)^{n-1}=n^{n}a^{n}x^{(n-1)^{2}}$$

O produto das anteriores expresións ten que dar $1$

$$n^{n+1}a^{n+1}\left( n-1\right)x^{n^{2}-n+1}=1$$

As mesmas consideracións feitas na anterior dedución implican que o expoñente da variable debe ser $0$ e así obtemos a mesma ecuación cuadrática para $n$. Ademais así eliminamos a variabe na anterior expresión e quédannos unicamente as constantes. Tomando $n_{1}=\phi$ teremos:

$$\phi^{\phi+1}a^{\phi+1}\left( \phi-1 \right)=1$$

$$\phi^{\phi+1}a^{\phi+1}\frac{1}{\phi}=1$$

$$\phi^{\phi}a^{\phi+1}=1$$

$$\phi^{\phi}a^{\phi}a=1$$

Tomando a raíz $\phi$-ésima e despexando:

$$\phi aa^{\frac{1}{\phi}}=1$$

$$\phi a^{1+\frac{1}{\phi}}=\phi a^{\phi}=1$$

E así, outra vez

$$a=\left( \frac{1}{\phi} \right)^{\frac{1}{\phi}}$$

Un último apuntamento

Nos cálculos anteriores estivemos usando sempre o valor $n_{1}=\phi$ pero resulta que a ecuación da que o obtivemos ese valor tiña outra solución: $ n_{2}=-\frac{1}{\phi}$. Neste caso chegaremos a outra función que tamén é solución do problema, $f\left( x \right)=\left( 1-\phi \right)^{\phi}x^{1-\phi}$. Reto ao lector, se o houber, a que faga el mesmo a dedución.

mércores, 5 de marzo de 2025

A outra fórmula do outro Bhaskara

Cando escoito o nome de Bhaskara inmediatamente penso na súa filla, a súa curiosa lenda e o libro que Bhaskara lle adicou e co que comparte nome, Lilavati. O libro foi editado pola RSME-SM dentro da colección Biblioteca de Estímulos Matemáticos. De aí recollo o seguinte problema e a súa resolución.

LXXVIII. A raíz da metade dun enxamio de abellas liba néctar de xasmíns, outras oito novenas partes o mesmo van facer. Faltan dúas, das que unha é cautiva dos lotos, prendida polo seu recendo. Dime miña querida, cantas zoantes abellas conforman ese panal.

Se identificamos o total de abellas con $2x^{2}$ poderemos establecer a seguinte ecuación 

$x-\frac{8}{9}\left( 2x^{2} \right)+2=2x^{2}$. Resolvéndoa veremos que $x=6$ e polo tanto o enxamio estará conformado por un total de $2x^{2}=72$ abellas.

Tanto no Lilavati  como noutra obra súa,  Bijaganita, Bhaskara estuda problemas cuadráticos. Quizais por esta razón André Pérez y Marín comentou nunha nota a pé de páxina no libro Lições de algebra publicado no 1909 que o método de resolución dunha ecuación cuadrática $ax^{2}+bx+c=0$ dado pola coñecida fórmula que vén a continuación debémosllo a Bhaskara.

$$x=\frac{-b\pm \sqrt{b^{2}-4ac}}{2a}$$



André Pérez y Marín
 André Pérez y Marín (1858-1928), nacido en Logroño (España), estuda en Madrid e comeza a impartir clase aos 18 anos. Aos 35 anos chega a Brasil onde durante un tempo  exerce de profesor particular. Co comezo do século XX accede a unha praza no Ginásio de Campinas, onde desenvolve o seu traballo docente ata o seu pasamento. Escribe dez libros de matemática escolar que tiveron moitas edicións. En varios deles repite a referida anotación de que a resolución das ecuacións cuadráticas se debe a Bhaskara. Este apuntamento sería reproducido por autores brasileiros posteriores e acabaría tendo certo éxito ata o punto de que hoxe en día a "fórmula de Bhaskara" non só se utiliza en Brasil, senón que ten certa sona internacional. Basta con facer unha búsqueda pola rede para comprobalo.


O outro Bhaskara e a outra fórmula

Pero desta volta non me vou referir a este matemático do século XII, tamén identificado como Bhaskara II, senón que trataremos sobre unha contribución de Bhaskara I, que viviu uns 500 anos antes, no século VII. 

Antes de nada, incluso antes de introducila, enmarquemos historicamente a achega de Bhaskara I. Para iso temos que ir ao século anterior, o VI, onde encontramos os primeiros tratados astronómicos hindúes. Os seus autores, Ariabata e Varahamihira curiosamente xa usaban o seno, no canto da corda dun ángulo. Eles e outros moitos continuaron o proxecto heleno de elaborar táboas trigonométricas. Segundo o que acabamos de dicir, na época grega esta táboas eran táboas de cordas, a partir da revisión hindú, comezaron a ser táboas de senos. Para aclarar do que estamos a falar, consideremos unha circunferencia de raio 1. Con vértice o centro $O$ trazamos un ángulo $\widehat{AOB}=2\theta$  que determinará unha corda da circunferencia $\overline{AB}$. A este valor denominámolo corda de $2\theta$ que escribiremos $crd(2\theta)=\overline{AB}$. De todos é sabido que o seno de $\theta$ é $sen\theta=\overline{AM}$. Basta con observar a seguinte imaxe para decatarse de que $crd\left(2 \theta\ \right) =2\cdot sen\theta$


A aportación de Bhaskara I foi realmente insólita. Hoxe diriamos que para ángulos de entre 0 e 180 graos ofreceu unha aproximación da función sinusoidal mediante unha función racional

$$sen\theta = R\cdot\frac{4\theta\left( 180-\theta \right)}{40500-\theta\left( 180-\theta \right)}$$

Velaquí as dúas funcións, a do seno e a súa aproximación, xunto co erro que cometemos. Tomamos, como é habitual hoxe en día $R=1$. O máis divertido é facer zoom ata poder ver ese erro.

De onde sacou Bhaskara I esa fórmula? Gen van Brummelen no seu libro The Mathematics of the Heavens and The Earth. The Early History of Trigonometry (Princenton University Press 2009) propón unha resposta con bastante cautela pois segue considerendo todavía un enigma a verdadeira liña de razoamento de Bhaskara. O argumento iníciase a partir da seguinte figura. Calculamos a área do triángulo $ABC$ de dúas formas distintas:

$área ABC=\frac{1}{2}AB\cdot BC=\frac{1}{2} BD\cdot AC$ De aí que $AB\cdot BC= BD\cdot AC$

$$sen\theta=R\cdot BD=\frac{R\cdot AB\cdot BC}{AC}\lt \frac{R \cdot \overset{\LARGE\frown}{AB}\cdot \overset{\LARGE\frown}{BC}}{2R}=\frac{\theta\left( 180-\theta \right)}{2}$$

Invertendo os termos teremos esta desigualdade:

$$\frac{1}{sen\theta}\gt \frac{2}{\theta\left( 180-\theta \right)}$$

Agora usaremos un método habitual entre os matemáticos hindús insertando un par de parámetros $x$ e $y$ que nos permitirían establecer a igualdade: $$\frac{1}{sen\theta}=x\cdot\frac{2}{\theta\left( 180-\theta \right)}+y\quad\quad [1]$$

Para os ángulos de $30$ e $90$ teremos que $sen30=\frac{R}{2}$ e $sen90=R$. Disto deducimos un sistema que resolvemos:

$$\left.\begin{matrix} \frac{2}{R}=\frac{2x}{30\cdot 150}+y \\\frac{1}{R}=\frac{2x}{90\cdot 90}+y \end{matrix}\right\} \left.\begin{matrix} \frac{2}{R}=\frac{2x}{4500}+y \\\frac{1}{R}=\frac{2x}{8100}+y \end{matrix}\right\} \left.\begin{matrix} 9000=2Rx+4500Ry \\8100=2Rx+8100Ry \end{matrix}\right\} \left.\begin{matrix} 2Rx=9000-4500Ry\\2Rx=8100-8100Ry \end{matrix}\right\}$$
$9000-4500Ry=8100-8100Ry$
$y=\frac{-900}{3600R}=\frac{-1}{4R}$
Substituíndo na primeira das ecuacións do sistema:
$2Rx=9000-4500R\cdot\frac{-1}{4R}=10125$
$2x=\frac{10125}{R}$
Finalmente substituímos os valores destes parámetros en [1]
$$\frac{1}{sen\theta}=\frac{10125}{R}\frac{1}{\theta\left( 180-\theta \right)}-\frac{1}{4R}=\frac{1}{R}\frac{40500-\theta\left( 180-\theta \right)}{4\theta\left( 180-\theta \right)}$$
Volvendo a inverter os dous membros da igualdade chegamos ao resultado desexado:
$$sen\theta = R\cdot\frac{4\theta\left( 180-\theta \right)}{40500-\theta\left( 180-\theta \right)}$$
Por último unha aclaración e un dato curioso. Co fin de adptar as anteriores consideracións ao punto de vista actual, tomáronse sempre circunferencias de raio 1, porén en cada época, incluso en cada autor teremos distintos valores do raio. Por exemplo Ptolomeo fixo as súas táboas para $R=60$ e utilizou un sistema numérico sexaxesimal. Bhaskara I e os seus predecesores Ariabata e Varahamihira utilizaban un valor realmente chamativo: $R=3438$$. Que sentido tiña escoller ese número?
Nunha circunferencia hai 360º, polo tanto $360 \cdot 60=21600'$, Se igualamos esta cantidade á lonxitude dunha circunferencia $2\pi R=21600$ e despexamos: $R=\frac{21600}{2\pi}=3438$

venres, 14 de febreiro de 2025

Xogando co teorema central do límite

Eu saín da Facultade de Matemáticas no ano 1990. O plan de estudos vixente naquela altura consistía en cursar 4 materias anuais Das que 3 eran fixas: Álxebra, Análise e Topoloxía/Xeometría. A cuarta materia, que para min significou sempre un horror,  era Física (en 1º), Cálculo Numérico (en 2º) e Estatística (en 3º). A partir de aquí había dúas vías para os dous últimos cursos, unha delas era Estatística e a outra Matemáticas Xerais. Esta última consistía nunha longa lista de materias con distintos niveis de optatividade. 

Sendo así as cousas eu só tiven unha materia de Estatística en toda a carreira,..e non a aproveitei moito. Creo recordar que no departamento axustaban a nota en función dos resultados. Como normalmente as notas eran bastante malas, o aprobado acababa baixando a un valor arredor do 4. Eu agarrábame a iso para transitar pola materia co menor dano posible. O triste do conto foi cando me chegou o momento de ter que explicar o teorema central do límite... e claro, eu non tiña nin idea de que trataba o asunto. 

A cousa non acabou en desastre total grazas a un libro, Matemática moderna aplicada. Probabilidades, estadística e investigación operativa (Alianza Universidad 1993), de J. C. Turner. A partir de aquí vou seguir a Turner, case letra a letra. Nun dos capítulos explica o que son as distribucións mostrais. Comeza co seguinte exemplo:

Tíranse 50 veces catro dados equilibrados. Apúntanse de cada vez os números obtidos. Despois calcúlase a media de cada mostra deses catro números. Un exemplo dun deses resultados sería:

Mostra: 1, 5, 6, 4

Media: $\overline{X}=4$

Antes de comezar a estudar a proposta, lembremos en que consiste a distribución orixinal, a do lanzamento dun dado. É ben simple, hai 6 posibles resultados e cada un deles ten a mesma probabilidade $\frac{1}{6}$. A media desta variable aleatoria discreta é $\mu=3'5$ e o seu desvío padrón é $\sigma=1'7078$. Por suposto, este estudo xa o temos feito na clase desde hai tempo.

A función $\overline{X}=\frac{X_{1}+X_{2}+X_{3}+X_{4}}{4}$ é un estatístico mostral. Cada vez que tomamos unha mostra podemos calcular o seu valor. Pero $\overline{X}$ é tamén unha variable aleatoria. A cuestión consiste en deducir como é a distribución mostral das medias $\overline{X}$ a partir dos valores mostrais. Agora é cando cobra sentido realizar o experimento moitas veces (50 no noso exemplo). Que é o que observamos?

Como na entrada anterior, podemos xogar coa seguinte folla de cálculo que simula o proceso. Hai dúas alternativas para traballar coa seguinte ferramenta. Marcadas en amarelo aparecen as medias de cada lanzamento de catro dados.

  • A mellor é descargar a folla de cálculo. Se queremos recalcular os datos basta premer F9
  • Podemos facelo on-line. Nese caso debemos recargar de novo a páxina ou, o que é o mesmo premer Maíuscula+F5



A distribución mostral das medias, $\overline{X}$, é moi diferente á poboación orixinal (lanzamento dun dado). Pensemos que resultará moi improbable obter resultados extremos para $\overline{X}$. Para que $\overline{X}$ tome o valor $1$ só hai unha mostra posible: $(1,1,1,1)$. Porén para obter un resultado intermedio para $\overline{X}$ como $3$ temos moitas posibilidades: $(3,3,3,3)$, $(2,3,4,3)$, $(3,1,6,2)$, $(3,1,2,6)$,... (Unha boa cuestión sería averiguar cantas tiradas distintas terán $3$ de media). Por esta razón a distribución $\overline{X}$ tomará valores no centro da distribución orixinal con máis frecuencia. Ademáis é bastante plausible que o centro da distribución $\overline{X}$ coincida coa media da distribución base, $\mu=3'5$, que é unha distribución discreta que xa estudamos máis arriba, na que a cada un dos posibles resultados lle asignamos unha probabilidade de $1/6$. Se pensamos o que sucedería se no canto de lanzar catro dados, lanzamos seis, pronto nos convenceriamos de que aumentaría a concentración de $\overline{X}$ arredor do centro. A dispersión de $\overline{X}$ diminuirá ao aumentar o tamaño da mostra $n$. 
Que máis podemos dicir sobre a relación entre a distribución orixinal e a distribución mostral das medias? Se observamos o diagrama obtido nas mostras de catro datos (e podemos facelo repetidamente varias veces usando a folla de cálculo) veremos que as frecuencias relativas caen rapidamente a ambos lados da media $\mu$. Aínda que feblemente, a gráfica ten un aire coa curva normal teórica coa mesma media e cun desvío padron $\frac{\sigma}{\sqrt{n}}$. Se $n$ é o suficientemente grande a distribución $\overline{X}$ pódese axustar por esta curva normal. Convén fixarse en que a distribución orixinal é un rectángulo, moi distinta da forma da distribución $\overline{X}$. Isto que acabamos de explicar é o teorema central do límite. Podémolo enunciar, con algo máis de pompa, deste xeito:

Teorema Central do Límite. Dada unha variable aleatoria $X$ calquera, consideremos mostras de tamaño $n$ desta distribución $\left( X_{1},X_{2},...,X_{n} \right)$. A distribución mostral das medias $\overline{X}=\frac{\sum_{i=1}^{n}X_{i}}{n}$ aproxímase a unha variable aleatoria normal $N\left( \mu,\frac{\sigma}{\sqrt{n}} \right)$

É difícil determinar cal debe ser o valor de $n$ para ter un bo axuste. Con todo, para mostras ben pequenas, de tamaño 4, xa vimos que $\overline{X}$ vai collendo un aire. Para mostras de tamaño $n\ge 30$ poderemos aplicar o teorema sen medo.

venres, 7 de febreiro de 2025

Xogando coa lei dos grandes números

Lembro que desde bastante novo tiven a ilusión de ser profesor de matemáticas. Quizais por esa razón recordo moi vívidamente as clases de matemáticas que me impartiron, sobre todo durante a época do instituto. Daquela a probabilidade e a estatística apenas estaba presente no temario que se impartía. En consecuencia, nos meus tempos de estudante só recibín unha definición de probabilidade e precisamente por iso resultaba algo estraña. Era a chamada definición de probabilidade de Laplace: se A é un suceso a súa probabilidade $P(A)$ vén dada por $$P(A)=\frac{número\quad de\quad casos\quad favorables\quad a\quad A }{número\quad de\quad casos\quad posibles}$$

Evidentemente, se recibía esa denominación é que tiña que haber outras definicións. E se as había era por que a dada por Laplace tiña un problema: só tiña sentido cando se trataba de sucesos equiprobables. Esta definición non é aplicable ao caso dun dado trucado ou ao lanzamento dunha determinada clase de chinchetas (aquí os sucesos serían caer punta arriba ou coa punta apoiada na mesa). Hoxe en día, nas aulas de Secundaria, ofrécense normalmente dúas alternativas para definir a probabilidade. Unha delas é difícil de explicar. É a definición hilbertiana, a axiomática, atribuída a Kolmogorov. Para entendela en profundidade cómpre saber en que consiste un sistema axiomático e, nesa altura o alumnado non está afeito a ese tipo de referentes. Diremos que $P$ é unha medida de probabilidade se verifica os seguintes axiomas aplicados a un espazo mostral $E$ no que consideraremos sucesos $A$ e $B$:

1. $P\left( A \right)\ge 0$

2. $P\left( E \right)=1$

3. Se $A$ e $B$ son incompatibles ($A\cap B=\emptyset $), entón $P\left( A\cup B \right)=p\left( A \right)+P\left( B \right)$

Aínda hai unha terceira alternativa para explicar en que consiste a probabilidade. Xurdida dos traballos de Jacob Bernouilli, é a coñecida como lei dos grandes números. Neste caso a idea é bastante intuitiva e non cómpre ningunha bagaxe cultural. Se realizamos un experimento moitas veces a probabilidade dun determinado suceso poderá aproximarse pola súa frecuencia relativa. Cantas máis veces fagamos o experimento mellor. De aí que se lle chamamos $n$ ao número de veces que realizamos o experimento, a probabilidade dun suceso $A$ virá dada por

$P(A)=\displaystyle\lim_{n \to \infty } \frac{nº\  de\  veces\ que\  sucede\ A}{n}$

Con todo, esta explicación non está exenta de dificultades. Teño comprobado, unha e outra vez, que tan pronto se lle presenta ao alumnado esta última liña, toda a claridade expositiva anterior parece esvaerse. Por iso intentei buscar unha alternativa para que lles permitira practicar coa lei. Acheina en Teching Statistics (Cambridge Uneversity Press 2018) de Darren Macey e Will Hornby. O único que fixen foi seguir as súas indicacións, paso a paso. Trátase de elaborar unha folla de cálculo que simule o lanzamento dunha moeda. Para iso xeramos unha restra de números aleatorios, 0s ou 1s, onde identificaremos o 1 con "sacar cara". Na seguinte folla de cálculo fanse simulacións de 15, 150 e 1500 lanzamentos. O mellor é xogar con ela para observar o que pasa. Ao final de cada experimento obtemos un valor aproximado para a probabilidade. 

Hai dúas alternativas para traballar coa seguinte ferramenta.

  • A mellor é descargar a folla de cálculo. Se queremos recalcular os datos basta premer F9
  • Podemos facelo on-line. Nese caso debemos recargar de novo a páxina ou, o que é o mesmo premer Maíuscula+F5
O efecto paréceme hipnótico