Bad Bunny y las matemáticas

¿Qué tan mal habla Benito Antonio Martínez Ocasio, alias Bad Bunny? Ban Sci nos trae una respuesta científica
Editado por : Adrián Nieve

Hace poco se dio el famoso espectáculo de medio tiempo del Super Tazón (Super Bowl para los puristas) con Bad Bunny (Benito Antonio Martínez Ocasio) como protagonista. El show dio mucho de qué hablar, especialmente en Estados Unidos donde los ánimos están muy caldeados por la administración actual y las deportaciones. Pero la comunidad hispanohablante también ha visto sus propias discusiones. Algo que encontré mucho es la crítica al acento puertoriqueño que Bad Bunny (particularmente esas “eres” pronunciadas como “eles”), tildándolo de que habla mal el castellano.

Pensaba eso la mañana siguiente al Super Tazón en uno de mis -ya tradicionales- debates conmigo mismo, tipo podcast mientras desayuno. Hablando ahí solo me puse a pensar cuán científico puede ser este debate. ¿Existe alguna ecuación que mida si algo es un acento o ya otro idioma? ¿Existe algún modelo matemático que “mida” cuán lejos está un idioma de otro? ¿O si un idioma es real o ficticio?

1924
Imagen: 88 Grados

Y, bueno, hoy les comparto el fruto de mi curiosidad matutina. La respuesta corta a esas preguntas es que… SÍ. Y, vaya, la ciencia que hay detrás de esto es maravillosa, sabrosa, iluminadora y, uff, muy pero muy interesante.

¿Acentos o español malo? (bad spanish)

Primero lo primero, ¿es científicamente comprobable que hablar como el Conejo Malo es hablar mal? 

Un matemático ruso llamado Vladimir Levenshtein diseñó, allá por los años sesenta, una métrica para “medir” distancias entre secuencias. La idea originalmente servía para distintos entes matemáticos o informáticos, pero la conexión con la lingüística no tardó en aparecer y en ser aplicada.

La métrica de Levenshtein consiste en medir una distancia entre dos cadenas de información. Dicha distancia es cuantos elementos de esa cadena necesitas cambiar para pasar de una a otra. Digamos, la distancia entre “libro” y “libra” es de uno, por que solo hay que cambiar una letra para pasar de una palabra a la otra (la “o” por la “a”). Mientras que la distancia entre “amigo” y “enemigo” es de tres, por que hay que cambiar la “a” por “e”, y luego añadir dos letras más (la “e” y la “n”). Ojo que de aquí en adelante nos enfocaremos en la fonética, es decir en cómo suena el idioma, y no estaremos tocando gramática u otros elementos lingüísticos porque si no nunca acabaría este artículo.

Por lo tanto, utilizando las distancias de Levenshtein, uno puede medir que decir “Debí tirar más fotos” y decir “Debí tiral más fotos” tienen una distancia de uno. 

Uno puede expandir esta herramienta matemática y sacar promedios entre varios grupos de palabras pronunciadas diferentemente entre los diversos acentos de nuestro idioma. Los resultados son que… en promedio, la distancia de Levenshtein entre todos los acentos del español (contando el chileno, boliviano, argentino, colombiano, mexicano, caribeño y de España) tienen una distancia de ¡casi cero!

Si uno hila fino, puede ver que hay más distancia entre los acentos caribeños y los acentos más neutros (como el colombiano), pero esas diferencias siguen siendo minúsculas comparadas con una distancia entre un idioma y otro. 

1925
Fotografía: NFL

Por ejemplo, la similitud entre el acento puertorriqueño y el boliviano es de aproximadamente 99% (una palabra de cada 100 se pronuncia diferente), mientras que la similitud entre el castellano y el portugués (uno de los idiomas más similares al nuestro) es de 90% (una palabra de cada 10 se pronuncia diferente). Con el inglés tenemos una similitud de 30% (solo tres palabras de cada 10 se pronuncian igual). 

Bonus track: Idioma real vs ficticio

Pero, ¡aún hay más! Al ir investigando sobre modelos matemáticos con lingüística me encontré con otra joyita. Resulta que George Kingsley Zipf, un lingüista y filólogo estadounidense, allá por los años cuarenta, creó una ley empírica estadística para analizar idiomas que nos ha traído conclusiones fascinantes.

La idea es la siguiente: Uno puede contar un grupo de palabras de un idioma como palabras de grado 1, que sería el grupo de palabras más frecuentes en su uso, ya sea por que son más cortas, o por que son muy versátiles. En esta categoría entrarían palabras simples como “sí, yo, el, de, por”. Por otro lado, hacemos otro conjunto de palabras de grado 2, que serían palabras no tan frecuentes, pero aún muy usuales como “hola, cuando, comer, hablar”. Y así sucesivamente, haciendo más y más grupos, más y más complejos. Resulta que poner esto en una ecuación (La Ley de Zipf) nos da una gráfica para los idiomas.

Lo impresionante, es que esa línea es prácticamente la misma para todos los idiomas. Lo que demuestra que, aunque existan tantos dialectos, idiomas, lenguas y acentos, los seres humanos tenemos una especie de “lógica” a la hora de economizar palabras. 

Pero la ley de Zipf aún nos trae dos sorpresitas más.

Resulta que, si usamos esa lógica con las matemáticas, y ponemos en el grupo 1 a cosas sencillas (como +, -, /, x) y en el grupo 2 a cosas intermedias (como log, coseno, raíz cuadrada) y así sucesivamente… ¡Las matemáticas también cumplen la ley de Zipf! Esto quiere decir, que podemos considerar a las matemáticas como un idioma, pues se comporta exactamente igual que lo hace el español, el chino mandarín o el alemán.

Por si no fuera poco, si uno pone a prueba idiomas ficticios, como el klingon, el élfico de Tolkien o el valyrio de Game of Thrones, uno puede ver que no cumplen con la ley de Zipf, puesto que “inventar” un idioma no puede imitar esa lógica humana que moldea los idiomas tras siglos de cambios.

1926
Imagen: WikiCommons

El misterioso manuscrito de Voynich, un libro medieval datado en los años 1400, tiene un extraño idioma escrito en sus páginas que nadie hasta la fecha ha podido descifrar. Muchos creían que era una farsa o broma de algún monje pues no se parece en nada a ningún otro idioma conocido en el mundo. Pero resulta que el idioma del manuscrito de Voynich, ¡sí pasa la prueba de la ley de Zipf! Lo que demuestra que no es un idioma falso, inventado o de broma. Es un idioma real que aún no podemos comprender.

De Bad Bunny a Zipf

Como pudimos aprender hoy, no importa qué tanto creamos en que existe un español “puro”, la verdad es que los idiomas son entes cambiantes y ricos en sus formas diversas. Diferencias ligadas a la cultura, clima e idiosincrasias solo nos muestran cuán vivo y vigente sigue nuestro querido castellano en todos sus acentos. Las diferencias entre pronunciar de vez en cuando una “ere” como una “ele”, o tener la doble “ere” raspada en vez de vibrada como en Bolivia, o decir “vos” en lugar de “tú”, son infinitesimales en comparación a una verdadera diferencia entre un idioma y otro. 

Así que disfrutemos de la variedad de nuestra lengua y ¡vayamos a descifrar juntos el manuscrito de Voynich! O a fiestear entre latinos, depende de cada quien.

15 me gusta
132 vistas