3.23.2006

Análisis completo del f22r

Mis comentarios en negrita. Pinche en las imágenes para ampliarlas.

Descripción:
  • Página botánica.
  • Número de folio (22) en el ángulo superior derecho, al igual que los folios anteriores.
  • Dos párrafos de texto (según Zandbergen). Las flores y el tallo interrumpen ambos. En realidad se trata de cuatro párrafos agrupados en dos bloques de dos. Así lo interpretan varios transcriptores (Takahashi entre ellos, ver abajo). Si esto no es así, entonces las líneas de texto tercera, sexta y novena son títulos.

Análisis avanzado:

  • Lenguaje: Currier A.
  • Autor: Mano 1 (según Zandbergen).
  • Color: rojo, marrón, verde, azul.
  • No hay demasiado para escribir acerca de este folio. La planta es absolutamente desconocida (ni siquiera Dana Scott se ha atrevido a especular acerca de su clasificación) y presenta una estructura imposible en las bifurcaciones y reuniones del tallo.

  • Como otros folios de la Sección Botánica, parece haber sido pintada por dos personas: una (la que pintó flores y hojas) lo hizo con cuidado y paciencia. La segunda, que pintó los capullos o inflorescencias, trazó grandes rasgos rectos sin ningún arte.
  • La cuarta palabra del primer renglón del segundo párrafo contiene un caracter anómalo.

Representación del texto en EVA Hand 1 (según Marcelo Dos Santos):

Transcripción EVA del texto (según Takahashi):

  • pol. olshy. fcholy. shol. dpchy. oty. okoly. daiin. opchy. s. ocphy-
    ol. oiin. shol. o. kor. qokchol. daiin. otaiin. cthor. dain. ckhy!dom-
    qokol. dykaiin. okchy. daiin. cthol. ctholo. dar. shain=
  • pchaiin. ofchy. daiin. cfhy. doroiin. ypchol. sy- {planta}schor. daiin-
    ol. daiin. qokchy. dar. daiin. chor. oldor. oky- {planta}y. choldchy-
    y. chokshchy. ctheen=
  • kchol. shol. dsheor. s{&S}!ka. chdoly. ytaiin. ol- {planta}otchy. cphal-
    dchor. oty. daiin. ctholy. qoky. chotaiin. chocthy- {planta}doiiin. dchor-
    odaiin. dain. cthy. ctheor. oraiino=
  • kchol. chor. daiin. cthoiin. dchor. chey. qokol. dy- {planta}opchol. oldam-
    doiin. yckhody. qokchy. oky. otoldy. yty. dol. or- {planta}dachy. daiin-
    odchaiin. cthy. okchy. kchy. dchol. daiin- {planta}ydaiin-
    dchor. dy!dain. qockhy. ykal!okain=

3.22.2006

La vida de William Friedman, estudioso del MV

Hacia el fin de la Segunda Guerra Mundial, los británicos comenzaron a manufacturar milles de pequeñas máquinas de cifrado llamadas "Criptógrafos de Pletts", para su uso por las fuerzas aliadad. La máquina poseía un mecanismo que alteraba regularmente el esquema de codificación; de tal forma, la primera "a" podía cambiarse por una "f" y la siguiente "a" por una "r". Nadie pudo romper la cifra. Sólo para estar seguros, los militares norteamericanos llamaron a un extraordinario equipo (formado por marido y mujer): William y Elizabeth Friedman. En menos de tres horas, decodificaron el primero de los cinco mensajes cifrados que les dieron. El texto decía: "Este cifrado es absolutamente indescifrable".

William Friedman (nacido Wolf Friedman) nació en Rusia y llegó a los Estados Unidos siendo un niño. Estudió genética y se estableció en Chicago para trabajar en los Laboratorios Riverbank, bajo las órdenes de un excéntrico millonario. Elizabeth se había doctorado en lengua inglesa y se involucró en la discusión que decía que las obras de Shakespeare habían sido en realidad escritas por Francis Bacon. Bacon había inventado un código secreto de sustitución que reemplazaba todo el alfabeto por combinaciones de dos letras, "a" y "b", y supuestamente había ocultado un mensaje secreto en "sus" obras.



Coronel William F. Friedman

Luego de conocerse, el matrimonio se convirtió en el mejor equipo de creación y desciframiento de códigos de la historia. Muchas veces aceptaron desafíos para resolver códigos supuestamente indescifrables, y lo consiguieron en todos los casos. Descifraron el código de los traficantes de ron durante la Ley Seca, los de los traficantes de drogas en los años 30 y, justo antes de la entrada de EEUU en la Segunda Guerra Mundial, pudieron quebrar el más alto y secreto código de los diplomáticos japoneses. Ambos pasaron el resto de sus vidas quebrando e inventando claves para el gobierno estadounidense.

Podría especularse que no es casual que Friedman haya comenzado su carrera como genetista: precisamente, el hecho de que algunos genetistas hayan descifrado el código genético representa una de las más grandes hazañas de la criptografía del siglo XX. Lo maravilloso es que esos científicos lograron su objetivo utilizando técnicas criptográficas desarrolladas por el matrimonio Friedman con fines militares. Imagínese cómo los agentes de contrainteligencia engañan a un espía. Si saben que el espía transmite mensajes cifrados, ellos le envían un mensaje como si fuera de sus jefes, y luego, cuando el enemigo lo codifica y lo transmite, "leen" el mensaje cifrado para descubrir el método que utiliza. El mismo método se utilizó para descifrar el ADN.

Una nota final interesante: después de la muerte del matrimonio Friedman, la NSA (Agencia de Seguridad Nacional (fundada por Friedman) creó el DES (Estándar de Encriptación), diseñado para ayudar al gobierno y a las empresas comerciales a transmitir datos sensibles mediante teléfonos inalámbricos y enlaces de datos. DES codifica mensajes de computadora que ya consistían en unos y ceros. Hay 256 claves posibles que, en su conjunto, generan 72 billones de combinaciones diferentes.

Este fue el hombre que, en 1944 y paralelamente a su trabajo para la guerra, fundó el FSG (Primer Grupo de Estudio) con la intención de descifrar de una buena vez el Manuscrito Voynich. William Friedman fue, posiblemente, el más capacitado de todos los investigadores que estudiaron el Manuscrito, y este problema fue, probablemente, el único fracaso comprobable de su carrera como criptógrafo.


Tumba de William Friedman en el
Cementerio Militar de Arlington.
La frase del último reglón dice:
"El conocimiento es poder"

Retirado del ejército norteamericano con el grado de coronel, fundó el SSG (Segundo Grupo de Estudio) que, con un nuevo equipo multidisciplinario de expertos y una poderosa computadora RCA301 prestada por el fabricante, pasó otros dos años estudiando el MV (1962-1963). Como lo explico en mi libro El Manuscrito Voynich, si bien los dos grupos de estudio dirigidos por Friedman no consiguieron quebrar el código del Voynich, sí obtuvieron interesantes resultados

En el trabajo de ambos grupos se basaron luego el criptólogo británico John Tiltman y la matemática norteamericana Mary D´Imperio, que son, junto con el inglés Gordon Rugg, quienes más nos han enseñados sobre el Manuscrito Voynich en la actualidad.

Los trabajos de Friedman sobre el Manuscrito Voynich han sentado un precedente y señalado el camino para futuros trabajos, marcando los estándares y criterios que los nuevos criptoanalistas seguirán para -de ser posible- descifrar el contenido del libro.

Es por ello que dedicamos el artículo de hoy a este hombre notable que destacó en la abtrusa y dificilísima ciencia de la criptografía.

3.21.2006

Una historia interesante (con personajes conocidos)

"Un tesoro pirata del siglo XIX puede estar enterrado en España". Así comienza el weblog El tesoro del Orbucán, al que nos referiremos hoy.
¿Qué tiene que ver un barco pirata cargado de oro con el Manuscrito Voynich? Mucho, porque parece ser que a lo largo de los años, la existencia del tesoro escondido fue estudiada por dos viejos conocidos nuestros, John Manly y William Newbold, conocidos criptógrafos que intentaron descifrar en el siglo XX el documento medieval que nos interesa.
Así que Manly, Newbold y otros tal vez intentaron demostrar que el oro del buque sigue allí, en la costa española.


Aunque lo que se dice allí no debe ser tomado al pie de la letra (hay una empresa de bebidas alcohólicas que utiliza esta leyenda en sus publicidades), la historia completa es interesantísima y, aunque solo tenga una relación tangencial con el MV, hoy la recomendamos a nuestros lectores.

3.20.2006

Descomposición prefijo-medio-sufijo de las palabras voynichesas

En un artículo anterior presentamos la primera versión de la teoría de Stolfi acerca de la división de las palabras voynichesas en sus componentes fundamentales: prefijos y sufijos. Esa idea ha quedado obsoleta luego del descubrimiento de que los vocablos están formados en realidad por tres núcleos distintivos: prefijo-medio-sufijo.
En consecuencia, el experto brasileño ha actualizado su división de palabras en el excelente artículo que ofrecemos hoy.

En consecuencia, presentamos a nuestros lectores -por primera vez en lengua castellana- el ensayo sobre la descomposición tripartita de las palabras de la Sección Biológica del MV.

Descomposición prefijo-medio-sufijo de las palabras voynichesas
por Jorge Stolfi
Traducción: Marcelo Dos Santos

Introducción
Esta nota describe la desconcertante descomposición de las palabras voynichesas en tres partes (prefijo-medio-sufijo).
Esta descomposición se basa en la partición del alfabeto voynichés (específicamente el EVA) en dos conjuntos de letras:
  • las letras blandas { q a o y d s j m n r l i }
  • La letras duras { t k sh ch p f cth ckh cph cfh e }

Con estas definiciones, descubrimos que casi todas las palabras voynichesas pueden descomponerse en un prefijo y un sufijo formados solamente por letras blandas, con un medio compuesto únicamente por letras duras. Por ejemplo, la palabra qoteedy, muy común, se descompone en el prefijo qo-, el medio -tee- y el sufijo -dy.

Cualquiera de estos tres elemento puede estar vacío. Cuando lo que está vacío es el medio (es decir, la palabra consiste únicamente en letras blandas) la división entre prefijo y sufijo se torna ambigua; en ese caso llamaré "unifijo" a la palabra entera.

He analizado bajo este paradigma a las palabras de la Sección Biológica (f75r-f84v). Abajo se ven los componentes más comunes de cada clase, y las cantidades en que aparecen. Los puntos no son espacios entre palabras, sino que representan marcas para señalar la estructura fina explicada más abajo.

Ver tablas en el documento original

Usted puede revisar mi cuaderno, donde encontrará un detalle de los procedimientos que utilicé, y los archivos de datos que allí se mencionan. En particular, puede obtener un archivo que contiene todas las palabras buenas de la sección biológica ya factorizadas como se explica (63 kB).

Pocos componentes
Una característica inesperada de este tipo de descomposición es que hay un número sorprendentemente pequeño de prefijos y sufijos con frecuencias de aparición altas. Como se puede ver en la tabla anterior, la distribución de cualquiera de estos componentes cae en forma abrupta.

Medios duros
Otra característica importante es que virtualmente todas las palabras presentan medios que consisten exclusivamente en letras duras. Las excepciones son bsatante raras (ver abajo). Si las palabras fueran cadenas de caracteres construidas al azar, cabría esperar un número sustancial de palabras con secuencias dura-blanda-dura. Hay solamente 74 medios anómalos (que contienen letras blandas), u 88 si contamos apariciones repetidas.

Ver la segunda tabla en el documento original

Obsérvese que las 24 apariciones de raíces que comienzan con p se listan aquí solamente porque yo entendí que esa p era siempre una letra "dura". Pero hemos conjeturado más arriba que esa p es una suerte de "comodín", posiblemente una mayúscula adornada que puede utilizarse para representar varias letras diferentes, de manera similar a las "horcas" de la ilustración de Capelli.

Por ello, las p indicadas pueden muy bien ser letras blandas, por ejemplo d o q. En ese caso, deberían haber sido divididas como formando parte del prefijo, dejando un medio bien formado (consistente sólo en letras duras).

De esta manera, nos quedamos con solamente 64 apariciones de palabras verdaderamente anómalas. Eso representa el 1% de las palabras muestreadas, y claramente cae dentro del rango de los errores de transcripción.

Notamos en particular que varias de ellas contienen q e y incrustadas, letras que son notoriamente iniciales y/o finales. Por lo tanto, esas excepciones pueden provenir de errores al determinar espacios entre palabras. Por ejemplo, la raíz -chedyk proviene de la palabra -chedykar, la cual puede ser un "chedy" y un "kar" (dos palabras muy comunes) escritas juntas.

La estructura fina
Parece ser que los prefijos, sufijos y unifijos pueden ser descompuestos aún más, en grupos de letras EVA, dibujadas en sí mismas a partir de un repertorio limitado. Algunos grupos comunes de letras blandas son: am ar al om or ol ain aiin oin oiin. Parecen haber severas restricciones acerca de cómo pueden o no ser concatenados estos grupos con otros. Por ejemplo, como bien sabemos, la q es casi siempre una letra inicial de la palabra, y casi siempre la sigue una o. De modo similar, y m n son casi siempre finales.

Existen, además, grupos de letras (qo ar am air dy ol or) que se comportan casi como si fuesen una sola letra. Los medios también parecen estar compuestos de un pequeño número de bloques constructivos, donde cada bloque es una de las letras k t sh ch cth ckh, seguido de cero, uno o dos caracteres e.

Los medios con tres o más e consecutivas o que comienzan con e pueden explicarse como errores de transcripción de otros caracteres, mayormente ch. De hecho, esos errores parecen ser la fuente de tantas palabras que muestran ee en el medio (nótese que -ee- es raro, pero que -e- es todavía más raro).

Posibles interpretaciones
He aquí algunas posibles interpretaciones de estos datos:

  1. El MV está cifrado. Dejo esta hipótesis a los expertos en criptografía.
  2. Las "palabras" voynichesas son en realidad sílabas. Las dos categorías de palabras definidas al principio son simplemente las vocales y las consonantes. ¿Cuál es cuál? Hay muchas palabras compuestas exclusivamente de letras blandas, pero no hay palabras hechas solo de letras duras. Además, los prefijos vacíos aparecen muy a menudo, mientras que los medios o los sufijos vacíos son muy raros. Por lo tanto, pareciera que las letras blandas fuesen vocales y las duras consonantes.
    Las letras blandas pueden incluir sonidos como "y", "w", "s", "l", "n" y "m", que pueden funcionar como modificadores de vocales más que como consonantes estrictas. Teniendo esto en mente, las estadísticas para las sílabas de cada tipo son:

    tipo frec porc
    ------ ------ -----
    V 1516 24 %
    CV 1849 30 %
    VCV 2797 45 %
    VC 20 0 %
    C 10 0 %

    donde V representa una vocal o grupo de vocales y c una o más consonantes.
    Es de hacer notar que hay entre 10 y 12 prefijos significativos y unos 20 sufijos significativos, lo cual parece normal para muchos idiomas, incluyendo el inglés (12 sonidos vocálicos, un par de docenas de grupos de vocales).
    El número de consonantes parece ser un poco alto: hay alrededor de 20 consonantes "simples", mas una larga serie de pares de consonantes.
    El punto débil de esta teoría es explicar por qué el autor decidiría indicar las separaciones entre sílabas en vez de las separaciones entre las palabras.
  3. El voynichés es un lenguaje tonal como el chino. Se trata de una variante de la teoría de las "sílabas" expuesta arriba. La diferencia es principalmente que algunas de las letras (tal ves el prefijo) tendría que indicar los tonos.
    Esta alternativa tiene el mérito de que en chino, las sílabas y no las palabras son en verdad las unidades del lenguaje.
  4. El voynichés es una lengua aglutinante como el turco, el nahuátl o el quichua: las letras "duras" son las raíces de las palabras, mientras que las blandas son los afijos modificadores.
  5. El voynichés es un lenguaje semita como el árabe o el hebreo; los prefijos, medios y sufijos corresponden a las tres consonantes básicas y a las vocales adjuntas.