3.20.2006

Descomposición prefijo-medio-sufijo de las palabras voynichesas

En un artículo anterior presentamos la primera versión de la teoría de Stolfi acerca de la división de las palabras voynichesas en sus componentes fundamentales: prefijos y sufijos. Esa idea ha quedado obsoleta luego del descubrimiento de que los vocablos están formados en realidad por tres núcleos distintivos: prefijo-medio-sufijo.
En consecuencia, el experto brasileño ha actualizado su división de palabras en el excelente artículo que ofrecemos hoy.

En consecuencia, presentamos a nuestros lectores -por primera vez en lengua castellana- el ensayo sobre la descomposición tripartita de las palabras de la Sección Biológica del MV.

Descomposición prefijo-medio-sufijo de las palabras voynichesas
por Jorge Stolfi
Traducción: Marcelo Dos Santos

Introducción
Esta nota describe la desconcertante descomposición de las palabras voynichesas en tres partes (prefijo-medio-sufijo).
Esta descomposición se basa en la partición del alfabeto voynichés (específicamente el EVA) en dos conjuntos de letras:
  • las letras blandas { q a o y d s j m n r l i }
  • La letras duras { t k sh ch p f cth ckh cph cfh e }

Con estas definiciones, descubrimos que casi todas las palabras voynichesas pueden descomponerse en un prefijo y un sufijo formados solamente por letras blandas, con un medio compuesto únicamente por letras duras. Por ejemplo, la palabra qoteedy, muy común, se descompone en el prefijo qo-, el medio -tee- y el sufijo -dy.

Cualquiera de estos tres elemento puede estar vacío. Cuando lo que está vacío es el medio (es decir, la palabra consiste únicamente en letras blandas) la división entre prefijo y sufijo se torna ambigua; en ese caso llamaré "unifijo" a la palabra entera.

He analizado bajo este paradigma a las palabras de la Sección Biológica (f75r-f84v). Abajo se ven los componentes más comunes de cada clase, y las cantidades en que aparecen. Los puntos no son espacios entre palabras, sino que representan marcas para señalar la estructura fina explicada más abajo.

Ver tablas en el documento original

Usted puede revisar mi cuaderno, donde encontrará un detalle de los procedimientos que utilicé, y los archivos de datos que allí se mencionan. En particular, puede obtener un archivo que contiene todas las palabras buenas de la sección biológica ya factorizadas como se explica (63 kB).

Pocos componentes
Una característica inesperada de este tipo de descomposición es que hay un número sorprendentemente pequeño de prefijos y sufijos con frecuencias de aparición altas. Como se puede ver en la tabla anterior, la distribución de cualquiera de estos componentes cae en forma abrupta.

Medios duros
Otra característica importante es que virtualmente todas las palabras presentan medios que consisten exclusivamente en letras duras. Las excepciones son bsatante raras (ver abajo). Si las palabras fueran cadenas de caracteres construidas al azar, cabría esperar un número sustancial de palabras con secuencias dura-blanda-dura. Hay solamente 74 medios anómalos (que contienen letras blandas), u 88 si contamos apariciones repetidas.

Ver la segunda tabla en el documento original

Obsérvese que las 24 apariciones de raíces que comienzan con p se listan aquí solamente porque yo entendí que esa p era siempre una letra "dura". Pero hemos conjeturado más arriba que esa p es una suerte de "comodín", posiblemente una mayúscula adornada que puede utilizarse para representar varias letras diferentes, de manera similar a las "horcas" de la ilustración de Capelli.

Por ello, las p indicadas pueden muy bien ser letras blandas, por ejemplo d o q. En ese caso, deberían haber sido divididas como formando parte del prefijo, dejando un medio bien formado (consistente sólo en letras duras).

De esta manera, nos quedamos con solamente 64 apariciones de palabras verdaderamente anómalas. Eso representa el 1% de las palabras muestreadas, y claramente cae dentro del rango de los errores de transcripción.

Notamos en particular que varias de ellas contienen q e y incrustadas, letras que son notoriamente iniciales y/o finales. Por lo tanto, esas excepciones pueden provenir de errores al determinar espacios entre palabras. Por ejemplo, la raíz -chedyk proviene de la palabra -chedykar, la cual puede ser un "chedy" y un "kar" (dos palabras muy comunes) escritas juntas.

La estructura fina
Parece ser que los prefijos, sufijos y unifijos pueden ser descompuestos aún más, en grupos de letras EVA, dibujadas en sí mismas a partir de un repertorio limitado. Algunos grupos comunes de letras blandas son: am ar al om or ol ain aiin oin oiin. Parecen haber severas restricciones acerca de cómo pueden o no ser concatenados estos grupos con otros. Por ejemplo, como bien sabemos, la q es casi siempre una letra inicial de la palabra, y casi siempre la sigue una o. De modo similar, y m n son casi siempre finales.

Existen, además, grupos de letras (qo ar am air dy ol or) que se comportan casi como si fuesen una sola letra. Los medios también parecen estar compuestos de un pequeño número de bloques constructivos, donde cada bloque es una de las letras k t sh ch cth ckh, seguido de cero, uno o dos caracteres e.

Los medios con tres o más e consecutivas o que comienzan con e pueden explicarse como errores de transcripción de otros caracteres, mayormente ch. De hecho, esos errores parecen ser la fuente de tantas palabras que muestran ee en el medio (nótese que -ee- es raro, pero que -e- es todavía más raro).

Posibles interpretaciones
He aquí algunas posibles interpretaciones de estos datos:

  1. El MV está cifrado. Dejo esta hipótesis a los expertos en criptografía.
  2. Las "palabras" voynichesas son en realidad sílabas. Las dos categorías de palabras definidas al principio son simplemente las vocales y las consonantes. ¿Cuál es cuál? Hay muchas palabras compuestas exclusivamente de letras blandas, pero no hay palabras hechas solo de letras duras. Además, los prefijos vacíos aparecen muy a menudo, mientras que los medios o los sufijos vacíos son muy raros. Por lo tanto, pareciera que las letras blandas fuesen vocales y las duras consonantes.
    Las letras blandas pueden incluir sonidos como "y", "w", "s", "l", "n" y "m", que pueden funcionar como modificadores de vocales más que como consonantes estrictas. Teniendo esto en mente, las estadísticas para las sílabas de cada tipo son:

    tipo frec porc
    ------ ------ -----
    V 1516 24 %
    CV 1849 30 %
    VCV 2797 45 %
    VC 20 0 %
    C 10 0 %

    donde V representa una vocal o grupo de vocales y c una o más consonantes.
    Es de hacer notar que hay entre 10 y 12 prefijos significativos y unos 20 sufijos significativos, lo cual parece normal para muchos idiomas, incluyendo el inglés (12 sonidos vocálicos, un par de docenas de grupos de vocales).
    El número de consonantes parece ser un poco alto: hay alrededor de 20 consonantes "simples", mas una larga serie de pares de consonantes.
    El punto débil de esta teoría es explicar por qué el autor decidiría indicar las separaciones entre sílabas en vez de las separaciones entre las palabras.
  3. El voynichés es un lenguaje tonal como el chino. Se trata de una variante de la teoría de las "sílabas" expuesta arriba. La diferencia es principalmente que algunas de las letras (tal ves el prefijo) tendría que indicar los tonos.
    Esta alternativa tiene el mérito de que en chino, las sílabas y no las palabras son en verdad las unidades del lenguaje.
  4. El voynichés es una lengua aglutinante como el turco, el nahuátl o el quichua: las letras "duras" son las raíces de las palabras, mientras que las blandas son los afijos modificadores.
  5. El voynichés es un lenguaje semita como el árabe o el hebreo; los prefijos, medios y sufijos corresponden a las tres consonantes básicas y a las vocales adjuntas.

2 Comments:

Blogger TIFY said...

hello.. Don MARCELO DOS SANTOS..interesante el blog y mas interesante el libro....
este manuscrito ha sido una gran inquietud.. para muchos que nos gustan la criptografia... y es interesante como las plantas que salen ahi, ningun Botanico las ha podido reconocer... y las cartas que vienen en el..en fin....
ya creoq ue todo esta aqui muy buen publicado...
Debo decir por demas que me encanta su programade conexion posetiva pero nunca me he podido comunicar.. auque no se pero creo que deberia hacer un porgrama sobre este tema. igual si ya lo hizo no lo vi.. pero interesante que lo hiciera..
abrazos enormes..

21/3/06 13:05  
Blogger Marcelo Dos Santos said...

Muchas gracias por lo elogios. Pero temo que me has confundido con otra persona -al menos en parte-. Soy, en efecto, el propietario de este blog y autor del libro "El Manuscrito Voynich" (Aguilar, Madrid, 2005).
Pero no tengo ningún programa de radio ni de televisión. Debe ser otro Dos Santos.
Como sea, gracias por todo.

21/3/06 14:11  

Publicar un comentario

Links to this post:

Crear un vínculo

<< Home