3.15.2006

Primera versión de la descomposición de prefijos y sufijos en la Sección Biológica

El profesor Jorge Stolfi, visitante habitual de nuestro blog, publicó en 1997 un interesante trabajo sobre la descomposición de prefijos y sufijos de todas las palabras de la Sección Biológica del Manuscrito Voynich.
Presento aquí, por primera vez en castellano, la versión completa de este trascendental (aunque antiguo) trabajo del genio brasileño de la voynichología.

Descomposición prefijo/sufijo para la Sección Biológica
por Jorge Stolfi
Traducción: Marcelo Dos Santos
Esta página ha quedado obsoleta a causa del nuevo esquema de descomposición prefijo/medio/sufijo.

Recuerdo haber visto en los archivos de la lista un diagrama sintáctico simple del tipo "riel", elaborado por Mike Roe y Rene Zandbergen, que generó la mayor parte de las palabras del MV.
El presente es el primer intento de reconstruir tal diagrama para la Sección Biológica, utilizando mi esquema "borroso" de codificación a nivel de trazo.

Texto fuente
Las cuentas fueron obtenidas de la Sección Biológica completa del MV (f75r-f84v), escrita en lenguaje Currier B. La versión usada fue un "consenso" mecánico a nivel de trazo entre las transcripciones de Currier y del FSG. Se utilizaron sólo las palabras "buenas" (aquellas en las que ambas versiones coinciden).

Codificación de caracteres
El texto fue codificado con un código ad hoc de nivel de trazo, con identificación de algunas letras que pueden confundirse fácilmente. Se trata, básicamente, de la codificación Frogguy, con los
siguientes cambios.

La tabla completa
En la
tabla adjunta, cada entrada es el recuento de todas las palabras que pueden ser separadas en prefijo y sufijo, donde cada prefijo es una de las 18 secuencias

y el sufijo es cualquier secuencia de la forma

[co][^HP4]*

esto es, una \c/ o \o/, seguida de cero o más símbolos que no son ni una "letra alta" ni un \4/.
Por razones de claridad, los sufijos más comunes han sido agrupados en clases similares.
Las entradas de esta tabla representan 4104 de las 4742 palabras "buenas" de esa sección (lo que implica un 87%).

Sufijos significativos
Sólo 19 sufijos se presentan en cantidades significativas.
Estos sufijos y los 18 prefijos listados arriba configuran 3611 palabras buenas (76%) de la Sección Biológica.
Tabla reducida
La siguiente tabla ofrece la misma información que la tabla completa, pero sólo para los sufijos significativos y ordenados por frecuencia.
Palabras indivisibles
Aquí se indican las palabras que no pueden dividirse mediante el sistema descripto. Algunas son demasiado cortas; otras pueden ser palabras con funciones determinadas (artículos, preposiciones, etc.). Otras más podrían cubrirse añadiendo algunos sufijos y/o prefijos más. Pero también podría tratarse de errores, y a veces es muy difícil decidir dónde dividir la palabra.

0 Comments:

Publicar un comentario

Links to this post:

Crear un vínculo

<< Home