17-05-2019  (856 lectures) Categoria: Braintext

Transcripció del text del Manuscrit de Voynich

Anàlisi de text - Transcripció del text

Introducció

El principal misteri del MS Voynich és clarament la seva escriptura desconeguda. Aquest tema s'adreça des de tres aspectes diferents, en tres (sèries de) pàgines:

  • Una mirada al sistema d‚Äôescriptura, que descriu les seves principals propietats i les similituds i difer√®ncies amb altres sistemes d‚Äôescriptura coneguts;
  • Transcripci√≥ del text;
  • An√†lisi estad√≠stica del text de l'EM (subdividit posteriorment en cinc √†rees).

Aquesta pàgina tracta la segona part, la transcripció del text. Resumeix els esforços històrics de transcripció i descriu l'estat actual de les coses. Aquesta pàgina és molt rellevant per a aquells que estiguin interessats en la interpretació del text Voynich MS, però es pot ometre per aquells que no ho són.

Una secció a la part inferior d'aquesta pàgina explica on es poden trobar els fitxers de transcripció principals.

Propòsit

El terme transcripció s'utilitza aquí per descriure la conversió del text manuscrit del MS Voynich en un format (fitxer) llegible per ordinador. El propòsit d’aquesta és permetre que els programes informàtics analitzin el text, per exemple, per obtenir estadístiques o per facilitar la interpretació i la traducció ideal del text. La primera vegada que aquest tipus de transcripció es va exercir va ser per William Friedman després de la Segona Guerra Mundial, per a la seva transformació per les anomenades "màquines tabuladores".

Molts anys abans, als anys trenta, el P. Th. Petersen de la Universitat Catòlica d’Amèrica ja va realitzar una transcripció completa de la mà (és a dir, una còpia escrita a mà) de l’EM utilitzant una fotocòpia completa de l’EM i, en alguns casos, per transcriure les parts difícils, la EM actual. Aquest document, en el qual va afegir moltes anotacions interessants, encara es conserva a la col·lecció William F. Friedman de la Biblioteca Marshall a Lexington (Va) (1) .

Una transcripci√≥ s'ha de distingir clarament d‚Äôuna proposta de traducci√≥ del text. L‚Äô√ļnic prop√≤sit d‚Äôuna transcripci√≥ √©s representar cada car√†cter escrit a m√† en un fitxer llegible per ordinador de manera coherent. Realment no importa quin s√≠mbol s‚Äôutilitza per a quin personatge. Des de la d√®cada dels quaranta, diferents persones han utilitzat convencions diferents o alfabets de transcripci√≥.

Història

FSG

La primera coneguda transcripci√≥ de grans parts del MS Voynich va ser realitzada en la d√®cada de 1940 per l'anomenat First Study Group (FSG) de William Friedman, que es va descriure breument aqu√≠ . El grup treballava a partir de c√≤pies fotost√†tiques de les p√†gines de l'EM, i havien definit un alfabet de transcripci√≥ acordat per tots els membres de l'equip. A causa del desig de secret de Friedman, durant molt de temps ning√ļ fora del seu equip era conscient d‚Äôaquest exercici de transcripci√≥ o de l‚Äôalfabet que utilitzava.

La transcripció de Friedman mai no va ser una transcripció completa de tot el text del MS. Van decidir concentrar-se en el text lineal escrit en paràgrafs, i no preocupar-se amb els diagrames complicats amb etiquetes i text escrits en cercles. Això és molt clar a partir d’anotacions escrites a mà realitzades a les còpies d’origen que diuen que "no punxeu això" o "només copegueu això".

L‚Äôalfabet de transcripci√≥ FSG utilitza lletres maj√ļscules i n√ļmeros. T√© un m√®tode bastant inusual (segons els est√†ndards posteriors) per transcriure la "forca intrusiva", √©s a dir, utilitzant un s√≠mbol especial (Z) per al pedestal ( ch ).

L’esforç de la transcripció de FSG es descriu en detall a Reeds (1995) (2) . Jim Reeds va descobrir una còpia impresa d'aquesta transcripció a la biblioteca Marshall esmentada anteriorment i, juntament amb Jacques Guy, el va introduir en forma llegible per ordinador. El fitxer resultant està disponible encara per descarregar . Aquesta transcripció està lluny de ser completa per les raons esmentades anteriorment.

Bennett

El 1976, el professor William R. Bennett de la Universitat de Yale va publicar un llibre sobre l'√ļs de l'ordinador per analitzar certes propietats del llenguatge i del text (3) . En aquest llibre, va dedicar un cap√≠tol a una an√†lisi del text Voynich MS, i per aix√≤ va necessitar un alfabet de transcripci√≥. L‚Äôalfabet de Bennett no s‚Äôha utilitzat fora d‚Äôaquesta publicaci√≥. La transcripci√≥ es va fer a partir de fotografies i es va emmagatzemar en cinta de paper. Segons va informar Brumbaugh (4) , Bennett va rebre ajuda en l'an√†lisi de Voynich MS per Jonina Duker, que aleshores era un estudiant de segon any (5) .

Currier

Aproximadament al mateix temps, el criptoanalista Prescott Currier va iniciar un important esfor√ß de transcripci√≥, usant un alfabet que va dissenyar independentment. Aquest alfabet utilitza les lletres maj√ļscules AZ i els n√ļmeros 0-9 (√©s a dir, tots els 36). No representa alguns car√†cters que fa l‚Äôalfabet FSG, i utilitza car√†cters individuals per al que sembla que s√≥n car√†cters compostos a el MS. Quan Currier va presentar els seus descobriments al simposi de 1976 del MS Voynich, Mary D'Imperio va suggerir que seria important que tots els investigadors utilitzessin un alfabet unificat. Tamb√© havia comen√ßat a transcriure parts de l'EM usant el seu propi alfabet, que va abandonar a favor de Currier, i els dos fitxers es van fusionar. La transcripci√≥ combinada de Currier i D'Imperio i de l‚Äôalfabet de transcripci√≥ dissenyat per Currier s‚Äôhan utilitzat fins als anys 90, tamb√© en els primers anys d‚ÄôInternet. A continuaci√≥, es pot fer refer√®ncia a la transcripci√≥ mitjan√ßant l‚Äôabreviatura "CD".

La taula seg√ľent mostra els tres alfabets esmentats anteriorment.

Char Bennett FSG Currier
Char Bennett FSG Currier
D 4 4
Jo Jo Jo
O O O
IL IE G
S 8 8
IIL IIE H
G G 9
IIIL IIIE 1
Z 2 2
QI IR T
L E E
IIQ IIR U
Q R R
IIIQ IIIR 0
CT T S
U L D
ET S Z
N N (*) N
H H P
M M (*) M
P P B
JO S√ďC IIIL 3
K D F

K J
F F V

IK K
CHT HZ Q

IIK L
CPT PZ W

IIIK 5
CKT DZ X

(6) 6
CFT FZ Y

(7) 7
A A A
Y Y (n)
C C C
V V (v)

(*) Nota: Tiltman va utilitzar l'alfabet FSG, però en comptes de N i M va escriure IL i IIL.

Una cosa que apareix immediatament d‚Äôaquesta taula √©s que els diferents transcriptors no van estar d‚Äôacord amb all√≤ que constitueix un personatge √ļnic del text Voynich MS, i aix√≤ resulta ser un dels punts m√©s dif√≠cils per a la transcripci√≥.

Posteriorment, Jim Reeds va mostrar que molts personatges del MS Voynich no poden representar-se exactament per cap dels alfabets existents. Hi ha alguns personatges "rars" i, a més, hi ha allò que sembla ser lligats a diversos personatges. Aquests personatges tradicionalment s’han anomenat 'weirdoes', encara que aquí utilitzaré el terme "caràcters rars". Jim Reeds va produir un document amb una visió general d'aquests personatges rars, cridant-los "X1" a "X128". A continuació es mostra un extracte d'aquest document poc conegut.

Transcripció a l’època de la WWW

Amb l‚Äôaparici√≥ de la "World Wide Web" i l‚Äôinici de la llista de correu Voynich, la transcripci√≥ de les parts que encara faltaven als esfor√ßos de Currier i D'Imperio es va continuar utilitzant l‚Äôalfabet de Currier. A aquest alfabet s‚Äôhan afegit diversos car√†cters amb min√ļscules. Aquests ja estan inclosos (entre par√®ntesis) a la taula anterior. Com a part d‚Äôaquesta nova transcripci√≥, que s‚Äôanomenar√† "Vnow", s‚Äôha adoptat un format de fitxer per a aquest fitxer de transcripci√≥, sobre el qual es dir√† m√©s a continuaci√≥.

En paral·lel a això, es va dissenyar un tipus completament nou d’alfabet de transcripció:

Frogguy

L'alfabet de transcripci√≥ 'Frogguy' va ser dissenyat per Jacques Guy el 1991. Utilitza car√†cters en min√ļscula, n√ļmeros i signes diacr√≠tics. En comptes de representar personatges complets, representa els "tra√ßos" del gui√≥ del MS Voynich. Com a resultat d‚Äôaquest enfocament, aconsegueix produir la semblan√ßa m√©s propera del text transcrit amb l‚Äôescriptura. Al mateix temps, alguns car√†cters del MS que es pot suposar que s√≥n un sol car√†cter estan representats per diversos usant aquest alfabet. Per la seva naturalesa, √©s el primer alfabet que permet representar correctament a molts dels personatges lligats que s‚Äôhan esmentat anteriorment. Jacques Guy tamb√© va introduir l'anomenada "regla de capitalitzaci√≥", el que significa que un personatge que estigui connectat al seg√ľent ha de ser representat per una lletra maj√ļscula. L‚Äôalfabet de transcripci√≥ de Frogguy i el seu √ļs s‚Äôexpliquen amb m√©s detall en una c√≤pia conservada de >> una de les p√†gines web de Jim Reeds . Pot ser que us interessi mostrar un exemple d‚Äôaquest alfabet:

daiin qotedy dar ochol osaror
8aiiv 40qpc89 8a2 octox osa2o2

Una altra contribució important de Jacques Guy va ser una eina que permetia la traducció dels fitxers de transcripció d’un alfabet de transcrició a un altre. Aquesta eina es deia BITRANS, es va escriure en Pascal i es va executar en DOS (encara ho seria). Podria manejar regles de traducció complexes, com les que es necessiten per a l’alfabet de Currier, on, per exemple, la traducció del caràcter i depèn del context.

L‚Äôalfabet Frogguy √©s l‚Äôaspecte m√©s proper al text Voynich MS, i resol la principal inconsist√®ncia de l‚Äôalfabet de Currier, √©s a dir, que Currier sintetitza les cadenes de car√†cters i consecutius en un sol car√†cter, mentre que aix√≤ no s‚Äôha fet per a cadenes de car√†cters consecutius. 6) . No obstant aix√≤, t√© un desavantatge clar en no ser molt adequat per al tipus d‚Äôan√†lisi num√®rica esmentada a la part superior d‚Äôaquesta p√†gina, principalment pel seu √ļs freq√ľent de l‚Äôapostrofe, i en menor mesura per la barreja de lletres i n√ļmeros. . No s‚Äôhan realitzat transcripcions significatives amb aquest alfabet.

Quan Gabriel Landini i jo vam iniciar una nova transcripció del MS, un projecte que vam anomenar "EVMT" en aquell moment, vam decidir que seria necessari un nou alfabet, però un basat en el principi de Frogguy.

Eva

Originalment, EVA era l‚Äôalfabet d‚ÄôEuropean Voynich, per√≤ m√©s tard es va convertir en l‚Äôalfabet extensible de Voynich. Va ser dissenyat per ser similar a Frogguy, per√≤ per utilitzar nom√©s car√†cters alfab√®tics. Va ser dissenyat per Gabriel Landini i jo mateix amb importants aportacions i suggeriments de Jacques Guy. El seu disseny formava part d‚Äôun esquema m√©s ampli que inclo√Įa:

  • La necessitat de poder representar el text sencer del MS Voynich, incloses les parts no transcrites anteriorment, per exemple, alguns text fora dels par√†grafs est√†ndard.
  • Estandarditzaci√≥ del format del fitxer de transcripci√≥, incloent-hi una manera est√†ndard per identificar la ubicaci√≥ de tots els elements de text a l'MS (en els llocs anomenats a continuaci√≥).
  • Mantenir la compatibilitat amb l‚Äô√ļs de BITRANS
  • L‚Äôalfabet havia de ser un superconjunt de FSG, Currier i Frogguy, de manera que seria possible i reversible una traducci√≥ de BITRANS de tota la transcripci√≥ existent a Eva (7) .
  • Una manera clara d‚Äôidentificar personatges rars, com ara la llista feta per Reeds.
  • La capacitat de dissenyar una font de tipus True True que representa amb exactitud el text Voynich MS (8) .

"Eva b√†sica" √©s el conjunt de car√†cters en min√ļscula identificats i "Eva estesa" inclou la representaci√≥ de tot tipus de car√†cters rars. L‚Äôalfabet b√†sic d‚ÄôEva s‚Äôha triat de manera que el text transcrit sigui gaireb√© pronunciable. Aquesta excel¬∑lent idea de Gabriel no era poder "parlar Voynichese", per√≤ fa molt f√†cil al cervell hum√† recon√®ixer i recordar paraules transcrites.

Els caràcters rars es poden classificar en quatre categories:

  1. Personatges singulars inusuals o rars
  2. Ligaments d’un sol caràcter d’Eva bàsica
  3. Ligaments que inclouen car√†cters rars √ļnics
  4. Alguna cosa més

Tots ells van ser identificats en el transcurs de l'exercici de transcripci√≥, que es basava en dos documents: la transcripci√≥ de la m√† de Petersen de l'EM ja mencionada (vegeu la nota 1) i el "copyflo" de Yale (9) . Com va resultar, hi havia tres personatges √ļnics que es podrien anomenar inusuals perqu√® no apareixien en cap dels alfabets de transcripci√≥ pr√®viament definits, per√≤ que es van produir m√©s de 10 vegades a la EM. Aquests tres car√†cters: b , u i z van ser assignats a la seva pr√≤pia lletra "Eva b√†sica" (b, u i z respectivament). Aqu√≠ s'inclou la taula de Basic Eva:

Es va assignar un car√†cter "alt ASCII" a personatges rars individuals o rares parts de lligadures i es va definir la manera d‚Äôincloure-les en fitxers de transcripci√≥ de la manera seg√ľent: & 185; per al codi ascii 185. La imatge seg√ľent mostra tots aquests car√†cters rars (10) .

Les ligatures dels car√†cters es poden representar de dues maneres. La primera √©s la regla de capitalitzaci√≥ anteriorment esmentada introdu√Įda per Jacques Guy. Com mostra la taula de Eva b√†sica anterior, aquest m√®tode permet una representaci√≥ exacta del text utilitzant el tipus de lletra Eva True Type. Un car√†cter en maj√ļscula sempre es connecta a la seg√ľent. A m√©s, hi ha els casos especials seg√ľents:

  • c / c i q / q ja es connecten a la dreta, de manera que no hi ha necessitat de fer-los amb maj√ļscules
  • h / h i H / H tamb√© es connecten a l‚Äôesquerra
  • E / E es connecta a la part inferior.

Sovint, els caràcters Sh, cTh, cKh, cPh i cFh s'escriuen simplement com sh, cth, ckh, sph i cfh, respectivament, la qual cosa resulta que la seva interpretació a la font de True Type no és òptima.

La segona manera d‚Äôindicar les lligatures en els fitxers de transcripci√≥, que √©s m√©s intu√Įtiva per al lector hum√†, √©s incloure els car√†cters connectats entre par√®ntesis. La taula seg√ľent mostra exemples d'aix√≤. La representaci√≥ d‚Äôescriptura d‚Äôaquesta taula utilitza la regla de maj√ļscules.

EVA EVA amb maj√ļscules √ös de TTF
(ao) Ao Ao
(ee) Ee Ee
(cthh) ey cthhey cthhey
(Ith) ITh ITh
(oy) Oy Oy
sh 1 Sh Sh
(yk) Yk Yk

1 Exemple d‚Äô√ļs est√†ndard encara que no √≤ptim.

Takeshi Takahashi

L‚Äôalfabet Eva, principalment en la seva forma b√†sica, va trobar una gran recepci√≥ a la comunitat i va ser utilitzat pel japon√®s Takeshi Takahashi per produir una nova transcripci√≥, tamb√© basada en el "copyflo" de Yale (vegeu la nota 9) , que era el primer que es podria considerar essencialment complet. Va utilitzar "Eva maj√ļscula" per representar tots els car√†cters de refer√®ncia o pedestallats, per exemple, "Sh" per Sh . Tamb√© ha actualitzat la seva transcripci√≥ al llarg del temps, basant-se en informes dels usuaris.

El fitxer de transcripció interlineal

Basat en un esfor√ß inicial de Jim Reeds, Gabriel Landini va recollir les transcripcions m√©s antigues importants esmentades anteriorment en un √ļnic fitxer interlinear , el que significa que es van presentar juntes per l√≠nia. Tots es van convertir en Eva, ja que aquesta conversi√≥ √©s coherent i revisable, com es va esmentar anteriorment.

El brasiler Jorge Stolfi va agafar aquest fitxer interlinear i va fer un esfor√ß molt important per millorar-lo, afegint transcripcions addicionals. Aix√≤ va incloure la transcripci√≥ completa de Takeshi Takahashi (estat de 1999), on va convertir la capitalitzada Eva a min√ļscules. Tamb√© va afegir les seves pr√≤pies transcripcions i transcripcions parcials de diverses altres, per exemple, John Grove. Com a resultat, aquest fitxer interlinear s'ha convertit en la font de fet per a les dades de transcripci√≥. A continuaci√≥, es coneix com a fitxer Interlinear Landini-Stolfi, amb l‚Äôabreviatura "LSI".

v101

Uns anys més tard, Glen Claston va iniciar una transcripció completa del MS Voynich i va idear un alfabet de transcripció que ell va anomenar Voynich 101 (aquí v101). L’alfabet v101 s’ha dissenyat per mantenir les combinacions de traços que li semblen signes individuals com a caràcters individuals. A més, distingeix entre diverses variants de caràcters que es van considerar un i el mateix en tots els alfabets anteriors. Va transcriure el text complet del MS Voynich usant aquest alfabet. A continuació es mostra la seva definició de l’alfabet i l’assignació a valors ASCII.

També per a l'alfabet v101 s'ha dissenyat un tipus de lletra True Type i, igual que el tipus de lletra Eva, permet la representació d'alta qualitat del text Voynich MS en documents electrònics (Word, Excel). També es pot descarregar aquest tipus de lletra al mapa del lloc . A continuació, aquesta transcripció s'indicarà amb l’abreviatura "GC".

Format de fitxer de transcripció

Per a l'anàlisi de les diverses transcripcions de text de Voynich MS, és molt desitjable que aquestes transcripcions estiguin contingudes en fitxers amb un format (estandarditzat) ben definit. Aquests fitxers haurien de ser "anotats", el que significa que inclouen les anomenades metadades, que no és el text en si, sinó informació sobre el text. Aquesta metadada ha d’indicar per a cada peça de text en què es troba el fulletó o la pàgina i on es troba a la pàgina. Es pot incloure informació rellevant addicional sobre les pàgines o el text. El programari d’anàlisi hauria de poder interpretar aquesta informació o ignorar-la.

En els primers dies d'Internet, quan s'estava ampliant la transcripció per part de Currier, es va acordar un format per a aquest nou fitxer. Aquest format es va ampliar en el transcurs de la transcripció per Gabriel Landini i jo. Va ser modificat per Jorge Stolfi i utilitzat en aquesta versió final en el recurs principal: el fitxer interlineal Stolfi-Landini.

Malauradament, les diferències són bastant significatives i el fitxer de transcripció v101 utilitza una altra representació. Només es poden donar algunes convencions generals aquí.

Símbol (s) Significat Comentari
# (hash) al començament de la línia Tota la línia és un comentari. No s'utilitza a "GC".
{...} Tot el text en claudàtors és igualment un comentari. Això pot aparèixer en qualsevol lloc d’una línia. No s'utilitza a "GC".
<...> Aquest √©s un indicador de lloc i apareix a l‚Äôinici de cada segment de text. Explica on es pot trobar aquest text. Si no inclou un per√≠ode (.), √Čs l'inici d'una nova p√†gina
[...] S'utilitza per a la lectura alternativa o incerta. [ao] significa que pot ser un o un o, però el transcriptor no és cert. Les opcions poden estar separades per un | que és opcional en cas que només hi hagi dos, però obligatoris quan hi hagi més, per exemple, [r | s | d]. Si és possible, l’opció més probable hauria de ser la primera. S'utilitza principalment a "Vnow" i "LZ".
. Un espai de paraules (separador de paraules). Utilitzat per tots
, Un espai de paraules incert. Utilitzat per la majoria
- Intrusió del dibuix en el text. En algunes transcripcions també s'utilitza per marcar el final d'una línia
= al final de la línia. Final d’un paràgraf. Utilitzat per tots
* Un sol caràcter il·legible. "GC" utilitza un?

L‚Äôestructura dels tipus de locus varia molt entre fitxers i fins i tot dins del fitxer "LSI", que no es pot proporcionar resum. El fitxer "GC" identifica loci per un n√ļmero de l√≠nia o una identificaci√≥ m√©s descriptiva en altres casos.

Jorge Stolfi tamb√© va introduir la caracter√≠stica √ļtil en el fitxer "LSI", on un √ļnic lloc pot ser representat diverses vegades, tal com es transcriu per diferents persones. En aquest cas, l'indicador de locus √©s post-fixat per un "identificador d'autor", que √©s un car√†cter en maj√ļscules. Es troba dins dels <> claud√†tors i precedit per un punt i coma.

Eina de transcripció

Per (pre-) processar un fitxer de transcripci√≥ per a l'an√†lisi estad√≠stica, he desenvolupat una eina de l√≠nia de comandes anomenada VTT (Voynich Transcription Tool). Aix√≤ es basa en el format del fitxer de transcripci√≥ del fitxer "LZ" i permet diverses operacions √ļtils sobre el text, principalment l'eliminaci√≥ dels diferents tipus d‚Äôanotacions i la selecci√≥ de p√†gines en funci√≥ de les seves propietats.

Aquesta "opci√≥ de selecci√≥ de p√†gines" es basa en la disponibilitat de comentaris espec√≠fics a les cap√ßaleres de p√†gines que defineixen "variables de p√†gina". Aquests s'utilitzen consistentment als fitxers "LSI" i "LZ". Sense entrar en tots els detalls, la seg√ľent l√≠nia en un fitxer de transcripci√≥:

{$ L = A $ H = 1 $ I = H}

estableix les tres variables de p√†gina L, H i I als valors A, 1 i H respectivament. (Aix√≤ significa, respectivament: llenguatge currier = A, m√† de currier = 1, tipus d'il¬∑lustraci√≥ = herbal). Es pot instruir l‚Äôeina VTT per incloure o excloure p√†gines amb qualsevol combinaci√≥ de variables establertes a determinats valors. Aquesta caracter√≠stica √ļtil tamb√© s‚Äôha incl√≤s al "Navegador d‚Äôinformaci√≥ Voynich" d‚ÄôElias Schwerdtfeger, que es mostra a continuaci√≥ .

L'estat de coses el 2017

Per resumir l'estat dels recursos de transcripció disponibles per a l'any 2017, tenim èxits importants, però també àrees problemàtiques molt importants.

Assoliments

Hi ha disponibles diverses transcripcions independents del MS Voynich. Hi ha tres que estan gairebé complets:

  • La transcripci√≥ de Landini-Zandbergen ("LZ"), que no va ser publicada mai.
  • El fitxer Landini-Stolfi Interlinear ("LSI"). La transcripci√≥ de Takeshi Takahashi, inclosa en ella, √©s gaireb√© completa.
  • La transcripci√≥ v101 de Glen Claston ("GC").

A continuació es mostra una llista més completa dels esforços de transcripció.

Àrees de problemes

La transcripci√≥ del MS Voynich √©s particularment dif√≠cil, ja que no es pot llegir el text. Un no t√© ajuda del context. El major problema √©s decidir si dos car√†cters gaireb√© semblants s√≥n dos, o dues representacions del mateix, on la variaci√≥ nom√©s √©s causada per variacions d‚Äôescriptura. Mentre es transcriu, un √©s obligat cont√≠nuament a prendre aquestes decisions i √©s inevitable que siguin subjectius. Hi ha un problema similar per decidir sobre espais de paraules. De vegades, els car√†cters es compensen una mica i √©s dif√≠cil decidir si hi ha un espai o no. Fins i tot la introducci√≥ de la coma per representar un espai incert no resol completament aquest problema. L‚Äô√ļnica manera d‚Äôavistar d‚Äôaquests dos problemes √©s que aquestes decisions s‚Äôadoptin de manera m√©s objectiva, √©s a dir, mitjan√ßant un programari (OCR), per√≤ estem lluny de ser capa√ß d‚Äôaconseguir-ho.

Un segon problema general és la manca de normes. Com es va esmentar anteriorment, els fitxers de transcripció tenen diferències força significatives en el format. No hi ha cap lloc on es recullen tots ells. Del fitxer interlinear també hi ha diverses versions.

Actualment és impossible presentar la transcripció "GC" en cap dels formats estàndard, ja que molts dels símbols que tenen un significat especial al fitxer "LSI" (i "LZ") són representacions dels caràcters de text Voynich MS a la Transcripció "GC". Cal trobar una solució a aquest problema.

Gaireb√© sempre √©s impossible repetir les an√†lisis fetes per altres, ja que no sabem quines dades van utilitzar, i realment no hi ha cap manera clara de com podrien haver-lo especificat. El format (s) de fitxer utilitzat actualment est√† lluny de les normes de representaci√≥ modernes. Ja fa m√©s d‚Äôuna d√®cada, RafaŇā Prinke va suggerir l‚Äô√ļs de TEI (Text Encoding Initiative), per√≤ mai no va sortir. Hi ha alguns comentaris m√©s sobre aquest tema general a la p√†gina final d‚Äôaquest lloc i es proporciona una descripci√≥ m√©s detallada en una p√†gina independent.

Transcripció de text de pròxima generació

Nova iniciativa

Inventari del text transcrit

Com es va esmentar anteriorment, existeixen tres transcripcions gairebé completes del text. Per establir la cobertura del text Voynich MS per cadascun d’ells, he comparat els tres amb l’altre i amb les imatges digitals de l’EM. Això va mostrar que hi ha algunes inconsistències menors en el recompte dels diferents llocs , que es podrien resoldre.

Nou format de fitxer de transcripció

L’anàlisi va mostrar que la transcripció "LZ", que es va beneficiar fortament de l’obra de Theodore Petersen, és més completa. Només falta:

  • Els pocs car√†cters de l‚Äôescriptura al marge dret de f1r (3 s√≥n visibles)
  • Les paraules curtes sota la pintura d‚Äôuna fulla a f2r (en tots els fitxers existents).
  • Una entrada al marge esquerre de f11v (tamb√© falta a tots els fitxers existents).
  • Les paraules de l‚Äôescriptura Voynichese que s‚Äôinclouen al marge superior de f17r , nom√©s s√≥n visibles sota llum ultraviolada (igualment a tots els fitxers de transcripci√≥ existents).
  • Les dues paraules Voynichese de f116v , que nom√©s es van incloure a "LSI".

He creat un fitxer nou que inclou només la meva pròpia part de l’esforç de transcripció LZ i l’he actualitzat per incloure tots els 5389 llocs . A continuació es coneixerà com a fitxer "ZL" (Zandbergen-Landini) i reconec la important influència de Gabriel Landini en la creació de la meva pròpia transcripció.

Tots els loci han estat distribu√Įts en diferents tipus, classificats per dos car√†cters. A continuaci√≥ es mostra la distribuci√≥ dels llocs sobre aquests tipus per a tot el MS (11) .

Escriviu Subtipus Significat Comptar
P - Tot el text en execució en paràgrafs 4130
- P0 Text alineado a l'esquerra estàndard 3885
- P1 Línies sangrades per mitja pàgina a causa de dibuixos o un altre text 72
- Pb Text dislocat en paràgrafs flotants lliures 134
- Pc Línies centrades en paràgrafs normals 17
- Pr Línies justificades a la dreta en paràgrafs normals 12
- Pt Títols del text del paràgraf normal 10

L - Totes les etiquetes i paraules o caràcters dislocats 1033
- L0 Paraules o caràcters individuals no prop d’un element de dibuix 297
- La Etiquetes d’elements astronòmics o cosmològics que no són estrelles o etiquetes del zodíac 7
- Lc Etiquetes de contenidors a la secció farmacèutica 40
- Lf Etiquetes de fragments d'herbes a la secció farmacèutica 195
- Ln Etiquetes de les nimfes a la secció biològica / balneològica 63
- Lp Etiquetes de plantes completes a la secció d'herbes 3
- Ls Etiquetes d'estrelles 76
- Lt Etiquetes de "tubs i banyeres" a la secció biològica / balneològica 47
- Lx Peces individuals d’escriptura "externa (?)" 6
- Lz Etiquetes d’elements del zodíac 299

C - Tot escrivint al llarg dels cercles 84
- Ca Escriure en sentit antihorari al llarg dels cercles 1
- Cc Escriure en sentit horari al llarg dels cercles 83

R - Tot escrivint al llarg dels radis dels cercles 142
- Ri Escriptura cap a l'interior al llarg dels radis dels cercles 75
- Ro Escriptura externa al llarg dels radis dels cercles 67

Total

5389

Nou format de fitxer de transcripció

Per poder representar totes les transcripcions existents en un √ļnic format de fitxer, utilitzant el seu propi alfabet de transcripci√≥ original, cal resoldre una s√®rie de problemes, principalment relacionats amb el joc de car√†cters de l‚Äôalfabet v101, que s‚Äôha mostrat anteriorment .

La taula seg√ľent explica les convencions utilitzades per al nou format, que he anomenat IVTFF (format intermedi de fitxers de transcrici√≥ Voynich).

La descripció del format completa es pot trobar aquí .

# (hash) al començament de la línia Tota la línia és un comentari.
Amb el caràcter Aquest és un indicador de lloc i apareix a l’inici de cada segment de text. Explica on es pot trobar aquest text. A continuació s'explica el format dels indicadors de locus .
...> Amb el <* NOT * a la primera posició d’una línia. Tot el text entre els delimètres és un comentari. Això pot aparèixer en qualsevol lloc d’una línia.
. Un espai de paraules (separador de paraules).
, Un espai de paraules incert.
[...] S'utilitza per a la lectura alternativa o incerta. [ao] significa que pot ser un o un o, però el transcriptor no és cert. Les opcions poden ser separades per un: el qual és opcional si només hi ha dos, però obligatòria quan hi hagi més, per exemple, [r: s: d]. Si és possible, l’opció més probable hauria de ser la primera.
{...} Una lligadura de car√†cters est√†ndard. √ös √ļnicament amb els alfabets Eva i Frogguy
@nnn; Un codi d'alta ascii. nnn ha d'estar entre 128 i 255
<-> Intrusió del dibuix en el text.
<$> al final de la línia. Final d’un paràgraf.
/ al final de la l√≠nia Aquest lloc es continua a la seg√ľent l√≠nia del fitxer. Aquesta l√≠nia tamb√© ha de tenir un / en la primera posici√≥.
? Un sol caràcter il·legible.
??? Un nombre incert de caràcters il·legibles.

Hi ha dos tipus d’indicadors de locus :

Un indicador de lloc sense un període significa l’inici d’una nova pàgina, en aquest cas f17r. No hi haurà text Voynich MS després d’aquest, però pot haver-hi un comentari, amb metadades referides a tota la pàgina.
Aquest és l’inici d’una peça de text del lloc "Ab". El valor de N ha d’augmentar monòtonament, començant per 1 per a cada pàgina. El significat de @ s'explica a la descripció detallada del format. El locus tipus Ab és com a la Taula que es mostra sota el títol "Inventari del text transcrit", anterior.
Igual que anterior, però identificant el transcriptor pel caràcter T.

Per preprocessar tots els fitxers en format IVTFF, l’eina VTT ha estat modificada i es diu IVTT.

Eina de transcripció Voynich

Ubicació dels principals recursos de transcripció

A continuació trobareu enllaços als recursos de transcripció originals que tinc coneguts i a les noves còpies en format IVTFF. Es presenten aproximadament en ordre cronològic.

Codi Descripció Alfabet Original Còpia en IVTFF Notes
FSG Còpia de la transcripció de la FSG, creada per Friedman's First Study Group, en el format preparat per Jim Reeds i Jacques Guy. FSG >> Enllaç versió beta (12)
CD La transcripció original de D'Imperio i Currier Currier >> Enllaç versió beta (13)
Vnow La versió actualitzada d’aquest fitxer, realitzada durant els primers anys de la llista de correu Voynich MS. Currier >> Enllaç Temporalment no disponible ! (14)
TT La transcripció original de Takeshi Takahashi. Eva A un conjunt de pàgines separades del seu lloc web. Versió 1999 (15)
LSI El fitxer Landini-Stolfi Interlinear Eva A una pàgina >> a la pàgina de Stolfi amb enllaços a aquest fitxer en diversos formats comprimits. versió beta (23/08/2017)
GC El fitxer de transcripció v101. v101 Còpia local . - Ordre de locus original
- ordenats
(16)
ZL El "Zandbergen" forma part de l'esforç de transcripció LZ. Eva - versió 1b (17)

El navegador d'informaci√≥ >> Voynich d' Elia Schwerdtfeger permet extreure transcripcions individuals del fitxer "LSI", amb moltes opcions √ļtils.

Notes

1
Està inclòs en els ítems 1615.1 i 1615.2 de la col·lecció William F. Friedman. Per obtenir més informació sobre la Biblioteca Marshall, vegeu aquí .
2
Vegeu Reeds (1995) .
3
Vegeu Bennett (1976) .
4
Vegeu Brumbaugh (1978) .
5
Estic agra√Įt a Jonina Duker pels seus records d'aquests esdeveniments de fa 40 anys.
6
Per descomptat, no tenim cap manera de saber si una suposició és correcta o no.
7
D'altra banda, hauria de quedar clar que no totes les característiques d'una transcripció feta directament a Eva poden convertir-se en els alfabets de transcripció més antics de manera reversible.
8
Aquest tipus de lletra ha estat dissenyat per Gabriel Landini i s’utilitza àmpliament en aquest lloc web. Vegeu el mapa del lloc .
9
Una impressió en blanc i negre d’un microfilm fet a la dècada dels setanta, vegeu també aquí .
10
Gabriel Landini va afegir tots ells a la font True Type.
11
Vegeu també la pàgina sobre el sistema d’escriptura .
12
Extret del fitxer LSI i convertit de nou en l’alfabet FSG. Encara no s’ha comprovat completament l’original.
13
Convertit de l’original.
14
Extret del fitxer LSI i convertit a l’alfabet de Currier. Resulta que el fitxer LSI estava incomplet, per la qual cosa s'ha de tornar a fer. Important, ja que aquest fitxer va ser utilitzat per Reddy i Knight, i part d’ella per Hauer i Kondrak.
15
S'ha extret la versió de 1999 del fitxer LSI. Les versions actuals encara s’han de processar.
16
S'ha verificat el fitxer. L‚Äô√ļnic canvi d‚Äôordre de lloc est√† relacionat amb l‚Äôordre de les p√†gines, √©s a dir, que la p√†gina de rosetes s‚Äôha mogut entre f85r2 i f86v4.
17
La versió 1b del 24/09/2017 té tots els errors coneguts. Les versions abans de les 0h tenien la majoria de textos ciculars llargs corromputs.
Continguts Inici Superior Anterior Pròxim
Mapa Ref Fotos Cerca Pàgines
Copyright René Zandbergen, 2018
Comentaris, preguntes, suggeriments? Els vostres comentaris són benvinguts.
Última actualització: 02/02/2018




versió per imprimir

Comentaris publicats

    Afegeix-hi un comentari:

    Nom a mostrar:
    E-mail:
    Genera una nova imatge
    Introdu√Įu el codi de seguretat
    Accepto les condicions d'ús següents:

    Per a participar en els comentaris l'usuari es compromet a complir i acceptar les següents normes bàsiques de conducta:

    • Respectar les opinions de la resta dels participants al fòrum, tot i no compartir-les necessàriament.
    • Abstenir-se d'insultar o utilitzar un llenguatge ofensiu, racista, violent o xenòfob, i no tenir cap conducta contrària a la legislació vigent i a l'ordre públic.
    • No enviar cap contingut amb copyright sense el permís del propietari. Si es considera oportú facilitar continguts d'internet amb copyright, cal escriure la URL completa perquè els altres usuaris puguin enllaçar-hi i descarregar-se els continguts des de la pàgina propietària.
    • Publicitat: No es permet enviar continguts promocionals i/o publicitaris.