1. Inicio
  2. Primeros pasos
  3. Estructura de un documento TEI-XML

Estructura de un documento TEI-XML

Un documento TEI XML es una colección de etiquetas anidadas unas dentro de otras con una estructura jerárquica muy clara y definida. Todo el contenido de un documento TEI va enmarcado por la etiqueta <TEI>:

<TEI> …… </TEI>

Es la única etiqueta que va entera en mayúsculas. El resto de etiquetas irá siempre en minúsculas o con alguna mayúscula interna si la etiqueta es la abreviatura de dos palabras. Hay que respetar siempre el formato de cada una.

Todo documento TEI XML está dividido siempre en dos partes principales, la cabecera o <teiHeader> y el texto propiamente dicho o <text>:

<TEI>

	<teiHeader>
		... Contenidos de la cabecera del documento ...
	</teiHeader>

	<text>
	 	 ... El documento ....
	</text>

</TEI>

<teiHeader>

Para toda la información e instrucciones sobre cómo hay que completarlo véase el capítulo dedicado al <teiHeader>.

<text>

Como nuestras ediciones contienen textos originales alineados con una o varias traducciones en paralelo, cada una de esas versiones del texto supone en sí misma un <text>. Y para que un único documento XML pueda contener varios <text> es necesario agruparlos con la etiqueta <group>. Esto permite añadir todas las traducciones que se desee, sin límite.

Así, el <text> de todas nuestras ediciones tiene la siguiente estructura:

<text>
	<group>
		<text type="source" xml:lang="la">
			<body>
				... Contenidos de la edición crítica: texto original y aparato crítico ...
			</body>
		</text>
		<text type="translation" xml:lang="es">
			<body>
				... Contenidos de la traducción paralela en español, con comentario en forma de notas ...
			</body>
		</text>
		<text type="translation" xml:lang="en">
			<body>
				... Contenidos de la traducción paralela en inglés, con comentario en forma de notas ...
			</body>
		</text>
	</group>
</text>

Es relevante observar los dos atributos que han de llevar obligatoriamente cada uno de los <text> dentro del <group>:

  • @type: hay dos posibles: "source" si es el <text> que recoge el texto original y su aparato crítico, y "translation", si recoge una de las traducciones.
  • @xml:lang: se ha de indicar la lengua en la que está cada uno de esos <text>. Véase el capítulo de @xml:lang para conocer los códigos de idioma posibles.

<body>

Cada uno de los <text> que integran el <group> raíz de nuestras ediciones contiene una única etiqueta <body>, el cuerpo del documento.

En <body> se contienen el texto original, el aparato, las traducciones, y las notas que se quieran añadir para confeccionar el comentario.

Cada obra tendrá su propia estructura interna dentro de su <body>: no tiene la misma estructura un poema épico que una tragedia, o una obra en prosa. Para conocer las diferentes estructuras de cada tipo de texto, cf. la etiqueta <div> y sus subcapítulos.

Para conocer qué etiquetas se pueden utilizar dentro del <body> para componer nuestras ediciones, véase el capítulo de Etiquetas importantes.

Sobre cómo etiquetar de forma alineada texto original y traducciones, véase el capítulo Alineamiento de texto original y traducciones.

¿Cómo podemos ayudarte?

es_ESES