lunes, 4 de abril de 2016

XML-TEI Bible

En uno de los últimos posts comenté algunos aspectos de un pequeño proyecto que comencé hace algunos meses y del que me gustaría informar sobre importantes novedades. El proyecto pasa a llamarse XML-TEI Bible y es una codificación en XML-TEI de los textos de la Biblia. XML es un lenguaje de marcado (markup language) emparentado con el HTML que conocemos de la web. TEI es una variante muy utilizada en proyectos editoriales y filológicos dentro y fuera de las Humanidades Digitales. Con este lenguaje estoy marcando en los textos bíblicos la siguiente información por ahora:
  • Estructura básica de libros, capítulos, perícopas y versículos
  • Identificar unívocamente personas, grupos, lugares y momentos
  • Diálogo, incluyendo quién habla con quién cómo (escrito, hablado, oración)
El código tiene la siguiente pinta, por ejemplo en concreto el pasaje de Mateo 1:20-21:
¿Por qué hago esto? Porque no me he encontrado una versión TEI de la Biblia que tenga codificada información dentro de los versículos. Creo que la Biblia tiene un mensaje importante para cada persona. Poder estructurar el texto lentamente de esta manera me permite acceder a detalles que una lectura normal omite. Y una vez el trabajo está terminado con un libro (y unas pocas decenas de capítulos por libro no es tanto), permite ver tendencias que los versículos ocultan.

Porque una vez se tienen los datos estructurados en el texto, se pueden extraer aspectos concretos y visualizarlos mediante otras herramientas. Por ejemplo, ¿quién habla en el Apocalipsis?:

¿A quién se menciona en los diálogos del Evangelio de Juan?

¿Y quiénes aparecen mencionados en el mismo versículo en el Evangelio de Mateo?
Estos son solo un par de ejemplos sobre posibles visualizaciones, pero al estar los datos ahí, se pueden utilizar o visualizar de otras maneras.

Por ahora están completados los Evangelios de Mateo, Juan y Apocalipsis, y he comenzado hace algunos días con Génesis, tras lo cual quiero continuar dando saltos por la Biblia. Además he desarrollado algunos programitas y archivos para facilitar la preparación (python), la extracción (XSLT y python) y visualización (CSS) de los datos, amén de cierta documentación. Todo está publicado en GitHub:

Hasta ahora he trabajado con el texto en español, lengua en la que quiero seguir realizándolo, aunque también se puede desarrollar el proyecto parte o totalmente en otras lenguas si existe el interés de realizarlo.

El proyecto ha tenido tres importantes influencias:
  1. la primera persona que me trajo la idea de estructurar digitalmente el contenido bíblico fue Silvia Gutiérrez 
  2. Un proyecto absolutamente fascinante sobre la Biblia y las Humanidades Digitales es OpenBible, a quienes les agradezco su web, sus datos, sus ideas y su cercanía
  3. Y por último, este proyecto reutiliza muchísimo de lo que aprendo a diario en CLiGS, en la Universidad de Würzburg. De hecho le agradezco a mi colega Ulrike Henny su constante ayuda con XPath y XSLT
Quiero ser todo lo abierto que me dejen con el proyecto. No solo los datos están ahí, también estoy muy abierto a posibles colaboraciones tanto puntuales como a medio o largo plazo. Sería especialmente interesante que gente con más conocimientos que yo de teología, Biblia, historia, informática u otras lenguas (vivas o muertas) quisiesen colaborar. También estoy abierto a otras perspectivas o áreas que puedan enriquecer el proyecto.

2 comentarios:

Anónimo dijo...

Enhorabuena. Es una idea magnífica. Si se hiciera eso con otros textos de "valor" podríamos hacer unas lecturas mucho más interesantes y ir mucho más lejos de donde hemos ido hasta hora. La lectura a distancia (distant reading) tiene mucho que decir y ayudar a la lectura profunda (deep reading). Prometo estudiar tus scripts. Un TEImaníaco.

José Calvo Tello dijo...

Hola! Gracias por tu comentario, me alegra que sea de interés. Uff, lo de estudiar mis scripts me pone mucha presión, son muy mejorables ;)

LinkWithin

Related Posts with Thumbnails