tag:blogger.com,1999:blog-61891068217343782812024-02-07T14:19:38.868+01:00EumanismoIdiomas, Europa y otros humanismosJosé Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.comBlogger572125tag:blogger.com,1999:blog-6189106821734378281.post-32160246920468977712017-05-31T16:09:00.000+02:002017-05-31T16:10:42.798+02:00Ponme un café que colecho<div dir="ltr" style="text-align: left;" trbidi="on">
<h2>
Precedentes</h2>
<div dir="ltr" style="text-align: left;" trbidi="on">
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiIh-yixzeCtiU1ugqUc0VQYj0n1orR-DOGUhxukQM9044WqRWzPPMm60Vkh9_0w8VmAbM22odDKGU0VTgBtMIjY48T3KiPO7I7fAJSVlwwOeZipBpWwoxhyphenhyphenooYBMInQ4YEK3bB8L0UBY0/s1600/Screenshot+from+2017-05-31+15%253A32%253A55.png" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" data-original-height="353" data-original-width="477" height="236" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiIh-yixzeCtiU1ugqUc0VQYj0n1orR-DOGUhxukQM9044WqRWzPPMm60Vkh9_0w8VmAbM22odDKGU0VTgBtMIjY48T3KiPO7I7fAJSVlwwOeZipBpWwoxhyphenhyphenooYBMInQ4YEK3bB8L0UBY0/s320/Screenshot+from+2017-05-31+15%253A32%253A55.png" width="320" /></a></div>
<b>Marge</b>: I'm afraid we're going to need a bigger house.<br />
<b>Homer</b>: No, we won't. I've got it all figured out. The baby can have
Bart's crib and Bart'll sleep with us until he's 21.<br />
<b>Marge</b>: Won't that warp him?<br />
<b>Homer</b>: My cousin Frank did it.<br />
<b>Marge</b>: You don't have a cousin Frank.<br />
<b>Homer</b>: He became Francine back in '76. Then he joined that cult. I
think her name is Mother Shabubu now.<br />
<br />
Cuando era niño, este era mi único recuerdo de alguna referencia sobre niños que dormían en la cama de sus padres. Ha llovido desde entonces.<br />
<br />
<h2>
Colecho: el secreto a gritos</h2>
Tener hijos te descubre una parte de la realidad que hasta ese momento sencillamente no veías. Llevo dos años y medio inmerso en esa nueva realidad desde que nació mi primer hijo y uno de los descubrimientos más sorprendentes es que hoy en día la mayoría de los padres pone a dormir a sus hijos pequeños en su cama (la de los padres), normalmente casi desde el nacimiento, durante algunos años (digamos entre 2 y 7 años). Lo tenemos bien atestiguado en familias de Alemania y España, pero lo hemos visto en muchas familias culturalmente relacionados con países tan diferentes como Siria o Estados Unidos, pasando por China o Brasil. De hecho lo vemos en todas las culturales con las que tenemos algún contacto. Digo la mayoría y no sé si eso es el 95% o el 55%, pero sí percibimos que es claramente más de la mitad.<br />
<br />
Hasta hace algunos años esta situación se mantenía más o menos en silencio. Poco a poco se va normalizando e incluso se le ha puesto un nombre: <i>colecho</i> (sustantivo) o <i>colechar</i> (verbo)<i>:</i> <i>yo colecho, tú colechas, él colecha</i>, nosotros no colechamos, pero a eso llegaremos. Digo que la situación se ha normalizado parcialmente porque en realidad uno nunca ve que los padres hayan tomado la decisión de manera tan consecuentemente como para que el niño no tenga cama en su cuarto. No sabéis la cantidad de camas vírgenes que hay hoy en día en los cuartos de retoños, esperando ser desfloradas con el sueño del infante. Tampoco los padres suelen explicar esto a la primera posibilidad que tienen, por lo que resulta algo complicado en realidad saber quién colecha y quién no colecha. <br />
<br />
Ahora mismo entre los lectores de este post tiene que haber dos respuestas muy diferentes.<br />
<ol style="text-align: left;">
<li>"Cuéntame algo nuevo; no entiendo por qué te has tomado el tiempo de escribir estas obviedades" pensarán la mayoría de padres jóvenes </li>
<li>"Pero de qué estás hablando???????" pensarán tanto los padres de hijos adultos, como la gente que no tiene hijos </li>
</ol>
Ahora que todos estamos en la misma página, vamos a seguir por detallar por qué he querido escribir este post. En primer lugar porque en las redes sociales en los últimos años he visto exclusivamente opiniones favorables que no comparto. En segundo lugar, porque creo que muchos padres empiezan poniendo a dormir al niño en su cama algunos días que llora mucho cuando es muy pequeño; esto se repite varias veces durante las siguientes semanas, se va convirtiendo en norma y de pronto uno aprende la palabra <i>colecho</i> y se da cuenta que lleva practicando colecho desde hace meses o años. Es decir, el colecho se implanta de manera orgánica sin saber muy bien cuáles van a ser las repercusiones. Porque si el llanto de un bebé de pocos meses para dormirse es doloroso, tienes que probar el llanto de un niño de 4 años que ya puede rogarte que por favor mamá, papá, llevadme a vuestra cama, que os quiere mucho y que tiene mucho miedo.<br />
<br />
Pero el argumento más importante para escribir este post fue que creo que el discurso sobre el colecho oculta de manera activa tres problemas importantes.<br />
<br />
<h2>
"Hoy en día los niños duerme con los padres"</h2>
Los padres que colechan han ido saliendo del armario a golpe de post y de redes sociales. <a href="https://www.bebesymas.com/tag/colecho"><i>Bebes y más</i></a> es un buen ejemplo de web donde se da una imagen entusiasta del colecho. Algunos ejemplos de post del sitio:<br />
<ul style="text-align: left;">
<li><a href="https://www.bebesymas.com/lactancia/el-colecho-y-la-lactancia-estan-tan-relacionados-entre-si-que-pronto-hablaremos-de-breastsleeping">El colecho y la lactancia están tan relacionados entre sí que pronto hablaremos de "breastsleeping"</a> </li>
<li><a href="https://www.bebesymas.com/ser-padres/no-lo-metas-en-tu-cama-que-se-acostumbra">"No lo metas en tu cama, que se acostumbra"</a></li>
<li><a href="https://www.bebesymas.com/ser-padres/mis-hijos-ya-no-duermen-conmigo-conclusiones-tras-9-anos-de-colecho">Mis hijos ya no duermen conmigo: conclusiones tras 9 años de colecho</a></li>
<li><a href="https://www.bebesymas.com/habitacion-infantil/la-increible-habitacion-colecho-en-la-que-duerme-una-pareja-y-sus-cinco-hijos">La increíble "habitación colecho" en la que duerme una pareja y sus cinco hijos</a></li>
</ul>
El discurso, las bromas, las expectativas, los regalos van haciendo que el colecho parezca hoy en día la opción por defecto para padres inseguros que acaban de recibir una criatura y que, efectivamente, se duerme mejor en la cama de los padres que en su cunita. Como alguien de nuestra familia resumió una vez "bueno, hoy en día los niños duermen con los padres".<br />
<br />
Los argumentos que se mencionan a favor del colecho son varios:</div>
<div style="text-align: left;" trbidi="on">
<ol style="text-align: left;">
<li>el niño se duerme mejor</li>
<li>está más cerca de la cama por lo que se le atiende más rápido</li>
<li>facilita dar el pecho</li>
<li>la cercanía física es mayor</li>
<li>los niños y los padres lo disfrutan </li>
</ol>
Los argumentos en contra del colecho que a nosotros nos dieron en la clínica fue que aumenta las probabilidades de muerte súbita y que el niño tiene riesgo de pasar mucho calor o de que le aplastemos. No están mal los argumentos. Claro que los estudios de muerte súbita están basados en pura estadística y no tenemos la menor idea de qué la causa, por lo que sus resultados pueden estar afectados por la selección de la muestra. Lo que nos recomendaron fue que durmiese durante los primeros meses en una cuna en nuestro cuarto y que posteriormente durmiese en su propio cuarto.<br />
<br />
No voy a intentar desmontar los argumentos. Los argumentos a favor pueden ser verdad y los argumentos médicos pueden ser contrarrestados con camitas especializadas para el colecho. Sencillamente creo que el colecho trae también aspectos negativos que en mi opinión acaban pesando más que los positivos.<br />
<br />
<h2>
Dormirse con los padres no es una necesidad</h2>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjKmZYMWBSuuvCXuZlZ4FvnxMGNfT45FxiIvwQuFnhhFfGIrXDmt14LCz5GDUvGNp6ZwChlgzkxnwqhDQlQSeC8sWl4Kd4EgNOqaaaWpmBVdI1tFuzlMJRjnQyS-BR_jAVoUFNlUVqKMj4/s1600/real.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" data-original-height="720" data-original-width="523" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjKmZYMWBSuuvCXuZlZ4FvnxMGNfT45FxiIvwQuFnhhFfGIrXDmt14LCz5GDUvGNp6ZwChlgzkxnwqhDQlQSeC8sWl4Kd4EgNOqaaaWpmBVdI1tFuzlMJRjnQyS-BR_jAVoUFNlUVqKMj4/s320/real.jpg" width="232" /></a></div>
Ante las enormes inseguridades que unos padres jóvenes padecen una de las maneras para saber si uno está haciendo algo con sentido es preguntarse: "<b>¿qué necesita realmente mi hijo?</b>". Y en realidad un niño necesita cosas sencillas: alimento, cariño, aprobación, atención, reglas que pueda entender, descanso, sentirse seguro, poder aprender cosas nuevas, contacto social...<br />
<br />
Creo que el colecho no aporta nada esencial a ninguna de estas áreas que no pueda dar a mi hijo de otra manera. Sí, por supuesto que le das cariño durante el colecho y (sobre todo al principio) el niño coge el sueño más rápido que si está solo. Pero podemos darle al niño sobredosis de cariño de otras maneras. Y una vez se acostumbre a dormir solo, el niño se dormirá igual de rápido con o sin progenitor.<br />
<br />
"¿Pero por qué buscas <i>otras maneras</i> cuando puedes colechar?" me preguntarán. Ah amigo, ¡porque el colecho trae un reverso tenebroso que nadie cuenta!<br />
<br />
Antes de pasar al lado tenebroso, explico un poco nuestra experiencia. Nosotros tuvimos muy claro que queríamos que nuestros hijos durmiesen en su propia cama o cuna por diferentes razones. Supongo que en parte tuvo que ver que nuestra pedagoga favorita, <a href="http://eumanismo.blogspot.de/2014/10/ideas-que-aprendi-con-la-super-nanny.html">Cris Poli, <i>Supernanny Brasil</i>, argumenta fuertemente a favor de que los niños duerman en su cama</a>. Lo que hacemos nosotros para llevarle a la cama es tener una rutina fija a una hora fija para que entienda que ya se va a la cama: bajar la persiana, ponerse el pijama, lavar los dientes, sentarse en su cama con él, leer una historia, orar, cantar una canción y apagar la luz. Tanto él como yo sabemos cómo es la rutina de ir a la cama, tiene
diferentes fases breves, pasamos tiempo de calidad juntos y tiene un fin
marcado. Si se duerme en el mientras, bien; si no, se duerme después
solito en su cama.
<br />
<br />
En algunos momentos del día hicimos pasos que se acercaban al colecho. Por ejemplo, durante el primer año de vida, nuestro hijo mayor se dormía durante la rutina de ir a la cama. Se acostumbró tanto que cuando le poníamos en la cama se despertaba. Había desarrollado una dependencia total de nuestra presencia física para dormirse y quedarse dormido aunque no colechábamos. Con el tiempo nos dimos cuenta que no lo queríamos hacer así y le desacostumbramos.<br />
<br />
<h2>
El lado oscuro del colecho</h2>
<blockquote class="tr_bq">
A las palabras de amor<br />
les sienta bien su poquito<br />
de exageración.</blockquote>
<b>Antonio Machado</b><br />
<br />
Estos versos de Machado son tan válidos para palabras de amor romántico como de amor parental. Porque cuando decimos cosas como "haría lo que fuese por mis hijos", quedamos muy heroicos, pero en realidad tendríamos que medir algo mejor lo que decimos: eso que voy a hacer consigue una necesidad básica de mi hijo? Es un capricho suyo? Cuánto trastorno me va a conllevar? Podríamos estar haciendo otras cosas juntos?...<br />
<br />
Lo sé, sueno como un mal padre egoísta al que no le importan sus hijos. La cuestión es que quizás si tu hijo pudiese elegir fríamente, quizás elegiría a un padre menoss irritable que no 9 horas de sueño cuerpo a cuerpo. Ya sabes, en los aviones los adultos se ponen la máscara de oxígeno antes que los niños. No se hace por egoísmo, sino por pura supervivencia de ambos.<br />
<br />
La enorme mayoría de opiniones sobre el colecho obvian tres puntos esenciales:<br />
<ol style="text-align: left;">
<li>el tiempo que lleva</li>
<li>la vida sexual de la pareja</li>
<li>el descanso de los padres </li>
</ol>
Empecemos por el menos importante: el tiempo.<br />
<br />
<h3>
Qué práctico es el colecho! ... al principio</h3>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhAcSgoY9Nio0JJ-pG0hmFlpefXK0PocDvDHLphR17ieoOT5T4wGHL2ofD154tyOIOtPSafuWgOk6W29_nq2Bru6-OywwTZNRhqOCaTzIHwwbtH31OHJTAjli7WGuTveOSKH4hkWUx-B80/s1600/3abd1a73ea83cd33959a2778ba3dbb76.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" data-original-height="528" data-original-width="480" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhAcSgoY9Nio0JJ-pG0hmFlpefXK0PocDvDHLphR17ieoOT5T4wGHL2ofD154tyOIOtPSafuWgOk6W29_nq2Bru6-OywwTZNRhqOCaTzIHwwbtH31OHJTAjli7WGuTveOSKH4hkWUx-B80/s320/3abd1a73ea83cd33959a2778ba3dbb76.jpg" width="290" /></a></div>
En los primeros meses de existencia, un bebé es una criatura que duerme, come y aguanta un ratito despierto y se vuelve a dormir. Duerme tantas siestas al día que en realidad su estado natural es dormido, solo que hace pausas para despertarse. Una de esas siestas tiende a coincidir con los padres yéndose a la cama entre 10 y 12. Si uno tiene suerte, los tres os dormís al mismo tiempo y si tienes más suerte el bebé aguanta durante ese sueño más que durante las siestas del día.<br />
<br />
Con este ritmo es muy práctico llevarse al bebé a la cama, que la mamá pueda darle el pecho ahí y que se duerme más rápidamente y con menos lloros. ¡Genial!<br />
<br />
El problema es que esa fase dura en realidad relativamente poco tiempo, digamos entre 4 meses y 1 año. Durante el segundo semestre de vida, el niño irá durmiendo menos siestas, el sueño de la noche irá siendo cada vez más largo, le querremos poner a dormir antes de nosotros irnos a la cama, y probablemente la mamá le dejará de dar el pecho. Si los padres siguen colechando, lo que antes era práctico se convertirá en un engorro porque el niño no aceptará simplemente dormir en la cama de papá y mamá: lo que él quiere es que tú te quedes con él. Esto significa que:<br />
<ul style="text-align: left;">
<li>papá o mamá tendrá que irse a la cama con el niño</li>
<li>tumbarse con él hasta que se duerma</li>
<li>salir del cuarto sin que se despierte</li>
<li>orar para que el niño no se despierte mientras nosotros estamos en el salón hasta que nos vayamos a la cama</li>
</ul>
Y estos pasos vienen después del largo día de actividades/trabajo; y al final de la tarde-noche, que es de traca con su baño, cena, pijama, recoger, pañal, limpiarse los dientes, leer historia... Cuando ya estamos agotados y nos apetece hacer relajarnos en el sofá, tendremos que estar 15, 30, 45, 60, 90 minutos tumbados con el niño cantando, haciéndole caricias o cualquier cosa a la que le hayamos acostumbrado. Si a los 57 minutos de estar tarareando la misma canción sientes que empiezas a perder contacto con la realidad, tranquilo. Y cuando creas que está dormido, te gires para irte, y el niño empiece a llorar de nuevo, sentirás que la caja de Pandora de tu cráneo se ha descuajeringado. Tranquilo, eso es causa de tu naturaleza humana.<br />
<br />
Muchos padres cuentan medio en broma medio en serio historias tortuosas sobre las cosas que tienen que hacer para que sus niños se duerman y ellos puedan salir de su cuarto. Al fin y al cabo, colechar hace que el niño tenga una dependencia directa de la presencia de los padres para poder dormirse. Creo que a medio plazo esto no es bueno ni para los padres ni para el niño. Al fin y al cabo para el pequeño tampoco tiene que ser un plato de buen gusto despertarse tantas veces solo porque papá o mamá tiene que irse no sé adónde.<br />
<br />
<h3>
Sexo: bienvenido al club de una vez al año</h3>
Hablemos de eso que nuestra sociedad idolatra pero que tanto nos cuesta tratar de manera normal. Las opiniones sobre el colecho tienden a ignorar de manera olímpica el aspecto sexual. Vamos a constatar algunas obviedades: la vida sexual de una pareja se resiente por el embarazo, el parto y los hijos. Independientemente de cómo fuese antes la vida sexual, cómo de problemático fuese el embarazo y parto, y en qué fase los hijos se encuentren, el sexo tiende a ser menos espontáneo y menos frecuente. No significa que antes fuese maravilloso y después horrible, simplemente no resulta tan fácil. ¿Hasta aquí todos de acuerdo? Vale. En caso de que antes de tener hijos la pareja tenía la tendencia de tener relaciones sexuales principalmente en su cama y durante la noche, tengo una mala noticia para ellos: ese sitio y ese momento han sido conquistados.<br />
<br />
¿Se puede hacer en otro sitio o en otro momento? ¡Claro! Pero creo que es obvio que el colecho acaba resultando un extra de dificultad para la vida sexual. Con hijos es más difícil que antes; con hijos y colecho es extra difícil. Si esta situación se extiende durante meses, un año, un par de años, algunos años... una parte de la relación entre la pareja puede verse dañada. De hecho conocemos algunas parejas en las que uno de los progenitores, normalmente el padre, pasa a dormir al sofá o en el cuarto del niño, con lo que se crean delirantes escenas de tiarrones de 90 kilos, treinta y tantos y cuarenta tacos y bigote, durmiendo en camitas de princesa de 1 metro por 1,50 metros. La risa... O mejor dicho: las lágrimas...<br />
<br />
<h3>
¿Te acuerdas cuando dormíamos 4 horas del tirón?</h3>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj1P9gECD3RIhSfEUlZB9S7Cq6feNIpZcuF_QUQWxT_A0ogobtU8bw-B9In4Oz14Zt6W4EOYB8lAQ6CR3qwF9f7tSpfX2n7Ez9GZO7wE-xjczEp3jQg4t9h_VDvsp0RmOtaAk8rit07ens/s1600/slide_207879_666725_free.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" data-original-height="469" data-original-width="640" height="234" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj1P9gECD3RIhSfEUlZB9S7Cq6feNIpZcuF_QUQWxT_A0ogobtU8bw-B9In4Oz14Zt6W4EOYB8lAQ6CR3qwF9f7tSpfX2n7Ez9GZO7wE-xjczEp3jQg4t9h_VDvsp0RmOtaAk8rit07ens/s320/slide_207879_666725_free.jpg" width="320" /></a></div>
Igual que con la actividad sexual, el descanso resulta más difícil con niños (para las mujeres esa dificultad empieza con el embarazo): despertarse entre dos y cuatro veces como mínimo por la noche durante el primer año de vida del bebé es estándar, duerma el niño donde duerma. Ahora bien, lector que no tienes niños, imagínate que te pones un peluche relativamente grande en la cama y que duermes con él. Ese peluche está motorizado, tiene pilas y está programado para realizar una serie de funciones de manera absolutamente <i>random</i> durante toda la noche, entre ellas:<br />
<ul style="text-align: left;">
<li>girarse</li>
<li>gatear en cualquier dirección </li>
<li>extender las extremidades</li>
<li>dar patadas</li>
<li>darte besos o chuparte</li>
<li>bajarse de la cama</li>
<li>hablar</li>
<li>llorar</li>
<li>cantar</li>
<li>mamar del pecho de la madre</li>
<li>otras funciones random que va aprendiendo y que no están especificadas de fábrica </li>
</ul>
¿Qué tal serían tus noches?<br />
<br />
Todo esto sería muy gracioso si no fuese porque esto ocurre en los días buenos y en los días malos, esos días en los que los padres están frustrados, cansados, enfadados; al día siguiente tienen tareas desde las 7
de la mañana, y durante la noche duermen de culo. Y piensan que
llevan sin dormir más de cuatro horas del tirón desde hace 5 años sin que alguien le ponga el pie en la cara. <br />
<br />
Es obvio que la pareja duerme peor con el niño en la cama que con el niño en su propia cama. A esto hay que añadirle la preocupación de que no le causemos algún daño serio porque tenga demasiado calor (debajo de la manta y con dos cuerpos al lado), nos giremos y le aplastemos o que se caiga de la cama (¡para algo las cunas tienen barrotes!). El sueño es una necesidad básica no solo para el niño, también para los padres. La falta de sueño nos hace estar más cansados, más irritables y eso nos hace, al final, ser peores padres.<br />
<br />
<h2>
Conclusión</h2>
El colecho tiene ventajas y desventajas. Creo que las ventajas que aporta no son esenciales para el niño, aunque sí que puedan ser prácticas durante los primeros meses de vida del niño. También es cierto que durante los primeros meses de vida es cuando el colecho puede causarles mayores daños al bebé (calor, ahogarse) si no tomamos las medidas necesarias. A medio y largo plazo creo que el colecho causa problemas esenciales para los padres (falta de sueño, falta de tiempo, menor intimidad) y crea al niño dependencia de sus padres para dormir.<br />
<br />
Cada pareja, obviamente, es libre de hacer lo que quiera. Pero la pareja debería discutir las ventajas y desventajas que tiene en el medio y largo plazo y no dejarse llevar porque una noche el niño lloró mucho y la cosa se nos fue de las manos. </div>
</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com2tag:blogger.com,1999:blog-6189106821734378281.post-38505622051698302972016-12-12T21:20:00.001+01:002016-12-12T21:20:42.275+01:00Grafos sobre Éxodo: grupos y subgrupos<div dir="ltr" style="text-align: left;" trbidi="on">
El proyecto <b><i><a href="https://github.com/morethanbooks/XML-TEI-Bible">XML-TEI Bible</a></i></b> continúa editando libros bíblicos y extrayendo algunos datos en formas de visualizaciones varias. El último libro en editarse ha sido <i>Éxodo</i>, del que he creado un grafo según las coocurrencias de personas y grupos en los versículos. El resultado mostraba agrupaciones interesantes que he tratado de señalar mediante colores del fondo en la siguiente imagen:
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjCia6IbJ3yv7UXLugRdmOBm-QYJ6ZykCz4n7nMhxN4v4iRoPFFXdne3NhlEG5JvQYsl4vDq9U44v5IEXB-MlRW5QOa1CsecTlmWaaAszH5J4aJ5IaqDp5xFDSHzjzdQfEOX0psVOpZcho/s1600/exodus-network-coocurrence.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="400" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjCia6IbJ3yv7UXLugRdmOBm-QYJ6ZykCz4n7nMhxN4v4iRoPFFXdne3NhlEG5JvQYsl4vDq9U44v5IEXB-MlRW5QOa1CsecTlmWaaAszH5J4aJ5IaqDp5xFDSHzjzdQfEOX0psVOpZcho/s400/exodus-network-coocurrence.png" width="352" /></a></div>
<br />
Veámoslo en detalle:<br />
<ul style="text-align: left;">
<li>El área violeta superior contiene la tribu de Leví y todos sus descendientes, incluida las familias de Moisés y Aarón.</li>
<li>El área naranja de la derecha contiene personas egipcias o directamente relacionadas con Egipto: faraones, egipcios, esclavos, hija de Farón... Moisés y los hebreos podrían considerarse que están en esta zona.</li>
<li>La zona inferior derecha de color amarilla son grupos varios que ni son egipcios ni hebreos (con la excepción de María, hermana de Aarón)</li>
<li>El resto de grupos son grupos hebreos varios. Los he agrupado en 5 áreas, todas con tonos azules:</li>
<ul>
<li>Inferior: tribu de Dan y otras referencias a cabezas de tribus</li>
<li>Inferior izquierda: tribu de Simeón</li>
<li>Inferior izquierda central: tribu de Judá</li>
<li>Superior izquierda: tribu de Rubén</li>
<li>Superior izquierda central: patriarcas</li>
</ul>
</ul>
He probado a hacer un clustering automático en Gephi para ver si los resultados eran los mismos y la respuesta es: no. Algunos tribus o los egipcios sí solían encontrarse en un cluster, pero la tribu de Leví quedaba divida en varias ramas, algunas de ellas unidas con otras partes de las tribus. De todas maneras el clustering de personajes de textos es algo bastante nuevo que todavía no ha sido evaluado en relación a metadatos y <i>ground truth</i>: es terreno por sembrar.<br />
<br />
El grafo también permite observar claramente que <i>Éxodo</i> va principalmente de estos elementos: Moisés, Dios, Israel y el Faraón. Y posteriormente, <i>Éxodo</i> va sobre la relación que debe haber entre Israel y otros grupos sociales: se crean las instituciones de los sacerdotes y jueces hebreos, se escapa de los egipcios, se definen los grupos enemigos, se rechaza alabar otros dioses, aparecen leyes que protegen a los pobres... A diferencia del <b><a href="http://eumanismo.blogspot.de/2016/05/grafo-de-personajes-del-genesis.html"><i>Génesis</i></a></b>, donde el protagonismo lo tenían personas, en <i>Éxodo</i> son grupos sociales quienes absorben ese protagonismo.<br />
<br />
Algo que comparten ambos libros es la cercanía de personas según su parentesco, algo que ya comenté sobre <b><a href="http://eumanismo.blogspot.de/2016/05/grafo-de-personajes-del-genesis.html"><i>Génesis</i></a></b>. ¿Podría exportarse a otros textos para intentar ver relaciones familiares? </div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-87237633106756342092016-06-23T09:52:00.002+02:002016-06-23T10:01:10.349+02:00¿Es Unidos Podemos más Unidos o más Podemos? Clasificación y aprendizaje automático de programas electorales<div dir="ltr" style="text-align: left;" trbidi="on">
<div class="separator" style="clear: both; text-align: right;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjtC2vrvrci1RabKjw8DBHoF5V4QkZqesXIMvxHj5i6DgvyuoQaSrM1rVulQHIBA1R52FuiZguXDkUdtPdbz_igxA7CaqKnaYmSJct_ivW3b4rcAqNwVOki5QzXBqoVmb2Wzv5y9dKsfz4/s1600/cartel-unidos-podemos-1465553364960.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjtC2vrvrci1RabKjw8DBHoF5V4QkZqesXIMvxHj5i6DgvyuoQaSrM1rVulQHIBA1R52FuiZguXDkUdtPdbz_igxA7CaqKnaYmSJct_ivW3b4rcAqNwVOki5QzXBqoVmb2Wzv5y9dKsfz4/s320/cartel-unidos-podemos-1465553364960.jpg" width="228" /></a></div>
Llevo dos posts sobre <a href="http://eumanismo.blogspot.de/search/label/estilometr%C3%ADa">estilometría</a> de las elecciones generales españolas del 26 de junio de 2016. <a href="http://eumanismo.blogspot.de/2016/06/escribimos-un-nuevo-programa-o-copiamos.html">En el primero realicé varios clusters e intenté observar si ciertos partidos habían copiado el anterior programa electoral</a>. <a href="http://eumanismo.blogspot.de/2016/06/unidos-o-podemos-colacion-de-las.html">En el segundo colacioné las dos versiones del programa de Unidos Podemos y encontré alguna anomalía</a>.<br />
<br />
En este post lo que me pregunto es: <b>¿Es el programa de Unidos Podemos más similar a los anteriores de Izquierda Unida o a los de Podemos? </b>Para ello voy trabajar de una manera similar al post en el que intenté descubrir <a href="http://eumanismo.blogspot.de/2015/12/machine-learning-con-programas.html">mediante aprendizaje automático qué partidos eran de izquierda y cuáles de derecha</a>. En este caso también utilizo aprendizaje automático supervisado (o clasificación). La máquina aprende cómo son los textos de IU y de Podemos a partir de los programas electorales de las anteriores elecciones generales, de las europeas y del texto marco para las autonómicas y municipales:<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiG-pV-HZGawh5fVoV8dXVF0oxssbQmWB80EaDL4pqJjYbNUy9IwSI47_1BrnjcU8nxTF3GBdjdLG5treY1e9JVosfpY8HeNSdJ6EqdVmqLiLdX3pintW7FJpKFpH0fzWc34toZF8Mgnfo/s1600/Screenshot+from+2016-06-21+21%253A20%253A37.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="180" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiG-pV-HZGawh5fVoV8dXVF0oxssbQmWB80EaDL4pqJjYbNUy9IwSI47_1BrnjcU8nxTF3GBdjdLG5treY1e9JVosfpY8HeNSdJ6EqdVmqLiLdX3pintW7FJpKFpH0fzWc34toZF8Mgnfo/s320/Screenshot+from+2016-06-21+21%253A20%253A37.png" width="320" /></a></div>
Posteriormente le damos a la máquina dos tareas diferentes. En primer lugar le damos un conjunto de textos para comprobar si consigue clasificar los textos correctamente, un test. En concreto le doy seis programas electorales de diferentes comunidades autónomas por cada partido:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjgWLrjzHInpc_U0h_p8e5HzLA6kA-xaDE2Hr4LiGCdEJfICAK9EfzS6oIe6_4GoAYLyR4s8aVy9qXLW8oJkrTNDPSskQv1NCBX9YBbqqRHk4HqB-_URVlG3v1B6VQFr4cI_6f0AtZGsaA/s1600/Screenshot+from+2016-06-21+21%253A22%253A11.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjgWLrjzHInpc_U0h_p8e5HzLA6kA-xaDE2Hr4LiGCdEJfICAK9EfzS6oIe6_4GoAYLyR4s8aVy9qXLW8oJkrTNDPSskQv1NCBX9YBbqqRHk4HqB-_URVlG3v1B6VQFr4cI_6f0AtZGsaA/s320/Screenshot+from+2016-06-21+21%253A22%253A11.png" width="302" /></a></div>
Y por último le doy las dos versiones (<a href="http://eumanismo.blogspot.de/2016/06/unidos-o-podemos-colacion-de-las.html">¡ya que ahora sabemos que son algo diferentes, probemos ambas!</a>) del programa electoral de Unidos Podemos para que tome la decisión de si le parece más similar a Podemos o a IU:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg1H_qoq5VcMskvIUiBQ-g1raYibJuXX5Y8lRkTnqLDxveouCZLD_KVh5n66a-OU47i9pY8XMtRUj_ey1oCFvtG8VxclvBy_7P6SWXh3Ursg6U2IRTqQPFDks9157KgzLu4kO7Mytfo284/s1600/Screenshot+from+2016-06-21+21%253A24%253A22.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="51" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg1H_qoq5VcMskvIUiBQ-g1raYibJuXX5Y8lRkTnqLDxveouCZLD_KVh5n66a-OU47i9pY8XMtRUj_ey1oCFvtG8VxclvBy_7P6SWXh3Ursg6U2IRTqQPFDks9157KgzLu4kO7Mytfo284/s320/Screenshot+from+2016-06-21+21%253A24%253A22.png" width="320" /></a></div>
<br />
Como casi siempre, trabajo con<a href="https://sites.google.com/site/computationalstylistics/stylo"> el paquete de R <i>stylo</i> para estilometría</a>, en concreto con la función classify(). Realizo la prueba desde las 1000 MFW hasta las 10000 MFW y utilizo la distancia textual Eders Delta.<br />
<br />
<b>Resultados de stylo</b><br />
<br />
<br />
Podemos_2015_andalucia --> IU<br />
UniPod_2016_Generales_IU --> Podemos<br />
UniPod_2016_Generales_Podemos --> Podemos<br />
<br />
1000 MFW , culled @ 0%, 11 of 12 (91.7%)<br />
<br />
<br />
<br />
Podemos_2015_andalucia --> IU<br />
UniPod_2016_Generales_IU --> Podemos<br />
UniPod_2016_Generales_Podemos --> Podemos<br />
<br />
2000 MFW , culled @ 0%, 11 of 12 (91.7%)<br />
<br />
<br />
<br />
Podemos_2015_A_Asturias --> IU<br />
Podemos_2015_andalucia --> IU<br />
UniPod_2016_Generales_IU --> Podemos<br />
UniPod_2016_Generales_Podemos --> Podemos<br />
<br />
3000 MFW , culled @ 0%, 10 of 12 (83.3%)<br />
<br />
<br />
<br />
Podemos_2015_A_Asturias --> IU<br />
Podemos_2015_andalucia --> IU<br />
UniPod_2016_Generales_IU --> Podemos<br />
UniPod_2016_Generales_Podemos --> Podemos<br />
<br />
4000 MFW , culled @ 0%, 10 of 12 (83.3%)<br />
<br />
<br />
<br />
Podemos_2015_A_Asturias --> IU<br />
Podemos_2015_andalucia --> IU<br />
UniPod_2016_Generales_IU --> Podemos<br />
UniPod_2016_Generales_Podemos --> Podemos<br />
<br />
5000 MFW , culled @ 0%, 10 of 12 (83.3%)<br />
<br />
<br />
<br />
Podemos_2015_andalucia --> IU<br />
UniPod_2016_Generales_IU --> Podemos<br />
UniPod_2016_Generales_Podemos --> Podemos<br />
<br />
6000 MFW , culled @ 0%, 11 of 12 (91.7%)<br />
<br />
<br />
<br />
Podemos_2015_andalucia --> IU<br />
UniPod_2016_Generales_IU --> Podemos<br />
UniPod_2016_Generales_Podemos --> Podemos<br />
<br />
7000 MFW , culled @ 0%, 11 of 12 (91.7%)<br />
<br />
<br />
<br />
Podemos_2015_andalucia --> IU<br />
UniPod_2016_Generales_IU --> Podemos<br />
UniPod_2016_Generales_Podemos --> Podemos<br />
<br />
8000 MFW , culled @ 0%, 11 of 12 (91.7%)<br />
<br />
<br />
<br />
UniPod_2016_Generales_IU --> Podemos<br />
UniPod_2016_Generales_Podemos --> Podemos<br />
<br />
9000 MFW , culled @ 0%, 12 of 12 (100%)<br />
<br />
<br />
<br />
UniPod_2016_Generales_IU --> Podemos<br />
UniPod_2016_Generales_Podemos --> Podemos<br />
<br />
10000 MFW , culled @ 0%, 12 of 12 (100%)<br />
<br />
General attributive success: 109 of 120 (90.8%)<br />
<br />
<b>Visualización de los resultados e i</b><b><b>nterpretación</b></b><br />
<div class="separator" style="clear: both; text-align: center;">
</div>
<div class="separator" style="clear: both; text-align: center;">
</div>
<div class="separator" style="clear: both; text-align: center;">
</div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEioP46wf9OKdBHSUv888fVTDVDZWjg5_4CSgZAitPuLw5Og6flZrp-6xspR26-O0vqKyTTFKUIXyYXcuJcqF02WvCByQIog4jcR-0-2s2E5eASkswP8HxBhaUhfyrql78wzPQ8rH7NN8tA/s1600/Screenshot+from+2016-06-23+09%253A49%253A37.png" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="250" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEioP46wf9OKdBHSUv888fVTDVDZWjg5_4CSgZAitPuLw5Og6flZrp-6xspR26-O0vqKyTTFKUIXyYXcuJcqF02WvCByQIog4jcR-0-2s2E5eASkswP8HxBhaUhfyrql78wzPQ8rH7NN8tA/s400/Screenshot+from+2016-06-23+09%253A49%253A37.png" width="400" /> </a></div>
<div class="separator" style="clear: both; text-align: left;">
En general el programa consigue reconocer bastante bien si los textos
autonómicos son de IU o de Podemos. A partir de 1000 MFW reconoce entre
10 y 11 textos de un total de 12 de manera correctamente: el Podemos de
Andalucía y de Asturias (solo desde 3000 a 5000 MFW) le parece IU. A
partir de las 9000 MFW clasifica todos los textos autonómicos
correctamente. ¡Bien!</div>
<div class="separator" style="clear: both; text-align: left;">
<br /></div>
<div class="separator" style="clear: both; text-align: left;">
<b>¿Y qué dice de Unidos Podemos?</b></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh_eF-dG6O5dhvy7hlM_8e556EA4BUfxVHz3myOUK-G-8cJ_RwOmb8woeNXKMN9gG6NK1caVgO_Vvmj44zt1crITZtMFG9Zcnj2iStcAP2PvW-X2OJ2VZr9kjEn0L7gt-CDByNmhdoQTpE/s1600/Screenshot+from+2016-06-23+09%253A49%253A31.png" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="68" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh_eF-dG6O5dhvy7hlM_8e556EA4BUfxVHz3myOUK-G-8cJ_RwOmb8woeNXKMN9gG6NK1caVgO_Vvmj44zt1crITZtMFG9Zcnj2iStcAP2PvW-X2OJ2VZr9kjEn0L7gt-CDByNmhdoQTpE/s400/Screenshot+from+2016-06-23+09%253A49%253A31.png" width="400" /></a> </div>
<div class="separator" style="clear: both; text-align: left;">
<b>Lo tiene claro: el programa de Unidos Podemos es clasificado como de Podemos y no de IU</b>.
Ese resultado ocurre en todos los rangos de MFW, y ocurre tanto con la
versión del programa de IU como de Podemos. Es decir, aunque habíamos
señalado que el estilo de los dos programas era algo diferente y aunque
estamos analizando el estilo del texto, esas diferencias no son
suficientemente fuertes como para que esas versiones diferencien
pertenencia a partido<b>.</b></div>
<br />
<br />
Como en otras ocasiones, las conclusiones son en parte esperables (¡Podemos ES el hermano mayor en escaños de la coalición!). Pero están sostenidas por algo más que "pues a mí me parece...".</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-39949885230149796272016-06-21T16:20:00.002+02:002016-06-21T16:22:48.159+02:00¿Unidos? ¿O Podemos? Colación de las versiones del programa electoral<div dir="ltr" style="text-align: left;" trbidi="on">
En el <a href="http://eumanismo.blogspot.de/2016/06/escribimos-un-nuevo-programa-o-copiamos.html">anterior post señalaba algunas particularidades de las siguientes elecciones y de los programas electorales y realizaba un análisis estilométrico</a>. Señalé que tomaba el programa electoral de Unidos Podemos, pero en realidad fue una simplificación de la historia, porque lo cierto es que <b>nos descargamos diferentes versiones del programa de las webs de <a href="http://www.izquierda-unida.es/sites/default/files/doc/50_Pasos_Para_Gobernar_Juntos_0.pdf">IU</a> o de <a href="http://podemos.info/wp-content/uploads/2016/05/acuerdo26J_final.pdf">Podemos</a></b>, diferencia que resulta obvia por los colores de los encabezados:<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiQ7fpI_lmx05-r6CIExbQliN9U0nZu3g2HKUmXSjN8eFxh0MdqKVRgcEz17RA_O_73wC6IA1yqbWuPFs639eWhlk9BCwXKh4TTKE0J5DPRhnX5vkpO6meD1R9YV5fC5Ai0-u2Zai4hKFg/s1600/Screenshot+from+2016-06-19+21%253A14%253A00.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="241" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiQ7fpI_lmx05-r6CIExbQliN9U0nZu3g2HKUmXSjN8eFxh0MdqKVRgcEz17RA_O_73wC6IA1yqbWuPFs639eWhlk9BCwXKh4TTKE0J5DPRhnX5vkpO6meD1R9YV5fC5Ai0-u2Zai4hKFg/s400/Screenshot+from+2016-06-19+21%253A14%253A00.png" width="400" /></a></div>
Además de la disposición y color de los encabezamientos, se ve que el título en Podemos ha añadido la colocación "Cambiar España". <b>La pregunta es: ¿puedo estar seguro de que ambos textos sean iguales en todos los detalles?</b> Porque cualquiera que haya trabajado en un texto importante entre diferentes personas sabe lo endiablado que se vuelve el control de versiones.<br />
<br />
Para ello he exportado el texto de los PDFs a texto plano y he limpiado algunos caracteres que quedaban de la decoración de la listas y la paginación. Posteriormente he utilizado el programa de Ubuntu Meld Diff Viewer (en Windows suelo utiliza Beyond Compare) para cotejar los textos automáticamente.<br />
<br />
<b>El resultado en general demuestra que los textos son bastante similares</b>, aunque no idénticos. Y no solo hay pequeñas diferencias de estilo, hay cambios también de contenido. He hecho una búsqueda rápida sobre esas posibles diferencias y encuentro un artículo en<a href="http://www.publico.es/politica/psoe-denuncia-votar-unidos-hacerlo.html"> Público que informa de un trabajo del PSOE muy crítico con los programas de Unidos Podemos</a>. Ninguna de las conclusiones a las que llega el PSOE son las mismas a las que yo llego (puede ser que ellos partan de textos diferentes a de los que yo parto). Mis conclusiones son de mucho menos calado que las suyas y las diferencias son muy secundarias. Si no saben si creer al PSOE o a mí, arriba tienen los links a los textos que he utilizado, suya es la posibilidad de reproducir este post.<br />
<br />
Vayamos al ajo programático. <b>La enorme mayoría de diferencias representan cambios de estilo</b>. Parece que una parte importante de corrección ocurrió en las sedes de los diferentes partidos después de que se negociase el programa común. Veamos algunos casos:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgBZQ0xSrhB5DYmsmtNYwfgXgaXwVL8rVw-dJIWrCxKd0Ev1UymxTKC0ML7xsBHn3f19IRqVXpsZKpus-mA7z6_rxMIhfQtL_HMcOHoNkcVRlTI8MnNbUA8qgDYyfL5PMu02UlJZLy6C7E/s1600/Screenshot+from+2016-06-21+15%253A53%253A48.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="186" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgBZQ0xSrhB5DYmsmtNYwfgXgaXwVL8rVw-dJIWrCxKd0Ev1UymxTKC0ML7xsBHn3f19IRqVXpsZKpus-mA7z6_rxMIhfQtL_HMcOHoNkcVRlTI8MnNbUA8qgDYyfL5PMu02UlJZLy6C7E/s400/Screenshot+from+2016-06-21+15%253A53%253A48.png" width="400" /></a></div>
Como vemos en esa imagen, hay algunos cambios léxicos como <i>reiterada</i> por <i>continuada</i>, algún cambio de orden (<i>anual tributaria > tributaria anual</i>), cambios en el estilo de la lista, de mayúsculas... Esta es la norma de las diferencias entre los dos documentos. Aquí va otro ejemplo donde se pueden observar ciertos cambios gramaticales puramente de estilo:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhNXtrNvAobP68GS2ZLREFXHYXTQvAE7yHU6Usf9GrCL8J3w3Y2e_Tfoky6jAmPsdVbS5NRtXYjxwkfhhhjRYOiWDgvoH-7g4aP5bqo55ozFi9FYHeHDv1X5iiGmbIvDUdw5B8aW7kihOY/s1600/Screenshot+from+2016-06-21+16%253A02%253A57.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="147" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhNXtrNvAobP68GS2ZLREFXHYXTQvAE7yHU6Usf9GrCL8J3w3Y2e_Tfoky6jAmPsdVbS5NRtXYjxwkfhhhjRYOiWDgvoH-7g4aP5bqo55ozFi9FYHeHDv1X5iiGmbIvDUdw5B8aW7kihOY/s400/Screenshot+from+2016-06-21+16%253A02%253A57.png" width="400" /></a></div>
<br />
<br />
En algún punto se han cambiado el orden de los párrafos y los puntos, por lo que parece que se ha cambiado texto, cuando no es así: <br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEghjUrHZBLdtHaeTz-7jizHpA6xy89cdT6rLArLBQmSMoDlN2D5IX-k5Vx0hiNAD8N6isktUP1dkKSSl-6y2jnn84SylUzpFilaoSndvlZCu5WJDngQvnPvKXvdyWxCUyNMm6TvLTZrWns/s1600/Screenshot+from+2016-06-21+15%253A56%253A25.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="198" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEghjUrHZBLdtHaeTz-7jizHpA6xy89cdT6rLArLBQmSMoDlN2D5IX-k5Vx0hiNAD8N6isktUP1dkKSSl-6y2jnn84SylUzpFilaoSndvlZCu5WJDngQvnPvKXvdyWxCUyNMm6TvLTZrWns/s400/Screenshot+from+2016-06-21+15%253A56%253A25.png" width="400" /></a></div>
Lo que sí ocurre en la imagen anterior es que la numeración de los puntos ya no va a la par, lo que dificulta la comparación del resto del documento. A partir de este punto Podemos va un número adelantado en comparación a IU. <b>Ese punto es rescatado con el punto 19 del programa de IU "Cultura"</b>:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj6QKcUd2qS9UoQ8Qf3ONSMXc2BNxnOUn7_1_J26TYTSMn5Z85EDNVb6Gaoy8sSdNN3OC2JuseMjVQwcldc3st2igkXaJ6eylMYrUPyXBeLwWQg-J4DG_VT6e1O0T2WSc7PBqsdc6s-J6c/s1600/Screenshot+from+2016-06-21+16%253A00%253A12.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="88" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj6QKcUd2qS9UoQ8Qf3ONSMXc2BNxnOUn7_1_J26TYTSMn5Z85EDNVb6Gaoy8sSdNN3OC2JuseMjVQwcldc3st2igkXaJ6eylMYrUPyXBeLwWQg-J4DG_VT6e1O0T2WSc7PBqsdc6s-J6c/s400/Screenshot+from+2016-06-21+16%253A00%253A12.png" width="400" /></a></div>
<b>¿Qué ha pasado con ese parrafito sobre cultura en la versión de Podemos?</b> La palabra <i>artista</i> no aparece en el programa de Podemos. El párrafo en el programa de IU señala que desarrollaran un modelo fiscal específico para artistas y que reducirán el IVA cultural. ¿Alguien cercano a los partidos podría explicarlo?<br />
<br />
<b>El otro gran aspecto que diferencia ambos textos es el 38 "Desarrollo rural y Política Agraria Común (PAC)"</b>:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgb3tqVjt-cN-3f-c7DttPzLaiTj2ycYeXvhXHRPS8LTOhIq4aaJgRkYIBsYtsmgsMkMqCJJStpm96fAO8spcJqTb1xX7rdS3gFRTj_iZQ1mpXSlp6XutiCkS0CR24zn0yAJbkt9u2bklQ/s1600/Screenshot+from+2016-06-21+16%253A04%253A41.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="168" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgb3tqVjt-cN-3f-c7DttPzLaiTj2ycYeXvhXHRPS8LTOhIq4aaJgRkYIBsYtsmgsMkMqCJJStpm96fAO8spcJqTb1xX7rdS3gFRTj_iZQ1mpXSlp6XutiCkS0CR24zn0yAJbkt9u2bklQ/s400/Screenshot+from+2016-06-21+16%253A04%253A41.png" width="400" /></a></div>
Como vemos, es un punto muy largo en el programa de IU con menciones concretas a leyes y programas, mientras que en el de Podemos es escueto y algo vago, aunque no señalan información contradictoria entre ellos<br />
<br />
<b>En conclusión</b>:<br />
<ul style="text-align: left;">
<li>los programas de Unidos Podemos de las web de <a href="http://www.izquierda-unida.es/sites/default/files/doc/50_Pasos_Para_Gobernar_Juntos_0.pdf">IU</a> o de <a href="http://podemos.info/wp-content/uploads/2016/05/acuerdo26J_final.pdf">Podemos</a> son diferentes, tanto en su maquetación, la corrección de estilo y ciertas diferencias de contenido </li>
<li>los programas son en su enorme mayoría idénticos en cuanto al contenido</li>
<li>la mayor diferencia de ambos programas está en el punto sobre Cultura, que no aparece en el programa de Podemos</li>
<li>la versión del programa de IU contiene bastante más contenido en cuanto a agricultura</li>
</ul>
</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-5914234521822269382016-06-18T15:59:00.000+02:002016-06-19T13:50:41.559+02:00¿Escribimos un nuevo programa o copiamos el anterior? Estilometría sobre elecciones generales 2016<div dir="ltr" style="text-align: left;" trbidi="on">
Nuevas elecciones > incremento en el corpus de programas electorales > nuevo post sobre estilometría política. Las elecciones generales en España del 26 de junio de 2016 se caracterizan por ser en realidad la repetición de las anteriores. Ni la época, ni los candidatos, ni los partidos ni (en principio) las ideas han cambiado. Así que ¿habrán cambiado los textos? ¿Su estilo? Quitando claro la excepción de Unidos Podemos y sus versiones en Cataluña, Valencia y Galicia (cuyos textos no están representados aquí por diferentes razones).<br />
<br />
En primer lugar he realizado un análisis de la distancia textual mediante Delta. Dependiendo de la cantidad de palabras a utilizar los resultados varían notablemente. Aquí un ejemplo de los resultados de los 4000 y 6000 MFW:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhWhRrfBixlFc5Pi8Xdyh7QR8Kf3O8z0p38jAijN30F6apc1pKSVzLYkS8MpOZl5Nq8E_gZgsh-kW6j90rSx49y8RlNg55Yg8kHViiZqtp_e6tDjfCts0Klk85wShQBNAG6tl1n-_Otzv4/s1600/1606+estilometria+generales_CA_4000_MFWs_Culled_0__Eder%2527s+Delta__001.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhWhRrfBixlFc5Pi8Xdyh7QR8Kf3O8z0p38jAijN30F6apc1pKSVzLYkS8MpOZl5Nq8E_gZgsh-kW6j90rSx49y8RlNg55Yg8kHViiZqtp_e6tDjfCts0Klk85wShQBNAG6tl1n-_Otzv4/s320/1606+estilometria+generales_CA_4000_MFWs_Culled_0__Eder%2527s+Delta__001.png" width="320" /></a></div>
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh3btqRJEbOmNMn8JOn3uGuvLbrCOiwUohc7AKoaq97D6QHKmHeRWIuEzNsLMzav9JTPlr9gFo3qdDvOk7YkfhN3kqRFCu6i_ZlB-eONB9xSpxcxe0_TFaLORx5QvuL9zp6kTdLix2sRIM/s1600/1606+estilometria+generales_CA_6000_MFWs_Culled_0__Eder%2527s+Delta__001.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh3btqRJEbOmNMn8JOn3uGuvLbrCOiwUohc7AKoaq97D6QHKmHeRWIuEzNsLMzav9JTPlr9gFo3qdDvOk7YkfhN3kqRFCu6i_ZlB-eONB9xSpxcxe0_TFaLORx5QvuL9zp6kTdLix2sRIM/s320/1606+estilometria+generales_CA_6000_MFWs_Culled_0__Eder%2527s+Delta__001.png" width="320" /></a></div>
Como vemos en el primero, el PP forma su propia rama mientras que en el segundo caso aparece bastante mezclado con los programas del PSOE. Por eso he considerado en realizar un Consensus tree que agrupe los diferentes resultados entre 1000 y 10 000 MFW en un solo análisis:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgSIjIS_o8_Bt6Oyy_N9C5XSa-cdDp1bz77r-QB-LkZ-tVXSOzS7gq7s4MjWyoWS3wfybQSH6bwLsTeh9t2uZSgc3O8nKl4sroZ58pKxet3rtNjagihwueYiCjoRliQHKNVEhewxlXHXwc/s1600/1606+estilometria+generales_Consensus_1000-10000_MFWs_Culled_0__Eder%2527s+Delta_C_0.5__001.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgSIjIS_o8_Bt6Oyy_N9C5XSa-cdDp1bz77r-QB-LkZ-tVXSOzS7gq7s4MjWyoWS3wfybQSH6bwLsTeh9t2uZSgc3O8nKl4sroZ58pKxet3rtNjagihwueYiCjoRliQHKNVEhewxlXHXwc/s320/1606+estilometria+generales_Consensus_1000-10000_MFWs_Culled_0__Eder%2527s+Delta_C_0.5__001.png" width="320" /></a></div>
Como vemos, <b>PNV y UPyD tienen sus propias ramas</b> perfectamente diferenciadas. <b>IU y Podemos muestran relaciones similares en sus programas de 2011 y 2015</b>. Curiosamente su programa electoral unido de 2016 no aparece entre los textos. En el caso del <b>PP y PSOE, sus programas de 2015 y 2016 aparecen emparejados</b>, mientras que los otros textos aparecen en diferentes lugares. Finalmente hay un grupo de tres textos que en realidad se pueden considerar <b>tres textos aislados: Unidos Podemos 2016, Ciudadanos 2016 y PP 2011</b>.<br />
<br />
<b>Resulta sorprendente que el programa de Unidos Podemos no aparezca en la misma rama en la que encontramos los textos de IU y Podemos</b> anteriormente. Por lo visto negociar un programa electoral no produce un término medio entre los programas anteriores de los partidos. Al menos en su estilo, que es de lo que la estilometría parte.<br />
<br />
Aún más sorprendente resulta que <b>el programa de Ciudadanos 2016 no esté estrechamente emparentado con su programa de 2015</b>. ¿Qué puede explicar esta diferencia? Lo desconozco.<br />
<br />
Porque en realidad uno esperaría que los partidos le hubiesen echado un poquito de cara y que en realidad hubiesen presentado el mismo programa que hace 6 meses, maquillándolo un poco y cambiando las fechas y fotos. De hecho podemos intentar medir qué partidos se han plagiado a sí mismos. Para ello troceamos cada texto en cadenas de 7 palabras (<i>7-gramas</i>), unidades del tipo "centros tecnológicos inspirados en los advanced manufacturing" o "como una inversión no como un gasto". Esperamos que estas unidades sean suficientemente largas como para considerar que no se repetirán aleatoriamente y que su coaparición en varios textos debería representar un relación de copia y pega entre textos. Con esa base, realizaremos un PCA cuyo resultado es un representación bidimensional de los textos:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgxgXx-n-yILcMgJ_hNWCG6ZMA-YwiDfPMP8O5p_o3uQduURvVLJLFJrSC6K6Vlsl9RLBjUgo980iAn2x6EXA6LLbStT0W_cABrzKSzyLAwjw6I6yWP8GdDx5Vq_GzSrHTGGaDKBhAlFu4/s1600/1606+estilometria+generales_PCA_5000_MFWs_Culled_0__PCA__001_clss.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgxgXx-n-yILcMgJ_hNWCG6ZMA-YwiDfPMP8O5p_o3uQduURvVLJLFJrSC6K6Vlsl9RLBjUgo980iAn2x6EXA6LLbStT0W_cABrzKSzyLAwjw6I6yWP8GdDx5Vq_GzSrHTGGaDKBhAlFu4/s320/1606+estilometria+generales_PCA_5000_MFWs_Culled_0__PCA__001_clss.png" width="320" /></a></div>
<b>El partido que se ha plagiado más a sí mismo es el PSOE</b> (1945 7-gramas comunes en los programas de 2015 y 2016), quien queda apartado del resto en el eje horizontal (PC1). <b>Los siguientes partidos que más han copiado-pegado</b> su propio programa son en este orden<b> PP</b> (1082 7-gramas comunes), <b>UPyD </b>(¡943 7-gramas en los tres programas! <b>¡se llevan copiando desde 2011 </b>hasta el día de hoy!) y <b>PNV</b> (710 7-gramas comunes).<br />
<br />
El resto de partidos (Ciudadanos, IU, Podemos y Unidos Podemos) no presentan repeticiones notables de cadenas de 7 palabras y por eso están tan cerca del valor 0 en ambos ejes. Solo algunos 7-gramas aparecen en programas de partidos muy diferentes, como por ejemplo: "a lo largo de toda la vida", "la participación de los ciudadanos en la", "por debajo del umbral de la pobreza", etcétera.<br />
<br />
Es curioso observar que la repetición señala principalmente relaciones entre textos muy similares y no sencilla similitud del estilo. No vemos que los textos del PSOE y PP del 2011 estén a medio camino entre el valor 0 y los textos de 2015-2016. La idea intuitiva de que cadenas relativamente largas podrían señalar copia entre textos parece validarse.<br />
<br />
Por supuesto hay dos manera de interpretar la repetición de cadenas largas en diferentes textos: como señal de desidia o como señal de coherencia. Uno puede valorar que el país no ha cambiado desde diciembre de 2015 y que por lo tanto no hay que cambiar los textos. Puede ser cierto, aunque en realidad lo que aquí se analiza no es el fondo del texto (las ideas) sino la superficie del texto (su estilo). Se puede expresar la misma idea de varias maneras y la estilometría no reconocerá su similitud.<br />
<br />
Entiendo bastante bien que un partido como UPyD, que está para que lo rematen, quiera ahorrarse cualquier trabajo y reutilice el texto. Lo sorprendente es que en realidad los dos partidos que más han copiado sean a su vez los más grandes y con mayores medios. Si no les faltan medios, será que les falta interés.</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-56310216712531300812016-06-07T21:09:00.000+02:002016-06-07T21:09:12.979+02:00Dios, ángeles y la serpiente en grafos del Génesis<div dir="ltr" style="text-align: left;" trbidi="on">
El <a href="http://eumanismo.blogspot.de/2016/05/grafo-de-personajes-del-genesis.html">grafo que comenté en mi anterior post sobre el <i>Génesis</i></a> solo mostraba los datos de las relaciones humanas. Volvamos a verlo y partamos de la información que ya teníamos con el anterior post:<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjMRZH-1KVHVGgScpB5Z4zUQ7vma0kb4seI7ZaocCh92TXl1vW1QDZqCUU9Cgt8Gxm_6EvXj8eMaHlOC6uSNySGwgWpAbEhZIwtfQdnPhteWFkIH5SquMTgs4dZ4XnmqwAjxtwhfITOim0/s1600/Screenshot+from+2016-06-02+21%253A03%253A53.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="400" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjMRZH-1KVHVGgScpB5Z4zUQ7vma0kb4seI7ZaocCh92TXl1vW1QDZqCUU9Cgt8Gxm_6EvXj8eMaHlOC6uSNySGwgWpAbEhZIwtfQdnPhteWFkIH5SquMTgs4dZ4XnmqwAjxtwhfITOim0/s400/Screenshot+from+2016-06-02+21%253A03%253A53.png" width="213" /></a></div>
Como ya expliqué, del cálculo de esas relaciones saqué de manera premeditada a Dios y al resto de seres superiores (por llamarlos de alguna manera): ángeles, demonio, Espíritu Santo... Veamos qué pasa con el grafo si sí lo tenemos en cuenta:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi6UhRJ7azHzo4FPUbBJpm9X_LkkZ0NJZGN6oZMcjp5r3L1Dt13r3DJzkWFJJtDTbjaK8sPHuuDZTRObJjkOmPAUicbTbMhOrHA82aAwJNaPf6Ikhcz9-OpX9kycm99CunwyAtIuaJWLMI/s1600/Screenshot+from+2016-06-02+21%253A06%253A12.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="400" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi6UhRJ7azHzo4FPUbBJpm9X_LkkZ0NJZGN6oZMcjp5r3L1Dt13r3DJzkWFJJtDTbjaK8sPHuuDZTRObJjkOmPAUicbTbMhOrHA82aAwJNaPf6Ikhcz9-OpX9kycm99CunwyAtIuaJWLMI/s400/Screenshot+from+2016-06-02+21%253A06%253A12.png" width="258" /></a></div>
El grafo pasa de estar compuesto de un núcleo principal y otro secundario alejado (alrededor de Noé, conectado con Adán), a tener un único núcleo principal del que salen diferentes ramas no demasiado alejadas. Coloquemos ahora un color diferente a aquellas entidades humanas y aquellas no completamente humanas:<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhdj74KTvzHW7Uv7Fv7GHO-GIg7x9oVC7Foj5di_n0NFGchNaLk8yOU0jEL0pqV2u6doMPiI2sCXuDIxvmrGDUqsDSaRBu9X4_4fSvmPY09toTeC-33xqUpC_VDLvmaA5pZ0KoeJnH4Tz0/s1600/Screenshot+from+2016-06-02+21%253A13%253A05.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="400" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhdj74KTvzHW7Uv7Fv7GHO-GIg7x9oVC7Foj5di_n0NFGchNaLk8yOU0jEL0pqV2u6doMPiI2sCXuDIxvmrGDUqsDSaRBu9X4_4fSvmPY09toTeC-33xqUpC_VDLvmaA5pZ0KoeJnH4Tz0/s400/Screenshot+from+2016-06-02+21%253A13%253A05.png" width="280" /></a></div>
Dios aparece localizado muy cerca de Abraham, y con fuertes relaciones con Isaac, Jacob, José, Adán, Caín y la familia de Noé. De hecho estas relación son las que han hecho que Adán y Noé fortalezcan enormemente sus relaciones indirectas con el núcleo principal del grafo. Efectivamente, la relación con Dios de estas personas es una relación mucho más importante que la frágil relación familiar que pueda haber entre ellos.<br />
<br />
Pero antes de pasar adelante con más relaciones: ¿de quién hablamos exactamente cuando hablamos de los seres superiores en el Génesis? Pues en concreto de estos nodos:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiIQnUg-3SmvxiksMDen5U_-Qdvrfq8vXeScoR1R4TqjNt0XhUoqeLLhEyKP6WNSifSJDqWvc3f5fyoFAseq5elbeGhlErf5eyk3E0C0K_Ztdnc1IyGAP9m9ibv9D2y8zCRBFwuA5wzeJI/s1600/Screenshot+from+2016-06-02+21%253A29%253A29.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="400" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiIQnUg-3SmvxiksMDen5U_-Qdvrfq8vXeScoR1R4TqjNt0XhUoqeLLhEyKP6WNSifSJDqWvc3f5fyoFAseq5elbeGhlErf5eyk3E0C0K_Ztdnc1IyGAP9m9ibv9D2y8zCRBFwuA5wzeJI/s400/Screenshot+from+2016-06-02+21%253A29%253A29.png" width="380" /></a></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjJ_GsiOtk1HcInpZ4RjsgiwGaZfnQMgsbs4g4dtIjq8CkYOcWEfk_lLrpMmThF16VYxzJKBTc8jtnPAS0ZAx4JzmkPNsNLH319KRdggSqNg2xQvQoZjUlWwSuRkoGX1EhWqXwnGV3EYmI/s1600/Screenshot+from+2016-06-02+21%253A24%253A13.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><br /></a></div>
Y vosotros diréis que aquí hay varias cosas raras. En primer lugar, ¿Espíritu Santo? Efectivamente no hay ninguna mención con ese nombre en el Génesis, pero sí hay varias al <i>Espíritu de Dios</i>, colocación que decidí codificarla como Espíritu Santo aunque señalando mediante un atributo de que no estaba completamente seguro. <br />
<br />
En segundo lugar, ¿por qué hay ángeles y no demonios? ¿Por qué solo aparece <i>diablo </i>en singular? La respuesta es clara: porque no hay menciones a demonios en plural (como si encontramos en otros libros, como los <i>Evangelios</i>). Y aquí viene una de las cosas sorpresas que me he encontrado: de hecho no hay prácticamente menciones al diablo en el Génesis. Exclusivamente en el capítulo 3 se menciona a la serpiente en Edén un puñado de veces. Después del capítulo 3 nada similar a un diablo vuelve a aparecer en el Génesis. Es por eso que en el grafo completo, el diablo aparece estrechísimamente relacionado con Adán y Eva, más incluso que sus propios hijos:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiE102WSDu7ZtnBjlF5Q1BZffhsxrHp-caStNXjmJcvIAELxt4FEfge28TZ0xu33WncErDyoneBMkitaxrqrRjF4_r0R-g5HmjWZJ9ChpHPyZqNh_GSnf6UdXqaEyadis2CFlmyMEwzZtw/s1600/Screenshot+from+2016-06-02+21%253A35%253A21.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="347" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiE102WSDu7ZtnBjlF5Q1BZffhsxrHp-caStNXjmJcvIAELxt4FEfge28TZ0xu33WncErDyoneBMkitaxrqrRjF4_r0R-g5HmjWZJ9ChpHPyZqNh_GSnf6UdXqaEyadis2CFlmyMEwzZtw/s400/Screenshot+from+2016-06-02+21%253A35%253A21.png" width="400" /></a></div>
<br />
Y en tercer lugar ¿<b>Jesús</b>? ¿No nos hemos saltado unos cuantos miles de años en la cronología bíblica? La cosa es que cuando leemos la bendición de Jacob a sus hijos, en la de Judá aparece esto:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgDexrvcslX2H0B2e5-1N7nLb8zG-0QkEJd_sDuy2u6eGuZndiemkNIpDHNcytZ_qegK6E4mDkc8CuZ5CU5n-FGmKDjbXa9qfUTh2aw8Chsi8laj9M0IXqPDPhlKlHLgeG-SyD3R_n7xqw/s1600/Screenshot+from+2016-06-02+21%253A38%253A27.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="217" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgDexrvcslX2H0B2e5-1N7nLb8zG-0QkEJd_sDuy2u6eGuZndiemkNIpDHNcytZ_qegK6E4mDkc8CuZ5CU5n-FGmKDjbXa9qfUTh2aw8Chsi8laj9M0IXqPDPhlKlHLgeG-SyD3R_n7xqw/s400/Screenshot+from+2016-06-02+21%253A38%253A27.png" width="400" /></a></div>
Y por lo que busqué, en algunos casos se interpreta <i>Siloh</i> como una mención a Jesús. Obviamente marqué como insegura esta referencia. Por lo visto en la Biblia hay unos cuantos huevos de Pascua (y casi nunca mejor dicho) escondidos.<br />
<br />
Por último me he preguntado con quiénes coaparecen los seres superiores. Resultados:<br />
<br />
<div style="text-align: center;">
<b>Dios</b></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj1LjCPuTzcrIWykDa_j5aTRTWS4gQYDjtsI-3dBFUM3jb0j0MiYI4cN181zhSpOlMw5yJikz-qNxE2YcDNLwmRLNaOYQpX59kAK1udCVZXs4yOtyT7h_ThTFBLJd-PIGb7EHt2EM5fOiQ/s1600/Screenshot+from+2016-06-02+21%253A43%253A38.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="304" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj1LjCPuTzcrIWykDa_j5aTRTWS4gQYDjtsI-3dBFUM3jb0j0MiYI4cN181zhSpOlMw5yJikz-qNxE2YcDNLwmRLNaOYQpX59kAK1udCVZXs4yOtyT7h_ThTFBLJd-PIGb7EHt2EM5fOiQ/s320/Screenshot+from+2016-06-02+21%253A43%253A38.png" width="320" /></a></div>
<div style="text-align: center;">
<b>Ángeles</b></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj4rNeOBRXSO7CPn8-0kZNPLU4Mmajr73cJDFGXBudrWaH7eSi8MWfArhlEoHzBEsy8w1muRVhUT5yjf2yfwJr3EMsvYDXiVQ85FYFGA6FhhxWEJBv8yITJCgyWHiWuiS2_MAMu7_oUu6g/s1600/Screenshot+from+2016-06-02+21%253A44%253A50.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="267" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj4rNeOBRXSO7CPn8-0kZNPLU4Mmajr73cJDFGXBudrWaH7eSi8MWfArhlEoHzBEsy8w1muRVhUT5yjf2yfwJr3EMsvYDXiVQ85FYFGA6FhhxWEJBv8yITJCgyWHiWuiS2_MAMu7_oUu6g/s320/Screenshot+from+2016-06-02+21%253A44%253A50.png" width="320" /></a></div>
<div style="text-align: center;">
<b>Espíritu Santo</b></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhF6Axn0VoydeGrgCa0iuFuCKtd2lIbZ62gY9sHioMVhJLdrgd5UaNxuVYItKJBJ-UjlilEtc7d4MhtKoz5V4-2_nc0xnHBCe9mCzodD3kB2jT3qjYgiPGoMB3xUtYtenaTMYOvOTzbn8A/s1600/Screenshot+from+2016-06-02+21%253A46%253A10.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="226" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhF6Axn0VoydeGrgCa0iuFuCKtd2lIbZ62gY9sHioMVhJLdrgd5UaNxuVYItKJBJ-UjlilEtc7d4MhtKoz5V4-2_nc0xnHBCe9mCzodD3kB2jT3qjYgiPGoMB3xUtYtenaTMYOvOTzbn8A/s320/Screenshot+from+2016-06-02+21%253A46%253A10.png" width="320" /></a></div>
<div style="text-align: center;">
<b>Diablo</b></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEirhTemT06uc9AWQhcqJdKMXL1l0gl__v20ggST_nuwfoQbmpx2sHg4-xIYG9lqfkip-ZkzttpmZj7yW95kIXoo4QgpwIIkrrIYAIxb_9023VvR5H1Haq8NHIKSlJpZ0SidigRBRAq4g4Q/s1600/Screenshot+from+2016-06-02+21%253A47%253A01.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEirhTemT06uc9AWQhcqJdKMXL1l0gl__v20ggST_nuwfoQbmpx2sHg4-xIYG9lqfkip-ZkzttpmZj7yW95kIXoo4QgpwIIkrrIYAIxb_9023VvR5H1Haq8NHIKSlJpZ0SidigRBRAq4g4Q/s320/Screenshot+from+2016-06-02+21%253A47%253A01.png" width="296" /></a></div>
<br />
<div style="text-align: center;">
</div>
</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-33192635258045691662016-06-02T16:50:00.000+02:002016-06-02T16:50:20.640+02:00Grafo sobre el Libro de Rut<div dir="ltr" style="text-align: left;" trbidi="on">
Dije que iba a seguir <a href="http://eumanismo.blogspot.de/2016/05/grafo-de-personajes-del-genesis.html">hablando del grafo del <i>Génesis</i></a> y cómo Dios modifica las relaciones entre las personas, pero vamos a hacer un inciso para ver un pequeño grafo del <i>Libro de Rut</i>, el último en formar parte de la edición <a href="https://github.com/morethanbooks/XML-TEI-Bible"><i>XML-TEI Bible</i></a>. Después de los 50 cargadísimos capítulos del <i>Génesis</i> me apetecía algo ligerito. Los 4 capítulos de Rut han sido como esas tapas minimalistas que te ponen en algunos bares que te terminas antes de querer darte cuenta. Tenéis <a href="https://github.com/morethanbooks/XML-TEI-Bible">datos, archivo gephi y visualización en GitHub</a>:<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgmU-6JV_5KBF6xq7c1pfYMbMZp22Mw2IEHXDhoMNhmQ_Oe57_M6_xV4y1rPN-dr82QKRSXO2raCSGAtVJRspD88eOvqy5UMkzva16b6A_MCnpqyrV75NoExqvXoQzOVeGHohti1W8Fu4s/s1600/Screenshot+from+2016-06-02+16%253A23%253A28.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="250" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgmU-6JV_5KBF6xq7c1pfYMbMZp22Mw2IEHXDhoMNhmQ_Oe57_M6_xV4y1rPN-dr82QKRSXO2raCSGAtVJRspD88eOvqy5UMkzva16b6A_MCnpqyrV75NoExqvXoQzOVeGHohti1W8Fu4s/s400/Screenshot+from+2016-06-02+16%253A23%253A28.png" width="400" /></a></div>
<br />Es bastante interesante observar de nuevo el desarrollo de la historia representado en el grafo: arriba a la derecha aparecen las personas y grupos mencionados al comienzo del libro, mientras que el extremo inferior izquierdo son menciones del final del libro. De esta manera aparece la gradación entre personas moabitas hasta el pueblo de Israel. Y es que de eso va Rut basicamente: una mujer que pasa a ser judía por su relación con Noemí y Booz.<br />
<br />
Un aspecto muy interesante es observar ese lazo que sale de Rut hacia la izquierda, a través de Tamar y Fares y que vuelve a ella por Obed (el hijo que tiene con Booz). Ese lazo representa exactamente un lazo familiar que se describe en relación a Rut desde el versículo 4:12 hasta el final del libro en 4:22. Los ancianos del pueblo de Israel comparan en 4:12 la familia de Rut con la de Fares, hijo de Judá (es decir, con los descendientes más importantes de Jacob). Y al final del capítulo se mencionan las generaciones que van de Fares a Rut:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEidPnl57vYb6ayi1SuScl0oNktF90z8SjK2hlml7ncZ_hv6Vrmq-hew5wv0HaknsM1Kl71o0xfojKhh_lBkZnFp__bpgGBFgiOBSeTgjrHtSj3wElKCJJ5NBatyj8lHXzCFzazJHxn0PJc/s1600/Screenshot+from+2016-06-02+16%253A36%253A00.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="195" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEidPnl57vYb6ayi1SuScl0oNktF90z8SjK2hlml7ncZ_hv6Vrmq-hew5wv0HaknsM1Kl71o0xfojKhh_lBkZnFp__bpgGBFgiOBSeTgjrHtSj3wElKCJJ5NBatyj8lHXzCFzazJHxn0PJc/s400/Screenshot+from+2016-06-02+16%253A36%253A00.png" width="400" /></a></div>
Ese lazo parece bastante <a href="http://eumanismo.blogspot.de/2016/04/xml-tei-bible.html">similar al que veíamos en <i>Mateo</i></a>. No solo en la forma, en ese también veíamos los nombres de Rut, Boaz, Tamar, Fares, Obed, Isaí, David... Conectados con Jesús:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjWHmSE9fEMpwQ_UwMd24Yoik2g4upFNm4c9J3c3QO4_RRADf4CjtKmHLhdqNSX_qIuTJuTSRybMc_4PdJeM13He8A2t4HxmuGCYuOOIoJ2uVUGHO84Ui0ZC4N2_eg5bIfnLlJCouZJo6c/s1600/Screenshot+from+2016-06-02+16%253A40%253A25.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="283" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjWHmSE9fEMpwQ_UwMd24Yoik2g4upFNm4c9J3c3QO4_RRADf4CjtKmHLhdqNSX_qIuTJuTSRybMc_4PdJeM13He8A2t4HxmuGCYuOOIoJ2uVUGHO84Ui0ZC4N2_eg5bIfnLlJCouZJo6c/s400/Screenshot+from+2016-06-02+16%253A40%253A25.png" width="400" /></a></div>
<br /></div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-1711725725140189192016-05-27T22:16:00.001+02:002016-05-27T22:20:04.755+02:00Grafo de personajes del Génesis<div dir="ltr" style="text-align: left;" trbidi="on">
<br />
<a href="http://eumanismo.blogspot.de/2016/04/xml-tei-bible.html">Como comenté en mi anterior post, sigo editando en XML-TEI textos bíblicos</a> y hace poco terminé <i>Génesis</i>. Así que he empezado a extraer y visualizar
datos. Tenía muchísimo interés en
visualizar el grafo entre personajes del <i>Génesis</i>, ya que está tan bien dividido en
diferentes partes con principales protagonistas: Adán, Noé, Lot, Abraham,
Isaac, Jacob, José...<br />
<br />
Para este post los nodos son personas y grupos que encontramos en la ontología. Las relaciones están
definidas como que las dos entidades aparecen en el mismo versículo, ya
sea como mención, como entidad que comunica o como entidad a la que es
comunicada y no he eliminado ninguna arista. Aunque he codificado también los lugares, en este post solo vamos a ver relaciones entre grupos y personas, y en concreto solo aquellos que pueden considerarse humanos, por lo que quedan fuera Dios, el Espíritu Santo, el diablo... Vamos a echarle un ojo muy por encima:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgNjXitFHu8L0ZasGHWng9MSKAeT9d7uTSQ9P5e6aI-e4pIumkRXCrbt-nStk5jlrFanXneEVkr2eor5tBFItc9hV9xKstoAr7unbypH9HBYBxgeTX-mOAQ_E6gVgun7q_KZ5ATDX2_W-0/s1600/Screenshot+from+2016-05-26+16%253A44%253A07.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="400" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgNjXitFHu8L0ZasGHWng9MSKAeT9d7uTSQ9P5e6aI-e4pIumkRXCrbt-nStk5jlrFanXneEVkr2eor5tBFItc9hV9xKstoAr7unbypH9HBYBxgeTX-mOAQ_E6gVgun7q_KZ5ATDX2_W-0/s400/Screenshot+from+2016-05-26+16%253A44%253A07.png" width="326" /></a></div>
<br />
Veamos el grafo poco a poco (<a href="https://github.com/morethanbooks/XML-TEI-Bible/blob/master/visualizations/gen_network_per|group_defined_human.svg">el original está aquí en SVG</a>). Como vemos hay un conjunto principal de nodos abajo a la derecha y otro menor arriba a la izquierda. El núcleo superior congrega a casi todos las personas anteriores a Lot y Abraham, mientras que el núcleo principal engloba desde Lot y Abraham hasta José y sus descendientes. Veamos más de cerca el primer núcleo cronológico:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhnBaCwzNy8DBhFoqTQlBfve39GDVl8YQFrf2_XsHwlV99jy64Vpt5ZyQ_MQChGaIWylNDcSvvqOtoflLrIFqI2yrpO4bhj4KAYV4P081BeIEGwzGTFXJ12xAY_4KOG2nypO28Z_efKPWI/s1600/Screenshot+from+2016-05-26+16%253A48%253A19.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="336" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhnBaCwzNy8DBhFoqTQlBfve39GDVl8YQFrf2_XsHwlV99jy64Vpt5ZyQ_MQChGaIWylNDcSvvqOtoflLrIFqI2yrpO4bhj4KAYV4P081BeIEGwzGTFXJ12xAY_4KOG2nypO28Z_efKPWI/s400/Screenshot+from+2016-05-26+16%253A48%253A19.png" width="400" /></a></div>
Si nos fijamos en la esquina superior izquierda, tenemos a la familia originaria: Adán, Eva y sus hijos. Caín está conectado con sus descendientes (que terminan con Lamec; hay otro Lamec, padre de Noé, pero obviamente no era el mismo), pero su línea no continúa. La semilla de Adán fluye por la rama de su tercer y menos conocido hijo: Set. Esta rama avanza pasando por Matusalén hasta Noé (no se le distingue claramente, pero ahí está). Este crea un conjunto de relaciones, entre ellas las de sus descendientes, quienes continuarán la rama familiar pasando por Canaán (no el lugar, sino el nieto de Noé, hijo de Cam). Esta rama va descendiendo hasta conectar con el núcleo principal del grafo, la conformada por los patriarcas Abraham, Isaac y Jacob y sus hijos:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjPmJtnB78lWo9rzfEitmk1yB73bixevBASND01c8lElG9iYI11qM8CJ2CaHkw3NHdHOAcX9-SdnRV1_SC9OH__jfwoJncjFuAWoKADFCUpj2dgpex6h3KhcjXzRBqTYslQYxsQmCseCM4/s1600/Screenshot+from+2016-05-26+16%253A50%253A37.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="297" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjPmJtnB78lWo9rzfEitmk1yB73bixevBASND01c8lElG9iYI11qM8CJ2CaHkw3NHdHOAcX9-SdnRV1_SC9OH__jfwoJncjFuAWoKADFCUpj2dgpex6h3KhcjXzRBqTYslQYxsQmCseCM4/s400/Screenshot+from+2016-05-26+16%253A50%253A37.png" width="400" /></a></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjzgTF60-YORsdP3Esmj90flP2StlBZITBuQOdKSawbdayg5gIZI84axZMlb9pbfJnoGxOgo2qi_u_HjqpR00xfFSh0r8231WZDCQFZo6yTsht-x1JGfGJIh2gkmVP2Fz1fPyJIuwHOvd0/s1600/Screenshot+from+2016-05-26+16%253A42%253A59.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><br /></a></div>
Reconocemos rápidamente algunos nombres: Abraham, Esaú, Jacob, sus hijos, José... Si nos fijamos más, veremos otros nombres como Ismael, Labán, Isaac, Rubén, Judá... Y aquí ya podemos observar algo que quizás no es siempre claro: Isaac es mucho menos importante para la historia del <i>Génesis</i> que Abraham, Jacob o incluso José.<br />
<br />
Una cosa muy interesante es observar qué ramas de la familia son apartadas y cuáles se mantienen en el tronco principal. Lo habíamos visto ya con Caín, y hay otros ejemplos alrededor de Noé. Pero en la última visualización queda claro de nuevo con los ejemplos de Ismael y Esaú. Incluso ambos aparecen hacia el mismo lado del grafo y es que Esaú acudió a Ismael para buscar esposa, por lo que hay relaciones entre ambas ramas.<br />
<br />
Las relaciones familiares llegan a representarse en el grafo de tal manera que iincluso se reconocen entre los hijos de Jacob quiénes eran de la misma madre. Vemos a José y Benjamín (hijos de Raquel) en el extremo superior de la siguiente imagen; Gad y Aser (hijos de Zilpa) en la parte inferior; Dan y Neftalí (hijos de Bilha) en el lado izquierdo; y Judá, Rubén, Leví, Simeón, Zabulón e Isacar (hijos de Lea) en el lado derecho (solo la olvidada Dina aparece apartada de sus hermanos, pero este personaje es tratado de manera totalmente diferente a sus hermanos).<br />
<div style="text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg5DyWzSUV6k9rmC4DTyX8PlSgNR34xLXfapPxP9B1ta_NFLOTPlUbSVQAijgY7ANVAx4wsCYF84ccTTROG_WWYOs9ry0CmZyk9AMnmiT4au5t3UO1FnC8iSNalR6tLWaAj2uC57hd55U4/s1600/Screenshot+from+2016-05-26+22%253A18%253A43.png" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="400" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg5DyWzSUV6k9rmC4DTyX8PlSgNR34xLXfapPxP9B1ta_NFLOTPlUbSVQAijgY7ANVAx4wsCYF84ccTTROG_WWYOs9ry0CmZyk9AMnmiT4au5t3UO1FnC8iSNalR6tLWaAj2uC57hd55U4/s400/Screenshot+from+2016-05-26+22%253A18%253A43.png" width="398" /></a> </div>
<br />
Las relaciones familiares siguen su camino hacia los extremos con las diferentes tribus. El hecho de marcase las personas cuando se mencionaban de manera individual pero como tribu al señalarse de manera conjunta hace todavía más claro las relaciones entre patriarcas, descendientes y tribus:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjUMLBzyCLuwJw0pDmGUs1rBDoC2u5S_lyQ9L_IWGtZqxsbEJeGV2nwvjHX2FpcODrLmd31_KYVBSH3uLOK7MHbI9iy-Q0ejRQv6qAv4fKL0TTmiPtA19kXnaaExnSGeeLpumfYPaWDu9U/s1600/Screenshot+from+2016-05-26+22%253A31%253A44.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="361" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjUMLBzyCLuwJw0pDmGUs1rBDoC2u5S_lyQ9L_IWGtZqxsbEJeGV2nwvjHX2FpcODrLmd31_KYVBSH3uLOK7MHbI9iy-Q0ejRQv6qAv4fKL0TTmiPtA19kXnaaExnSGeeLpumfYPaWDu9U/s400/Screenshot+from+2016-05-26+22%253A31%253A44.png" width="400" /></a></div>
Como vemos las relaciones familiares son desde luego uno de los principales aspectos que representan la coaparición por versículo, pero no todas. Por ejemplo José agrupa a su alrededor una serie de nodos cuya mayoría no son familiares (aunque algunos como Manasés o Efraín sí): el faraón, los egipcios, , Potifar, el jefe de la cárcel, el copero...<br />
<br />
Otro ejemplo curioso de nodos que penden sin ser familia es la rama que pende hacia arriba desde Abraham, rama muy similar a las creadas por las tribus de Israel. En realidad el tal Bera es el rey de Sodoma, con el que Abraham se relaciona en el capítulo 14. El resto de nodos que penden de Bera son también reyes que guerrean entre ellos: <br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjVuYqFcaWP-_RpZTlth-GXOmUM_EjTOH54yfaICU4f_bkFPiVyyo6w2klLP7NfhHrUOyqV16z9tkkWGCuqTkkicVtq0EpeoV6rKF4QrAlmZqQ7cTHf6o5QmThMNJhbnZlQJ8YDJev0d6c/s1600/Screenshot+from+2016-05-27+21%253A29%253A42.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="400" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjVuYqFcaWP-_RpZTlth-GXOmUM_EjTOH54yfaICU4f_bkFPiVyyo6w2klLP7NfhHrUOyqV16z9tkkWGCuqTkkicVtq0EpeoV6rKF4QrAlmZqQ7cTHf6o5QmThMNJhbnZlQJ8YDJev0d6c/s400/Screenshot+from+2016-05-27+21%253A29%253A42.png" width="298" /></a></div>
En algunos casos las relaciones entre personas en realidad señalan relaciones de grupo étnico (si es que se les puede llamar grupo étnico). Por ejemplo en la siguiente imagen encontramos a Het por encima de "descendientes de Abraham" y a Moab en la esquina izquierda inferior. <br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj9R6Xaf6JWijo6YkrM89ymBOekWnzP2pJJiNtXp0QZRiwvPLM_6C9Ba1Ks-ojFnCp4LIYcMFsLyOoQH_RKZ01yKaOIDS2g7Mfkgu22etmu0if-Z-iPDkBv2Ds36X2XePvAjA7YcPO9jp8/s1600/Screenshot+from+2016-05-26+22%253A45%253A21.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="400" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj9R6Xaf6JWijo6YkrM89ymBOekWnzP2pJJiNtXp0QZRiwvPLM_6C9Ba1Ks-ojFnCp4LIYcMFsLyOoQH_RKZ01yKaOIDS2g7Mfkgu22etmu0if-Z-iPDkBv2Ds36X2XePvAjA7YcPO9jp8/s400/Screenshot+from+2016-05-26+22%253A45%253A21.png" width="396" /></a></div>
Het en realidad es bisnieto de Noé. ¿Por qué entonces aparece tan cerca de Abraham? Porque la palabra <i>Het</i> se encuentra más frecuentemente dentro de la construcción <i>hijos de Het</i>, una denominación étnica especialmente frecuente en el capítulo 23, contemporáneo a Abraham. Algo similar ocurre con <i>Moab</i>, nombre que sirve de base para el grupo de los moabitas, quienes también aparecen en la anterior imagen. Esto me ha hecho pensar en la manera de definir las relaciones. Veamos el código XML-TEI:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiAKtBe9ntPEKjR_1s0EasLlLl5yImiY5jC84fmroLfHaPN67sBEFcmNqHRv6pwkQ0vEDRVjXqHwtkzukWfP0EwGKGfXEPG-xw2ppU9PuzPnzH_myLfZIk_ngNBKkBIw7cZ8TYh3NDV_Y4/s1600/Screenshot+from+2016-05-27+21%253A43%253A01.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="91" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiFihOhnH3nr-7MTu1F-qkBi0OScwjUVf8HOjrVxZe6yf6RBi6B8zxJfLGBWt4QeQLiR353tyvu1jEXl53rVJnSfPfrNkVnULSTpMIHhbZVQ71IvvIztNU8mt3vBCehkaGVkXP7LE1IEj0/s400/Screenshot+from+2016-05-27+21%253A43%253A01.png" width="400" /> </a></div>
<div class="separator" style="clear: both; text-align: left;">
Como vemos, Abraham y Het en realidad son elementos que penden en diferentes niveles. Abraham y los hijos de Het cuelgan del mismo elemento, mientras que Het cuelga de un elemento inferior (de sus hijos en concreto). Es decir, que si decidiésemos coger solamente los elementos que son hijos directos del versículo, quizás conseguiríamos relaciones más homogéneas.</div>
<div class="separator" style="clear: both; text-align: left;">
<br /></div>
<div class="separator" style="clear: both; text-align: left;">
De cualquier manera, lo que personalmente observo de manera clara es que la coaparición de referencias en el mismo versículo está en correlación con la relación familiar. También resulta llamativa la forma que tiene el grafo de manera conjuntan. Esperaba ver diferentes núcleos alrededor de los nombres como Adán, Noé, Abraham, Isaac, Jacob y José; y que esos núcleos no estuviesen lejos entre sí. Lo cierto es que hay un enorme núcleo desde Abraham a Jacob y sus hijos; Noé y Adán quedan ambos como núcleos menores conectados entre sí y con el resto del grafo de manera muy débil. Y es que las personas no hacen mención al pasado anterior a Abraham: Adán no vuelve a aparecer en todo el texto después del capítulo 5. Lo mismo ocurre con Noé desde el capítulo 10. ¿Sabían de ellos Abraham y sus descendientes?</div>
<div class="separator" style="clear: both; text-align: left;">
<br /></div>
<div class="separator" style="clear: both; text-align: left;">
<span style="color: black;"><span style="color: black;">Y la pregunta más importante de todas: ¿Y Dios? ¿Dónde queda? ¿Qué cambia si lo tenemos en cuenta en el grafo? Eso lo vemos en otro post, que este ya ha quedado suficientemente largo. </span></span></div>
</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com2tag:blogger.com,1999:blog-6189106821734378281.post-89704103197942535202016-04-04T21:57:00.001+02:002016-04-07T15:47:12.723+02:00XML-TEI Bible<div dir="ltr" style="text-align: left;" trbidi="on">
En <a href="http://eumanismo.blogspot.de/2016/02/xml-tei-del-evangelio-de-mateo.html">uno de los últimos posts</a> comenté algunos aspectos de un pequeño proyecto que comencé hace algunos meses y del que me gustaría informar sobre importantes novedades. El proyecto pasa a llamarse <b><a href="https://github.com/morethanbooks/XML-TEI-Bible">XML-TEI Bible</a></b> y es una codificación en XML-TEI de los textos de la Biblia. XML es un lenguaje de marcado (<i>markup language</i>) emparentado con el HTML que conocemos de la web. <a href="http://www.tei-c.org/">TEI</a> es una variante muy utilizada en proyectos editoriales y filológicos dentro y fuera de las Humanidades Digitales. Con este lenguaje estoy marcando en los textos bíblicos la siguiente información por ahora:
<br />
<ul style="text-align: left;">
<li>Estructura básica de libros, capítulos, <a href="https://es.wikipedia.org/wiki/Per%C3%ADcopa"><i>perícopas</i></a> y versículos </li>
<li>Identificar unívocamente personas, grupos, lugares y momentos</li>
<li>Diálogo, incluyendo quién habla con quién cómo (escrito, hablado, oración)</li>
</ul>
El código tiene la siguiente pinta, por ejemplo en concreto el pasaje de Mateo 1:20-21:
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjVA9ku10V4U3CxZddWqnreNDhoShNkWiMwXPrRsS8bK47xQu8ceVwYbYIaV69S0rkZ4mAm7q2nbzRQqX5EBjgwsioXg7hcVOztzOUSDS2WiXowqUy-j8u0XuPFazRrm89Ld7V7L-N1oDc/s1600/Screenshot+from+2016-04-02+19%253A33%253A28.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjVA9ku10V4U3CxZddWqnreNDhoShNkWiMwXPrRsS8bK47xQu8ceVwYbYIaV69S0rkZ4mAm7q2nbzRQqX5EBjgwsioXg7hcVOztzOUSDS2WiXowqUy-j8u0XuPFazRrm89Ld7V7L-N1oDc/s400/Screenshot+from+2016-04-02+19%253A33%253A28.png" /> </a></div>
<div class="separator" style="clear: both; text-align: left;">
¿Por qué hago esto? Porque no me he encontrado una versión TEI de la Biblia que tenga codificada información dentro de los versículos. Creo que la Biblia tiene un mensaje importante para cada persona. Poder estructurar el texto lentamente de esta manera me permite acceder a detalles que una lectura normal omite. Y una vez el trabajo está terminado con un libro (y unas pocas decenas de capítulos por libro no es tanto), permite ver tendencias que los versículos ocultan.</div>
<div class="separator" style="clear: both; text-align: left;">
<br /></div>
<div class="separator" style="clear: both; text-align: left;">
Porque una vez se tienen los datos estructurados en el texto, se pueden extraer aspectos concretos y visualizarlos mediante otras herramientas. Por ejemplo, ¿quién habla en el <i>Apocalipsis</i>?:</div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEie0_ZMaSGrtJhlVBwyH6tpGy97HjvK8m2lgjLJitUHogyKM21nGLMJs4drtfOMdzHF2Sq2N6nenaYZVP2RTJ3QpNVUJTSNJ6Osiw2acmH0TgKBmWQG3ejirp0ZGug8sxnXRaRuzOznw7w/s1600/APO_q-who-wordle.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="200" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEie0_ZMaSGrtJhlVBwyH6tpGy97HjvK8m2lgjLJitUHogyKM21nGLMJs4drtfOMdzHF2Sq2N6nenaYZVP2RTJ3QpNVUJTSNJ6Osiw2acmH0TgKBmWQG3ejirp0ZGug8sxnXRaRuzOznw7w/s320/APO_q-who-wordle.png" width="320" /></a></div>
<br />
¿A quién se menciona en los diálogos del <i>Evangelio de Juan</i>? <br />
<div class="separator" style="clear: both; text-align: center;">
</div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiLEp6lLMZsNEV8c2X_gamywJBWgijzdYI234mhCuWJeIMMFpZ2y87n1KWnERPyvjGPCs9UptRFuFHSR-1tWBfXYS4ukI1phouVS1asRI9fJR9og9a1yPVOmnNfL6qbxA8qYq3tOPORnP4/s1600/JOH_q_rs_wordle.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="200" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiLEp6lLMZsNEV8c2X_gamywJBWgijzdYI234mhCuWJeIMMFpZ2y87n1KWnERPyvjGPCs9UptRFuFHSR-1tWBfXYS4ukI1phouVS1asRI9fJR9og9a1yPVOmnNfL6qbxA8qYq3tOPORnP4/s320/JOH_q_rs_wordle.png" width="320" /></a></div>
<br />
¿Y quiénes aparecen mencionados en el mismo versículo en el <i>Evangelio de Mateo</i>?<br />
<div class="separator" style="clear: both; text-align: center;">
</div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhn1pdcCctspTkgWJBG0QhW8DRwi37DTjTNJMLkX2H7iO59iyHkcG24iEv9bAi0QtKMl5Dxo0R1FYRqJv4yp-RRu8Zot1eA4N5DZnjEXk1wui5oLyyl_5HtZjSHXUpBtYNtzdxjkT6VqfY/s1600/red-biblia.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhn1pdcCctspTkgWJBG0QhW8DRwi37DTjTNJMLkX2H7iO59iyHkcG24iEv9bAi0QtKMl5Dxo0R1FYRqJv4yp-RRu8Zot1eA4N5DZnjEXk1wui5oLyyl_5HtZjSHXUpBtYNtzdxjkT6VqfY/s320/red-biblia.png" width="320" /></a></div>
<div class="separator" style="clear: both; text-align: left;">
Estos son solo un par de ejemplos sobre <a href="http://eumanismo.blogspot.de/2016/02/xml-tei-del-evangelio-de-mateo.html">posibles visualizaciones</a>, pero al estar los datos ahí, se pueden utilizar o visualizar de otras maneras.</div>
<div class="separator" style="clear: both; text-align: left;">
<br /></div>
<div class="separator" style="clear: both; text-align: left;">
Por ahora están completados los <i>Evangelios</i> de <a href="https://github.com/morethanbooks/XML-TEI-Bible/blob/master/TEIBible.xml">Mateo, Juan y<i> Apocalipsis</i></a>, y he comenzado hace algunos días con <i>Génesis</i>, tras lo cual quiero continuar dando saltos por la Biblia. Además he desarrollado algunos programitas y archivos para facilitar la preparación (python), la extracción (XSLT y python) y visualización (CSS) de los datos, amén de cierta documentación. Todo está publicado en <a href="https://github.com/morethanbooks/XML-TEI-Bible">GitHub</a>:</div>
<div class="separator" style="clear: both; text-align: left;">
<a href="https://github.com/morethanbooks/XML-TEI-Bible">https://github.com/morethanbooks/XML-TEI-Bible</a></div>
<div class="separator" style="clear: both; text-align: left;">
<br /></div>
<div class="separator" style="clear: both; text-align: left;">
Hasta ahora he trabajado con el texto en español, lengua en la que quiero seguir realizándolo, aunque también se puede desarrollar el proyecto parte o totalmente en otras lenguas si existe el interés de realizarlo.</div>
<div class="separator" style="clear: both; text-align: left;">
<br /></div>
<div class="separator" style="clear: both; text-align: left;">
El proyecto ha tenido tres importantes influencias:</div>
<ol style="text-align: left;">
<li>la primera persona que me trajo la idea de estructurar digitalmente el contenido bíblico fue <a href="http://dhd2013.filos.unam.mx/sigutierrez/2013/05/20/humanidades-digitales-periferia/">Silvia Gutiérrez</a> </li>
<li>Un proyecto absolutamente fascinante sobre la Biblia y las Humanidades Digitales es <a href="http://www.openbible.info/">OpenBible</a>, a quienes les agradezco su web, sus datos, sus ideas y su cercanía</li>
<li>Y por último, este proyecto reutiliza muchísimo de lo que aprendo a diario en <a href="http://cligs.hypotheses.org/">CLiGS, en la Universidad de Würzburg</a>. De hecho le agradezco a mi colega Ulrike Henny su constante ayuda con XPath y XSLT</li>
</ol>
<div class="separator" style="clear: both; text-align: left;">
</div>
<div class="separator" style="clear: both; text-align: left;">
Quiero ser todo lo abierto que me dejen con el proyecto. No solo los datos están ahí, también estoy muy abierto a posibles colaboraciones tanto puntuales como a medio o largo plazo. Sería especialmente interesante que gente con más conocimientos que yo de teología, Biblia, historia, informática u otras lenguas (vivas o muertas) quisiesen colaborar. También estoy abierto a otras perspectivas o áreas que puedan enriquecer el proyecto.</div>
</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com2tag:blogger.com,1999:blog-6189106821734378281.post-1962996466034082422016-03-12T14:22:00.002+01:002016-03-12T14:26:30.615+01:00Adán y Eva, la condenación y Cristo en el Olimpo, de Leipzig<div dir="ltr" style="text-align: left;" trbidi="on">
Mi reciente visita a Leipzig con motivo de las <a href="http://www.dhd2016.de/">DHd 2016</a> me ha dejado un hueco para poder visitar el <a href="http://www.mdbk.de/"><i>Museum der bildenden Künste</i></a>, en pleno centro de la ciudad. El museo tiene una exposición permanente de muy buena calidad, especialmente si te interesa el arte de finales del siglo XIX y comienzos del XX. Las entradas son muy asequibles y si eres estudiante es casi regalada. Así que si pasas por Leipzig debería ser uno de tus destinos.<br />
<br />
Aquí comparto algunas de las obras que más me impresionaron:<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhffqnd_EBfDY5B2Kw3mr_ruSksSbkegzQJGfihWx42sMBHRMf51t045tzWFgEW4wqI4t6-vl3BRMclUiCDxPlCfvmeKUSVxtxgFdVjjQ8SbqmV-wdxvRNVI0C_cuaW69FkIK2L97OOxXk/s1600/adam-eva.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhffqnd_EBfDY5B2Kw3mr_ruSksSbkegzQJGfihWx42sMBHRMf51t045tzWFgEW4wqI4t6-vl3BRMclUiCDxPlCfvmeKUSVxtxgFdVjjQ8SbqmV-wdxvRNVI0C_cuaW69FkIK2L97OOxXk/s400/adam-eva.jpg" /></a></div>
<div style="text-align: center;">
<a href="http://www.akg-images.de/archive/Adam-und-Eva-in-paradiesischer-Landschaft-2UMDHUTE4B0F.html"><i>Adam und Eva in paradiesischer Landschaft</i></a> (<i>Adán y Eva en paisaje paradisíaco</i>), de Ludwig von Hofmann, 1893/97 </div>
<div style="text-align: center;">
<br /></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEimqJHeYU-oi9ZAENmu5xgcpCm8VXxn9GwVajbM9783cQONopjvkKgEmoQALwEyZn45uIlaqhbTnuiXgIfZkIgxjHlZy9hajarW9Zxf8Aed51YAuAEPW3RFERRS1ATQem2eHVIfQ5-3EsQ/s1600/Balthasar_permoser%252C_dannazione%252C_1725_ca._01.JPG" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEimqJHeYU-oi9ZAENmu5xgcpCm8VXxn9GwVajbM9783cQONopjvkKgEmoQALwEyZn45uIlaqhbTnuiXgIfZkIgxjHlZy9hajarW9Zxf8Aed51YAuAEPW3RFERRS1ATQem2eHVIfQ5-3EsQ/s400/Balthasar_permoser%252C_dannazione%252C_1725_ca._01.JPG" /></a></div>
<div style="text-align: center;">
<a href="http://artealasocho.blogspot.de/2013/11/die-verdammnis-el-condenado.html"><i>Die Verdammnis</i></a> (<i>La maldición</i>), de Balthasar Permoser, c. 1725. </div>
<div style="text-align: center;">
<br /></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgUY7tLYUYux7eQWqy4PuRuGPB_qG7SYrXkjqY8UoAozoKXiQHZmO5GionibLAawW8vNH_l2cbd5wMedZv7K8xvKlD3BrUH0ahciCdQyyzqXZgeiA09Q0bHzWXgweOGrMrvrNXimhXS1ak/s1600/Christus+im+Olymp-18_12_08.deb594281dde6d8cd043b4883362dfde76.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgUY7tLYUYux7eQWqy4PuRuGPB_qG7SYrXkjqY8UoAozoKXiQHZmO5GionibLAawW8vNH_l2cbd5wMedZv7K8xvKlD3BrUH0ahciCdQyyzqXZgeiA09Q0bHzWXgweOGrMrvrNXimhXS1ak/s400/Christus+im+Olymp-18_12_08.deb594281dde6d8cd043b4883362dfde76.jpg" /></a></div>
<div style="text-align: center;">
<a href="http://www.industriekultur-leipzig.de/vortr%C3%A4ge/%E2%80%9Echristus-im-olymp%E2%80%9C.-%C3%BCber-die-restaurierung-eines-gem%C3%A4lde-im-museum-der-bildenden-k%C3%BCnste-leipzig.html"><i>Christus im Olymp </i></a>(<i>Cristo en el Olimpo</i>), de Max Klinger, 1889–1897
</div>
</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com2tag:blogger.com,1999:blog-6189106821734378281.post-41165133411779049452016-02-15T17:28:00.002+01:002016-05-27T22:16:47.688+02:00XML-TEI del evangelio de Mateo<div dir="ltr" style="text-align: left;" trbidi="on">
A principios de este año decidí invertir tiempo en desarrollar una idea que había comenzado hace algunos meses. He utilizado XML-TEI para codificar el evangelio de Mateo. La idea es poder acceder a textos bíblicos de una manera innovadora, <a href="http://eumanismo.blogspot.de/2014/02/comparando-mateo-marcos-lucas-y-juan.html">como ya probé</a>.<br />
<br />
Principalmente he marcado las menciones a personas, lugares y grupos; también he marcado cuando alguien dice algo de manera directa, colocando atributos sobre quién lo ha dicho, de qué manera y a quién. El código actualmente tiene la siguiente pinta:<br />
<br />
<br />
<div style="text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiKQykLpZsFOfxI_65k-GFBSt0neff6bIdFOlGonWyUp2Sdp739lzu1S65-9eUmBtFVb4oDCi4LzoClFV55ANxPza0bB6gZaJl3QS2MQeU2q5S9OJSDyxy5Fs9he23BbcJ4su_FV5aDsyY/s1600/Screenshot+from+2016-02-15+17%253A05%253A42.png" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="240" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiKQykLpZsFOfxI_65k-GFBSt0neff6bIdFOlGonWyUp2Sdp739lzu1S65-9eUmBtFVb4oDCi4LzoClFV55ANxPza0bB6gZaJl3QS2MQeU2q5S9OJSDyxy5Fs9he23BbcJ4su_FV5aDsyY/s320/Screenshot+from+2016-02-15+17%253A05%253A42.png" width="320" /></a></div>
<br />
Estoy desarrollando el código con un esquema para validarlo y voy desarrollando una ontología de personas de la Biblia según van apareciendo nuevos personajes. Lo estoy desarrollando en GitHub, donde quiero publicarlo en cuanto me quede claro cómo hacerlo correctamente.<br />
<br />
He hecho algunas pruebas de visualizaciones con CSS sobre el texto y tengo otras tantas ideas que quiero implementar según vaya consiguiendo que XSLT se deje de quejar.<br />
<br />
Por ejemplo, en la siguiente visualización se muestra el evangelio de Mateo, cada versículo como un cuadradito. Las superficies en azul son diálogos dicho por Jesús; los rojos son diálogos pronunciados por alguien diferente a Jesús:<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgMpMDKLy9vTy8daW_luR4NHfpCpp9zlTyl-ENQBpZlbgb-vc7KJ98OU_2rg7CJfvCD2wk2iGlgtHKi6m0QBNBNDyyb0_TScXUkz95sMYzfxGwVPQP2oiYUVDFY8O9rgdWuYHldLKU8K4E/s1600/Screenshot+from+2016-02-09+22%253A52%253A59.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="283" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgMpMDKLy9vTy8daW_luR4NHfpCpp9zlTyl-ENQBpZlbgb-vc7KJ98OU_2rg7CJfvCD2wk2iGlgtHKi6m0QBNBNDyyb0_TScXUkz95sMYzfxGwVPQP2oiYUVDFY8O9rgdWuYHldLKU8K4E/s320/Screenshot+from+2016-02-09+22%253A52%253A59.png" width="320" /></a></div>
<br />
Si los versículos no nos dejan ver el texto, al hacer cada versículo más pequeño conseguimos reconocer ciertos patrones. En primer lugar vemos como al principio y al final del evangelio Jesús tiende a no decir mucho. También se reconocen ciertos monólogos bastante largos en los que Jesús habla de manera ininterrumpida. También se reconocen muchas secciones en las que alguien dice algo (normalmente en un único versículo) y posteriormente Jesús responde. Esas son todas esas secciones en las que Jesús es preguntado o acusado de algo y él responde o se defiende.<br />
<br />
CSS también permite mezclar una lectura alejada y cercana del texto, ya que mediante las funciones <i>hover</i>, al pasar el cursor por un versículo, podemos agrandarlo para poder leerlo:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgpnm7pGHlxAyt7yPs0MC0Fn9cZJWaav41hrP8fG01SqTf__vL9spwGf-MIz-19oanrL5lRdpCHIMpNml9aPufTxlPefaQlPwQifO2_SelBilrZJoFyrVoRy6qCn_4HQT-mY0snfCm_yRI/s1600/Screenshot+from+2016-02-15+17%253A18%253A32.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="158" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgpnm7pGHlxAyt7yPs0MC0Fn9cZJWaav41hrP8fG01SqTf__vL9spwGf-MIz-19oanrL5lRdpCHIMpNml9aPufTxlPefaQlPwQifO2_SelBilrZJoFyrVoRy6qCn_4HQT-mY0snfCm_yRI/s320/Screenshot+from+2016-02-15+17%253A18%253A32.png" width="320" /></a></div>
<div class="separator" style="clear: both; text-align: left;">
En fin, esto es solo un par de pruebas sobre posibilidades de visualizaciones a partir del texto codificado. Actualmente estoy viendo cómo continuar con el evangelio de Juan reutilizando lo ya obtenido en Mateo de la mejor manera. Iré postando novedades, ideas y dudas. Estoy buscando recursos e idea que reutilizar o que aplicar, así que estoy muy abierto a sugerencias, ideas y colaboraciones :) </div>
</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-58901061781570958752015-12-13T21:08:00.000+01:002015-12-13T21:13:28.513+01:00Comparación léxica de los programas electorales del 20D 2015<div dir="ltr" style="text-align: left;" trbidi="on">
<div class="separator" style="clear: both; text-align: center;">
</div>
<div class="separator" style="clear: both; text-align: center;">
</div>
<div class="separator" style="clear: both; text-align: center;">
</div>
<div class="separator" style="clear: both; text-align: left;">
Todas las pruebas que he hecho hasta ahora con estilometría sobre los programas electorales daban información general sobre los programas electorales, pero no aportaban información sobre el contenido o los conceptos clave de los textos. Por eso en este caso voy a utilizar la función <i>oppose</i> de <a href="https://sites.google.com/site/computationalstylistics/stylo">stylo</a>. El objetivo de esta función es contraponer dos grupos de textos y rescatar aquellos términos léxicos que en un grupo están sobrerrepresentados y en el otro infrarrepresentados. Esta función está basada en el concepto de <i>Burrow's Zeta</i>. <a href="http://eumanismo.blogspot.de/2015/12/machine-learning-con-programas.html">Siguiendo los resultados de nuestro anterior experimento sobre derecha (PP, PSOE y Ciudadanos_2015) e izquierda (IU, Podemos, UPyD y Cs_2008)</a>, en la siguiente imagen aparecen a la derecha las palabras preferidas por los partidos de la derecha y los de la izquierda:</div>
<div class="separator" style="clear: both; text-align: left;">
<br /></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgVfeV_Es2CfiiWHL4r9WQLhfJogJgkWMuI7y1BJ7mmxFTHTB-6dcePaCbxyd1PQTQTRjrcWPhuPswVg_gsO6lS65zVtLxebDq9f9OohcKTZjAC3V46wIrNea0U3yK-_WYSgZkLl5KMDUA/s1600/151207_stilometrie+politics_Craig_001_words.png" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="400" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgVfeV_Es2CfiiWHL4r9WQLhfJogJgkWMuI7y1BJ7mmxFTHTB-6dcePaCbxyd1PQTQTRjrcWPhuPswVg_gsO6lS65zVtLxebDq9f9OohcKTZjAC3V46wIrNea0U3yK-_WYSgZkLl5KMDUA/s400/151207_stilometrie+politics_Craig_001_words.png" width="400" /></a></div>
<div class="separator" style="clear: both; text-align: left;">
<br /></div>
<div class="separator" style="clear: both; text-align: left;">
</div>
<div class="separator" style="clear: both; text-align: left;">
Encontramos que términos directamente relacionados con los partidos aparecen entre las palabras más frecuentes (<i>socialistas, izquierda, iu</i>...). Es lógico que estas palabras aparezcan frecuentemente en los programas del partido y no en los del contrincante. También es interesante ver que los partido de izquierda <i>proponen</i>, mientras que los de derecha <i>impulsan y promueven</i>. Pero lo cierto es que los resultados son bastante complicados de interpertar: parece que la derecha utiliza más verbos en primera persona mientras que los de la izquierda utilizan más sustantivos. No sé interpretar eso ni en clave política ni en clave estilística. Así que decidí quedarme solamente con aquellas palabras cuyo contenido semántico es más fácil de descifrar: los sustantivos. Y para intentar eleminar el ruido que aporta el plural y el singular, he reunido ambos tipos de formas en el lema. Para realizar este paso he utilizado la herramienta <a href="http://nlp.lsi.upc.edu/freeling/demo/demo.php">Freeling </a>y posteriormente limpié ciertos errores que la heramienta había cometido al analizar lingüísticamente los encabezamientos. Para el futuro sería positivo tener los programas en XML-TEI. ¿Alguien se anima a pedir un proyecto para hacer esto y publicarlo en abierto y Creative Commons :) ?</div>
<div class="separator" style="clear: both; text-align: left;">
<br /></div>
<div class="separator" style="clear: both; text-align: left;">
Es decir, que de los textos originales hemos borrado todas las categorías gramaticales que no fuesen nombres (propios o comunes) y además hemos eliminado la diferencia entre singular y plural. Sobre esta lista de sustantivos realicé un árbol de consenso desde las 1000 hasta las 5000 palabras más frecuentes. El resultado: </div>
<div class="separator" style="clear: both; text-align: center;">
<img border="0" height="400" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjzUklLFEGqgRJuk9GRuY4yjeX3EH6yviEb6oQamM_hFTB2oXk0KueiJ6ponq3PG1UPvDg5TkeId67o3lslluWQHlK4Md1ZJGJxqYDQvMnKMEseyLRwzjxQcPA3Cem0DIg6fhnmWy4htt0/s400/151207_stilometrie+politics_Consensus_1000-5000_MFWs_Culled_0__Eder%2527s+Delta_C_0.5__001.png" width="400" /></div>
<br />
Como vemos el resultado es bastante similar al que vimos con los trigramas, aunque no idéntico:<br />
<ul style="text-align: left;">
<li>PP y PSOE siguen en una rama</li>
<li>UPyD_2011 y 2015 tiene su propia rama independiente</li>
<li>El resto de partidos están en otra rama, aunque en esta hay diferencias: IU está organizado en una rama propia; Podemos, Ciudadanos y UPyD_2008 comparten rama</li>
</ul>
Estos cambios respecto a los anteriores resultados parecen señalar que IU y Podemos comparten una manera de expresarse similar y a su vez PP, PSOE y Cs_2015; pero si vamos a los conceptos (representados con los sustantivos), Podemos se desliga de IU y se acerca más a UPyD y Ciudadanos; y a su vez Ciudadanos deja de estar relacionado con PP y PSOE, también en su versión 2015. Parece que los sustantivos han conseguido separar relativamente bien a los partidos nuevos.<br />
<br />
Pero volvamos a la comparación de sustantivos y veamos los resultados:<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjHtM7sK4aAtH5Wv6binNSsDfxlCVMcasNJL3ex97B3dcR0UmKiOiffeP__U-YoqVJ_gMh_cjeBWJZWTTcmUWeYX2ZyaZpa0B_RBqWvY_YedQAG4eo2xllfygnXHkSMtzMZbSlU2T_5QNA/s1600/151207_stilometrie+politics_Craig_001.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="400" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjHtM7sK4aAtH5Wv6binNSsDfxlCVMcasNJL3ex97B3dcR0UmKiOiffeP__U-YoqVJ_gMh_cjeBWJZWTTcmUWeYX2ZyaZpa0B_RBqWvY_YedQAG4eo2xllfygnXHkSMtzMZbSlU2T_5QNA/s400/151207_stilometrie+politics_Craig_001.png" width="400" /></a></div>
<div class="separator" style="clear: both; text-align: left;">
<br /></div>
En este caso las diferencias son mucho más fácilmente apreciables. Recordemos que los sustantivos de la columna de la derecha son los que PP, PSOE y Cs_2015 prefieren utilizar; mientras que los sustantivos en la columna izquierda son los preferidos por IU, Podemos, UPyD y Cs_2008. Vamos a ir comentando algunos grupos de palabras (¡y prometo que he intentado ser equilibrado en este comentario!):<br />
<ul style="text-align: left;">
<li>La izquierda utiliza <i>derogación, supresión, limitación, revisión, prohibición</i>. Es decir, sustantivos que señalan un cambio en cuanto a lo que se ha hecho hasta ahora</li>
<li>La derecha usa<i> reto, respuesta, desafío, modernización, caminio, senda, horizonte</i>; palabras que señalan un problema actual y su resolución en el futuro</li>
<li>Además, frente a la ruptura de la izquierad, la derecha utiliza más conceptos que representan llegar juntos a
acuerdos: <i>diálogo, consenso, flexibilidad, cohesión, interlocutor,
interconexión</i></li>
<li>La izquierda utiliza sustantivos que señalan aspectos negativos de la economía como <i>precariedad, privatización, recorte, explotación</i> </li>
<li>La derecha usa conceptos positivos, muchas veces relacionados con la
economía: <i>éxito, talento, potencial, </i><i><i>confianza, </i></i><i>fruto, eficacia, productividad,
ventaja, vanguardia, crecimiento, motor, bienestar</i> </li>
<li>La izquierda utiliza conceptos positivos relacionados con la democracia (o la denuncia de su falta): <i>referéndum, censo, </i><i><i>privilegio, fraude, </i>circunscripción, debate, democratización, regeneración, constitucional, ciudadanía</i></li>
<li>La derecha utiliza conceptos geográficos amplios, desde las Comunidades Autónomas hasta el ámbito internacional:<i> comunidad, autónoma, internacionalización, globalización</i></li>
<li>La izquierda utiliza más conceptos desde el ámbito municipal hasta las comunidades autónomas: <i>circunscripción, ayuntamiento, pueblo, Navarra</i> </li>
<li>La izquierda habla de la iglesia católica y de la religión: <i>iglesia, confesión, religión, laicismo, católica</i>, </li>
<li>La izquierda menciona a sus grupos clásicos de votantes, como son sindicatos, estudiantes y trabajadores agrarios; también menciona aspectos relacionados con las viviendas: <i>casa, alquiler, sindicato, beca, agricultura </i></li>
<li>La derecha menciona a los autónomos: <i>emprendimieneto </i></li>
</ul>
Vamos que resumiendo:<br />
<ul style="text-align: left;">
<li><b>La izquierda</b> (IU, Podemos, UPyD) se destaca por hablar de cambio, de situación económica injusta, de renovación democrática, de ámbitos regionales pequeños, de religión y de algunos aspectos concretos de sus votantes</li>
<li><b>La derecha</b> (PP, PSOE y Cs)<i> </i>se destaca por hablar de los retos del futuro, de los aspectos positivos de la economía, de abordar problemas de manera dialogada, de aspectos regionales amplios y de autonómos</li>
</ul>
Ustedes me dirán que para saber esto se podían haber ido a la página de Wikipedia sobre derechas e izquierdas y yo no tendría ni que haber hecho este experimento ni haber escrito este post, porque lo que señalo es una obviedad detrás de la otra. Cierto... en parte. El hecho de que nos encontremos cosas obvias hace que atestigue que el eje derecha e izquierda sigue siendo válido: si no lo fuese, estaríamos ante un conjunto rándom de sustantivos. En segundo lugar, esto da legitimidad a utilizar <i>Burrow's Zeta</i> a programas electorales (cosa que hasta donde yo sé, no se hace por ahora).<br />
<i><br /></i>
Pero no todo es del todo obvio: esperaba que los partidos de derecha hablasen más sobre inversión, beneficios, impuestos, pensiones... Y no parece. Tampoco me parece del todo obvio que la derecha se muestre tan dialogante y flexible si tenemos en mente como se han comportado con Cataluña, por mencionar un caso. Ni es obligatoriamente un clásico de la izquierda exigir más democracia, pero en la comparación queda bastante claro que la izquierda española lo reclama. El resultado tampoco muestra que ambas ramas se distingan principalmente por otros aspectos como feminismo, corrupción, ecología, cultura, educación, monarquía...<br />
<i><br /></i>
Desde luego este experimento no es definitivo: hay mucho que mejorar en el formato de entrada de los textos, la lematización y la interacción del formato de salida de Freeling y cómo lo interpreta el tokenizador de stylo. Como en los casos anteriores, espero que el experimento pueda aportar algo interesante, pueda aportar una nueva manera de mirar los programas electorales y quizás anime a hacer más experimentos sobre los textos.</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-30659567594848677442015-12-12T20:50:00.000+01:002015-12-12T22:35:54.699+01:00Machine learning con programas electorales: ¿qué partidos son de izquierda y derecha?<div dir="ltr" style="text-align: left;" trbidi="on">
En el anterior post he probado <i>unsupervised machine learning</i> para organizar (<i>cluster</i>) los programas políticos. Para ello al programa solo le dábamos los textos, no le aportábamos más información sobre si algunos partidos eran de derechas o de izquierdas. Esa falta de información es lo que hace que el método sea <i>unsupervised</i>. En este post voy a hacer lo contrario. <br />
<h4>
Supervised machine learning </h4>
<h4 style="text-align: left;">
</h4>
<i>Supervised machine learning </i> se utiliza cuando tenemos un conjunto de elementos que estamos seguros que pertenecen a una clase concreta. El programa aprende (por eso se llama <i>machine learning</i>) qué características son propias a esas clases; posteriormente se le pide al programa que aplique ese conocimiento a otros nuevos elementos. <br />
<br />
¿Muy abstracto? Vamos a por un ejemplo sobre autoría literaria: escogemos un grupo de textos de dos autores cuya autoría está clara. Hacemos que el programa aprenda qué rasgos distinguen los textos de un autor y los textos del otro. Una vez realizado, le entregamos al programa otro texto cuyo autor creemos que es uno de los dos analizados y vemos qué nos responde. <br />
<h4 style="text-align: left;">
Supervised Machine learning con programas políticos </h4>
<br />
Vamos a aplicar el mismo método a programas políticos; y en vez de buscar a un autor, vamos a preguntarnos por la orientación ideológica de cada programa. El eje tradicional de la política izquierda-derecha ha sido puesto en duda tanto por los votantes (<i>PSOE, PP, la misma mierda es</i>) como por los nuevos partidos como Ciudadanos, UPyD o Podemos. ¿Pero realmente ya no podemos ordenar a los partidos en ese eje? <br />
<br />
Creo que tanto los partidos como los votantes están de acuerdo en que el PP es de derechas y que IU es de izquierdas, ¿cierto? A nadie se le caen los anillos por decir eso. Es decir, tenemos elementos cuya clase no está discutida. Pues esos partidos van a representar el conjunto de datos de los que nuestro programa va a aprender qué rasgos son típicos de izquierdas y de derechas.<br />
<br />
Los rasgos sobre los que lo va a aprender son desde las 1000 hasta las 5000 palabras más frecuentes, de nuevo voy a implementarlo con <a href="https://sites.google.com/site/computationalstylistics/stylo"><i>stylo</i></a>, mediante la función <i>classify</i> y he utilizado Support Vector Machines . <br />
<h4 style="text-align: left;">
Comprobando el método</h4>
<br />
Antes de aplicar ese conocimiento a los otros partidos, vamos a hacer una prueba para ver si el programa hace el trabajo de manera aceptable. Vamos a darle los programas de UP y del PP 2015 (programas que no formaban el conjunto de datos de los que ha aprendido) para ver si los clasifica correctamente. El resultado es el siguiente:<br />
<br />
1000 MFW , culled @ 0%, 2 of 2 (100%)<br />
2000 MFW , culled @ 0%, 2 of 2 (100%)<br />
3000 MFW , culled @ 0%, 2 of 2 (100%)<br />
4000 MFW , culled @ 0%, 2 of 2 (100%)<br />
5000 MFW , culled @ 0%, 2 of 2 (100%) <br />
<br />
¿Qué significa esto? Pues que tanto en las 5 pruebas desde las 1000 hasta las 5000 palabras, tanto el programa de UP como el de PP han sido reconocidos correctamente como izquierda y derecha. Es decir, hay un acierto de 2 de 2, 100%.<br />
<br />
(Sé que probarlo con dos programas de los mismos partidos no sería suficiente para demostrar que el experimento funciona de manera totalmente científica, pero creo que es una aproximación válida si queremos poder publicar algo antes de las elecciones.)<br />
<h4 style="text-align: left;">
Resultados con 1000 palabras más frecuentes </h4>
Ahora que ya tenemos algún dato de que el programa ha hecho bien 2 tareas, vamos a ponerlo a prueba con los programas de los otros partidos. ¿A qué partido pondrá en la izquierda? ¿A cuál en la derecha? Los resultados son los siguientes, según las 1000 palabras más frecuentes: <br />
<br />
CS_2008_Generales --> izquierda<br />
CS_2015_Generales --> izquierda<br />
Podemos_2015_Generales --> izquierda<br />
PSOE_2004_Generales --> izquierda<br />
PSOE_2008_Generales --> derecha<br />
PSOE_2011_Generales --> derecha<br />
PSOE_2015_Generales --> izquierda<br />
UPyD_2008_Generales --> izquierda<br />
UPyD_2011_Generales --> izquierda<br />
UPyD_2015_Generales --> izquierda<br />
<br />
1000 MFW , culled @ 0%, 2 of 2 (100%)<br />
<br />
Por ahora el programa solo localiza los programas del PSOE_2008 y 2011 en la derecha. Hay que tener en cuenta que de los cuatro programas electorales del PSOE presentes en este análisis, los de 2008 y los 2011 son los que el PSOE escribió desde el gobierno, los de 2004 y los de 2015 desde la oposición. O sea, que con las 1000 palabras más frecuentes, el programa localiza al PSOE como derecha cuando gobierna. Al resto de partidos en la izquierda.<br />
<h4 style="text-align: left;">
Resultados hasta 5000 palabras más frecuentes</h4>
Vamos a ver ahora qué pasa si hacemos los mismos análisis hasta las 5000 palabras más frecuentes:<br />
<br />
CS_2008_Generales --> izquierda<br />
CS_2015_Generales --> izquierda<br />
Podemos_2015_Generales --> izquierda<br />
PSOE_2004_Generales --> izquierda<br />
PSOE_2008_Generales --> derecha<br />
PSOE_2011_Generales --> derecha<br />
PSOE_2015_Generales --> izquierda<br />
UPyD_2008_Generales --> izquierda<br />
UPyD_2011_Generales --> izquierda<br />
UPyD_2015_Generales --> izquierda<br />
<br />
2000 MFW , culled @ 0%, 2 of 2 (100%)<br />
<br />
<br />
<br />
CS_2008_Generales --> izquierda<br />
CS_2015_Generales --> izquierda<br />
Podemos_2015_Generales --> izquierda<br />
PSOE_2004_Generales --> izquierda<br />
PSOE_2008_Generales --> derecha<br />
PSOE_2011_Generales --> derecha<br />
PSOE_2015_Generales --> izquierda<br />
UPyD_2008_Generales --> izquierda<br />
UPyD_2011_Generales --> izquierda<br />
UPyD_2015_Generales --> izquierda<br />
<br />
3000 MFW , culled @ 0%, 2 of 2 (100%)<br />
<br />
<br />
<br />
CS_2008_Generales --> izquierda<br />
CS_2015_Generales --> izquierda<br />
Podemos_2015_Generales --> izquierda<br />
PSOE_2004_Generales --> derecha<br />
PSOE_2008_Generales --> derecha<br />
PSOE_2011_Generales --> derecha<br />
PSOE_2015_Generales --> izquierda<br />
UPyD_2008_Generales --> izquierda<br />
UPyD_2011_Generales --> izquierda<br />
UPyD_2015_Generales --> izquierda<br />
<br />
4000 MFW , culled @ 0%, 2 of 2 (100%)<br />
<br />
<br />
<br />
CS_2008_Generales --> izquierda<br />
CS_2015_Generales --> derecha<br />
Podemos_2015_Generales --> izquierda<br />
PSOE_2004_Generales --> derecha<br />
PSOE_2008_Generales --> derecha<br />
PSOE_2011_Generales --> derecha<br />
PSOE_2015_Generales --> derecha<br />
UPyD_2008_Generales --> izquierda<br />
UPyD_2011_Generales --> izquierda<br />
UPyD_2015_Generales --> izquierda<br />
<br />
5000 MFW , culled @ 0%, 2 of 2 (100%)<br />
<br />
General attributive success: 10 of 10 (100%)<br />
<br />
Como vemos, algunos programas han ido pasando de la izquierda a la derecha según ampliábamos la cantidad de palabras por analizar. Vemos algo que ya habíamos visto en el post anterior: en primer lugar, el PSOE pasa a ser considerado siempre de derechas, da igual si en la oposición o en el gobierno. En segundo lugar, Ciudadanos_2015 pasa también a ser parte de la derecha.<br />
<h4 style="text-align: left;">
Interpretación</h4>
En primer lugar hay que señalar que el método ha sabido no solo detectar correctamente la tendencia política de los programas actuales del PP y de UP, sino que también ha sabido ordenar correctamente a Podemos, cuya orientación política es clara. En segundo lugar, el método llega a conclusiones similares a opiniones muy extendidas y que encajan con opiniones extendidas:<br />
<ul style="text-align: left;">
<li>UPyD es de izquierda</li>
<li>Ciudadanos era de izquierda, hoy en día es de derechas</li>
<li>El PSOE ha abandonado la izquierda; es obvio cuando está en el gobierno, hay que ir más al fondo del programa cuando están en la oposición</li>
</ul>
En tercer lugar, el método consigue llegar a diferenciaciones más sutiles según recoge más palabras. Parece que según más cantidad de programa electoral tiene en cuenta, mejor sabe calar a los partidos. </div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-33423221341342905272015-12-11T18:29:00.002+01:002015-12-13T12:58:00.417+01:00Estilometría políticas: elecciones generales 2004-2015<div dir="ltr" style="text-align: left;" trbidi="on">
Como os podíais imaginar no iba a dejar pasar estas elecciones sin hacer algunas pruebas estilométricas sobre los programas electorales. ¡Vamos allá!<br />
<h3 style="text-align: left;">
¿Qué es esto de la <a href="http://eumanismo.blogspot.de/search/label/estilometr%C3%ADa">estilometría</a>?</h3>
Como he comentado en <a href="http://eumanismo.blogspot.de/search/label/estilometr%C3%ADa">otros posts en elecciones anteriores</a>, la estilometría es el estudio de la frecuencia de palabras en textos con el objetivo de encontrar similitudes entre ellos. Principalmente se ha utilizado para investigar autoría literaria, aunque también se ha aplicado para estudiar las diferencias de estilos entre hombres y mujeres, la época que fue escrito o el género literario. La idea general es que los textos que pertenecen a un clase común (textos de tal autor, textos de tal género) comparten ciertas características léxicas que pueden observarse estadísticamente. Estas similitudes son encontradas y visualizadas mediante diferentes métodos de <i>unsupervised machine learning</i>.<br />
<h3 style="text-align: left;">
¿Por qué estilometría en programas políticos?</h3>
Los programas políticos son textos fácilmente comparables ya que comparten características concretas con valores muy claros: un programa político es de un partido, de un año y para un ámbito (generales, europeas...).<a href="http://eumanismo.blogspot.de/search/label/estilometr%C3%ADa"> Después de unas pocas pruebas </a>se observa que los textos aparecen organizados por partidos políticos, pero que también se observa información sobre tendencia política, temporal e incluso de líder político.<br />
<br />
<h3 style="text-align: left;">
Método</h3>
<br />
En este caso he utilizado trigramas, es decir unidades del tipo "las comunidades autónomas", "común para españa", "acceso a la", "a través de"... Es decir, fragmentos de tres (<i>tri+</i>) palabras (<i>+gramas</i>). La idea detrás de utilizar trigramas en vez de palabras únicas (o <i>unigramas</i>), es que con los trigramas se recogen además de aspectos léxicos, ciertos aspectos sintácticos.<br />
<br />
Lo he implementado con <a href="https://sites.google.com/site/computationalstylistics/home">stylo</a> (<i>of course</i>) y he utilizado una medida de distancia muy utilizada en las Humanidades Digitales llamada <a href="http://llc.oxfordjournals.org/content/17/3/267.short?rss=1&ssource=mfc">Delta, propuesta por Burrow</a> pero en la versión de <a href="https://sites.google.com/site/computationalstylistics/home">Maciej Eder</a> ya que hay estudios que señalan que esta funciona mejor para lenguas flexionantes como el español. Los datos los visualizo a través de un dendograma, es decir, una estructura que imita un estructura de árbol. La distancia en el eje horizontal señala la similitud del estilo entre los textos. Veamos los resultados utilizando los 1000 trigramas más frecuentes<br />
<br />
<h3 style="text-align: left;">
Resultados: dendogramas </h3>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjr7jog9taBpE_nTYuslyxm-lJd-Ij3VJftsnqcfA2Z7TAQbZ_Om7p33eXzPwbN4GE1J6PvaIlH38R9QvMTPFL_YXGrsid5rhEb9nhI-ehlhIMOeihV-1OlhpzADiMLaoAeO1jFFJN8m7Q/s1600/151207_stilometrie+politics_CA_1000_MFWs_Culled_0__Eder%2527s+Delta__001.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjr7jog9taBpE_nTYuslyxm-lJd-Ij3VJftsnqcfA2Z7TAQbZ_Om7p33eXzPwbN4GE1J6PvaIlH38R9QvMTPFL_YXGrsid5rhEb9nhI-ehlhIMOeihV-1OlhpzADiMLaoAeO1jFFJN8m7Q/s320/151207_stilometrie+politics_CA_1000_MFWs_Culled_0__Eder%2527s+Delta__001.png" width="320" /></a></div>
<br />
Antes de pasar hablar de los resultados, asegurémonos de todos estamos interpretando la imagen de la misma manera; vamos a observar solo los resultados del PP y del PSOE. Como vemos, los textos del PSOE aparecen organizado; el PSOE_2011 y el PSOE_2008 serían textos muy similares entre sí; el siguiente más similar a estos dos es el PSOE_2015; y el siguiente más similar a estos tres es el PSOE_2004. Hasta aquí de acuerdo, ¿verdad? Si seguimos la dirección de la rama hacia la izquierda veremos que los textos más similares a los del PSOE son los del PP_2015 y PP_2008. El siguiente más similar a estos 6 es el PP_2004; el siguiente más similar a estos 7 es el PP_2011.<br />
<br />
<br />
Si echamos un vistazo al árbol en su conjunto, veremos que hay dos grandes ramas: una con el PP y el PSOE; la otra con el resto de partidos (UPyD y Ciudadanos más juntitos; IU y Podemos arrimados). Por ahora no hay resultados demasiado extraños como que Ciudadanos, IU y PP forman una rama, ¿verdad?<br />
<br />
Pero ¿qué pasa esi en vez de utilizar los 1000 trigramas más frecuentes utilizados los 5000? Pues:<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgdGIoEzcn4OgVLAWT2Ayn3j-aGbTxHPxCmhd1gBr49RBm1J01NtocG04NRuiLTyemkBr2S-NCtxRrhP3wtDEtXAjzQHj_8ydzpmlYDjP67_tG2h0-aFKsY8q6t-R2-3spEmHR1W6n-zEE/s1600/151207_stilometrie+politics_CA_5000_MFWs_Culled_0__Eder%2527s+Delta__001.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgdGIoEzcn4OgVLAWT2Ayn3j-aGbTxHPxCmhd1gBr49RBm1J01NtocG04NRuiLTyemkBr2S-NCtxRrhP3wtDEtXAjzQHj_8ydzpmlYDjP67_tG2h0-aFKsY8q6t-R2-3spEmHR1W6n-zEE/s320/151207_stilometrie+politics_CA_5000_MFWs_Culled_0__Eder%2527s+Delta__001.png" width="320" /></a></div>
Como vemos la imagen ha cambiado bastante; UPyD_2015 y 2011 ahora forman su propia rama <i>exiliada</i>; los textos del PP ahora forman un grupo más homogéneo y ¡Ciudadanos_2015 se mete entre el PSOE (y el PP)!<br />
<br />
¿Qué resultados elegimos: el de los 1000 trigramas o el de los 5000?<br />
<h3 style="text-align: left;">
Más resultados: árbol de consenso</h3>
<br />
Una manera de resolver este problema es combinar los resultados en un árbol de consenso que refleje diferentes dendogramas. La siguiente imagen es un árbol de consenso que recoge 5 dendogramas diferentes, desde los 1000 hasta los 5000 trigramas más frecuentes:<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgHBkvuMTFYK1cILkHcbUshKHRbVYqhFNtiXR6vbaiOFFjSYa0ZDKtJpcn10B5dBvX2UcLf8tvKCHpQgq0bQKS5evn8-wrruPhgGPdyXYTzAAU4r2-l3NcfgSHUaSbNYLn2HZ8Pf5E29dU/s1600/151207_stilometrie+politics_Consensus_1000-5000_MFWs_Culled_0__Eder%2527s+Delta_C_0.6__001.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgHBkvuMTFYK1cILkHcbUshKHRbVYqhFNtiXR6vbaiOFFjSYa0ZDKtJpcn10B5dBvX2UcLf8tvKCHpQgq0bQKS5evn8-wrruPhgGPdyXYTzAAU4r2-l3NcfgSHUaSbNYLn2HZ8Pf5E29dU/s320/151207_stilometrie+politics_Consensus_1000-5000_MFWs_Culled_0__Eder%2527s+Delta_C_0.6__001.png" width="320" /></a></div>
<br />
Aquí el punto de mayor división no está a la izquierda como hasta ahora habíamos visto. En el árbol de consenso se encuentra en el centro. Y del centro de este arbolito salen tres ramas:<br />
<ol style="text-align: left;">
<li>UPyD_2011 y 2015</li>
<li>PP, PSOE y CS_2015</li>
<li>IU-UP, Podemos, Cs_2008 y UPyD_2008</li>
</ol>
Dentro de esas grandes ramas, observamos que el método tiende a agrupar de manera bastante correcta los textos de los partidos. Y dentro de las ramas por partidos (en las divisiones más sutiles) observamos que el método tiende a agrupar los textos por cercanía cronológica. En fin, que el método, sin saber nada de política, ni de español, ni de historia, ha sabido distinguir bastante bien tendencias políticas, partidos y años. ¿Qué más pedirle?<br />
<h3 style="text-align: left;">
Interpretación </h3>
<br />
Vale José, el método es la pera, pero ¿qué aporta esto de manera práctica? Pues creo que otra mirada sobre los programas y los partidos. Está habiendo mucha discusión sobre el grado de renovación del PSOE, si Ciudadanos es de centro derecha o de centro izquierda, si Podemos se está moderando... Creo que estos resultados pueden aportar algo más de luz desde un sitio que ni los partidos ni los medios controlan. Personalmente estos resultados me hacen pensar varias cosas:<br />
<ul style="text-align: left;">
<li>Hay una <b>rama izquierda-centro izquierda</b> donde está IU, Podemos y donde estaban Cuidadanos y UPyD </li>
<li>Hay una<b> rama tradicional</b> donde se encuentran el PSOE, el PP y Ciudadanos</li>
</ul>
Por partidos, observo:<br />
<ul style="text-align: left;">
<li><b>PP</b>: el partido con menos variación. Conservadores en el estilo y en la política</li>
<li><b>PSOE</b>: a diferencia de los análisis realizados en las europeas, es un partido más cercano al PP que la izquierda; la marcha de Zapatero y la llegada de Sánchez no ha traído ningún cambio notable</li>
<li><b>IU-UP</b>: Garzón parece haber modificado el discurso de su partido y de hecho ahora aparece más relacionado con nuestro siguiente partido</li>
<li><b>Podemos</b>: es difícil saber si se ha moderado, pero desde luego el texto más similar al de Podemos es el de IU</li>
<li><b>Ciudadanos</b>: un caso interesante ya que en 2011 no se presentó. Ciudadanos ha pasado del centro izquierda en el que estaba en 2008 al centro derecha en 2015. Nada sorprendente, <a href="http://www.eldiario.es/piedrasdepapel/dice-ultimo-barometro-CIS_6_449415058.html">según la percepción de los electores</a> y su reciente afiliación europea al Partido Liberal</li>
<li><b>UPyD</b>: en 2008 UPyD tenía un discurso de centro izquierda muy similar a Ciudadanos. Posteriormente encontró una manera radicalmente diferente de expresarse que ha mantenido en estas elecciones. Un caso muy interesante para mayor estudio, lástima que le queden dos telediarios </li>
</ul>
Hasta aquí mis análisis y mis interpretaciones. Si la idea os atrae pero mi manera no os convence, descarga stylo, los programas electorales y déjame un comentario para que comparemos resultados ;)<br />
<h4 style="text-align: left;">
Actualización </h4>
<div style="text-align: left;">
Los mismos datos hasta ahora comentados los he convertido en una tabla de relaciones de tipo grafo y lo he visualizao a través de Gephi. Es decir, la siguiente imagen se basa en los mismos datos que el anterior árbol de consenso; la diferencia es que en el árbol de consenso aparecían solamente señalada la relación de un texto con otro(s) texto(s) más cercano. En el árbol de consenso no veíamos por ejempo si algún programa electoral de IU tenía alguna relación (por ínfima que fuese) con el PSOE. La siguiete imagen sí reproduce esas relaciones de caracter terciario:</div>
<div style="text-align: left;">
<br /></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg46V4wpkEn5SphoX-IvefZ4H9YX8lEJut4d3PozUQNrkB9HlFzsbMdzWTFBOuXwMUPolZne1zlZl4khk_a1CuMIf6rJau2OTmATBvm2y38ZiXzM3hvOWf5LWkHw_yLkVnVZT-9MuAmzNI/s1600/3grams-1000-5000-peque%25C3%25B1o.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="292" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg46V4wpkEn5SphoX-IvefZ4H9YX8lEJut4d3PozUQNrkB9HlFzsbMdzWTFBOuXwMUPolZne1zlZl4khk_a1CuMIf6rJau2OTmATBvm2y38ZiXzM3hvOWf5LWkHw_yLkVnVZT-9MuAmzNI/s400/3grams-1000-5000-peque%25C3%25B1o.png" width="400" /></a></div>
<br /><h3 style="text-align: left;">
Anexo: enlaces a los programas electorales:</h3>
<ul style="text-align: left;">
<li>https://www.ciudadanos-cs.org/nuestras-ideas</li>
<li>http://unpaiscontigo.es/wp-content/uploads/2015/12/Programa-Elecciones-Generales-Podemos-2015.pdf</li>
<li>www.psoe.es/media-content/2015/11/PSOE_Programa_Electoral_2015.pdf</li>
<li>http://www.pp.es/sites/default/files/documentos/programa_electoral_20d.pdf</li>
<li>http://www.unidadpopularvalladolid.org/component/jdownloads/send/6-programa/66-porgrama-unidad-popular</li>
<li>http://www.eaj-pnv.eus/adjuntos/pnvDocumentos/17970_archivo.pdf</li>
<li>upyd2015.es/wp-content/uploads/2015/12/Programa_UPYD_Elecciones_Generales_2015.pdf</li>
</ul>
</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-89072879191604226062015-05-23T11:20:00.001+02:002015-05-23T14:15:59.726+02:00Más estilometría sobre programas autonómicos españoles 2015<div dir="ltr" style="text-align: left;" trbidi="on">
Después de que la semana pasada publicase algunos resultados sobre comparaciones textuales estilométricas sobre los programas electorales de la <a href="http://eumanismo.blogspot.de/2015/05/comparacion-de-los-programas.html">Comunidad de Madrid</a>, decidí seguir por el mismo camino. En vez de 10 programas de una sola comunidad, decidí ampliar a 50 de 7 comunidades autónomas más los programas marcos. No he podido conseguir todos los programas: algunos son imposibles de encontrar, algunos no he podido descargarlos (por ejemplo <a href="http://issuu.com/csasturias/docs/programa_definitivo_asturias_9_05_2/1">Ciudadanos en Asturias</a>). Las comunidades autónomas son:<br />
<ul style="text-align: left;">
<li>Andalucía</li>
<li>Aragón</li>
<li>Asturias</li>
<li>Castilla la Mancha</li>
<li>Navarra</li>
<li>Madrid</li>
<li>Valencia</li>
</ul>
En este caso he realizado de nuevo un <i>consensus tree</i> y con esos mismos datos una visualización de tipo <i>network analysis</i>.<br />
<br />
El resultado del <i>consensus tree </i>es:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgaPwPAIvydmKFbQJP965NEW8dgmG7Ymvnoncg65jzbDKGKRcTVGxJ7-VIGHhED7Pvs7P0e3UYmKP8CYz2T3tfJnBpSwjxEBRmZVhGJisQXzFlxJGdjfL16WDge_UsTc66kE9xp40WEby8/s1600/autonomias2015_Consensus_100-5000_MFWs_Culled_0__Eder%2527s+Delta_C_0.5_001.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="400" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgaPwPAIvydmKFbQJP965NEW8dgmG7Ymvnoncg65jzbDKGKRcTVGxJ7-VIGHhED7Pvs7P0e3UYmKP8CYz2T3tfJnBpSwjxEBRmZVhGJisQXzFlxJGdjfL16WDge_UsTc66kE9xp40WEby8/s400/autonomias2015_Consensus_100-5000_MFWs_Culled_0__Eder%2527s+Delta_C_0.5_001.jpg" width="400" /></a></div>
Observamos:<br />
<ul style="text-align: left;">
<li>Con excepción de un par de textos (PP y PSOE), los partidos quedan separados en dos grandes ramas</li>
<li>Dentro de esas ramas, los partidos tienden a agruparse de manera bastante clara en subramas, aunque no hay correspondencia perfecta</li>
</ul>
Si interpretamos algunos aspectos (habría muchísimo más que decir) estos datos, podremos decir que:<br />
<ul style="text-align: left;">
<li>Hay dos ramas principales de la política: una que agrupa la mayor parte de programas electorales de centro-derecha y derecha (principalmente PP, UPyD y Cs); la otra agrupa a los partido de centro-izquierda e izquierda (principalmente IU, PSOE y Podemos)</li>
<li>Los partidos que solo están representados por un programa programa (Foro, Compromís, UPN, Bildu, Partido Andalucista) quedan bien representandos ideológicamente.</li>
<li>Los programas marcos muestran resultados extraños. Quizás esto se deba a que no son las formaciones autonómicas quienes los realizan, sino sus direcciones nacionales</li>
<li>Con más datos, <a href="http://eumanismo.blogspot.de/2015/05/comparacion-de-los-programas.html">UPyD deja de tener resultados tan anómalos</a>: aparecen emparentados con Cs y de manera más lejana con el resto de partidos de la derecha</li>
</ul>
Si observamos el network analysis vemos resultados algo similares <br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgaL7mk3HRWvgORj2g2oZir3u5EXa2bq9LZMloZz0ecSs_cmAe00-ELvpaKwkD1lvAz8WAKEqFueaOs7H3966ReFNWYT3sgPnTmefQUU5G7eBy-an-edJTmJcjutiW_o3Peq_h7itW4mlM/s1600/network5000conast.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="400" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgaL7mk3HRWvgORj2g2oZir3u5EXa2bq9LZMloZz0ecSs_cmAe00-ELvpaKwkD1lvAz8WAKEqFueaOs7H3966ReFNWYT3sgPnTmefQUU5G7eBy-an-edJTmJcjutiW_o3Peq_h7itW4mlM/s400/network5000conast.png" width="400" /></a></div>
Si interpretamos los resultados generales, observamos:<br />
<ul style="text-align: left;">
<li>De nuevo vemos que se refleja la clásica división derecha-izquierda (más esperable que la obtenida en la <a href="http://eumanismo.blogspot.de/2015/05/comparacion-de-los-programas.html">CA de Madrid</a>)</li>
<li>Aunque ambas representaciones están basadas en los mismos datos, aquí se visualiza mejor la cercanía y relación entre PSOE y PP. De hecho en esta visualización Cs y PSOE aparecen casi en el mismo eje horizontal</li>
<li>UPyD vuelve a mostrar resultados algo sorprendentes: en esta imagen aparece más cercano a partidos de izquierda, principalmente IU</li>
<li>Foro y UPN aparecen perfectamente integrados entre los textos del PP</li>
<li>Bildu y Compromis aparecen integrados entre los programas de IU</li>
<li>Podemos forma un grupo bastante homogeneo de textos (ya se observaba en el <i>consensus tree</i>)</li>
</ul>
Algunos datos generales que me han llamado la atención:<br />
<ul style="text-align: left;">
<li>PSOE - Castilla la Mancha aparece como programa netamente de derechas</li>
<li>El marco del PP aparece entre los programas del PSOE</li>
<li>Cs Madrid es el programa más a la derecha de ese partido, integrado entre los programas del PP</li>
<li>PSOE Valencia y IU Aragón son los dos textos que más relaciones comparten con otros (qué significa esto es algo a lo que no puedo responder)</li>
<li>Los programas de Podemos Valencia y PSOE Valencia están fuertemente relacionados</li>
<li>El programa de Cs Castilla la Mancha tiene mayor relación con los textos de UPyD que con los de Cs</li>
<li>UPyD Asturias aparece sorprendentemente cerca a Foro</li>
</ul>
</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-43673041992836735342015-05-17T16:39:00.001+02:002015-05-18T08:58:28.399+02:00Estilometría: comparación de los programas electorales de CA Madrid 2015<div dir="ltr" style="text-align: left;" trbidi="on">
En una semana habrá elecciones municipales y autonómicas, entre ellas en la Comunidad de Madrid. De la misma manera que realicé varios análisis estilométricos con <a href="http://eumanismo.blogspot.de/2015/03/estilometria-sobre-los-programas.html" target="_blank">los programas políticos de Andalucía</a>, he recogido algunos programas políticos autonómicos de los partidos que se presentan en estas elecciones autonómicas madrileñas y he realizado algunas pruebas de comparación cuantitativa de textos entre ellos. En concreto de los partidos madrileños (con los candidatos a las elecciones de la semana que viene entre paréntesis):<br />
<ul style="text-align: left;">
<li>Ciudadanos (Cs) (Ignacio Aguado)</li>
<li>IU (Luis García Montero)</li>
<li>Podemos (José Manuel López)</li>
<li>PP (Cristina Cifuentes)</li>
<li>PSOE (Ángel Gabilondo)</li>
<li>UPyD (Ramón Marcos)</li>
</ul>
Además, para el análisis resulte más consistente, he recogido los programas electorales de aquellos partidos que se presentaron en 2011. Me hubiese gustado utilizar también el de 2007, pero me ha resultado imposible encontrar los programas políticos (y eso que en ese año solo había tres partidos con representación en la Comunidad de Madrid...). Hay que recordar que durante el post hablaré de partidos, aunque en realidad hay que entender que me refiero a los textos de los programas electorales de esas formaciones en dos citas electorales. Agradezco a Miguel Ortega la ayuda para conseguir algunos programas políticos. Y reconozco la inspiración de los artículos de <a href="http://www.eldiario.es/autores/regional_manifestos_project/"><i>Regional Manifestos Project</i> en eldiario.es</a>.<br />
<br />
Para quien necesite una introducción a esto de la estilometría y los tratamientos cuantitativos de textos, sugiero <a href="http://www.digitalhumanities.org/companion/" target="_blank">la guía a Humanidades Digitales</a>, <a href="http://www.digitalhumanities.org/companionDLS/" target="_blank">la específica sobre literatura</a>, <i>Macroanalysis </i>de Jockers (2013) o <i>Graphs, maps, trees</i> de Moretti (2005). La política no es mi campo de conocimiento, sino la filología. Estaría encantado de colaborar con politólogos o periodistas para profundizar de manera conjunta en este ámbito.<br />
<br />
Para este análisis he vuelto a trabajar con la estupenda herramienta <a href="https://sites.google.com/site/computationalstylistics/stylo" target="_blank"><i>stylo</i></a> para realizar el análisis. En este caso he preferido utilizar todas las unidades que <i>stylo </i>permite analizar (las 5000 más frecuentes), para no tener que tomar ninguna decisión.<br />
<h3>
Cluster analysis</h3>
En primer lugar he realizado un <i>cluster analysis</i>, es decir, le pedimos al programa que vaya agrupando todos los textos según las 5000 palabras (<i>tokens </i>en realidad, aunque para que sea más comprensible utilizaré en el post <i>palabras</i>) más frecuentes:<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhdt2vhkkA62mEWIpsqLp8Gdk2KlaL9lp14u1_QqOvuQcrd0rNEztQP_QxpF2hL_MCywzHJyd02jeh1p3EYq2XqUu4Ry-RAwI7AxpVg-DNZCwvxrCVTYMdQfRJDkjO4d1Zk2c0_gREm24c/s1600/CA-Madrid_CA_5000_MFWs_Culled_0__Eder's+Delta_001.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhdt2vhkkA62mEWIpsqLp8Gdk2KlaL9lp14u1_QqOvuQcrd0rNEztQP_QxpF2hL_MCywzHJyd02jeh1p3EYq2XqUu4Ry-RAwI7AxpVg-DNZCwvxrCVTYMdQfRJDkjO4d1Zk2c0_gREm24c/s320/CA-Madrid_CA_5000_MFWs_Culled_0__Eder's%2BDelta_001.jpg" width="320" /></a></div>
(Nota sobre los colores: no los elijo yo, es aleatorio; sé que ver el PSOE como amarillo o Podemos de azul no es lo más intuitivo, qué se le va a hacer...)<br />
<br />
Resultados:<br />
<ul style="text-align: left;">
<li>Los programas electorales aparecen dividas en dos grandes ramas: en una PP y Cs; en la otra el resto de partidos.</li>
<li>Podríamos interpretar, claro, ambas ramas como derecha e izquierda</li>
<li>Los partidos quedan identificados casi perfectamente; solo un único caso cambia: el IU de 2011 es más similar a Podemos que a IU de 2015. En mi opinión, revelador.</li>
<li>Los partidos parecen graduados ideológicamente; los más a la izquierda son IU y Podemos, después vendría PSOE, posteriormente UPyD. Cs representa una derecha menos radical que el PP.</li>
</ul>
<h3>
Consensus tree</h3>
Además del <i>cluster analysis</i>, he realizado también un <i>consensus tree</i> de los <i>cluster analysis</i> desde las 100 palabras más frecuentes hasta las 5000, incrementando cada vez 100 palabras. Es decir, un montón de <i>cluster analysis</i> hechos a la vez (por eso se llama <i>consensus</i>), mostrados en representación arbórea (por eso se llama <i>tree</i>). Este análisis es más robusto que el anterior:<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhdpWb8xsMOUPK7K2BnBwI7naxvJwRVbU1yZey5A_mDSGPXUDbEFzfvLeMUXuIyMtvublDXiIcieVZI8FjoghC-OJifDj8vEI_UPPCbRtSNMpQT_AUVjmML0Lm2gbsDRxPCrYyOFFtLgxs/s1600/CA-Madrid_Consensus_100-5000_MFWs_Culled_0__Eder's+Delta_C_0.5_001.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhdpWb8xsMOUPK7K2BnBwI7naxvJwRVbU1yZey5A_mDSGPXUDbEFzfvLeMUXuIyMtvublDXiIcieVZI8FjoghC-OJifDj8vEI_UPPCbRtSNMpQT_AUVjmML0Lm2gbsDRxPCrYyOFFtLgxs/s320/CA-Madrid_Consensus_100-5000_MFWs_Culled_0__Eder's%2BDelta_C_0.5_001.jpg" width="320" /></a></div>
El resultado son tres ramas principales, ocupadas por:<br />
<ol style="text-align: left;">
<li>PP y Cs</li>
<li>UPyD</li>
<li>PSOE, IU y Podemos</li>
</ol>
Es decir, que el <i>consensus tree</i> aparta a UPyD del resto de partidos de la izquierda. Las otras relaciones se mantiene: gradación ideológica, acierto de partidos, excepción de IU2011 y Podemos.<br />
<br />
Si interpretamos estos resultados de manera ideológica, señalaríamos que:<br />
<ul style="text-align: left;">
<li>PP y Cs son de derecha</li>
<li>IU, Podemos y PSOE de izquierda</li>
<li>UPyD se desmarca de ambos, probablemente localizándose en el centro </li>
</ul>
<h3>
Principal Component Analysis</h3>
Pero esto no es lo único que podemos hacer con la estilometría y <i>stylo</i>, uno de los tipos de análisis más utilizados es el llamado <i>Principal Component Analysis </i>o PCA. Para quien quiera saber más, recomiendo el libro de Jackson, <i>A user's guide to principal components</i> (2003). De manera muy reducida y simplista, este análisis entiende cada palabra como una dimensión diferente; cada texto recibe un valor para cada dimensión, por lo que cada texto termina definido por valores de 5000 dimensiones (que son las palabras con las que nosotros hemos decidido trabajar, eligiendo las más frecuentes). Para posibilitar una visualización, el análisis rota esas dimensiones en dos <i>principal components</i> que terminan representados en clásicas coordenadas cartesianas. Lo interesante de este resultado es que se consigue visualizar una cantidad enorme de información; la desventaja es que esa rotación pierde información. Vamos a ver un ejemplo:<br />
<br />
<div style="text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEitONySUAnimlgvUe46HonxWk65q2SGx_A7gqNs__sUBd_5HStxlmMFijBBatRiLLVK5lNf-3qQMYnkpTrnnM2AwpQ9Tpqfn-e6vw4KmMwdXhyGz6NuKo9w-W-XsngScRbVOYHZazHdWhk/s1600/CA-Madrid_PCA_5000_MFWs_Culled_0__PCA_001-cov.jpg" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEitONySUAnimlgvUe46HonxWk65q2SGx_A7gqNs__sUBd_5HStxlmMFijBBatRiLLVK5lNf-3qQMYnkpTrnnM2AwpQ9Tpqfn-e6vw4KmMwdXhyGz6NuKo9w-W-XsngScRbVOYHZazHdWhk/s320/CA-Madrid_PCA_5000_MFWs_Culled_0__PCA_001-cov.jpg" width="320" /></a> </div>
<div style="text-align: left;">
Como vemos, los programas electorales son puntos en coordenadas cartesianas. Es importante tener en cuenta que el eje de x (el horizontal) tiene un valor de 28,2%, frente a la y (o vertical) que tiene un 18,6%. ¿Qué quiere decir eso en cristiano? Que las diferencias que vemos en la horizontal son más importantes que las que vemos en la vertical.</div>
<div style="text-align: left;">
<br /></div>
<div style="text-align: left;">
¿Y qué vemos en este PCA?</div>
<ul style="text-align: left;">
<li>PP y Cs se localizan muy cercanos, de nuevo</li>
<li>PSOE, IU y Podemos son muy cercanos</li>
<li>UPyD está aislado </li>
</ul>
Es decir, observamos resultados muy similares a los que el <i>consensus tree</i> nos señalaba. Aunque UPyD y PP-Cs aparecen alineados en la vertical (los tres partidos están entre valores de -1 y -0,5 de la x), en la horizontal sus valores son radicalmente diferentes: PP-Cs están entre -1 y -2, UPyD está entre 1 y 2.<br />
<br />
Otro aspecto que hay que tener en cuenta es que aunque PP y PSOE parecen muy separados, en el valor x tienen valores casi idénticos, principalmente en el año 2011: ambos están en -1. En los programas electorales de este año la diferencia ha aumentado: el PP se ha ido al extremo, mientras que el PSOE se ha acercado a IU y Podemos.<br />
<br />
En general este análisis resulta muy interesante ya que parece mostrar que el <i>principal component 1 </i>diferencia a los partidos en cuatro grupos:<br />
<ol style="text-align: left;">
<li>PP 2015</li>
<li>PP 2011, Cs y PSOE </li>
<li>IU y Podemos</li>
<li>UPyD</li>
</ol>
Mientras que el <i>principal component 2</i> separa los partidos en dos grupos:<br />
<ol style="text-align: left;">
<li>UPyD, Cs y PP</li>
<li>PSOE, IU y Podemos</li>
</ol>
Si interpretamos el PC1, diría que nos muestra la diferencia izquierda-derecha, aunque UPyD en ese caso aparece como extrema izquierda, algo que es difícil de tragar. Pero el PC2 parece indicar claramente centralismo vs. no-centralismo. Esperaría esos resultados en los programas autonómicos de Cataluña o País Vasco (entre otras comunidades), no en el de la Comunidad de Madrid.<br />
<div class="separator" style="clear: both; text-align: left;">
</div>
<h3>
Network analysis</h3>
Por último, realicé un <i>Network analysis</i> utilizando los datos del <i>consensus tree</i>. De esta manera conseguimos la robustez del <i>consensus tree</i>, pero nos permite visualizar las relaciones entre cualquiera de los textos entre ellos. Cada texto es un nodo y los nodos tienen relaciones entre ellos; cuanto más ancha sea la línea que los une, más intensa es la relación.<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjM8qMO8I8muu4WH6nN8RrHns2m1Od7si6_LR2zBfl3WrKsXo6L24k-bTRCDmjL_yKfACtZV92PLJyTKOVxyzfNyFvRb8b8DREMsQ0YLqztpn-AVt3Cke_faLzkC-TfQeZCx-yEhLlunwY/s1600/CA-Madrid_Consensus_100-5000.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjM8qMO8I8muu4WH6nN8RrHns2m1Od7si6_LR2zBfl3WrKsXo6L24k-bTRCDmjL_yKfACtZV92PLJyTKOVxyzfNyFvRb8b8DREMsQ0YLqztpn-AVt3Cke_faLzkC-TfQeZCx-yEhLlunwY/s320/CA-Madrid_Consensus_100-5000.png" width="320" /> </a></div>
<div class="separator" style="clear: both; text-align: left;">
En este caso, claro, los colores no son aleatorios, <a href="http://gephi.github.io/">Gephi </a>me ha permitido elegirlos. Probablemente esta visualización es una de las más completas e intuitivas de todas las vistas hasta ahora. </div>
<br />
Algunos datos generales de la visualización:<br />
<ul style="text-align: left;">
<li>Las relaciones internas entre los programas de un partido son las más fuertes (con una excepción)</li>
<li>Los partidos parecen diferenciarse en un eje ideológico derecha-izquierda</li>
<li>Si eso fuese así, UPyD quedaría como un partido de extrema izquierda </li>
</ul>
Analizando las relaciones por partidos, observamos:<br />
<ul style="text-align: left;">
<li><b>PP</b>: No cambia apenas entre 2011 y 2015; sus mayores relaciones son con el PSOE2011 y con Cs</li>
<li><b>PSOE</b>: En el 2011 aparecía localizado como partido de la derecha, mientras que el texto de 2015 mantiene relaciones intensas con Podemos y también (aunque menos) con IU </li>
<li><b>Cs</b>: Sus principales relaciones son en primer lugar con el PSOE y en segundo lugar con el PP</li>
<li><b>IU</b>: Es el único partido cuyas relaciones internas no son las más intensas: IU2011 tiene mayor relación con Podemos que con IU2015. Mantiene importantes relaciones con PSOE y UPyD</li>
<li><b>Podemos</b>: parece el heredero de IU2011; tiene importantes relaciones con el PSOE, ligeras con UPyD y Cs y nulas con PP</li>
<li><b>UPyD</b>: Está en las antípodas del PP. Tiene cierta relación con Podemos pero principalmente con IU2011</li>
</ul>
<h2>
Conclusiones</h2>
Después de tantos dibujitos con colores y de tantos números, vamos a intentar sacar algunas cosas en claro. De nuevo, en las conclusiones hablo de partidos, y en realidad debería hablar de textos. Permitidme la metonimia:<br />
<ol style="text-align: left;">
<li>La estilometría tiene mucho que decir y que analizar sobre los programas políticos</li>
<li>Los diferentes análisis realizados (<i>cluster analysis, consensus tree, PCA </i>y<i> Network analysis</i>) muestran resultados bastante similares, aunque con algunos matices </li>
<li>Aunque es fácilmente observable cierta relación entre espacio ideológico (derecha vs. izquierda) en las representaciones, no parece que sea solo eso lo que vemos, a menos que se acepte que UPyD Madrid es de extrema izquierda (cosa que ni UPyD aceptaría, ni tampoco la extrema izquierda)</li>
<li>La principal diferencia entre partidos sigue siendo derecha-izquierda (frente a otros posibles ejes como nuevo-viejo o gobierno-oposición)</li>
<li>El eje centralista-no centralista también divide los partidos en la política madrileña</li>
<li>Cs de Madrid y PP constituyen la derecha política, siendo Cs más moderado que el PP. El PP se ha ido más a la derecha que en las anteriores elecciones</li>
<li>Podemos, IU y PSOE hoy en día se agrupan en la izquierda</li>
<li>El PSOE de Madrid era muy cercano al PP en 2011, pero en estas elecciones se ha acercado a Podemos e IU</li>
<li>La principal relación de IU Madrid 2011 no es con IU Madrid 2015, sino con Podemos. ¿Podemos entender Podemos como un heredero textual de IU? </li>
<li>UPyD Madrid es un partido raro. No parece tan relacionado con <a href="http://eumanismo.blogspot.de/2015/03/estilometria-sobre-los-programas.html">Cs como podría pensarse</a>. En cierta manera está relacionado con la izquierda, en cierta manera con la derecha, en cierta manera está aislado. Es una lástima que sea dudoso que se mantengan mucho tiempo. Es posible que estos resultados extraños se deban a un error sistemático en los textos</li>
<li>Los resultados difieren algo de los que <a href="http://eumanismo.blogspot.de/2015/03/estilometria-sobre-los-programas.html">publiqué sobre las elecciones andaluces</a> (de nuevo, UPyD) y difieren también de las pruebas que he hecho y que aún no he publicado con los programas a las elecciones europeas y nacionales de las últimas décadas</li>
<li>Es decir, hay que seguir trabajando e investigando para tener resultados más sólidos. Con este post me gustaría invitar a politólogos y periodistas a colaborar</li>
</ol>
</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-61518239769965457362015-03-20T22:19:00.002+01:002015-03-22T10:05:22.577+01:00Estilometría sobre los programas políticos andaluces 2015<div dir="ltr" style="text-align: left;" trbidi="on">
¿<i>PSOE, PP, la misma mierda es</i>? ¿Podemos se acerca al PSOE o a IU? ¿Ciudadanos y UPyD son lo mismo aunque no lo sepan? ¿Esos partidos son de derechas, de centro o de izquierdas? ¿El eje nuevo-viejo tiene más importancia que derecha-izquierda? Los intereses partidistas, las diferencias de discursos y el márketing político aportan respuestas alambicadas a preguntas sencillas.<br />
<br />
Por eso, para intentar buscar respuestas sencillas y lo menos contaminadas, he hecho unas pruebas de comparación del estilo de los <a href="http://www.rtve.es/noticias/elecciones/andalucia/programas-electorales/" target="_blank">programas electorales</a>. En concreto un análisis de <i>clusters </i>sobre las 2000 palabras más frecuentes (una cantidad de léxico utilizada en numerosos estudios estilométricos literarios) con <i><a href="https://sites.google.com/site/computationalstylistics/stylo" target="_blank">stylo</a></i>. El resultado es el siguiente:<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhcetPkBU7fjl-jDQFAF8UK6eI1fX57XAsZEkicDkFZIN6csvtcITDNEZAk-066FYm8LGBk9SFntwBIxl8TG-H0vEiWMEJZhDedeGujALRUW7frJg2HWbg-eKznteVgCPOBhjtPc3e8ebE/s1600/andalucia_CA_2000_MFWs_Culled_0__Eder's+Delta_001.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhcetPkBU7fjl-jDQFAF8UK6eI1fX57XAsZEkicDkFZIN6csvtcITDNEZAk-066FYm8LGBk9SFntwBIxl8TG-H0vEiWMEJZhDedeGujALRUW7frJg2HWbg-eKznteVgCPOBhjtPc3e8ebE/s1600/andalucia_CA_2000_MFWs_Culled_0__Eder's%2BDelta_001.jpg" height="320" width="320" /></a></div>
El resultado son dos claras ramas de la política:<br />
<ul style="text-align: left;">
<li>En la primera UPyD, Cs y PP</li>
<li>En la segunda, Podemos, IU, PSOE y el Partido Andalucista</li>
</ul>
¿Cómo podemos interpretar estos datos?<br />
<ul style="text-align: left;">
<li>Los partidos políticos andaluces se organizan en dos grupos: derecha e izquierda</li>
<li>Dentro de la derecha, UPyD y Cs serían más similares entre ellos</li>
<li>Podemos e IU serían los partidos más similares de la izquierda, estos mantienen una relación cercana con el PSOE y por último estos tres juntos se parecen al PA</li>
</ul>
Claro que si usamos las 2000 palabras más frecuentes nos podemos estar dejando controlar por los conceptos utilizados por unos partidos y no por otros. ¿Qué obtenemos si utilizamos solamente las 200 palabras más frecuentes (entre las que casi solo encontraremos determinantes, preposiciones, conjunciones, verbos auxiliares, etcétera)? Palabras como <i>y, de, con, el, la, es, que</i>... Es decir, ¿qué pasa si comparamos aquellas palabras cuyo uso es más difícilmente controlable? Los resultados: <br />
<div>
<div style="text-align: center;">
</div>
<div style="text-align: center;">
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjKgPP7yJ6xKU1LbNQd3oAcXcX7rSYXsRtH-yym60T7NsVyF0Y-Bp90mNNhXOmLU-xhR9H2u6JKXXX6ixXSSuUol_hjAcyP9ZzJtTmtA73IhY5rOv_vpVQl5WWHYLQNqKtoE5nmlbjfP48/s1600/andalucia_CA_200_MFWs_Culled_0__Eder's+Delta_001.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjKgPP7yJ6xKU1LbNQd3oAcXcX7rSYXsRtH-yym60T7NsVyF0Y-Bp90mNNhXOmLU-xhR9H2u6JKXXX6ixXSSuUol_hjAcyP9ZzJtTmtA73IhY5rOv_vpVQl5WWHYLQNqKtoE5nmlbjfP48/s1600/andalucia_CA_200_MFWs_Culled_0__Eder's%2BDelta_001.jpg" height="320" width="320" /></a></div>
</div>
<div style="text-align: left;">
Pues los resultados no cambian radicalmente:</div>
<div style="text-align: left;">
<ul style="text-align: left;">
<li>El uso de esas palabras gramaticales también diferencia un grupo de derechas y otro de izquierdas</li>
<li>Aumenta la diferencia entre el PP con relación a UPyD y Cs</li>
<li>UPyD y Cs siguen siendo muy similares</li>
<li>Podemos e IU siguen siendo similares</li>
<li>El PSOE y el PA pasan a formar un grupo unidos</li>
</ul>
Como conclusión final, basándonos en los programas electorales andaluces para 2015 y en un análisis de <i>clusters</i>, se puede constatar que:</div>
<div style="text-align: left;">
<ul style="text-align: left;">
<li>El eje izquierda-derecha continúa siendo la principal diferencia política, por mucho que muchos partidos traten de deshacerse de él</li>
<li>El eje nuevo-viejo no acaba de demostrarse en los análisis textuales</li>
</ul>
(<b>Actualización</b>: al revisar el post me di cuenta que la segunda imagen no era sobre las 200 palabras más frecuentes sino sobre los 200 bigramas de palabras más frecuentes. Ahora mismo se puede ver la nueva imagen, en la que han cambiado las relaciones entre IU-Podemos y PA-PSOE. Siento el error.)
</div>
</div>
</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-51880339232842616792015-01-01T18:53:00.002+01:002015-01-01T19:01:24.417+01:00Conceptos básicos para criar de manera bilingüe<div dir="ltr" style="text-align: left;" trbidi="on">
La <a href="http://www.spiegel.de/politik/deutschland/csu-in-bayern-migranten-sollen-im-wohnzimmer-deutsch-sprechen-a-1006904.html" target="_blank">derecha populista bávara en el poder tuvo la ocurrencia de sugerir como medida política <b>prohibir que se hable en casa o en la calle otra idioma</b> que no sea alemán</a>. La propuesta recuerda a la opresión lingüística franquista contra vasco, catalán y gallego. No se llevará a cabo, evidentemente: es una sonrisita hacia la ultra derecha al mismo tiempo que un escupitajo contra cualquiera que tenga presente en su casa un idioma diferente al alemán. Al margen del ridículo, creo que puede ser visto como <b>indicador del rechazo germano contra la crianza bilingüe</b>.<br />
<br />
<div class="separator" style="clear: both; text-align: left;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjhOB40a5_QNu1f7m_55Nz4I-pogzwpsYOgCoHTqEzQTEKZQ7kCdpIRKGVb2sMbIZBlZbJQN1l93FjSpJdSyElCc50i1sU57elzz_z1iDS0QBw07yHOlVcHNJVDlGCsXtO-u_fP_lEp-V8/s1600/escanear0002.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjhOB40a5_QNu1f7m_55Nz4I-pogzwpsYOgCoHTqEzQTEKZQ7kCdpIRKGVb2sMbIZBlZbJQN1l93FjSpJdSyElCc50i1sU57elzz_z1iDS0QBw07yHOlVcHNJVDlGCsXtO-u_fP_lEp-V8/s1600/escanear0002.jpg" width="250" /></a></div>
Prejuicios que encuentras de manera constante en Alemania señalan que un niño que se cría con dos idiomas: es probable que tenga problemas en la escuela; su desarrollo lingüístico y cognitivo será más lento; se sentirá confuso; hablará los dos idiomas de manera parcial (<i>halbsprachig</i>) y con errores; probablemente tartamudeará; aprenderá a hablar más tarde...<br />
<br />
El <b>bilingüismo infantil es ampliamente observado de manera negativa </b>(no así el adulto), parcialmente también por parte de profesores, pediatras e incluso investigadores sobre el tema. Al buscar bibliografía en alemán sobre el tema, el concepto <i>bilingüismo </i>(<i>Bilinguismus </i>o <i>Zweisprechigkeit</i>) suele aparecer asociado a otras palabras como <i>problema</i>, <i>reto</i>, <i>retraso </i>o incluso <i>afasia </i>(es decir 'enfermedad del habla').<br />
<br />
Cada cultura tiene sus fantasmas y sus obsesiones y los alemanes tienen sus problemas históricos con la emigración, principalmente turca. Criar un hijo de manera bilingüe en Alemania es un reto, por lo que he intentado leer literatura científica sobre el tema, también en alemán para formarme. Este post pretende ser un resumen de algunos conceptos que deberían estar claros al plantearse este reto:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEii0KA2OfNnKmsVd0xRIu8SJ_r_MplpDRxXz54BjSdhzxcugUtXVdlaK4XvCYWyf5yHjUV7DvWZ1q5p5aSxQlE1DMiQTnh7dZVsBYez4I7H76uJgdQz92-kOFSwotOMRsgiMs5TvJX1FH4/s1600/escanear0001.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEii0KA2OfNnKmsVd0xRIu8SJ_r_MplpDRxXz54BjSdhzxcugUtXVdlaK4XvCYWyf5yHjUV7DvWZ1q5p5aSxQlE1DMiQTnh7dZVsBYez4I7H76uJgdQz92-kOFSwotOMRsgiMs5TvJX1FH4/s1600/escanear0001.jpg" width="250" /></a></div>
<ul style="text-align: left;">
<li>La <b>crianza bilingüe no trae ninguna desventaja</b> ni cognitiva ni lingüística. Rechaza de raíz cualquier prejuicio de ese tipo.</li>
<li>Si el niño adquiere suficiente competencia en varias lenguas, <b>el bilingüismo tiene ventajas </b>tanto cognitivas (capacidad de abstracción más temprana) como lingüísticas (mayor sensibilidad lingüística).</li>
<li>Las personas señalarán que el niño comete errores en ambos idiomas y que es debido al bilingüismo. Cualquier niño comete errores al aprender un idioma; cuando un monolingüe los comete, se percibe con humor ("qué gracioso, ha dicho..."). Cuando un plurilingüe los comete, es un indicador de retraso y problemas.</li>
<li>Todos conocemos el concepto de<i> lengua madre</i>. En realidad ese concepto no es tan importante como se tiende a pensar. Es más importante el concepto de <b><i>lengua de entorno</i></b>.</li>
<li>Pongamos una familia de españoles en Alemania. Su hijo tendrá el español como lengua madre (o lengua familiar), pero en realidad es el alemán su lengua de entorno y será su idioma dominante o más fuerte, ya que es el que utiliza la sociedad donde vive.</li>
<li>En general,<b> la lengua de entorno tiende a ser la más fuerte</b>; la familiar es la lengua débil. A un par de españoles viviendo en Alemania no les tiene que preocupar si su hijo hablará bien alemán, porque lo hará con toda seguridad. Lo que les debe preocupar es si su hijo hablará español y cómo.</li>
<li>El niño, principalmente en la entrada a la guardería o a la escuela, <b>tenderá a dejar de hablar la lengua familiar </b>y solo utilizar la lengua de entorno. El niño puede hacerlo de manera inconsciente (no se da cuenta que no la utiliza) o de manera consciente y activa ("no quiero hablar vuestra estúpida lengua").</li>
<li>La mayoría de los niños (76%) dejan de utilizar la lengua familiar durante una época. Depende de los padres conseguir que vuelvan a hablarla.</li>
<li>En la lengua dominante el niño aprenderá a jugar con otros niños, a hablar con otros niños, a hablar en las tiendas; en la escuela aprenderá a contar, a leer muchos tipos diferentes de textos, escuchar a personas cultas explicar cosas complicadas... Todas esas funciones el niño las podrá hacer más cómodamente en la lengua dominante que en la lengua familiar. En general <b>la lengua de entorno será con la que más seguridad y creatividad </b>utilizará el niño.</li>
<li>Las lenguas tienen diferentes grados de prestigio social: todo el mundo ve como muy positivo aprender inglés; por contra, el turco o el búlgaro (por ejemplo) se ven como poco útiles. El niño percibe ese rechazo o refuerzo social. <b>Resulta más difícil criar a nuestro hijo en una lengua que se percibe como de pobres emigrantes pobres</b> que en una que se percibe como de cultura y éxito.</li>
<li>El prestigio social del español es en general positivo, aunque no tiene el prestigio de inglés o francés.</li>
<li>La situación lingüística dentro de casa es extremadamente importante. Una situación positiva es cuando ambos padres hablen en casa solo y de manera consecuente la lengua familiar.</li>
<li>Si uno de los padres habla la lengua de entorno, se reducen notablemente las posibilidades de que el niño utilice fluidamente la otra lengua. Esto es aún más negativo si quien habla la lengua no dominante es quien pasa más tiempo (tradicionalmente la madre).</li>
<li>Para entender mejor el punto anterior, pongamos el caso de un español que vive en Alemania, tiene un hijo con una alemana; ella pasa más tiempo con el niño y ella le habla en alemán. Es muy poco probable que ese niño hable español.</li>
<li>Es importante que el niño conozca otras personas que hablen el idioma familiar. Para ello pueden incentivarse los viajes, la relación con niños que hablen ese idioma, las visitas de parientes, libros, DVDs o televisión, juguetes, etcétera.</li>
</ul>
<h3>
Bibliografía principal</h3>
<ul>
<li>Leist, Villis, Anja, <i>Elternratgeber Zweisprachigkeit</i>, Tübingen: Stauffenburg 2008</li>
<li>Kielhöfer, Bernd / Jonekeit, Sylvie, <i>Zweisrpachige Kindererziehung</i>, Tübingen: Stauffenburg 1995</li>
<li>Scharff Rethfeldt, Wiebke, <i>Kindliche Mehrsprachigkeit</i> Stuttgart: Thieme 20013</li>
</ul>
</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-31317260705079480422014-10-10T22:46:00.000+02:002016-11-21T15:11:32.202+01:00Ideas que aprendí con la Super Nanny brasileña<div dir="ltr" style="text-align: left;" trbidi="on">
Dicen que los que no tienen hijos suelen criticar la manera de criar niños sin tener ni idea. Si Dios quiere me volveré padre en unas semanas, así que el José sin hijos quiere criticar al José con hijos sin que tenga ni idea de lo que habla, pero de manera interna, para que no me mosquee con nadie que no sea yo mismo.<br />
<br />
Por que, efectivamente, no tengo práctica criando niños. Fui el pequeño de mi familia, así que ni siquiera estoy acostumbrado a dormir con un bebé en la misma casa. Curiosamente una de las cosas que más me ha hecho reflexionar sobre la paternidad es Super Nanny.<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjo-YsGnjtjQ60b_K5X2NLNiWBdWOuDS3duPkVt4lrw30O0qptwPIRuazDPrAgdeUcVxgEDWUVK5GIdciMF5MxK1eWTXpaD7aVsqVNxj3HA7sCkvYuuCz7s23xfcCvaZAOCYfgmsRRGXVM/s1600/supernanny.png" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjo-YsGnjtjQ60b_K5X2NLNiWBdWOuDS3duPkVt4lrw30O0qptwPIRuazDPrAgdeUcVxgEDWUVK5GIdciMF5MxK1eWTXpaD7aVsqVNxj3HA7sCkvYuuCz7s23xfcCvaZAOCYfgmsRRGXVM/s1600/supernanny.png" width="172" /></a></div>
Comencé a verlo en la versión española hace ya unos 3 años, con Rocío Ramos-Paul en el papel de pedagoga. Creyendo que si pasaba al angloparlante el programa mejoraría, probé a ver las versiones inglesa y estadounidense. Fue un enorme chasco: el español es mucho menos teatral y más claro. Y posteriormente vi el programa brasileño por recomendación de mi mujer. Y, sin duda, este es la mejor versión de Super Nanny que he visto hasta ahora.<br />
<br />
La pedagoga se llama <a href="http://pt.wikipedia.org/wiki/Cris_Poli" target="_blank">Cris Poli </a>y me gustaría agradecerle el enorme trabajo que ha realizado en ese programa. Podéis ver bastantes programas completos en la web <a href="http://www.sbt.com.br/supernanny/videos/" target="_blank">cadena emisora: SBT</a>. En mi opinión utiliza estrategias claras que en el programa parece que funcionan. Repito que con este post no intento predicarle a nadie, solo recordarme a mí mismo, dentro de un tiempo, lo que pensaba que estaba claro y que podía funcionar, antes de que mi hijo me funda mis esquemas con una mirada sonriente y un par de besos y tenga la tentación de dejarle hacer lo que le dé la gana. Ahí van algunas ideas sacadas de Super Nanny Brasil:<br />
<ul style="text-align: left;">
<li>Los niños deben ir aprendiendo a hacer cosas por sí solos: vestirse, bañarse, comer solos... Hacerles las cosas es cómodo para el niño, pero también frustrante y para los padres un estrés</li>
<li>Es positivo para los niños tener horarios y rutinas marcadas</li>
<li>Debe haber reglas claras en la casa; incluso pueden escribirse en cartelitos en algún lugar de la casa o hacerse dibujos que las representen</li>
<li>Los niños deben dormir en su cama, no en la cama de sus padres</li>
<li>Es importante que los niños aprendan a entretenerse solos, que puedan jugar sin los padres</li>
<li>Pero también es importante que los padres jueguen con ellos. No solamente estar presentes durante el juego, sino participar del juego. Es una manera de interactuar con ellos, hablar, conocerlos...</li>
<li>Dar las órdenes de manera clara, con una delimitación temporal y explicar la consecuencia si no se hace. Hacer esto una vez, no irlo repitiendo hasta que se consuma el tiempo. Los niños muchas veces quieren atención: es secundario si esa atención viene en forma de beso o de charlote. Si echamos broncas, nos estaremos cabreando y en realidad estaremos reforzando positivamente con nuestra atención una actividad negativa</li>
<li>No castigar directamente cuando haga algo erróneo. Dar una advertencia clara, explicar la consecuencia; a la segunda, actuar como hemos dicho que haríamos </li>
<li>Reforzar positivamente cuando haga algo bien, sobre todo cuando sepamos que le ha costado hacerlo</li>
<li>Si hace algo bien que le ha costado, aunque lo haga de morros, no deberíamos echarle la bronca: por lo menos lo ha hecho. Todos tenemos derecho a enfadarnos: también los niños. ¿Los adultos no hacen cosas de morros (sin esperar recibir una bronca por ello)?</li>
<li>Nuestra función de padres no anula nuestra relación de pareja. Es importante cogerse un tiempo a solas con tu pareja. Como escuché una vez, en una relación de pareja, los hijos son los últimos en llegar y ¡los primeros en irse!</li>
</ul>
</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com2tag:blogger.com,1999:blog-6189106821734378281.post-41619701902031665442014-09-17T16:07:00.000+02:002014-09-17T16:07:04.221+02:00Categorías gramaticales y estilometría: conjunciones decimonónicas vs. puntuación modernista<div dir="ltr" style="text-align: left;" trbidi="on">
En el anterior post hice una primera aproximación sobre algunos<a href="http://eumanismo.blogspot.de/2014/09/estilometria-stylo-y-novelas-en-espanol.html" target="_blank"> métodos estilométricos, como el <i>clustering</i></a>, aplicados a las novelas españolas de la Edad de Plata. Para ese análisis utilicé las formas simples de las palabras. Pero ¿y si en vez de analizar <i>dijo, decía, dicho</i> (etc.) solo analizamos el verbo <i>decir</i>? O sea ¿y analizamos un texto lematizado? O más abstracto aún: ¿y si solo usamos sobre categorías gramaticales? En este post os quiero comentar los resultados de un pequeño experimento <b>estilométrico con categorías gramaticales en textos entre los siglos XIX y XX</b>. Había varios aspectos de las pruebas que os voy a comentar en este post que aún tengo que comprobar.<br />
<br />
Para saber con qué estamos trabajando, vamos a basarnos en un texto concreto: <b><i>Niebla </i>de Unamuno</b>. Debemos partir de una versión en texto plano .txt:<table align="center" cellpadding="0" cellspacing="0" class="tr-caption-container" style="margin-left: auto; margin-right: auto; text-align: center;"><tbody>
<tr><td style="text-align: center;"><a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg4ePpeWddZKG33ZwzXK2yw55MDQBDyq8Q3aY1EJuxElX5yrXgPW1Y_S_E_Igvpi7Q_q84cTEt-_9emu6w7NMxtjh8mVSQH_6KWoCn2ZQoYukx3CYb_smgwUxwhlmvnRWSn8nVsXgG_fmo/s1600/1.jpg" imageanchor="1" style="margin-left: auto; margin-right: auto;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg4ePpeWddZKG33ZwzXK2yw55MDQBDyq8Q3aY1EJuxElX5yrXgPW1Y_S_E_Igvpi7Q_q84cTEt-_9emu6w7NMxtjh8mVSQH_6KWoCn2ZQoYukx3CYb_smgwUxwhlmvnRWSn8nVsXgG_fmo/s1600/1.jpg" height="321" width="400" /></a></td></tr>
<tr><td class="tr-caption" style="text-align: center;"><i>Niebla </i>en formato plano</td></tr>
</tbody></table>
<br />
Para procesar el texto he utilizado <a href="http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/" target="_blank"><i>TreeTagger</i>, de la Universidad de Múnich</a> y lo he utilizado directamente desde el entorno de <i>R</i> mediante la librería <i><a href="http://cran.r-project.org/web/packages/koRpus/index.html" target="_blank">koRpus</a></i>. Confieso que poner a trabajar las diferentes herramientas no fue sencillo, ni para mí ni para los docentes del <i>European Summer School in Digital Humanities</i>. Si quisiésemos <b>lematizar <i>Niebla</i></b>, el resultado debería ser un archivo txt similar a este: <br />
<br />
<table align="center" cellpadding="0" cellspacing="0" class="tr-caption-container" style="margin-left: auto; margin-right: auto; text-align: center;"><tbody>
<tr><td style="text-align: center;"><a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEglflXcEIJpEA08ZDOOT_YQCUCjxRL0novA1bMtC6l0HfjXQcB7xFxZ0-UdTuxV1i0YASwDJZ70rI2ju22AVV4e70v_OiBOgLVXFk1-Ndw0uqGEE4dKtE1LVjK9lXQZAKePms2GfCRo44w/s1600/2.jpg" imageanchor="1" style="margin-left: auto; margin-right: auto;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEglflXcEIJpEA08ZDOOT_YQCUCjxRL0novA1bMtC6l0HfjXQcB7xFxZ0-UdTuxV1i0YASwDJZ70rI2ju22AVV4e70v_OiBOgLVXFk1-Ndw0uqGEE4dKtE1LVjK9lXQZAKePms2GfCRo44w/s1600/2.jpg" height="255" width="400" /></a></td></tr>
<tr><td class="tr-caption" style="text-align: center;"><i>Niebla </i>lematizada</td></tr>
</tbody></table>
Por lo general la estilometría prefiere no trabajar con lemas ya que se considera que muchos datos se pierden: se pierde la diferencia entre las novelas escritas en pasado o aquellas escritas en presente, por ejemplo. Algunos autores han señalado que podría ser más interesante dar un paso más allá de la lematización y conseguir las categorías gramaticales (<i>Part of Speech</i>, POS) de todas las palabras del texto. Es lo que vamos a hacer para nuestro experimento; esto sigue siendo <i>Niebla</i> habiendo hecho <b>un análisis gramatical de cada palabra</b>:<br />
<br />
<table align="center" cellpadding="0" cellspacing="0" class="tr-caption-container" style="margin-left: auto; margin-right: auto; text-align: center;"><tbody>
<tr><td style="text-align: center;"><a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjdEJcj_Eef568g8SF39Fecen20p7Ny-mRVbQVlQdDtTKT7cG76XRZnlLFcs3oQ3PLI9ZE55ZT3MwdxQibrau-oc_SnqQv1fkMlCXJAIW9B6bdoxq7VvvRNa1Q0c1hdnuHYN6EpZTnIY_4/s1600/3.jpg" imageanchor="1" style="margin-left: auto; margin-right: auto;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjdEJcj_Eef568g8SF39Fecen20p7Ny-mRVbQVlQdDtTKT7cG76XRZnlLFcs3oQ3PLI9ZE55ZT3MwdxQibrau-oc_SnqQv1fkMlCXJAIW9B6bdoxq7VvvRNa1Q0c1hdnuHYN6EpZTnIY_4/s1600/3.jpg" height="245" width="400" /></a></td></tr>
<tr><td class="tr-caption" style="text-align: center;"><i>Niebla </i>según categorías gramaticales del TreeTagger</td></tr>
</tbody></table>
Como vemos en la <a href="http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/spanish-tagset.txt" target="_blank">documentación de las categorías gramaticales para el español del <i>TreeTagger</i></a>, no solo se nos aporta si es un verbo o un sustantivo, también se nos da si el verbo está en forma finita (VLfin) o si es un nombre propio o común. Por ejemplo <i>don Miguel de Unamuno</i> sería en la anterior imagen «NC NP PREP NC». En total TreeTagger devuelve más de 70 categorías gramaticales diferentes.<br />
<br />
Como queremos trabajar algo más manejable, decido simplificar el análisis a solo <b>10 grandes categorías gramaticales</b>. En este análisis <i>don Miguel de Unamuno</i> sería «N N R N». El resultado es el siguiente: <br />
<br />
<table align="center" cellpadding="0" cellspacing="0" class="tr-caption-container" style="margin-left: auto; margin-right: auto; text-align: center;"><tbody>
<tr><td style="text-align: center;"><a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi4QUmARyeLwwpYAaTH6KK6rLmh2ZZCNWdqtcHfDoLEc7st4U0HGvo6mYMZBwX8gvSCvt02XMtzuRBWjeJPyok__I7UrGnQmMzr6gzLDYy1cxUEFcs4mGZKZiQlDD7ILpfvQYKZ4fF-bFA/s1600/4.jpg" imageanchor="1" style="margin-left: auto; margin-right: auto;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi4QUmARyeLwwpYAaTH6KK6rLmh2ZZCNWdqtcHfDoLEc7st4U0HGvo6mYMZBwX8gvSCvt02XMtzuRBWjeJPyok__I7UrGnQmMzr6gzLDYy1cxUEFcs4mGZKZiQlDD7ILpfvQYKZ4fF-bFA/s1600/4.jpg" height="256" width="400" /></a></td></tr>
<tr><td class="tr-caption" style="text-align: center;">No, <a href="http://www.catch22.net/sites/default/files/matrix.jpg" target="_blank">no es Mátrix</a>, es <i>Niebla</i>, en 10 cómodas categorías gramaticales. </td></tr>
</tbody></table>
Lo que observamos en la anterior imagen es la estructura léxico-gramatical de <i>Niebla</i>. Este proceso lo realizamos con varias decenas de textos publicados entre finales del siglo XIX y principios del siglo XX. Las <b>listas obtenidas de categorías gramaticales las analizamos mediante <i>Principal Components Analysis</i></b>, con lo que obtenemos una visualización en dos dimensiones teniendo en cuenta aquellos valores que más tienden a diferenciar textos. ¿El resultado?<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEibSbpYXAEj_pJZzo-kzqdf0BuuhFR11OTW3ltFFV63eJ6ZN42cNbeDZSf1PuotF8mEfhpT7N6vUtyakjoWjEl_WcXmeu-hGYlbajNP3WtXu0E7hBC3K81MAYfYNAfDcWd7_-y0FP5csbA/s1600/5.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEibSbpYXAEj_pJZzo-kzqdf0BuuhFR11OTW3ltFFV63eJ6ZN42cNbeDZSf1PuotF8mEfhpT7N6vUtyakjoWjEl_WcXmeu-hGYlbajNP3WtXu0E7hBC3K81MAYfYNAfDcWd7_-y0FP5csbA/s1600/5.png" height="400" width="400" /></a></div>
<br />
En esta nueva imagen vemos que los textos de Valle, por ejemplo, quedan en la parte superior y que los textos de Valera aparecen en el extremo inferior. Es decir, hay un valor que diferencia por completo a estos dos autores. A su vez, Unamuno aparece en el extremo derecho y Blasco Ibáñez a la izquierda. Pero ¿qué significan estas agrupaciones? ¿Según qué criterios se están organizando? Para saberlo, utilizamos la opción <i>loading</i> en <i>stylo</i>.<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhCyjxanOOZTt-SUT94seBSEjz_D3ux3ommfAPs87lVOeaxVHx3Nwpvo-UN2fKOd21GaW3S-xAKcFNpvMGm7_RsxU5kHfqFeqTpa-5nINqQdw1LIQnEa4Bi_SHPD5ckK34TVXO-9I1uY_w/s1600/6.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhCyjxanOOZTt-SUT94seBSEjz_D3ux3ommfAPs87lVOeaxVHx3Nwpvo-UN2fKOd21GaW3S-xAKcFNpvMGm7_RsxU5kHfqFeqTpa-5nINqQdw1LIQnEa4Bi_SHPD5ckK34TVXO-9I1uY_w/s1600/6.png" height="400" width="400" /></a></div>
Sé que no lo parece, pero esta imagen es muy interesante. Es la misma imagen anterior, ahora los textos están en gris, y con las categorías gramaticales como vectores. Observamos que nombres, <b>artículos, preposiciones y adjetivos</b> aparecen muy cercanos entre ellos en la izquierda: es decir, las categorías gramaticales que forman principalmente sintagmas nominales aparecen agrupados.<br />
<br />
Ese «polo nominal» aparece enfrentado en la dimensión horizontal por otro polo formado por <b>verbos y pronombres</b> (y en parte también por signos de puntuación, adverbios y conjunciones): una especie de «polo verbal». El <i>Principal Components Analysis</i> que esa diferencia entre polo nominal y polo verbal resulta importantísima, ya que el valor de ese PC es un excepcionalmente alto 50,3%.<br />
<br />
Es decir, la imagen nos está indicando que se puede hacer una <b>diferencia sólida entre textos que prefieren sintagmas verbales, y aquellos que prefieren sintagmas nominales</b>. Unamuno, por ejemplo, resultaría extraordinariamente verbal; Blasco Ibáñez, por contra, resultaría bastante nominal.<br />
<br />
Estos resultados son interesantes, sí, pero no sorprendentes: es bastante esperable que haya autores que utilicen más verbos (y estos suelen llevar pronombres relacionados) y otros que utilicen más sustantivos (con sus adjetivos y determinantes). <b>Lo inesperado es el eje vertical</b>.<br />
<br />
Porque el análisis muestra que la otra dimensión de mayor importancia es la diferencia entre conjunciones (y adverbios) frente a signos de puntuación. ¿Cómo? ¿Qué significa eso? Yo lo interpreto en el sentido que <b>algunos autores preferirían relacionar las oraciones entre sí mediante símbolos de puntuación, como Valle o Baroja; frente a otros, que preferirían utilizar conjunciones: como Valera u Ortega</b>.<br />
<br />
Sinceramente, no esperaba esta diferenciación ya que tendería a pensar que los signos de puntuación y las conjunciones no se excluyen. Al tener estos resultados delante hay que recordar que los signos de puntuación no son una categoría gramatical de por sí como adjetivos, adverbios, sustantivos o verbos. La lingüística computacional tiende a darle rango de categoría gramatical y por eso lo incluyo en el análisis, pero es cuestionable desde el punto de vista teórico. Además los signos de puntuación es un aspecto sensible a la intervención del editor, por lo que lo óptimo sería utilizar textos que han sido editados de manera homogénea.<br />
<br />
Señaladas estas precauciones, creo que es un aspecto interesante que hay que seguir estudiando, también en relación a otras variables. Porque resulta aún más llamativo cuando introducimos en el análisis la variable cronológica. En la siguiente imagen los textos decimonónicos aparecen en rojo, frente a los verdes del siglo XX.<br />
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgwC_U4pcRgAqfnL57o1SWPEeYWMGrFNhuEpQXbKYWAKhl3h4cdNXPPjengpZK6APFNdHI9NRHSHzC_3hWjtOA9WsVmKACEJR-A38bbUl0NvRbBOgxi8BaQHGalWsflkAY2_sb0Y_wvVB4/s1600/7.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgwC_U4pcRgAqfnL57o1SWPEeYWMGrFNhuEpQXbKYWAKhl3h4cdNXPPjengpZK6APFNdHI9NRHSHzC_3hWjtOA9WsVmKACEJR-A38bbUl0NvRbBOgxi8BaQHGalWsflkAY2_sb0Y_wvVB4/s1600/7.png" height="400" width="400" /></a></div>
De manera casi total (un texto de Bazán, Fernández Flórez y Ortega son las excepciones), los títulos en rojo aparecen en la mitad inferior de la imagen: es decir, <b>el siglo XIX prefería las conjunciones</b>; frente a esto los títulos verdes aparecen en la parte superior: es decir, <b>el siglo XX prefiere los signos de puntuación</b>.<br />
<br />
En el paso del siglo XIX al XX la literatura no solo realizó cambios estéticos o temáticos, parece que también cambió conjunciones por signos de puntuación.</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-54825160695575955082014-09-09T18:27:00.004+02:002014-09-10T08:08:41.752+02:00Estilometría: stylo y novelas en español<div dir="ltr" style="text-align: left;" trbidi="on">
<div class="separator" style="clear: both; text-align: center;">
</div>
<a href="http://eumanismo.blogspot.de/2014/08/ideas-del-european-summer-school-in.html" target="_blank">Como comenté en mi último post</a>, tuve el privilegio de estar en la <a href="http://www.culingtec.uni-leipzig.de/ESU_C_T/node/97" target="_blank"><i>European Summer School in Digital Humanities 2014</i></a> donde pude aprender sobre <b>estilometría</b>. Los profesores Jan Rybicki y Maciej Eder fueron los encargados de enseñarnos sobre estilometría y la librería de <a href="http://en.wikipedia.org/wiki/R_%28programming_language%29" target="_blank">R</a> llamada <a href="https://sites.google.com/site/computationalstylistics/stylo" target="_blank">stylo</a> que ha diseñado el grupo <a href="https://sites.google.com/site/computationalstylistics/">Computational Stylistics Group</a>:<br />
<br />
<table align="center" cellpadding="0" cellspacing="0" class="tr-caption-container" style="margin-left: auto; margin-right: auto; text-align: center;"><tbody>
<tr><td style="text-align: center;"><a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjBR1fG12Bkt1akozxPW2WRElyBlf72OW66ZOXmm9MpLDLTB1xEHxWWGsxLoxuszmTYO28HpJiTK-EHcRlGv0_wfE7uwRFrNIwOC2EZN6JLkbXV-sQZ0Kom11NgHM_c_kJNpAZsHramurE/s1600/2014-09-09_16h53_04.jpg" imageanchor="1" style="margin-left: auto; margin-right: auto;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjBR1fG12Bkt1akozxPW2WRElyBlf72OW66ZOXmm9MpLDLTB1xEHxWWGsxLoxuszmTYO28HpJiTK-EHcRlGv0_wfE7uwRFrNIwOC2EZN6JLkbXV-sQZ0Kom11NgHM_c_kJNpAZsHramurE/s1600/2014-09-09_16h53_04.jpg" height="215" width="320" /></a></td></tr>
<tr><td class="tr-caption" style="text-align: center;"><i>stylo</i>, sonriente nada más despertarse</td></tr>
</tbody></table>
<br />
La <b>estilometría </b>es una metodología estadística para analizar textos a través de sus palabras más frecuentes (<i>Most Frequent Words</i> o MFW). Fue <a href="http://en.wikipedia.org/wiki/Wincenty_Lutos%C5%82awski" target="_blank">Wincenty Lutosławski</a> quien acuñó esta palabra; en los últimos años <a href="http://llc.oxfordjournals.org/search?author1=John+Burrows&sortspec=date&submit=Submit" target="_blank">John Burrow</a> ha sido uno de los principales investigadores, cuya influencia puede observarse en varios grupos de investigación en Centro Europa.<br />
<br />
La estilometría se ha utilizado principalmente para estudiar atribuciones de autorías. Cada autor tiene tendencias al escribir: unos tienden a utilizar más estructuras determinante+adjetivo+sustantivo, algunos prefieren sumar oraciones con <i>y</i> u <i>o</i>, otros prefieren la confrontación mediante <i>peros </i>y <i>aunques</i>... Decenas de esos rasgos medidos estadísticamente medidos y enfrentados crearían la llamada <i>huella dactilar textual</i> de un autor: un patrón que podría reconocer la autoría de cualquier autor. Al menos esa es la idea.<br />
<br />
La realidad, como casi siempre, es más compleja. Pero lo emocionante que os quiero enseñar que esta metodología funciona sorprendentemente bien. Para empezar a trabajar necesitaremos un grupo de textos que formen un corpus más o menos equilibrado. Para esta prueba he decidido trabajar con un grupo de textos entre la segunda mitad del siglo XIX y las primeras décadas del siglo XX. Por ejemplo <a href="http://www.clasicoshispanicos.com/benito-perez-galdos/19-la-batalla-de-los-arapiles.html" target="_blank"><b><i>La batalla de Arapiles</i></b>, de Galdós, publicada por Clásicos Hispánicos</a>. Algunos criterios que se deben tener al trabajar con estilometría es que el corpus:<br />
<ul style="text-align: left;">
<li>debe tener varios textos del mismo autor</li>
<li>los textos pueden tener un formato plano, pero asegúrate que la codificación y el tipo de final de línea es homogéneo</li>
<li>los resultados son mejores si el género literario es homogéneo</li>
</ul>
Bajo estos criterios, vamos a trabajar con algunas novelas de autores como <b>Baroja, Bazán, Blasco Ibáñez, Clarín, Galdós, Miró, Sénder, Unamuno, Valle</b>... Cada una de las novelas la guardamos en un archivo de texto diferente. Queremos que el <i>stylo</i> ordene los textos según su semejanza. Intuitivamente tenderíamos a pensar que dos novelas de Galdós son más semejantes entre sí que una novela de Galdós y una de Clarín; y que las novelas de Galdós y Clarín (ambos parte del realismo) son más semejantes entre sí que, digamos, una novela de Galdós y una de Valle, ¿cierto?<br />
<br />
Para ello vamos a realizar un <i>cluster analysis</i>, (algoritmo de agrupamiento) que <i>stylo </i>consigue realizar de manera múltiple en iteraciones: primero trabaja con las 100 palabras más frecuentes y crea un <i>cluster</i>, después coge las siguientes 100 palabras y hace otro <i>cluster</i>; así hasta que llega a las 5000 palabras más frecuentes. Todos esos <i>clusters </i>son tenidos en cuenta para crear un resultados más robustos en forma de <i>Consensus Tree</i>. Para ello utilizamos la <i>Distance Delta</i> en la variedad de Eder. ¿El resultado? La siguiente imagen:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg7B0X9hylpo4CBwASN1clQaFdqS0U2UIBBTSJzQqyhzprBrA5Io0lx8wIavQX4tnhMBcStl8tuUgNfqnDa9h1lrtPnuvs-2EpoQMSSsHNdlcRJ49zFuCdW0WhOxtLq9q1on8Xbf6gYOo0/s1600/2014-09-09_17h43_18.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg7B0X9hylpo4CBwASN1clQaFdqS0U2UIBBTSJzQqyhzprBrA5Io0lx8wIavQX4tnhMBcStl8tuUgNfqnDa9h1lrtPnuvs-2EpoQMSSsHNdlcRJ49zFuCdW0WhOxtLq9q1on8Xbf6gYOo0/s1600/2014-09-09_17h43_18.jpg" height="400" width="330" /></a></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhg_QzQRBhYSG2n2tQejd2l2cK5pujMIcV93twbxChvOplywblZbDdg9zcukycV0gGLNeypPkygrxMbmt-5aImbL9A62v3ttAMn8pVOl8cbjMPCzUKLhZByzs-uRlr7rCLsxZrh3Uxcm1o/s1600/2014-09-09_17h42_53.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><br /></a></div>
Quizás estés pensando ¿qué son estas raíces de colores y qué significa? Estamos ante una visualización bidimensional de los clusters (o grupos) de las novelas. La relación jerárquica de las ramas significa la distancia entre los textos. Vamos a ver un segmento de este <i>consensus tree</i>:<br />
<table align="center" cellpadding="0" cellspacing="0" class="tr-caption-container" style="margin-left: auto; margin-right: auto; text-align: center;"><tbody>
<tr><td style="text-align: center;"><a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjlpsM2cMMbSWeP6auD-v9blDSmU2Udt6An58est4cgs-wK3Bz8OFNfCdB6W8V24aUwDci3ON4-V3rlCb4uzVhorQKb88ndqKaYKYbqjuxAeV3LiNHd_J3r_WRMmvoPLn-UfS5a1gHuZzw/s1600/2014-09-09_17h45_14.jpg" imageanchor="1" style="margin-left: auto; margin-right: auto;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjlpsM2cMMbSWeP6auD-v9blDSmU2Udt6An58est4cgs-wK3Bz8OFNfCdB6W8V24aUwDci3ON4-V3rlCb4uzVhorQKb88ndqKaYKYbqjuxAeV3LiNHd_J3r_WRMmvoPLn-UfS5a1gHuZzw/s1600/2014-09-09_17h45_14.jpg" height="320" width="260" /></a></td></tr>
<tr><td class="tr-caption" style="text-align: center;">Rama con textos de Clarín, Valera y Blasco Ibáñez</td></tr>
</tbody></table>
En esta rama de Clarín, Valera y Blascos Ibález vemos que los dos textos de <i>La Regenta</i> penden de un mismo nodo, por lo que los dos textos son muy similares entre sí. De la misma manera penden los dos textos de Valera. Los textos de Blasco Ibáñez tienen una estructura más compleja: <i>Arroz y tartana</i> es similar a la segunda parte de<i> La araña negra;</i> esos dos son parecidos a <i>La catedral</i> (aunque no tan parecidos); estos tres textos a su vez serían similares a <i>La barraca</i>. El análisis de clusters señala que los textos de Clarín y Valera son más similares entre sí y que estos, a su vez, tienen cierto parecido (aunque menor) con los de Blasco Ibáñez. Ahora que ya sabemos entender las ramas, volvamos a la imagen completa:<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgR_BayXarEtrQZ53ZYro-gBbFhQ3JwMrhPJYwb4SLb4HL14aOrEX1O8p5vsTNubQnqO0bvO7g8PFADN7ZzCOw_wlSNj1WxpAiB04fgOf84K2zUYqRxyNajegc8E0rvScXN8aBACu30lX0/s1600/2014-09-09_17h43_18.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgR_BayXarEtrQZ53ZYro-gBbFhQ3JwMrhPJYwb4SLb4HL14aOrEX1O8p5vsTNubQnqO0bvO7g8PFADN7ZzCOw_wlSNj1WxpAiB04fgOf84K2zUYqRxyNajegc8E0rvScXN8aBACu30lX0/s1600/2014-09-09_17h43_18.jpg" height="400" width="330" /></a></div>
El programa nos facilita la visualización por colores, con lo que nos es muy fácil reconocer los autores de los textos. Como vemos el análisis de clusters ha conseguido reconocer la huella del autor: los textos de Galdós no se mezclan con los de Bazán: ambos aparecen en una misma rama, pero el programa consigue distinguirlos por autores. De esta manera todos los textos han sido ordenados correctamente por autor. Es decir,<b> la <i>huella digital textual</i> no es solo una bonita metáfora</b>: se puede demostrar empíricamente. ¡Hurra!<br />
<br />
Solo hay un problema:<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhnsbR2_1aYAm3lnKLDGufvI2v8NG69i2Wccyt8cNsHibNuETeu-UVj0djGsC4CIfvqQI1yGerWSWhNPJvPnY2IXAn4IpAxsEYiSs2ihyphenhyphenTyc3Z4Q_H3a0fsK4wvGfIWuS-Dr9HQviwKYhM/s1600/2014-09-09_17h54_40.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhnsbR2_1aYAm3lnKLDGufvI2v8NG69i2Wccyt8cNsHibNuETeu-UVj0djGsC4CIfvqQI1yGerWSWhNPJvPnY2IXAn4IpAxsEYiSs2ihyphenhyphenTyc3Z4Q_H3a0fsK4wvGfIWuS-Dr9HQviwKYhM/s1600/2014-09-09_17h54_40.jpg" /></a></div>
<br />
<br />
¿Todos los textos han sido organizados por autor? ¡No todos! Sénder y su primera novela <i>Imán </i>está separado de sus otras dos novelas, que aparecen emparentadas con Baroja. Es decir, que de 32 novelas, 31 han sido organizadas por autor correctamente. Vale, <b>el sistema no es perfecto</b>, pero no me dirán que resulta fascinante que una máquina que no sabe absolutamente nada de literatura consiga organizar miles de palabras mágicamente por autor.<br />
<br />
Pero lo cierto es que la máquina ha hecho más que eso. Si nos fijamos, observamos que también se ha organizado cronológicamente: casi todos los autores del siglo XIX están en la rama inferior; los que empiezana publicar en el siglo XX en la rama superior. <b>La máquina no solo ha conseguido distinguir la autoría: también la periodización literaria.</b><br />
<br />
Ahora bien ¿qué significan las ramas intermedias? Uno esperaría haber encontrado a Valle, Unamuno y Baroja en una rama a la que llamaríamos «Rama del 98» y confirmaría la clásica agrupación de autores; pero no, el programa ha agrupado a Valle con Miró y a Baroja con Sénder. ¿Qué significan estos datos? ¿Es que Valle y Miró escribían novelas líricas mientras que Baroja y Sénder escribían novelas de aventuras? ¿Es otra cosa? ¿Esa diferencia es más importante? ¿Por qué Fernández Flórez aparece rodeado de autores muy anteriores a él? ¿Qué es lo que reúne a Clarín, Valera y Blasco Ibáñez, que los diferencia de Bazán y Galdós?<br />
<br />
¿Son estos resultados ruido? ¿O <b>están apuntando nuevas agrupaciones literarias</b>?</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com2tag:blogger.com,1999:blog-6189106821734378281.post-9997015327352735512014-08-09T09:09:00.003+02:002014-08-09T09:09:53.233+02:00Ideas del European Summer School in Digital Humanities 2014<div dir="ltr" style="text-align: left;" trbidi="on">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhhrczxCXKvq7RFYqJpRRry5-EURQ_7x6fyz2LyLKF74uizVepOIKh1ZuDdl4lsKShBTikIyBlJCTtCE5b0LTcKRBdq789LQZQTfPXgao3wduTH1n1OQCVhyw5jD94-lSNZBMM4GX6Kots/s1600/University-of-Leipzig-610x180.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em; text-align: center;"><br /></a>
<br />
En las últimas semanas he tenido el privilegio de poder asistir al <a href="http://www.culingtec.uni-leipzig.de/ESU_C_T/node/97" style="text-align: left;" target="_blank">European Summer School in Digital Humanities</a> organizado por Elisabeth Burr en la Universidad de Leipzig. En él pude no solo aprender más sobre métodos estilométricos y herramientas específicas, también me permitió tener un generoso panorama sobre qué se cuece hoy en día en los espacios de encuentre entre filología e informática.
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjX4BPx_oZbxgVs8jYqPUEV8i3BR346JADDzOGtJ6ppMOMt77MwEnUMKLL3cqtrxYZ3CsLPyM9DdMyoWP9GdPDk05c-YLRGTY0lt8_uSHkChOEfgrf2cdPwVugViT98dbHCZyh32AVkc1Y/s1600/2014-08-09_08h59_58.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjX4BPx_oZbxgVs8jYqPUEV8i3BR346JADDzOGtJ6ppMOMt77MwEnUMKLL3cqtrxYZ3CsLPyM9DdMyoWP9GdPDk05c-YLRGTY0lt8_uSHkChOEfgrf2cdPwVugViT98dbHCZyh32AVkc1Y/s1600/2014-08-09_08h59_58.jpg" height="320" width="224" /></a></div>
<br />
Aquí van algunas ideas que saqué en claro:<br />
<h3>
Tecnología</h3>
<br />
<li>Los sistemas de <b>marcación </b>(markup) ganan terreno con <a href="http://www.tei-c.org/index.xml" target="_blank">TEI</a> como líder</li>
<li>Por ejemplo se están desarrollando sistemas de marcación de <a href="http://en.wikipedia.org/wiki/Music_Markup_Language" target="_blank">música </a>o <a href="https://tla.mpi.nl/tools/tla-tools/elan/" target="_blank">pragmática</a></li>
<li><b>Perl</b>, lengua madre de lingüistas coputacionales, se abandona</li>
<li><b>Python </b>le come terreno</li>
<li><b>R</b> marca su territorio en tratamiento estadístico</li>
<li>Las DH tienden a no utilizar<b> bases de datos</b> relacionales</li>
<li>Prefieren poner los datos en archivos XML (en mi opinión, muy cuestionable)</li>
<li>Las DH dependen de herramientas de <b>Natural Language Processing</b></li>
<li><b>Lematizar </b>un texto sigue siendo doloroso como un parto</li>
<li>Las herramientas abiertas disponibles son oscuras, anticuadas, deficientes y poco amigables</li>
<br />
<h3>
Digital Humanities</h3>
<br />
<li><b>Definición positiva de DH</b>: espacio interdisciplinar que busca la representación e investigación tecnológica de la cultura (principalmente textual)</li>
<li><b>Definición negativa de DH</b>: lugar de encuentro y apoyo para personas y proyectos que utilizan métodos informáticos en departamentos con un fuerte rechazo por la tecnología (literatura, clásicas, filosofía, teología, etc.) donde nadie los entiende</li>
<li>La lingüística de corpus se perfila como puente entre la lingüística computacional y las DH</li>
<li>A pesar de que la codificación del texto exige una interpretación, instituciones y academia no lo valoran como investigación</li>
<li>Hay muy pocos proyectos TEI en español y muchos menos abiertos</li>
<li>La <b>visualización de los datos</b> pasa a ser una tarea central</li>
<li>No solo porque es bonito: ¡es útil!</li>
<li>La Universidad debería aprender retórica. Muchas conferencias podrían considerarse armas de aburrimiento masivo</li>
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjfh4tzRhJTDEaW22vYSfx8JGN5_jCEtfq-J8KQaw7d31v9K_2GHt5aHo7RfITiIT6fAa0xon1EVIco0eDmS6iUMddWCEKgli8gbNjRCFoCdisXHK-LbRvbg7WvcxsPjSC9WlG2qq9ZWs8/s1600/2014-08-02_10h34_09.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjfh4tzRhJTDEaW22vYSfx8JGN5_jCEtfq-J8KQaw7d31v9K_2GHt5aHo7RfITiIT6fAa0xon1EVIco0eDmS6iUMddWCEKgli8gbNjRCFoCdisXHK-LbRvbg7WvcxsPjSC9WlG2qq9ZWs8/s1600/2014-08-02_10h34_09.jpg" height="278" width="320" /></a></div>
<h3>
Tendencias</h3>
<br />
<br />
<li>El papel se revaloriza con tintes fetichistas</li>
<li>Atentos a los proyectos de <b>mediavalistas angloparlantes</b>: pueden tener la clave sobre el futuro del eBook</li>
<li>Parece que el péndulo pasa de lo subjetivo, cualitativo e hiperteórico a lo empírico y cuantitativo</li>
<li>Los nuevos métodos de investigación pueden producir en los siguiente años un salto cualitativo en muchos campos</li>
<br />
<h3>
Leipzig</h3>
<br />
<li>Leipzig es una ciudad bellísima tomada por bicis y tranvías</li>
<li>La Universidad de Leipzig estrena nuevo edificio en pleno centro de la ciudad, impresionante y calatravense</li>
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhhrczxCXKvq7RFYqJpRRry5-EURQ_7x6fyz2LyLKF74uizVepOIKh1ZuDdl4lsKShBTikIyBlJCTtCE5b0LTcKRBdq789LQZQTfPXgao3wduTH1n1OQCVhyw5jD94-lSNZBMM4GX6Kots/s1600/University-of-Leipzig-610x180.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em; text-align: center;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhhrczxCXKvq7RFYqJpRRry5-EURQ_7x6fyz2LyLKF74uizVepOIKh1ZuDdl4lsKShBTikIyBlJCTtCE5b0LTcKRBdq789LQZQTfPXgao3wduTH1n1OQCVhyw5jD94-lSNZBMM4GX6Kots/s1600/University-of-Leipzig-610x180.jpg" height="117" width="400" /></a>
<li>Al mismo tiempo elimina proyectos, carreras, puestos de trabajo y realiza recortes. ¿De qué nos suena?</li>
<li>Si vas a Leipzig, ve al <b>Völkerschlachtdenkmal </b>(le mejor manera es en bici!). No es bonito, pero si impresionante</li>
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgPXDE0lXRP8KAi-1h81q8jVDhIHoqKAWD57D6spD9l3EZR7QqeQXoQ5BZkgUt4XQfa7Hx4HP6D1PPlr2qfq5L5maMYVE4w3F_PDPo45Ynuce0F_8I4pElo5ajlUin2eDmFqtWcIJbPzxM/s1600/V%C3%B6lkerschlachtdenkmal_20131030_151606.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgPXDE0lXRP8KAi-1h81q8jVDhIHoqKAWD57D6spD9l3EZR7QqeQXoQ5BZkgUt4XQfa7Hx4HP6D1PPlr2qfq5L5maMYVE4w3F_PDPo45Ynuce0F_8I4pElo5ajlUin2eDmFqtWcIJbPzxM/s400/V%C3%B6lkerschlachtdenkmal_20131030_151606.jpg" height="320" width="257" /></a></div>
</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com2tag:blogger.com,1999:blog-6189106821734378281.post-83782805059269694392014-07-12T15:30:00.000+02:002014-07-12T15:33:28.620+02:00Ayudas y derechos de los padres en Alemania<div dir="ltr" style="text-align: left;" trbidi="on">
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj9cXdYYn0GqM1XbofO8T7UfU09oPaXkU2Ev34MKxD5IpuPR9HCTxNO2KrN-pNkuVexmcGbG1br2kvvH0_GkzMWY0z3F-FzZzUoNyBk7dnwX9I7SOjSyWxL8YCo3tOtVH-LsGljYnuC4v0/s1600/52432715.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj9cXdYYn0GqM1XbofO8T7UfU09oPaXkU2Ev34MKxD5IpuPR9HCTxNO2KrN-pNkuVexmcGbG1br2kvvH0_GkzMWY0z3F-FzZzUoNyBk7dnwX9I7SOjSyWxL8YCo3tOtVH-LsGljYnuC4v0/s1600/52432715.jpg" height="200" width="200" /></a></div>
Cuando en España un político habla de «proteger la familia», sabemos que significa algo contra homosexuales o el aborto. Cuando en Alemania se habla de lo mismo, las cuentas bancarias de los padres se ponen contentas. En los últimos años tener un hijo en España se ha convertido en una producto de lujo y fue una de las razones por las cuales mi mujer y yo decidimos marcharnos a Alemania. La diferencia entre la respuesta estatal de un país y otro es una sima abisal. Este post es una mero intento de lanzar una cuerda informativa entre ambas orillas: un resumen sobre las principales ayudas alemanas a la paternidad.<br />
<br />
Para dejarlo más simple, baso la información del post en una pareja casada, con pasaportes de la UE, ambos con trabajo en Alemania desde hace un año que tienen su primer hijo. Para otros casos, claro, habría que ir viendo cada aspecto en detalle. La mayoría son a nivel estatal y mi información se basa principalmente en folletos entregados por el <a href="http://www.bmfsfj.de/" target="_blank">ministerio</a> y la web del <a href="http://www.zbfs.bayern.de/" target="_blank">ZBFS</a>.<br />
<br />
<h4>
Mutterschutz y Mutterschaftsgeld: «protección materna» y «dinero materno»</h4>
<b>6 semanas </b>antes del día previsto del nacimiento, le dan la baja a la madre. Desde ese momento hasta<b> 8 semanas</b> después del nacimiento la mujer recibe el <b>100% de su salario</b>.<br />
<br />
<h4>
Elternzeit: «tiempo de los padres»</h4>
Una vez se termina los dos primeros meses, existe la posibilidad de pedir una <b>excendencia laboral </b>hasta que el niño cumple <b>los tres años</b>. Por supuesto se puede pedir menos. Esos meses se pueden dividir entre la pareja; incluso pueden pedir primero dos años, volver al trabajo y volver a entrar en excendencia de doce meses años después (por ejemplo cuando el niño entre en la escuela con 6 años).<br />
<br />
<h4>
Elterngeld: «dinero de los padres»</h4>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhcVqMxbxZQvNc6d258_mY8WwvnliJGYKOxKo-0kpEoRLIW8beL0lEMoPEUnYxwyelM_ZbYFr07Tenbe5bhguuN_zlA8n-zHbQJZT23pFK8wXVwgHClkBjMZ0ZHRw5AO978Cy-1cChTBjM/s1600/52432528.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhcVqMxbxZQvNc6d258_mY8WwvnliJGYKOxKo-0kpEoRLIW8beL0lEMoPEUnYxwyelM_ZbYFr07Tenbe5bhguuN_zlA8n-zHbQJZT23pFK8wXVwgHClkBjMZ0ZHRw5AO978Cy-1cChTBjM/s1600/52432528.jpg" height="200" width="200" /></a></div>
¿Y mientras esa excedencia tiene lugar, se cobra? <i>Ja</i>, aunque no todo el tiempo. Existe el «dinero de los padres»: <b>catorce meses durante los cuales se recibe el 67%</b> del salario. Esos catorce meses se pueden repartir entre los dos padres, con un máximo de doce meses. Por ejemplo, la madre puede cogerse 12 meses de «dinero de los padres» y el padre coge 2 meses.<br />
<br />
<h4>
Betreuungsgeld: «dinero de asistencia»</h4>
Pongamos que pasa el primer año, se termina el «dinero de los padres» y la mujer sigue de excedencia. ¿Tenie que pasar el resto de los dos años de excedencia sin cobrar nada? <i>Nein</i>! Aunque sí que va a cobrar menos. Ahora ya no es un porcentaje del salario, sino una cantidad fija y condicionada a que el niño <b>no</b> esté en la guardería. Dura desde el mes <b>15º hasta que cumple tres años</b> y son <b>150€ mensuales</b>.<br />
<br />
<h4>
Landeserziehungsgeld: «dinero de crianza estatal»</h4>
Algunos Estados alemanes tienen unas ayudas extra, como Baviera, Sajonia y Turingia. En el caso de Baviera, esto significa <b>150€</b> extras entre los <b>meses 12º y 18º</b> (a partir del segundo hijo es hasta el mes 24º)<b>.</b><br />
<b> </b>
<br />
<h4>
Kindergeld: «dinero de los niños»</h4>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhVu_zAZELc0aBAyW701-yT1xb_e_sqpBLNUF8sWzd0QcWeIhBmj47AIWAFY87I3DHrvo39rTDN8tPfe_WCu7SzuZMYJFHPNQB3N4AhRZCvoubCNqLqln0CUU2PCXL3bGwjrS_VbpKEEm0/s1600/52432227.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhVu_zAZELc0aBAyW701-yT1xb_e_sqpBLNUF8sWzd0QcWeIhBmj47AIWAFY87I3DHrvo39rTDN8tPfe_WCu7SzuZMYJFHPNQB3N4AhRZCvoubCNqLqln0CUU2PCXL3bGwjrS_VbpKEEm0/s1600/52432227.jpg" height="200" width="200" /></a></div>
Otras de las fuentes de ingresos para los padres (o para los hijos) es el Kindergeld o «dinero de los niños»: 180€ mensuales desde el mes de nacimiento hasta que el niño cumple 25 años (si sigue estudiando).<br />
<br />
<h4>
Otras ayudas</h4>
Estas son las principales ayudas al tener niños. Existen otras muchas dependiendo de las condiciones, el estado donde vives y otros servicios interesantes como:<br />
<ul style="text-align: left;">
<li>Cursos de preparación para el parto pagados por el seguro de salud</li>
<li>Cursos de natación, gimnasia, masajes para madre y recién nacido, pagados por el seguro </li>
<li>La matrona venga a tu casa, cada día, las primeras semanas después del nacimiento, pagado por el seguro</li>
<li><a href="http://de.wikipedia.org/wiki/Kinderzuschlag" target="_blank">Subvenciones</a> extra en caso de que los ingresos no sean suficientes</li>
</ul>
Todo esto para el primer hijo; con el segundo y sobre todo el tercero (familia numerosa) mejora notablemente. Y claro, puedes entrar en bucle y una vez termine el dinero volver a tener otro niño y volver a la primera ayuda de este post :) ¡Feliz fertilidad!</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com2tag:blogger.com,1999:blog-6189106821734378281.post-34426587694851084202014-06-15T14:04:00.001+02:002014-09-10T08:12:47.108+02:00El PSOE como movimiento literario<div dir="ltr" style="text-align: left;" trbidi="on">
<blockquote>
<div dir="ltr" style="text-align: left;" trbidi="on">
«Yo amo los mundos sutiles, <br />
ingrávidos y gentiles<br />
como pompas de jabón»</div>
</blockquote>
Estos tres versos aletean nerviosos en mi cráneo desde hace algunos días. La poesía, la literatura, el arte en general ensancha los horizontes de nuestra triste realidad y consiguen crear nuevos mundos, algunos sutiles, otros tortuosos, pero casi siempre originales. «<a href="http://www.casa-de-citas.com/busqueda.php?query_rapida=Reconozco+que+no+me+gusta+la+realidad%2C+que+nunca+me+ha+gustado." target="_blank">Reconozco que no me gusta la realidad, que nunca me ha gustado</a>» decía Martín Gaite. Y a quién sí que le gusta la realidad de este atasco que no acaba nunca, de todavía me quedan 5 horas para salir de la oficina, de a ver si aparece el salario en mi cuenta bancaria de una vez. <br />
<br />
La realidad es que a veces la realidad es asquerosa. Pero ahí está la literatura para abrazarnos, aliviarnos. No caigamos en la ingenuidad de pensar que solo nuestra realidad de curritos sin vela en ningún entierro (ni en el nuestro) apesta. ¡La realidad de las castas también es desagradable! ¿Ustedes se piensan que a Aznar no le gustaría ser vizconde? ¿O que Felipe no hubiese preferido ni enterarse por la prensa? <br />
<br />
<div style="text-align: right;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj3AF9h5exq_RfZfOa5RkJO__B4SQSjcsjbfjWOLGa_Jq4g6TJyVyCOUCl39MylzEBliIIKjfiqK3okxD9FZBesPOvnAReVxbCEP61qhIgFxT8Ss0A2KrZDsUBJQR3d0y_NJ6ICNdu28gM/s1600/martin-gaite-no-me-gusta-la-realidad.jpg" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj3AF9h5exq_RfZfOa5RkJO__B4SQSjcsjbfjWOLGa_Jq4g6TJyVyCOUCl39MylzEBliIIKjfiqK3okxD9FZBesPOvnAReVxbCEP61qhIgFxT8Ss0A2KrZDsUBJQR3d0y_NJ6ICNdu28gM/s1600/martin-gaite-no-me-gusta-la-realidad.jpg" height="226" width="320" /></a> </div>
La verdadera diferencia entre ellos y nosotros es que parte de esas élites han sabido reaccionar de manera lírica. Estos días tenemos un ejemplo óptimo de que a ellos la realidad no les gusta: el apoyo del PSOE a la corona. <a href="http://www.publico.es/politica/524576/rubalcaba-apoya-al-nuevo-rey-y-zanja-el-debate-de-su-ejecutiva-entre-monarquia-y-republica" target="_blank">Cuando vemos al secretario general del partido republicano más grande de España negar la necesidad de un referendum sobre la monarquía</a>, diríamos aquello de «<a href="http://www.casa-de-citas.com/busqueda.php?query_rapida=es+evidente+que+aqu%C3%AD+la+l%C3%B3gica+se+ha+saltado+la+tapa+de+los+sesos" target="_blank">es evidente que aquí la lógica se ha saltado la tapa de los sesos</a>».<br />
<br />
¡Craso error! No es lógica lo que el PSOE nos ofrece: ¡Es lirismo! Son mundos sutiles, inexistentes, pero no por ello menos consoladores. La mayor prueba de que esto es así es que el PSOE es federal, laico y republicano en la literatura, causas por las que ha hecho la nada más absoluta. <br />
<br />
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEicZuTOo-kBkCPo1VhC9TxDNLoPDpzd16yVy_c9TayBzdyiaBWfVDFJoIOG6yZBKi-REeRVrIQA0klSCtYx9sIwbJFGBupErnRjTso-g7-ugOgWLhxy4SYlxOXtlqrEo4RC1H83OMH_yUg/s1600/antonio-machado-mundos-sutiles.jpg" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEicZuTOo-kBkCPo1VhC9TxDNLoPDpzd16yVy_c9TayBzdyiaBWfVDFJoIOG6yZBKi-REeRVrIQA0klSCtYx9sIwbJFGBupErnRjTso-g7-ugOgWLhxy4SYlxOXtlqrEo4RC1H83OMH_yUg/s1600/antonio-machado-mundos-sutiles.jpg" height="226" width="320" /></a>Los cortos de vista señalarán que el partido está dirigido por <i>corruptólogos</i> que han refinado una traición sistémica de una legislatura de duración. ¿Ustedes creen que hoy en día seríamos mucho más felices si España fuese una república federal donde la Iglesia no estuviese enchufada a la Hacienda? Puede ser que fuésemos más felices, incluso puede ser que se hubiese aprendido algo de la crisis y cosas se hubiesen enmendado, quién sabe. Pero ¡<a href="https://www.youtube.com/watch?v=C5HkuCdgRGs" target="_blank"><i>mejor es la ilusión que abrir el regalo</i></a>!
Imagínense que vencemos a los monárquicos, centralistas y obispos, y luego decimos ¡contra los Borbones, contra Madrid, contra los Obispos se vivía mejor! ¿O nos vamos a creer que el monte de las repúblicas federales laicas es todo orégano? El antídoto contra la desagradable realidad real no es otras realidades menos espantosas; el antídoto es leer el programa electoral socialista con la sensibilidad poética con la que leemos cuentos de Darío o los sonetos de Garcilaso. Legislatura tras legislatura nos vuelve a prometer cosas que saben que no harán y que nosotros esperamos que no hagan, no vayamos a agotar las existencias de nuestras pompas de jabón, marca España. <br />
<br />
Exigirles a los socialistas vulgaridades como coherencia con el programa electoral o compromiso con su ideario es como decirle a Machado «oye macho, cógeme esas pompas y friégame el balcón». Delata un nula inspiración poética y política. Si quieres coherencia o ideario de izquierda, vete a buscarlo a otro sitio. <b>El PSOE te ofrece algo diferente: mundos sutiles donde las hadas pueblan antiguos palacios episcopales, donde existen los Estados Federales Satíricos y donde los Borbones se exilian a la Atlántida. </b></div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0tag:blogger.com,1999:blog-6189106821734378281.post-45453581993348388622014-04-23T21:57:00.001+02:002014-04-25T14:08:51.847+02:00Frankenstein y la soledad<div dir="ltr" style="text-align: left;" trbidi="on">
<a href="http://www.eldiario.es/cultura/palabras-Gabriel-Garcia-Marquez_0_250575309.html" target="_blank">Decía el recientemente fallecido Gabriel García Márquez que solo había escrito en la vida sobre la soledad</a>. No solo <i>Cien años de soledad</i>, también otras de sus obras como <i>El general en su laberito</i>, <i>Relato de un náufrago</i> o <i>El coronel no tiene quien le escriba</i> tratan sobre ese infierno mundano que es el sentirse excluido.<br />
<br />
La soledad es el demonio que exorcizamos cuando buscamos amor, cuando nos cuestionamos sobre Dios. La soledad es el fantasma que se nos aparece cuando se nos muere alguien al que queríamos. El amor, Dios y la muerte son tres temas que orbitan alrededor de la soledad en el último clásico que me he leído,<a href="http://ebooks.adelaide.edu.au/s/shelley/mary/s53f/" target="_blank"> <i>Frankenstein</i>, de Mary Shelley</a>.<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEguZqMNBQ6cgK92k-XjRCqGd66jtT3lvNEv0A5ExDX9JgfWOEdJRCNIDnF1qkQhe2T4uRhGYkM7O0pbH8HIXGwaebmF2oYwYNFvqy7NMBHZeXRwm9jblVaDOJpCU7uejiZFePhyrQIAmCg/s1600/cover.png" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEguZqMNBQ6cgK92k-XjRCqGd66jtT3lvNEv0A5ExDX9JgfWOEdJRCNIDnF1qkQhe2T4uRhGYkM7O0pbH8HIXGwaebmF2oYwYNFvqy7NMBHZeXRwm9jblVaDOJpCU7uejiZFePhyrQIAmCg/s1600/cover.png" height="400" width="281" /></a></div>
No puedo decir que haya disfrutado como lo hice con <i>Dracula </i>o <i>The picture of Dorian Gray</i>. Este es un libro lento y sus numerosas descripciones ralentizan aún más la trama. Pero el texto sorprende con los relatos y las opiniones de un ser rechazado por todos, que no conoce a nadie similar a él y repudiado por su creador. Un ser tan malditamente solitario que prefiere estar cerca de su creador, aunque sabe que lo busca para matarlo. El mismo monstruo invita a Victor a que siga haciéndolo:<br />
<blockquote class="tr_bq">
«Follow me; I seek the everlasting ices of the north, where you will feel the misery of cold and frost»</blockquote>
<br />
La muerte y la venganza se convierten en los principales objetivos tanto del doctor como del monstruo. Ambos pasan años alimentando su relación: persiguiéndose, destrozándose, odiándose.<br />
<br />
No tenemos que irnos al siglo XVIII ni reconstruir cadáveres para ver este tipo de relaciones enfermizas. Todos conocemos ejemplos de parejas, de hijos y padres, incluso de amigos, que escogen las burlas más amarga y las afilan durante horas, que encuentran insultos tan dolorosos que ni parecen insultos y los sueltan como si fuesen un comentario más. El rencor se convierte en su deporte favirto, donde cada jugador lucha por ganar efimerísimas victorias. Este juego impone una rutina miserable y solitaria, pero no completamente solitaria ya que es un juego de dos (o más): uno sabe que, ahí fuera, hay otra criatura pensando en ti, aunque sea para hacerte daño.<br />
<br />
Porque por oscura que sea una existencia de rencor, siempre nos es más llevadera que una vida de soledad integral. Ahora bien, las personas que eligen este camino no deberían sorprenderse si al final repiten la lamentación del monstruo:<br />
<blockquote class="tr_bq">
«For while I destroyed his hopes, I did not satisfy my own desires»</blockquote>
</div>
José Calvo Tellohttp://www.blogger.com/profile/00884302766921171232noreply@blogger.com0