¿Es Unidos Podemos más Unidos o más Podemos? Clasificación y aprendizaje automático de programas electorales
Llevo dos posts sobre estilometría de las elecciones generales españolas del 26 de junio de 2016. En el primero realicé varios clusters e intenté observar si ciertos partidos habían copiado el anterior programa electoral. En el segundo colacioné las dos versiones del programa de Unidos Podemos y encontré alguna anomalía.
En este post lo que me pregunto es: ¿Es el programa de Unidos Podemos más similar a los anteriores de Izquierda Unida o a los de Podemos? Para ello voy trabajar de una manera similar al post en el que intenté descubrir mediante aprendizaje automático qué partidos eran de izquierda y cuáles de derecha. En este caso también utilizo aprendizaje automático supervisado (o clasificación). La máquina aprende cómo son los textos de IU y de Podemos a partir de los programas electorales de las anteriores elecciones generales, de las europeas y del texto marco para las autonómicas y municipales:
Posteriormente le damos a la máquina dos tareas diferentes. En primer lugar le damos un conjunto de textos para comprobar si consigue clasificar los textos correctamente, un test. En concreto le doy seis programas electorales de diferentes comunidades autónomas por cada partido:
Y por último le doy las dos versiones (¡ya que ahora sabemos que son algo diferentes, probemos ambas!) del programa electoral de Unidos Podemos para que tome la decisión de si le parece más similar a Podemos o a IU:
Como casi siempre, trabajo con el paquete de R stylo para estilometría, en concreto con la función classify(). Realizo la prueba desde las 1000 MFW hasta las 10000 MFW y utilizo la distancia textual Eders Delta.
Resultados de stylo
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
1000 MFW , culled @ 0%, 11 of 12 (91.7%)
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
2000 MFW , culled @ 0%, 11 of 12 (91.7%)
Podemos_2015_A_Asturias --> IU
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
3000 MFW , culled @ 0%, 10 of 12 (83.3%)
Podemos_2015_A_Asturias --> IU
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
4000 MFW , culled @ 0%, 10 of 12 (83.3%)
Podemos_2015_A_Asturias --> IU
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
5000 MFW , culled @ 0%, 10 of 12 (83.3%)
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
6000 MFW , culled @ 0%, 11 of 12 (91.7%)
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
7000 MFW , culled @ 0%, 11 of 12 (91.7%)
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
8000 MFW , culled @ 0%, 11 of 12 (91.7%)
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
9000 MFW , culled @ 0%, 12 of 12 (100%)
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
10000 MFW , culled @ 0%, 12 of 12 (100%)
General attributive success: 109 of 120 (90.8%)
Visualización de los resultados e interpretación
Como en otras ocasiones, las conclusiones son en parte esperables (¡Podemos ES el hermano mayor en escaños de la coalición!). Pero están sostenidas por algo más que "pues a mí me parece...".
En este post lo que me pregunto es: ¿Es el programa de Unidos Podemos más similar a los anteriores de Izquierda Unida o a los de Podemos? Para ello voy trabajar de una manera similar al post en el que intenté descubrir mediante aprendizaje automático qué partidos eran de izquierda y cuáles de derecha. En este caso también utilizo aprendizaje automático supervisado (o clasificación). La máquina aprende cómo son los textos de IU y de Podemos a partir de los programas electorales de las anteriores elecciones generales, de las europeas y del texto marco para las autonómicas y municipales:
Posteriormente le damos a la máquina dos tareas diferentes. En primer lugar le damos un conjunto de textos para comprobar si consigue clasificar los textos correctamente, un test. En concreto le doy seis programas electorales de diferentes comunidades autónomas por cada partido:
Y por último le doy las dos versiones (¡ya que ahora sabemos que son algo diferentes, probemos ambas!) del programa electoral de Unidos Podemos para que tome la decisión de si le parece más similar a Podemos o a IU:
Como casi siempre, trabajo con el paquete de R stylo para estilometría, en concreto con la función classify(). Realizo la prueba desde las 1000 MFW hasta las 10000 MFW y utilizo la distancia textual Eders Delta.
Resultados de stylo
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
1000 MFW , culled @ 0%, 11 of 12 (91.7%)
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
2000 MFW , culled @ 0%, 11 of 12 (91.7%)
Podemos_2015_A_Asturias --> IU
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
3000 MFW , culled @ 0%, 10 of 12 (83.3%)
Podemos_2015_A_Asturias --> IU
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
4000 MFW , culled @ 0%, 10 of 12 (83.3%)
Podemos_2015_A_Asturias --> IU
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
5000 MFW , culled @ 0%, 10 of 12 (83.3%)
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
6000 MFW , culled @ 0%, 11 of 12 (91.7%)
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
7000 MFW , culled @ 0%, 11 of 12 (91.7%)
Podemos_2015_andalucia --> IU
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
8000 MFW , culled @ 0%, 11 of 12 (91.7%)
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
9000 MFW , culled @ 0%, 12 of 12 (100%)
UniPod_2016_Generales_IU --> Podemos
UniPod_2016_Generales_Podemos --> Podemos
10000 MFW , culled @ 0%, 12 of 12 (100%)
General attributive success: 109 of 120 (90.8%)
Visualización de los resultados e interpretación
En general el programa consigue reconocer bastante bien si los textos
autonómicos son de IU o de Podemos. A partir de 1000 MFW reconoce entre
10 y 11 textos de un total de 12 de manera correctamente: el Podemos de
Andalucía y de Asturias (solo desde 3000 a 5000 MFW) le parece IU. A
partir de las 9000 MFW clasifica todos los textos autonómicos
correctamente. ¡Bien!
¿Y qué dice de Unidos Podemos?
Lo tiene claro: el programa de Unidos Podemos es clasificado como de Podemos y no de IU.
Ese resultado ocurre en todos los rangos de MFW, y ocurre tanto con la
versión del programa de IU como de Podemos. Es decir, aunque habíamos
señalado que el estilo de los dos programas era algo diferente y aunque
estamos analizando el estilo del texto, esas diferencias no son
suficientemente fuertes como para que esas versiones diferencien
pertenencia a partido.
Como en otras ocasiones, las conclusiones son en parte esperables (¡Podemos ES el hermano mayor en escaños de la coalición!). Pero están sostenidas por algo más que "pues a mí me parece...".