Estimación repartija de votos segunda vuelta presidenciales Chile 2017

Este Articulo fué hecho apurado y con pocos datos, el definitivo está en Quien votó por cada Candidato?

Después de la primera vuelta de las elecciones presidenciales de Chile, es tradicional que cada uno de los candidatos comienza a “rematar” los votos de sus seguidores a aquel candidato con el que se siente más a fin.

En la en realidad los votos no se pueden “transferir” y como el voto es secreto, nadie sabe para quien trabaja, por eso decidí utilizar data-science para descifrar como se repartieron los votos de la primera vuelta a la segunda vuelta.

Como en todo modelo, hay que realizar supuestos y en este caso el supuesto clave que realizaremos es que los votos de la primera vuelta se distribuyeron del mismo modo en todas las regiones en la segunda vuelta (posiblemente debería hacerlo por centro de votación o comuna, pero la base de datos completa no está disponible aún).

Lo que haremos es realizar una regresión lineal con restricciones donde del estilo beta*X = y, donde:

  • X: son los votos por región de cada candidato en primera vuelta de cada candidato y la cantidad de votos extra en segunda vuelta.
  • beta: son los parámetro a estimar, que representan el porcentaje de votos de cada uno de los X que se fue a Piñera. estos valores pueden estar entre 0 y 1.
  • y: Los votos que obtuvo Piñera en segunda vuelta.

Al ejecutar el modelo, obtenemos un R^2 de 0.99 con los siguiente betas (que representan porcentajes cedidos de primera vuelta a Piñera en segunda):

Podemos ver que, como era de esperarse, todos los que votaron por Kast y Piñera en primera vuelta, votaron por Piñera en segunda vuelta, también que el 75% de los nuevo votantes votaron por Piñera y entre otros análisis Guillier cedió 6% votos a Piñera, mientras que los votantes de Artes y Goic no entregaron ninguno. EDITADO: a navarro lo considero un error por que tena muy pocos votos.

En el siguiente grafico presentamos los votos cedidos por candidatos a Piñera en segunda Vuelta

Recordemos que la ventaja que le sacó Piñera a Guiller fue de 635.671 votos, Por lo que si los votantes de Sanchez y MEO no lo hubiesen apoyado, Piñera perdía las elecciones. Ahora, por que personas que en primera vuelta votaron por ellos, en la segunda, votaron por Piñera, solo el votante lo sabe.

AGREGADO: creo que el supuesto de que los votos se mueven homogéneamente se puede cumplir más por mesa en cada centro de votación, a ver si me consigo la base de datos completa.

Me gustaría recibir comentarios sobre este articulo a ver si me dan ideas para realizar una mejor estimación cuando salga la base de datos por mesa de votación.

Muchas gracias!

Print Friendly, PDF & Email

18 comentarios

  1. Hola Tocayo, Colega y Profe R,
    Interesante análisis, me llama la atencióm el beta de navarro 1? Al igual que Kast y Piñera?, por otro lado Goic 0 beta?.. es mas probable en la práctica que de Goic algo de votos se pasen a Piñera que los votos de Navarro.

    1. creo que navarro obtuvo tan pocos votos que el modelo se mareó, sobre lo de Goic, interpretaría que es cercano a 0.
      Lo que quiero hacer es realizar este análisis por local de votación asumiendo que todas las mesas se mueven homogéneamente, pero os datos un no están, tal-vez haga un web scraping del servel este fin de semana y podremos verlo.
      Gracias por leer el articulo

      Saludos!

      1. Revisando en la web encontré estos artículos que se aproximan a lo propuesto, desconozco si los haz revisado:
        Teniendo a priori un modelo de intensión de voto geopolítico chileno (con algoritmo árbol de decisión, determinando patrón de comportamiento) y luego teniendo los datos finales completos reales de la elección ajustaría el modelo, se tendría como hipótesis entonces un mejor modelo de estimación de pronóstico eleccionario y geopolítico actual dado diversos supuestos.
        http://rtdibermatica.com/?p=1147
        https://www.comunicae.es/nota/sera-posible-conocer-la-intencion-de-voto-de_1-1149525/

        Saludos,

  2. Me parece que tu error es considerar que el 100% de los votantes de Sánchez asistieron a la segunda vuelta, solo debes considerar un mínimo de 50% y los diferencia la marcaron los nuevos votantes.
    Slds

  3. Interesante!
    Donde conseguiría uno la BbDd?
    Para mi, lo primero sería determinar el número de personas que asistió a ambos comicios. Tengo la sospecha de que debe haber entre 800 y 900 mil que solo votamos en segunda vuelta (yo estaba en el extranjero en noviembre). Por lo tanto, supongo que casi 500.000 de los que votaron en primera vuelta, no lo hicieron en la segunda.
    Yo me haría un modelo después de conocer ese dato….
    Me avisas como sigues, yo estoy muy intrigado.

  4. Me pareció interesante el ejercicio hecho, pero me gustaría hacer algunos aportes:

    Cuando le agregas un componente de “territoriedad” a los datos, te das cuenta que en comunas del “barrio alto” la cantidad de votantes aumentó sensiblemente entre ambas elecciones, aumentando el margen en favor de piñera (estas representan aproximadamente un 30% de la diferencia de votos finales a favor de Piñera) y eso es un dato no menor, que -de alguna forma- válida la tesis de que mucho del votante de Piñera no fue a votar en primera vuelta por sentirse triunfalista, pero si lo hicieron en segunda.

    La otra acotación, es que no veo un estimado de personas que votaron en primera, pero no en segunda (efecto Beatriz Sánchez)… sería interesante agregar un proxy para esto…

    Saludos

  5. No me hacen mucho sentido los resultados. Creo que podria ayudar agregar una dummy por region.
    Por otro lado, probablemente estas omitiendo variabled que producen correlacion de alguna o todas las variables con el error. Tambien debe haber multicolinealidad.
    Creo que hay varios problemas metodologicos.

Dejar una contestacion

Tu dirección de correo electrónico no será publicada.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.