#Electopromedio 19 de enero

Empieza la nueva temporada electoral. A partir de ahora vamos a publicar periódicamente un promedio ponderado (poll of polls) de los sondeos que se vayan conociendo para unas hipotéticas elecciones generales. Desde el 20 de diciembre se han publicado algunas proyecciones pero tan solo tres encuestas para toda España. Todavía es muy poco, y hay que tomarse estos primeros datos con mucha cautela. De momento, su promedio ponderado es éste:

Formato electopromedio segoe ul semibold 24 variaciones 20 20160119
En el centro, porcentajes de cada grupo político. En los márgenes, variación respecto al 20-D.

 

Habrá que esperar un par de semanas para que todo empiece a ser algo más sólido.  La primera encuesta postelectoral del CIS  se publicará a principios de febrero, aunque el trabajo de campo ya se ha debido llevar a cabo. Salvo que haya novedades significativas antes, entonces publicaremos el siguiente promedio.

Sin título2

Los datos de las tres encuestas publicadas son aún poco consistentes porque, entre otras cosas, predicen un incremento del porcentaje de voto global de los cuatro partidos mayoritarios que no se explica muy bien. Esto ocurre sobre todo en la publicada por Metroscopia. La extrapolación de escaños que resulta a partir de estos datos, es, por tanto, poco fiable:

Formato escaños segoe ul semibold 24 variaciones 20
Escaños según el promedio de encuestas, según grupos políticos (centro) y variación respecto al 20-D (esquinas).

 

20160119 electopromedio escaños

 

 

 

24 Comentarios
  1. Hay cuatro factores que -humildemente- creo que hacen imprevisible el resultado de una repetición de elecciones:

    1. ¿Con qué confluencias se presentaría Podemos? Dudo que se repitiesen las actuales.

    2. Derivada de la anterior: ¿podría afectar negativamente a la credibilidad del proyecto de Podemos que las confluencias actuales le diesen la espalda? No me refiero sólo a que se desvincularan de los morados los 27 de las confluencias sino al efecto entre mucha gente de izquierdas que pudiesen considerar que Iglesias no es tan de fiar como creían.

    3. Cambio de candidatura en el PP: No aceptarán, por mucho que quiera Rajoy, que éste vuelva a ser su cartel electoral una vez pierda por dos veces la investidura.

    4. Posible cambio de candidatura en el PSOE: Los barones más influyentes no soportan a Sánchez porque han comprobado su capacidad para empeorar lo que parecía imposible: el resultado de 2011.

    ¿Cómo lo veis vosotros?

    1. Sobre el punto 1), yo no veo tantas fisuras en En Mareas y en ECP. Creo que si se repitieran las elecciones habría muchas opciones para repetir las Confluencias. El problema si lo veo más en la Comunidad Valenciana, donde el pacto ya costó mucho y ahora podría volver a generar tensiones dentro de la misma Compromís, por lo que el resultado puede ser muy incierto.

      1. Me acaba de saltar una notificación de El país en el movil: "Podemos presenta un único grupo en el Congreso con 65 diputados; cuatro parlamentariode Compromís pasarán al Grupo Mixto."

        Supongo que esta noticia dificultará más aún que repitan confluencia.

        1. Compromís va a intentar crear grupo propio, si no lo consigue debatirán si entrar al grupo mixto o entrar en el grupo "plurinacional" de Podemos. Creo que les conviene esto segundo.

    2. Con lo de "no aceptarán, por mucho que quiera Rajoy, que éste vuelva a ser su cartel electoral"… ¿qué planeas?
      ¿cómo?
      Si en el PP manda Rajoy y se hace lo que Rajoy quiera.
      La única forma de que Rajoy no repita en mayo, será que Rajoy no quiera repetir. Y no le veo muy por la labor.

  2. Siempre ofreciéndonos más datos para debatirlos. Muchas gracias por el esfuerzo. Seguiremos de cerca este #electopromedio.

  3. Público informa de una encuesta según la cual PP y PSOE crecerían a costa de Podemos y Ciudadanos:
    http://www.publico.es/politica/pp-y-psoe-aumentar

    Haciendo cuentas la cosa quedaría así:

    PP: 31,42% ( 2,7)
    PSOE: 23,51% ( 1,5)
    Podemos: 19,46% (-1,2)
    Ciudadanos: 11,83% (-2,1)

    En escaños:

    PP: 136 (+13)
    PSOE: 96 (+6)
    Podemos: 63 (-6)
    Ciudadanos: 29 (-11)

    1. La clave parece estar en la participación, que bajaría 4 puntos.

      A ver si aparece la ficha técnica (no está en la Web de Llorente y Cuenca) para poderla incorporar a la media y a un post aquí.

      1. Pero si existe, es verdad y tiene ficha técnica habrá que incluirla en el Electopromedio ¿o con qué criterios se ponen unas y no otras?

          1. En principio toda encuesta será incluida en el Electopromedio. No podemos pararnos a hacer evaluaciones del tipo "este tiene tal relación con aquel… etc etc". Porque además todo eso es subjetivo, y por tanto opinable.

            Lo que habíamos pensado es otra cosa. Al hacer el promedio, resaltar cada vez quién se aleja más de él. Es decir, si tienes datos de doce encuestadoras en un momento dado, evaluar cúal se desvía más de la media y cuál se acerca más a ella y decirlo al publicar el electopromedio. Eso es un dato objetivo que no admite discusión.

            También se podría excluir del Electopromedio al 20% de las encuestadoras que más se desvíen de la media en cada ocasión, y hacerlo público. Es algo parecido a las puntuaciones en deportes en los que hay jueces. Si hay nueve jueces y las puntuaciones para un atleta son 8.0; 8,9; 9,2; 9,2; 9,3; 9,3; 9,3; 9,4 y 9,5, suele excluirse del cómputo al juez que puntúa con 8 y al que lo hace con 9,5. De esta forma se purgan posibles favoritismos o persecuciones…

            En el caso de las encuestas un mecanismo parecido podría ayudarnos a purgar sesgos excesivos. Lo meditaremos y para cuando tengamos un número de encuestadoras suficientes (ahora no hay ni de lejos) lo pondríamos en marcha.

          2. Personalmente preferiría no excluir a ninguna, ya que si hubiera algún cambio electoral brusco (un caso de corrupción, un mal hacer, etc) la primera encuesta que lo recoja sería injustamente castigada.

            Me parece mucho mejor exponer simplemente la lejanía de cada encuesta sobre la media anterior. Algo que de por si no es bueno ni malo, puedes alejarte de la media y ser esa la que acierta y estar equivocada la media.

            Lo que si me gustaría es que en cada Electopromedio se informara de las encuestas incluidas en él. Eso nos aportará mucha luz para entender los datos, y además si hubiera alguna que se haya escapado avisaros para incluirla.

  4. Enhorabuena por la iniciativa.

    Ya se empiezan a ver de nuevo los sesgos generales de las encuestadoras:

    1) como antes del 20D, C's está sobrevalorado: su bajada debería ser, al menos, equivalente a la subida del PP,

    2) como antes del 20D, la derecha está sobrevalorada respecto a la izquierda (PSOE y Podemos sumaron algo más en % de voto que PP y C's, y ya le empiezan a dar la vuelta; ahora ligeramente, pero iremos viendo cómo el sesgo crece).

  5. De cara a nuevas elecciones dudo que Podemos pudiese presentarse con las mismas confluencias si no se resuelve satisfactoriamente para todas estas el tema de los grupos parlamentarios, que me sorprendería que acabase siendo así.

    No obstante lo anterior tiendo a pensar que sí se acabara formando un nuevo gobierno que evitará la repetición de elecciones. El odio al PP suma mayoría absoluta, para mi este dato es determinante.

    1. Es muy posible que haya cambios en las confluencias, es verdad. Pero mientras eso ocurra, de momento las encuestas salen uniendo sus datos a los de Podemos con los mismos criterios que como se presentaron a las generales.

      En el futuro, ya veremos.

  6. Buenas tardes. Los criterios de cálculo de este promedio de encuestas serán los siguientes:

    -Los resultados de Podemos se ofrecen sumando confluencias.

    -Se concede más peso a los sondeos con una muestra mayor y a aquellos cuyo trabajo de campo sea más reciente. Cuanto más antiguo sea un sondeo, menos peso tendrá en el promedio, de forma progresiva. Pasados 75 días desde la fecha del trabajo de campo, dejará de ponderarse en el promedio.

    -Se descartarán las encuestas de empresas que hayan publicado otra posterior dentro del período de 75 días.

    -La estimación de escaños es una aproximación, y se realiza globalmente para toda España, suponiendo que los votos varían homogéneamente en todas las provincias, aplicando al resultado global un coeficiente corrector en función del carácter más o menos mayoritario de cada grupo político.

    1. ¡Buen trabajo! Gracias por la explicación. Me parece que el 'modus operandi' para el pronóstico está lleno de sentido común.

      Saludos.

    2. ¿Y puedes concretar cuanto es cada ponderación según el tamaño de la muestra?

      ¿Puedes concretar como has ponderado estas tres: Metroscopia, Invymark y Celeste Tel?

      Yo creo que sería más justo un valor medio, dado que hay encuestas con muestras menores que se acercan más que otras con muestras mayores. De este modo estás valorando la cantidad de muestra, pero no la buena selección de la muestra ni la metodología, que son realmente más importantes que el mero tamaño.

      Por ejemplo en valores medios estaríamos (resulta parecido al ponderado por ser solo 3 encuestas pero con el tiempo irían divergiendo):

      PP: 30%
      Pod+:22,1%
      PSOE: 21,3%
      Cs: 13,9%
      UP: 3,3%

      Creo que se debería intentar incluir UP en todos los gráficos, son casi 1 millón de votos, cifra que no se puede despreciar.

      Y yo también reflexionaría sobre el periodo elegido: 75 días. En caso que se repitan las elecciones habrá una ducha de nuevas encuestas y la situación puede cambiar de un día para otro. Arrastrar un resultado durante dos meses y medios me parecen excesivos. Es cierto que en EEUU se tiende incluso a más, tres meses. Pero en Europa es más frecuente los 30 días.

      Por lo demás, gracias por tu esfuerzo y tu trabajo.

      1. Buenas noches.

        En cuanto a la ponderación sobre el tamaño de la muestra, no es lineal, porque como bien dices sería excesivo. Un sondeo de 2000 entrevistas no es dos veces más preciso que otro de 1000. Solo es "un poco" más preciso, por motivos estadísticos en que no podemos entrar aquí. Para tener en cuenta esto, parto de una valoración minima común para todos los sondeos, y luego elevo a (1/4) el tamaño de la muestra para darle más peso (solo un poco más) a las muestras más grandes. Si la casa encuestadora no facilita el tamaño de la muestra, la despacho con el valor mínimo y punto. La falta de información hay que penalizarla. En el caso de los tres sondeos iniciales, no tengo el tamaño de la muestra de Inymark, así que lo pondero menos. Se siente, oigan, informen más.

        A continuación, sobre el coeficiente así hallado aplico una rebaja que tiene en cuenta la antigüedad. La antigüedad no es la de la fecha de publicación, que por ejemplo en el caso del CIS es muy tardía, sino la FECHA MEDIA DE LA TOMA DE DATOS. Si la casa encuestadora no facilita esa información, le adjudico un -40 en este apartado, para penalizar esa falta de transparencia. Normalmente las fechas suelen estar entre -8 y -12 respecto al día de publicación, pero ya digo que el CIS por ejemplo puede tardar 20 o 25 días en publicar sobre los días del trabajo de campo.

        Aplico una fórmula lineal que idealmente no penalizaría los datos publicados el mismo día de la toma de datos, valoraría a la mitad el trabajo de campo realizado 35 días atrás, y deja en 0 el trabajo realizado 75 días atrás. Prefiero la fórmula lineal por simplicidad. Kikollan aplica una fórmula de rebaja diaria porcentual del peso de la encuesta, pero empíricamente he verificado la sdiferencia entre su modelo y el mío, y los outputs son tan parecidos que considero que añadir ese elemento (teóricamente más preciso) no merece la pena. A menudo soy partidario, cuando las diferencias son mínimas, de aplicar la navaja de Occam. De lo contrario, todo acaba complicándose demasiado y convirtiéndose en inmanejable.

        La vida media de los sondeos considerados, teniendo en cuenta esta corrección, no es por tanto de 75 días, sino de 38,5. Lo considero un plazo razonable. No estoy elaborando una proyección, donde hay que intentar ser muy fino y prever las más mínimas variaciones (para que luego te machaquen encima en los comentarios, jajaja). De momento solo estamos en la fase de hacer un buen promedio, que no hace falta que reaccione ante la última encuesta con una precisión milimétrica. Entre otras cosas porque la última encuesta puede no ser más que ruido…

        En cuanto a UP, el problema es que en algunas encuestas ya ni se da su porcentaje de votos, así que debo deducirlo (con la chapuza que eso supone) del número de escaños, si es que lo dan. Dado su tamaño, creo que está bien representado en los gráficos lineales que presento, aunque no hay sitio para ella, es cierto, en el gráfico general que construyo a partir del esquema "diamant" al estilo del Diagrama de Nolan. Si UP creciera me lo plantearía. Mientras se mantenga en un 3-4% de votos, le mantendré en los gráficos lineales y lo obviaré en los de Nolan. No puedo hacer más.

        Un saludo.

        1. Gracias por la explicación.

          Entiendo la ponderación que haces en función de la antigüedad, sigues un criterio propio y me parece bien, porque no existe en esto una verdad absoluta, pero no llego a entender la ponderación por el tamaño de la muestra.

          ¿Cuando consideras que una muestra es pequeña y cuando grande, a partir de cuantos encuestados? ¿Y como se ponderan ambos casos? Igual se entendería mejor si lo explicas usando como ejemplo las encuestas ya publicadas, que son pocas.

          1. Ejemplo:

            De Invymark no tengo el tamaño de la muestra, así que mi sistema le penaliza y le asigna un coeficiente 2,00 (un punto por publicarse y otro más por encuesta). Es un mínimo convencional, por supuesto. Podría ser cualquier otro razonable.

            Llorente, muestra 1.000, coeficiente de ponderación, 6,62

            Celeste, muestra 1.110, coeficiente de ponderación, 6,76

            Metroscopia, muestra 1.200, coeficiente 6,89

            Una hipotética macroencuesta de 5.000, tendría un coeficiente de 9,41.

            La ponderación no crece proporcionalmente al tamaño, sino mucho menos, intentando replicar el descenso del margen de error de que el aumento del tamaño de la muestra supone, y que también es mucho menos que proporcional.

            Estos criterios son convencionales, por supuesto, pero suponen en todo caso una mejora sobre un simple promedio no ponderado. Harán que varíen solo algunas décimas en la asignación para cada partido, pero esas décimas son significativas.

            Hasta ahí las complicaciones del modelo. Con algunos detalles se podría afinar incluso un poco más, pero ese refinamiento solo incidiría en centésimas del dato final, y considero que no merece la pena. Los márgenes de error son muy superiores a eso, y se comerían todo el refinamiento.

            Otros promedios, que no quieren complicarse, no aplican ningún criterio de ponderación y punto. Así todo es mucho más simple, claro. Pero eso es otra historia, que por desgracia resulta bastante habitual.

          2. Gracias, ahora lo he entendido, es complejo, pero si te ofreces para hacerlo, adelante. Justo de esto se trata esta Web.

            Me parece que vas a tener mucho curro, en dos días han llegado 5 encuestas (Celeste Tel, Llorente y Cuenca, Invymark, Encuestamos y Metroscopia), ojo que Llorente y Cuenca es solo una encuesta, no son dos jejeje… broma.

            Animo.

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

Social Media Auto Publish Powered By : XYZScripts.com