Statistics for Dummies (II): Metroscopy vs. 20-D

64

tatandaan mo yan sa nakaraang artikulo ang "error" ng isang survey ay tinukoy, ito ay itinuro kung paano kalkulahin ang kaukulang standard deviation at, sa wakas, ipinaliwanag kung paano gamitin ang mga data na ito upang maitaguyod ang pagiging maaasahan ng isang pollster, na inihambing ang mga hula nito sa malupit na katotohanan.

Gayunpaman, ang "gross" na pamamaraang iyon ay may malubhang problema na naging dahilan upang ito ay halos hindi nalalapat (kahit man lang, sa mga Heneral ng Kastila): makatuwiran lamang kung ang "kahina-hinalang" poll ay napakalapit sa halalan: kung dalawa o ang pinag-uusapan natin. tatlong linggo na lang, gaya ng dati, laging posible na i-claim na...

"Sa oras na iyon, maraming mga boto ang gumagalaw, at samakatuwid ay lohikal na ang pollster ay medyo mali. Walang dahilan para makakita ng multo."

Sa katunayan, ang boto ay gumagalaw: ito ay maliwanag na ang elektoral na mga inaasahan ng isang partido ay maaaring magbago nang malaki sa mga huling linggo ng kampanya. Pero... ganun karami? Nakatuon sa palaging kontrobersyal na Metroscopia, ang mga error sa pagtataya ng sakuna nito isang buwan bago ang 20-D ay resulta lamang ng napakalaking pagkakaiba-iba sa sentimento ng botante? Ang pagtaas ba ng Podemos (3.6 puntos) at, HIGIT SA LAHAT, ang sakuna ng C (8.7 puntos), sa wala pang isang buwan na ipinapakita sa atin ng pollster na ito, posible ba ang mga ito ayon sa istatistika?

Pamamaraan

Malinaw, ang sagot ay depende sa kung magkano ang average na buwanang variation ng party na iyon. Kung ang isang partido ay nanatili, siguro, stable sa 20% para sa isang buong taon, magiging napakahirap na bigyang-katwiran ang isang "biglaang" pagbaba ng 10 puntos. Kaya ang unang bagay na kailangan natin ay isang bagay na maihahambing. At hindi lamang para sa isang partikular na laro, ngunit para sa kabuuan.

At para dito, ano ang mas mahusay kaysa sa pagkuha ng data mula mismo sa Metroscopia sa buong 2015 at pagtatatag ng average na buwanang pagkakaiba-iba sa intensyon na bumoto?

petsa Kami PSOE PP Mga C's mga iba IU
IE 28,2 23,5 19,3 8,1 15,7 5,3
KUNG 27,7 18,3 20,9 12,2 14,4 6,5
IM 22,5 20,2 18,6 18,4 14,7 5,6
IA 22,1 21,9 18,5 19,4 10,8 5
IJ 21,5 23 20,8 13 13,9 4,1
Ako-JL 21,5 22,5 23,1 15 14 4
III-JL 18,1 23,5 23,1 16 13,7 5,6
AY 18,6 24,6 23,1 16,1 12,3 5
IO 14,1 23,5 23,4 21,5 11,9 5,6
SA 17 21 23,5 22,5 9,7 6,3
IV-N 17,1 22,5 22,7 22,6 9,9 5,2
II-D 19,1 21 25,5 19,1 11,4 5
Halalan 20,7 22 28,7 13,9 11 3,7

Ang Podemos, halimbawa, ay may intensyon na bumoto noong Enero ng 28,2 at noong Pebrero ay bumaba ito sa 27.7, kaya ang rate ng variation sa panahong iyon para sa Podemos ay (27,7-28,2)/1=-0,5 .21,5 Puntos/buwan. Sa madaling salita, nawalan ito ng intensyon sa pagboto sa rate na kalahating punto bawat buwan. Sa kabilang banda, at para sa paghahambing, sa dalawang linggo sa pagitan ng dalawang survey na inilathala noong Hulyo, ang Podemos ay naging 18,1 hanggang 18,1, kaya ang rate ng variation noon ay (21,5-0.5)/ 6.8=-XNUMX puntos/buwan (I hindi alam kung anong paranormal na kaganapan ang nagbibigay-katwiran sa pagbagsak na ito).

Kung gayon, ang problemang kinakaharap namin ay pag-isahin ang lahat ng buwanang pagkakaiba-iba na ito: "sumar” ang mga resulta ng Podemos, C's, PSOE, PP… para makakuha ng average na halaga na maihahambing sa nangyari noong 20-D. At sabihin ko "sumarlas”, sa mga quote, dahil maliwanag na hindi natin ito magagawa: ang resulta ay magiging zero (kung ano ang nanalo, ang iba ay natatalo). Sa kabutihang palad, upang kalkulahin ang "global" na iyon ay mayroong hindi bababa sa dalawang magkaibang pamamaraan.

1) Ang klasiko: sumar ang ganap na halaga ng buwanang pagkakaiba-iba ng bawat partido

formula1

2) Isa pang "exotic": ilapat ang Pythagoras.

formula2

Ang unang anyo ay tinatawag na "Manhattan distance", ang pangalawa ay "Euclidean distance". Ito ay kagiliw-giliw na malaman na ang parehong mga pamamaraan, bagama't maaari silang magbigay ng numerical na napaka-ibang mga resulta, ay istatistika mas marami o mas kaunti katumbas: ang pangalawa ay mas sensitibo sa mga biglaang pagbabago sa isang tugma. Sa kasong ito, at upang gawing malinaw na walang bitag o karton, ang pagkalkula ay isinagawa ng BOTH method.

Mga Resulta

Kaya, kapag ang lahat ng data ay ipinasok sa isang talahanayan ng Excel, ang mga sumusunod ay nakuha:

-Ang average na pagkakaiba-iba sa pangkalahatang intensyon sa pagboto para sa Metroscopia polls ay (ayon sa Manhattan) 8,55 puntos/buwan. Ang karaniwang paglihis ay 4.76 puntos/buwan

-Ang average na pagkakaiba-iba sa intensyon na bumoto sa buong mundo para sa Metroscopia polls ay (Euclidean) 4,51 puntos/buwan. Ang karaniwang paglihis ay 2,5 puntos/buwan

Konklusyon

Tumutok tayo sa pamamaraan ng Manhattan, na mas madaling maunawaan:

Lumalabas na kung ihahambing natin ang pandaigdigang resulta ng 20-D sa survey bago ang halalan na inilathala ng Metroscopia sa katapusan ng Nobyembre, makukuha natin iyon sa loob lamang ng isang buwan, at sa pag-aakalang ito ay totoo, ang mga naipong variation ng lahat the parties (especially C's and Podemos) give... are you sitting

 28,5 puntos/buwan!!!.

Sa madaling salita, kung totoo ang nai-publish, sa loob ng 23-25 ​​na araw na lumipas mula noong nakolekta ang data mula sa nabanggit na survey hanggang sa mga halalan, ang bilis ng pagbabago ng intensyon na bumoto QUADRUPLED ang normal. Sa katunayan, ang pagkakaiba-iba lamang ng C, na may pagbaba ng 11 puntos/buwan, ay wala na sa mga chart.

Well, ito ay nananatili lamang upang makita kung hanggang saan ito maanomalyang. At para doon ay inilalapat namin ang eksaktong parehong pamantayan na ipinaliwanag sa nakaraang artikulo. Sa partikular, ang paglihis mula sa average ay napakalaki ng 4,2 beses ang karaniwang paglihis, at nangangahulugan iyon na…

Ang posibilidad na ang pagkakamali sa survey ng Metroscopia noong 29/11/15 ay resulta ng mga tunay na pagkakaiba-iba sa intensyon na bumoto sa panahon ng kampanya ay: 0.0027%. Ibig sabihin, isa sa 37000.

Kung uulitin natin ang mga kalkulasyon para sa pamamaraang Euclidean, makakakuha tayo ng halos magkaparehong resulta: ang posibilidad ay 0.0022%. Ibig sabihin, isa sa pagitan 45000: perpektong naaayon sa itaas.

Totoo na ang isang kampanyang elektoral ay hindi isang "normal" na panahon at dapat na ipagpalagay na ang boto ay may posibilidad na mag-iba nang mas biglaan at "kinakabahan" (bagaman may mga sosyolohikal na pag-aaral na itinatanggi ito, na nagsasabi na ang impluwensya ng kampanya sa botante ay halos wala). Ngunit, sapat na upang salungatin ang malalakas na bilang na ito? Hinahayaan ko ang lahat na gumawa ng kanilang sariling mga konklusyon.

-

Tandaan: kapag gumagawa ng mga kalkulasyon, ang huling survey ng Metroscopia pre-election ay itinapon, dahil nagpapakita ito ng mga variation na masyadong biglaan at napapanahon (maging diplomatiko tayo) na may paggalang sa nauna. Gayunpaman, kung ito ay kasama, ang posibilidad ay magiging 1 sa 200, humigit-kumulang.

Isang artikulo ni Victorino Garcia.

 

Ang iyong opinyon

Mayroong mga ilang pamantayan magkomento Kung hindi sila sinunod, hahantong sila sa agaran at permanenteng pagpapatalsik mula sa website.

Walang pananagutan ang EM para sa mga opinyon ng mga gumagamit nito.

Gusto mo ba kaming suportahan? Maging isang Patron at makakuha ng eksklusibong access sa mga dashboard.

sumuskribi
Ipaalam ang tungkol sa
64 Komento
Pinakabago
Pinakamatanda Karamihan Binoto
Mga Paunang puna sa Inline
Tingnan ang lahat ng mga komento

VIP Buwanang Patronkaragdagang impormasyon
eksklusibong benepisyo: ganap na pag-access: preview ng mga panel ilang oras bago ang kanilang pampublikong publikasyon, panel para sa pangkalahatan: (breakdown ng mga upuan at boto ayon sa mga lalawigan at partido, mapa ng nanalong partido ayon sa mga lalawigan), electoPanel nagsasarili eksklusibong dalawang linggo, eksklusibong seksyon para sa mga Patron sa El Foro at electoPanel especial VIP eksklusibo buwan-buwan.
€ 3,5 bawat buwan
Quarterly VIP Patternkaragdagang impormasyon
eksklusibong benepisyo: ganap na pag-access: preview ng mga panel ilang oras bago ang kanilang bukas na publikasyon, panel para sa pangkalahatan: (breakdown ng mga upuan at boto ayon sa mga lalawigan at partido, mapa ng nanalong partido ayon sa mga lalawigan), electoPanel nagsasarili eksklusibong dalawang linggo, eksklusibong seksyon para sa mga Patron sa El Foro at electoPanel especial VIP eksklusibo buwan-buwan.
€10,5 para sa 3 na buwan
Semester VIP Patternkaragdagang impormasyon
eksklusibong benepisyo: Advance ng mga panel ilang oras bago ang kanilang bukas na publikasyon, panel para sa mga heneral: (breakdown ng mga upuan at pagboto ayon sa mga probinsya at partido, mapa ng nanalong partido ayon sa mga probinsya), eksklusibong biweekly autonomous electoPanel, eksklusibong seksyon para sa mga Patron sa El Foro at electoPanel eksklusibo buwanang VIP na espesyal.
€21 para sa 6 na buwan
Taunang VIP Skipperkaragdagang impormasyon
eksklusibong benepisyo: ganap na pag-access: preview ng mga panel ilang oras bago ang kanilang bukas na publikasyon, panel para sa pangkalahatan: (breakdown ng mga upuan at boto ayon sa mga lalawigan at partido, mapa ng nanalong partido ayon sa mga lalawigan), electoPanel nagsasarili eksklusibong dalawang linggo, eksklusibong seksyon para sa mga Patron sa El Foro at electoPanel especial VIP eksklusibo buwan-buwan.
€35 para sa 1 taon

Makipag-ugnay sa amin


64
0
Gusto pag-ibig ang iyong mga saloobin, mangyaring magkomento.x
?>