viernes, 1 de mayo de 2015

Col sopa nun se xuega...

    Toos comimos daqué vegada sopa de lletres, cuando en casa hai neños ye algo qu’hai que tener n’alacena. La verdá que ye bien entretenio comer sopa de lletres con neños, puedees formar pallabres mentantes comes, y buscar el to nome ente’l caldu. Ya de grandín entamé a fixame’n que depende la garciellada unes lletres apaecíen más qu’otres, anque siempre cavilé qu’eses diferencies debíen ser coses del azar; poro vi que eso nun yera asina siempre una tardiquina, sentaú n’antoxana casa, xugando a los “cacharritos” cola mio fia. 


    Garráremos unos puñaos de fideos de sopa de lletres crugos pa xugar, y reparé otra vegada na distribución de les lletres, la A y la O apaecíen con más frecuencia, o eso paecía, ¿sedría por azar, o ye qu’el fabricante metía más “as” y “os”? Nun quedaba otra qu’usar l’análisis estadísticu pa retrucar la entruga.
    Garré un puñáu de lletres (215 pa ser esautos), y cunté cuantes vegaes apaecía cada lletra:


Numberu de vegaes qu'apaeció cada lletres o frecuenca oservada

    Como ves la A y la O apaecíen muches más vegaes (21 vegaes) que les otres, depués  apaecíen  otres con más de 10 repiticiones como la D, H, Q o la S. Toos sabemos qu’el azar ye caprichosu y munches vegaes engáñanos, tinía qu’asegurame qu’estes diferences nun yeren causa d’él, por suerte problemas como estos soceden en tolos ámbitos de la investicagión, polo que cuantayá qu’hai una ferramienta perútil pa caltriar cuando un socesu ye o no productu del azar, ye’l análisis de frecuencies.
    Nesti casu la frecuencia ye’l númberu de vegaes qu’apaez una lletres, y lo que queremos saber ye si eses lletres que apaecen más son productu del azar o non.     Podemos entamar reflexonando sobre cuála sedría la distribución de frecuencies si toes les lletres saliesen el mesmo númberu de vegaes, pa ello calculamos la frecuencia esperada, que ye el númberu de lletres total (215) ente’l númberu de lletres qu’apaecieron (26), o sía 8,27 vegaes, más o menos 8 o 9 vegaes, los datos que tomamos del puñáu del sopa nun s’asemeyen muncho a esto pol azar, poro l’azar a partir de cierto númberu d’elementos déxase sentir menos, y la distribución aseméyase más a la realidá; les 215 lletres son bastantes p’averamos bastante a lo que socede (ya te cuntaré porqué n’otra entrada), entós les frecuencies son productu del azar y hai diferencia na distribución dalgunes lletres. Por ciertu nel análisis quité la lletra I, por que yera perpequeña y de xugar con elles perdiéranse muches, asina que pa nun sesgar el resultáu quiteles.
    Sabemos la distribución esperada, sabemos la oservada, porqué nun restamos una de la otra, si les diferencies son grandes algo tendrá qu’haber, ¿non? Nesto ye lo que se sofita la prueba de chi cuadráu o de bondá d’axuste, anque p’agrandar estes diferencies eleven al cuadráu la resta y dividen ente la frecuencia esperada:


    Asina vemos qu’el resultáu d’unes lletres y otres destrema enforma, los qu’idearon esti métodu, vieron que si sumaben tolos resultaos d’aplicar la fórmula pa caúna de les lletres, y lo comparaben una tabla con resultaos teóricos estadísticos pa dellos percentaxes d’error podíen saber si les diferencies qu’apaecen son frutu del azar nesi percentaxe o non. Polo xeneral nun s’admite muncho error, y suele aceutase que los resultaos nun son frutu del azar a partir del 5%, anque’n munchos ámbitos nun s’aceuta hasta el 1%, esto quier dicir que namás qu´hai una posibilidá ente 100 de que una distribución de frecuencies sea por azar, pamique bastante poco, más cuando tenemos amueses grandes.
    Pal exemplu del sopa de lletres la suma de toos los resultaos ye 62,53, esti númberu nun te diz nada, pero’l comparalu col resultáu de la tabla de resultaos teóricos pa esi númberu de variables (26 lletres) y con 1% d’error, vi que yera perdestremáu, 44,31. Cuando’l resultáu ye más altu qu’el teóricu sabemos que la distribución nun se debe a l’azar, sinón que hai daqué que produz esa diferencia, quiciabes el fabricante mete más lletres A y O por daqué motivu, como por aforrar en producción.
    Apaez otra entruga agora, yeren solo les lletres A y O les qu’apaecen más veces de lo que cabría esperar, o aquelles qu’apaecíen más de 10 vegaes tamién lo faen de forma fortuita. Ye fácil de saber, quitamos les lletres A y O, y volvemos a facer l’análisis, esta vegada con un total 173 lletres y 24 diferentes. El resultáu 23, 02, qu’al comparar cola tabla nun solo ye menor al nivel del 1%, sinón que ye menor con un cachu qu’al nivel del 5%, polo xeneral con errores mayores ya nun s’aceuta una hipótesis de que hai diferencies sentibles ente una y otra distribución, asina que paecía ser que les lletres A y O yeren les culpables d’esa diferencia. 




    ¿Qué socedió cuando la neña y la muyer fueron pala camina, y quedé yo solu na cocina? Púnxeme a cuntar más puñaos, con mesmos resultaos (la I apaecía igual que toes), la marca de sopa metía más lletres A y O qu’otres.  Pa confirmalu escribí un corréu entrugándoyoslo. Col problema fináu colé pala cama, y a la vera la rapacina durmime tranquilu.

Postdata: de momentu la marca de la pastia del sopa lletres nun retrucó’l mensaxe, qu’estraña confabulación tendrán, sedrá un códigu, o sedrá que ye más baratu facer “aes” y “oes”.

   

1 comentario:

  1. Lo primero, qué paciencia tienes ;)
    Y lo segundo me ha encantado la entrada. Resulta curioso que solo dos letras sean las que más se repitan, cuando por lógica, si se hiciera la misma cantidad de cada letra, tendrían que aparecer en una proporción similar.
    A ver si te contestan, que siento curiosidad jejeje ;)

    ResponderEliminar