miércoles, 20 de mayo de 2015

Col sopa nun se xuega (estaya segunda)

   Va dellos díes qu’asoleyé la entrada sobre la distribución de frecuencies de les lletres del sopa (http://cienciaastur.blogspot.com.es/2015/05/col-sopa-nun-se-xuega.html), nun m’espereba yo que diba adicar tan bien el tema, y que diera’n milenta comentarios na muria de facebook, nel mio corréu y en presona, toos sobre si podría tar venceyada la distribución de frecuencies de les lletres  del sopa cola distribución d’usu de les lletres d’una llingüa (la marca de sopa yera española, polo que sedría’l castellanu). Güei vamos tratar d’atalantar si hai o non tala relación.
   Pa tal fin tuve a la gueta de les frecuencies d’usu de delles llingües del nueso arrodiu, coles que facer comparanza cola frecuencia qu’atopé cuntado los fideos de les sopes de lletres, cuntado qu’el pais d’orixen del productu fuese dalguno usaren daqué llingua de les que m’informé. Puedes ver na tabla les diferentes frecuencies, a golpe de vista parezse más l’usu ente toles llingues (a lo cabero toes son derivaes, direuta o indireutamente, de la llingua indoeuropea) que a la distribución de frecuencies de los fideos. 

Distribución de frecuencies de les lletres en distintes llingües y nel sopa de lletres

   Poro, como sabes, en ciencia (y en la vida en xeneral) nun sirven conxetures sobre lo que nos paez a nós, hai que sofitase’n daqué, pa ello, y anque hai preseos más concretos pa ello, y como esto ye un blogue de ciencia amateur, decidí usar uno que ya usemos otra vegada, que da resultaos nos que podemos enfotar y ye bien cenciellu d’usar, el coeficiente de correllación, que ya usara pa comprobar si l’escanciáu del café na mio taza valíanos p’augiar la presión atmostéfico (http://cienciaastur.blogspot.com.es/2015/02/ye-un-barometru-la-mio-taza-de-cafe.html). Daquella’l coeficiente dicía si había venceyamientu ente les dos variables (si una medrada a la par que la otra) y en qué midida; nesta ocasión va dicinos cuánto d’asemeyáu ye una y otra distribución de frecuencia pa caún de los pares de llingües y sopa posibles.
   Pa refrescar la memoria alcuerdate qu’el valor de la correllación taba siempre ente 1 y -1, siendo 1 una correllación direuta, nesti casu les dos llingües tienen la mesma distribución de frecuencies, y -1 negativa, y que 0 sedría que nun s’asemeyen nada, los valores entemedies indiquén el cuánto de asemeyaes son los pares de llingües, polo xeneral (anque depende de l’amuesa) si ta perbaxo el 0,5 nun hai venceyamientu o ye persele, a partir d’ehí tarán más venceyaes a midida que nos averamos al 1 (o -1 nel casu de facelo de forma negativa).
   Lo qu’atopé foi la tabla que sigui, ye lo que parecía a lo primero tán toes pervenceyaes unes con otres menos la distribución de los fideos:

Coeficiente de correllación pa caún de los pares de llingües y los fideos

   Nun nos tenía que garrar de sustu, qu’el castellanu y el francés seyan les más veceyaes (siempre falando de la distribución d’usu de les lletres, y non de la llingua mesma, cuidáu con esto), seguíu del inglés y l’alemán (nun miré l’italianu, pero de xuru que taba más averáu al castellanu). No que respeuta a los fideos de les sopes, nun s’asemeyaba a nenguna llingüa, la más averada’l castellanu, pero con un valor perbaxo (0,37), perpoco pa cabilar que tienen la mesma distribución, les otres peor tovía, l’alemán hasta con valores negativos.
   Pa comprobar el resultáu fici un análisis de conglomeraos (una triba d'análisis multivarienta) que busca atopar los elementos más asemeyaos y rescampla les diferencies ente los grupos, esplicate cómo se fae nesta entrada diba ser enguedeyame muncho, asina que prométote falar d’ello n’otra entrada con un exemplu illustrativu, ya que pal científicu amateur ye perinteresante conocer esti preséu. Bono a lo que diba, fici esti análisis, con resultaos perasemeyaos a los del de correllación, puedes ver el dendrograma resultante:

Dendrograma que fici a lo cabero del análisis de conglomeraos

   Nél vemos que cuanto más separtaes, a lo alto, tán les distribuciones de frecuencies de dos llingües más estremen estes, y que como ves tán toes apiñaes alredor d’un mesmo valor, menos la distribución de la sopa lletres, que ta un cachu grande perriba de toes les demás, hasta del castellanu. Entós si la distribución de frecuencies d’aparición de cada lletra nel sopa nun sigui patrones de nenguna llingüa, ¿qué criteriu sigue la marca? Pamique sedrá un misteriu que nun vamos poder resolver col métodu científicu, o quiciabes si...
 
Postdata: La marca entá nun me retrucó, voi intentalo otra vegada, a ver si somos quien a saber el porque d’esa caprichosa distribución.

lunes, 11 de mayo de 2015

Les otres matemátiques: píldores alternatives a les lleiciones gafes de mates

Calcular la media ensin mates: media y centru de gravedá

    Tolos que lleen esti blogue ya saben que Toño, el mio profesor de mates de secundaria (ver per exemplu: http://cienciaastur.blogspot.com.es/2015/04/les-otres-matematiques-pildores.html, http://cienciaastur.blogspot.com.es/2015/02/les-otres-matematiques-pildores_28.html),prestaba-y aprendenos d’au viníen les fórmules, el porqué d’elles; asina que cuando entamamos cola estadística atopó una mena d’au sacar temes palos sos desvaríos. Especial señaldá (polo esclariador que foi pa mio) teo de la vegada que nos cuntó l’orixe de la media aritmética, y ensin malapenes un recursu matemáticu, de forma totalmente empírica.


    Más o menos toos sabemos que la media o permediu calcúlase sumando’l valor de tolos datos, y dividiéndo la suma pol númberu de datos, tien quedar pernidio que nun ye nin el  puntu mediu (sedría la mediana) nin el valor que repítise más (la moda). Daquella Toño, pidiéranos que-y dixéramos el pesu nueso. Con esos datos, y los de les otres tres clases de tercero, tuviéramos trabayando enforma calculando los estadísticos que tábamos deprendiendo, dicía que yera más didáuticu facelo con datos reales que colos que traía’l nueso llibru. Cuando tocó calcular la media del pesu de tolos alumnos de tercero, atopáramos que yera 74.74 kg.
 
Distribución de frecuencies del pesu de los alumnos de terceru de mio promoción (n=111).

    Pero, a lo cabero de la clase d’esi día, entrugonos la mesma entruga de siempre:
-Puede dicime daquién porqué esto ye asina.-Naide retrucó. – Supongo que a estos altores ya vos diría Josefina (la profesora de ciencies experimentales, que ye cómo se nomaba daquella a la asignatura de física y química) cómo calcular el centru de gravedá d’un cuerpu, ¿non?- afirmamos toos, más o menos. –Pues la media aritmética tien muncho que ver col centru de gravedá.
Habíamos graficáu los datos de los pesos, asina que sacó una fueya cola gráfica impresa, que recortó darréu por tola so contorna, garróla , y sofitando la base de la gráfica nel llápiz y apoyada na pizarra, foi equillibrándola a un llau y a otru del llápiz hasta que quedó horizontal.


    -¿Cuál ye’l puntu d’equillibriu? ¿Podéis velu?
    Una de les d’alantre dixo: -74, non 75, bono cerca de 75...
    -Ehí, concretamente ta en 74,74 kg, ehí tenéis la media aritmética. Si vos dais cuenta, la gráfica representa los vuesos pesos, polo que ye proporcional a ellos, si en vez de la gráfica pusiesevos a toos en filera nun tablón, pa equillibralu tendría que poner un tochu madera ente los que pesen 74 y 75, o un poco averáu a los de 75.
    Sonó la sirena, y como yera la última clase colamos pa casa. Dubio muncho qu’otros compañeros de clase fuesen pa casa cabilando nello, pero yo aquella tarde, tuve dándo-y vueltes al asuntu, probé delles gráfiques col métodu de Toño, y  depués probé a busca-yos el centru de gravedá como nos deprendiera Josefina (otra mayestra que fexo güelga en mio, y de la que de xuru falo de ralu’n ralu), lo que Toño dixera yera bien cierto, el centru de gravedá coincidía cola media aritmética.

viernes, 8 de mayo de 2015

Cuntando a bultu: ¿cómo estimamos los humanos los grandes grupos?

    Cuantayá, cola idea d’atalantar el grau de precisión que tienen los ornitólogos pa estimar el númberu d’aves d’un báramu, fici un experimentu con dellos oservadores (con distintos niveles d’esperiencia). N’él enseñaba unes semeyes de báramos d’aves, los participantes tiníen estimar el númberu d’aves qu’había depués de mirar la semeya dos segundos, el númberu d’aves taba ente 1 y 100, y en munchos casos el númberu d’aves del báramu repitíase, pero con diferente distribución. Los resultaos destremaron muncho en función de la esperiencia del oservador (aunque non tanto como se pudiese pensar), sicasí toos estimaron bien los báramos pequeños, de 1 a 10 aves, d’ehí p’alantre  les diferencies disparábense, pero toos tuvieron tendencia a infravalorar el númberu que formaba un grupu grande. Aquellos datos una vez usados palos mios propósitos quedaron escaecíos nel archivu mio. El pasu del tiempu vieno a da-yos nuevu protagonismu, non ya p’atalantar cuán d’entrenaos tán los paxareros n’estimar grupos, sinon cómo concibe la mente humana les cantidaes d’oxetos reales.



A bultu, ¿cuántos estorninos hai?
     Los humanos tendemos a cabilar qu'el nueso conceuto del mundu ye la que siempre esistió, y el que prevalez sobre los demás, algo perllonxanu de la realidá, nin siquiera angüaño. Esisten fautores culturales que condicionen el nueso pensamientu, ente ellos la nuesa manera de cuntar, tamos tan avezaos a la aritmética que pensamos qu’el ser humán siempre cuntó, cuando’n realidá la mayor parte de les sociedaes de cazadores-esbilladores actuales, y quiciabes ancestrales, nun tienen nel vocabulariu so más qu’el un y el dos, pal restu afáyense ensín numberales, asina ye común que digan “una mano” pa nomar a los númberos averaos a cinco, poro ensin muncha esautitú, lo mesmo pa los numberales “dos manos” o “dos manos y dos pies” que definen a númberos averaos a 10 o 20 respeutivamente, pa otros númberos mayores pueden dicir “munchos” o “munchísimos”. Nun cuenten, nun lo necesiten, lo mesmo que pasa con otros animales. Hai que tener nes cuentes que l’aritmética ñació como un preseu de les sociedaes agrícoles, por mor la so necesidá de llevar les cuentes de les sos reserves de granos y otros productos.
    Si los cazadores-esbilladores nun cuenten, cómo conciben el tamañu de los grupos de les  preses o enemigos. Fae dellos años la revista Sciencie (DEHAENE et al., 2008) espublicaba un artículu que dexaba patente que los cazadores-esbilladores, tres facer un test (en cierto mou asemeyáu al que fici yo a los ornitólogos), tienen una perceución destremada a la que tenemos nós, los ocidentales, al estimar grupos de ente 1 y 10 elementos, estos conciben les cantidaes de forma llogarítmica mentantes que los humanos con educación “ocidental” facémoslo de forma llineal, la mesma conceición tiénenla los ornitólogos al estimar báramos d’aves d’ente 1 y 10 aves. 
Númberu d'aves del grupu y númberu estimáu polos ornitólogos


    ¿Támos ante un rasgu cultural o tenemos formes destremaes de ver les coses? Parez llóxicu pensar que la escala llineal ye la más natural, pero cómo podemos esplicar entós que los individuos que nun tuvieron contauto cola aritmética vean de forma llogarítmica, tamos ante un efeuto cultural. Cuando grafiqué los datos de les estimaciones de los báramos de 10 a 100 aves vs. el valor real del grupu, por increíble que paeza, apaeció un patrón llogarítmicu. 

Númberu d'aves del grupu y númberu estimáu polos ornitólogos

    ¿Por qué esa diferencia? Quiciabes a que los báramos pequeños podemos contalos rápido y por tanto  podemos representarlos de forma llineal, mentantes que los grandes estimamos a bultu, quiciabes de la forma natural ¿podría ser? Todo apunta a que ye asina. La revista Child Development (SIEGLER & BOOTH, 2004) asoleyaba un interesante artículu que dexábalo pernido, los autores ficieron un esperimentu con neños, que separtaron en tres grupos (5-6 años, 6-7 años y 7-8 años), mandaben-yos colocar númberos del 1 al 100 n’una reuta, en función d’áu creyíen ellos que yera la posición correuta. Lo qu'asocedió foi chocante (anque esperable colo que sabemos), según diben avanzando nel so aprendizaxe de matemátiques la representación de los númberos na reuta pasaba d’una conceición llogarítmica a una llineal, lo mesmo sucedió-y a DEHAENE y los sos collaboradores, cuando aumentaron el númberu de elementos na so prueba a “ocidentales”, con muchos puntos la so perceipción de les cantidaes yera como la de los cazadores-esbilladores. Paez ser, entós, que la escala llineal ye frutu de la educación y la cultura, ye más,  pruebes con animales dan resultados nesta llinia, ya que comparen cantidaes en función del so ratio, y non na diferencia ente elles, quiciabes ye meyor, falando evolutivamente, estimar cantidaes a bultu, que pararse a cuntales, por tanto ye del todo llógicu pensar qu’ante la falta de recursos matemáticos pa precisar el númberu d’oxetos faigamos usu de la nuesa programación por defeutu, y cuntemos a bultu.

viernes, 1 de mayo de 2015

Col sopa nun se xuega...

    Toos comimos daqué vegada sopa de lletres, cuando en casa hai neños ye algo qu’hai que tener n’alacena. La verdá que ye bien entretenio comer sopa de lletres con neños, puedees formar pallabres mentantes comes, y buscar el to nome ente’l caldu. Ya de grandín entamé a fixame’n que depende la garciellada unes lletres apaecíen más qu’otres, anque siempre cavilé qu’eses diferencies debíen ser coses del azar; poro vi que eso nun yera asina siempre una tardiquina, sentaú n’antoxana casa, xugando a los “cacharritos” cola mio fia. 


    Garráremos unos puñaos de fideos de sopa de lletres crugos pa xugar, y reparé otra vegada na distribución de les lletres, la A y la O apaecíen con más frecuencia, o eso paecía, ¿sedría por azar, o ye qu’el fabricante metía más “as” y “os”? Nun quedaba otra qu’usar l’análisis estadísticu pa retrucar la entruga.
    Garré un puñáu de lletres (215 pa ser esautos), y cunté cuantes vegaes apaecía cada lletra:


Numberu de vegaes qu'apaeció cada lletres o frecuenca oservada

    Como ves la A y la O apaecíen muches más vegaes (21 vegaes) que les otres, depués  apaecíen  otres con más de 10 repiticiones como la D, H, Q o la S. Toos sabemos qu’el azar ye caprichosu y munches vegaes engáñanos, tinía qu’asegurame qu’estes diferences nun yeren causa d’él, por suerte problemas como estos soceden en tolos ámbitos de la investicagión, polo que cuantayá qu’hai una ferramienta perútil pa caltriar cuando un socesu ye o no productu del azar, ye’l análisis de frecuencies.
    Nesti casu la frecuencia ye’l númberu de vegaes qu’apaez una lletres, y lo que queremos saber ye si eses lletres que apaecen más son productu del azar o non.     Podemos entamar reflexonando sobre cuála sedría la distribución de frecuencies si toes les lletres saliesen el mesmo númberu de vegaes, pa ello calculamos la frecuencia esperada, que ye el númberu de lletres total (215) ente’l númberu de lletres qu’apaecieron (26), o sía 8,27 vegaes, más o menos 8 o 9 vegaes, los datos que tomamos del puñáu del sopa nun s’asemeyen muncho a esto pol azar, poro l’azar a partir de cierto númberu d’elementos déxase sentir menos, y la distribución aseméyase más a la realidá; les 215 lletres son bastantes p’averamos bastante a lo que socede (ya te cuntaré porqué n’otra entrada), entós les frecuencies son productu del azar y hai diferencia na distribución dalgunes lletres. Por ciertu nel análisis quité la lletra I, por que yera perpequeña y de xugar con elles perdiéranse muches, asina que pa nun sesgar el resultáu quiteles.
    Sabemos la distribución esperada, sabemos la oservada, porqué nun restamos una de la otra, si les diferencies son grandes algo tendrá qu’haber, ¿non? Nesto ye lo que se sofita la prueba de chi cuadráu o de bondá d’axuste, anque p’agrandar estes diferencies eleven al cuadráu la resta y dividen ente la frecuencia esperada:


    Asina vemos qu’el resultáu d’unes lletres y otres destrema enforma, los qu’idearon esti métodu, vieron que si sumaben tolos resultaos d’aplicar la fórmula pa caúna de les lletres, y lo comparaben una tabla con resultaos teóricos estadísticos pa dellos percentaxes d’error podíen saber si les diferencies qu’apaecen son frutu del azar nesi percentaxe o non. Polo xeneral nun s’admite muncho error, y suele aceutase que los resultaos nun son frutu del azar a partir del 5%, anque’n munchos ámbitos nun s’aceuta hasta el 1%, esto quier dicir que namás qu´hai una posibilidá ente 100 de que una distribución de frecuencies sea por azar, pamique bastante poco, más cuando tenemos amueses grandes.
    Pal exemplu del sopa de lletres la suma de toos los resultaos ye 62,53, esti númberu nun te diz nada, pero’l comparalu col resultáu de la tabla de resultaos teóricos pa esi númberu de variables (26 lletres) y con 1% d’error, vi que yera perdestremáu, 44,31. Cuando’l resultáu ye más altu qu’el teóricu sabemos que la distribución nun se debe a l’azar, sinón que hai daqué que produz esa diferencia, quiciabes el fabricante mete más lletres A y O por daqué motivu, como por aforrar en producción.
    Apaez otra entruga agora, yeren solo les lletres A y O les qu’apaecen más veces de lo que cabría esperar, o aquelles qu’apaecíen más de 10 vegaes tamién lo faen de forma fortuita. Ye fácil de saber, quitamos les lletres A y O, y volvemos a facer l’análisis, esta vegada con un total 173 lletres y 24 diferentes. El resultáu 23, 02, qu’al comparar cola tabla nun solo ye menor al nivel del 1%, sinón que ye menor con un cachu qu’al nivel del 5%, polo xeneral con errores mayores ya nun s’aceuta una hipótesis de que hai diferencies sentibles ente una y otra distribución, asina que paecía ser que les lletres A y O yeren les culpables d’esa diferencia. 




    ¿Qué socedió cuando la neña y la muyer fueron pala camina, y quedé yo solu na cocina? Púnxeme a cuntar más puñaos, con mesmos resultaos (la I apaecía igual que toes), la marca de sopa metía más lletres A y O qu’otres.  Pa confirmalu escribí un corréu entrugándoyoslo. Col problema fináu colé pala cama, y a la vera la rapacina durmime tranquilu.

Postdata: de momentu la marca de la pastia del sopa lletres nun retrucó’l mensaxe, qu’estraña confabulación tendrán, sedrá un códigu, o sedrá que ye más baratu facer “aes” y “oes”.