SPSS: diferència entre les revisions

2.430 bytes afegits ,  3 juny 2014
m
Text replacement - "[[Imatge:" to "[[Image:"
m (Text replacement - "[[Imatge:" to "[[Image:")
 
(32 revisions intermèdies per 5 usuaris que no es mostren)
Línia 22: Línia 22:


'''Lloc, dates i durada''': El curs té una durada de 20 hores repartides en 5 sessios:
'''Lloc, dates i durada''': El curs té una durada de 20 hores repartides en 5 sessios:
{|border=1
|-
|EAP
|Sessió 1
|Sessió 2
|Sessió 3
|Sessió 4
|Sessió 5
|-
|Raval Nord
|???
|20-4-07 12:30h-14:30h
|Pendent
|Pendent
|Pendent
|-
|Raval Sud
|???
|20-4-07 10h-12h
|Pendent
|Pendent
|Pendent
|-
|La Pau
|18-4-07 16h-18h
|Pendent
|Pendent
|Pendent
|Pendent
|}


'''Certificació''': es lliurarà un certificat d’assistència a tots els alumnes que assisteixin al 80% de les hores lectives del curs. En el certificat  constarà el nombre d’hores del curs i el registre corresponent.
'''Certificació''': es lliurarà un certificat d’assistència a tots els alumnes que assisteixin al 80% de les hores lectives del curs. En el certificat  constarà el nombre d’hores del curs i el registre corresponent.
Línia 80: Línia 49:
   - material i mètodes: descriptiu, variables (edat, pes o prim si/no i estat civil)
   - material i mètodes: descriptiu, variables (edat, pes o prim si/no i estat civil)
   - resultats:  
   - resultats:  
     1. comparar les mitjanes de pes per a cadascun dels estats civils
     1. comparar la proporció de prims en cadascun dels estats civils (objectiu principal)
     2. comparar la proporció de prims en cadascun dels estats civils
     2. comparar les mitjanes d'edat dels prims i dels no prims (confusió)
    3. comparar la mitjana d'edat amb l'estat civil (confusió)
   - conclusions: en funció dels resultats
   - conclusions: en funció dels resultats


Línia 92: Línia 62:
L'SPSS funciona com qualsevol altre programa, amb els iconos i els menús de la part de dalt que anirem veient per què serveixen alguns d'ells poc a poc. L'SPSS a més té varies pantalles que serveixen per diferents coses. Ara les veurem, només per conèixer-les.
L'SPSS funciona com qualsevol altre programa, amb els iconos i els menús de la part de dalt que anirem veient per què serveixen alguns d'ells poc a poc. L'SPSS a més té varies pantalles que serveixen per diferents coses. Ara les veurem, només per conèixer-les.


#La pantalla que ens surt primer de tot és la pantalla on hi hauran les '''nostres dades''' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf1.JPG (Figura 1)]. A les files normalment hi ha els pacients i a les columnes les diferents variables que hem recollit. Si mirem la part de baix de la pantalla, veurem que hi ha dues pestanyes: la que posa ''data view'' que és la que acabem de veure i la que posa ''variable view''. Aneu a la que posa ''variable view'' i veureu que ara canvia: les files ara son les variables i les columnes son les característiques de cadascuna de les variables. [[Imatge:SPSSf1.JPG|thumb|320px|center|Figura 1]]
#La pantalla que ens surt primer de tot és la pantalla on hi hauran les '''nostres dades''' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf1.JPG (Figura 1)]. A les files normalment hi ha els pacients i a les columnes les diferents variables que hem recollit. Si mirem la part de baix de la pantalla, veurem que hi ha dues pestanyes: la que posa ''data view'' que és la que acabem de veure i la que posa ''variable view''. Aneu a la que posa ''variable view'' i veureu que ara canvia: les files ara son les variables i les columnes son les característiques de cadascuna de les variables. [[Image:SPSSf1.JPG|thumb|320px|center|Figura 1]]
#Després tenim la pantalla que es diu '''sintaxi''' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf2.JPG (Figura 2)]. És on s'escriuran les ordres per a l'anàlisi de les nostres dades. Molta gent no ho fa servir,però és molt útil fer servir la sintaxi ja que així guardem pas per pas tot el què fem i si algun dia canviem alguna dada o afegim més pacients amb 10 segons tornem a tenir tot l'anàlisi fet.[[Imatge:SPSSf2.JPG|thumb|320px|center|Figura 2]]
#Després tenim la pantalla que es diu '''sintaxi''' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf2.JPG (Figura 2)]. És on s'escriuran les ordres per a l'anàlisi de les nostres dades. Molta gent no ho fa servir,però és molt útil fer servir la sintaxi ja que així guardem pas per pas tot el què fem i si algun dia canviem alguna dada o afegim més pacients amb 10 segons tornem a tenir tot l'anàlisi fet.[[Image:SPSSf2.JPG|thumb|320px|center|Figura 2]]
#I finalment tenim la pantalla dels '''resultats o output''' en anglès, que és on ens sortiran les taules i gràfics que nosaltres li direm que ens faci. De moment no veiem la pantalla perquè com que no tenim dades no podem tenir cap resultat.
#I finalment tenim la pantalla dels '''resultats o output''' en anglès, que és on ens sortiran les taules i gràfics que nosaltres li direm que ens faci. De moment no veiem la pantalla perquè com que no tenim dades no podem tenir cap resultat.


Línia 103: Línia 73:
*Per '''importar una base de dades en Access''', hem de fer el següent. Haurem d'anar a ''file'' -> ''open database'' -> ''new query'' -> ens hem de posar damunt de ''MS Access Database'' -> ''siguiente''.  
*Per '''importar una base de dades en Access''', hem de fer el següent. Haurem d'anar a ''file'' -> ''open database'' -> ''new query'' -> ens hem de posar damunt de ''MS Access Database'' -> ''siguiente''.  
*Ara ens demana on tenim la base de dades en Access. Per dir-li on la tenim piquem a ''browse'' i busquem la nostra base de dades en Access -> i un cop la tenim anem a ''l'OK''.  
*Ara ens demana on tenim la base de dades en Access. Per dir-li on la tenim piquem a ''browse'' i busquem la nostra base de dades en Access -> i un cop la tenim anem a ''l'OK''.  
*Ara ens surt una pantalla amb la taula principal de la nostra base de dades i totes les seves variables. Hem d'arrastrar el nom de la taula, en aquest cas ''principal'' a la finestra del costat on posa ''retrieve fields in this order''. Ens han de sortir les nostres variables al quadre de la dreta. Un cop comprovat [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf3.JPG (figura 3)] fem ''siguiente'' -> ''siguiente'' un altre cop. [[Imatge:SPSSf3.JPG|thumb|640px|center|Figura 3]]
*Ara ens surt una pantalla amb la taula principal de la nostra base de dades i totes les seves variables. Hem d'arrastrar el nom de la taula, en aquest cas ''principal'' a la finestra del costat on posa ''retrieve fields in this order''. Ens han de sortir les nostres variables al quadre de la dreta. Un cop comprovat [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf3.JPG (figura 3)] fem ''siguiente'' -> ''siguiente'' un altre cop. [[Image:SPSSf3.JPG|thumb|640px|center|Figura 3]]
*En aquesta pantalla on veiem totes les variables poden passar varies coses [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf4.JPG (figura 4)]:
*En aquesta pantalla on veiem totes les variables poden passar varies coses [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf4.JPG (figura 4)]:
**Que hagueu posat als noms de les variables símbol raro que a l'SPSS no li agradi. En aquest cas us el farà canviar.
**Que hagueu posat als noms de les variables símbol raro que a l'SPSS no li agradi. En aquest cas us el farà canviar.
**Que tingueu una variable amb diferents categories, com és el cas del nostre ''estat civil''. Com veieu, hi ha un quadradet que podem marcar o no. Si no el marquem, la variable romandrà tal quan l'hem fet, per tant, serà una variable ''tipus text''. Si el marquem, la variable es convertirà en numèrica i el text que és es convertirà en etiqueta. Això és el què ens interessa, per tant, marquem el quadradet.
**Que tingueu una variable amb diferents categories, com és el cas del nostre ''estat civil''. Com veieu, hi ha un quadradet que podem marcar o no. Si no el marquem, la variable romandrà tal quan l'hem fet, per tant, serà una variable ''tipus text''. Si el marquem, la variable es convertirà en numèrica i el text que és es convertirà en etiqueta. Això és el què ens interessa, per tant, marquem el quadradet.
[[Imatge:SPSSf4.JPG|thumb|640px|center|Figura 4]]
[[Image:SPSSf4.JPG|thumb|640px|center|Figura 4]]
*''Siguiente'' -> marquem l'opció de ''paste it'' -> ''finalizar''. Veureu que se us ha obert una nova finestra, és l'arxiu de la ''sintaxi'' de l'SPSS. I en aquest arxiu de ''sintaxi'' veiem que s'hi han escrit les ordres d'importar la base de dades a la fulla de ''dades'' de l'SPSS, però encara no les hem importat!  
*''Siguiente'' -> marquem l'opció de ''paste it'' -> ''finalizar''. Veureu que se us ha obert una nova finestra, és l'arxiu de la ''sintaxi'' de l'SPSS. I en aquest arxiu de ''sintaxi'' veiem que s'hi han escrit les ordres d'importar la base de dades a la fulla de ''dades'' de l'SPSS, però encara no les hem importat!  
*És molt útil escriure a dalt de cada ordre de sintaxi què és el què fa. Per exemple, sobre de la sintaxi que hem enganxat per importar la base de dades, podem escriure el següent per saber d'aquí uns mesos què vol dir. Per escriure a la sintaxi i que després al tirar-la no doni error, hem d'escriure el què volem entre un asterisc (*) i un punt (.), tal com es veu en el següent quadre:
*És molt útil escriure a dalt de cada ordre de sintaxi què és el què fa. Per exemple, sobre de la sintaxi que hem enganxat per importar la base de dades, podem escriure el següent per saber d'aquí uns mesos què vol dir. Per escriure a la sintaxi i que després al tirar-la no doni error, hem d'escriure el què volem entre un asterisc (*) i un punt (.), tal com es veu en el següent quadre:
   *Importar base de dades.
   *Importar base de dades.
*Per importar-les de veritat hem d'aprendre un nou concepte de l'SPSS: ''executar o tirar la sintaxi''. La sintaxi son ordres escrites que el què faran és importar la base de dades, crearan variables o ens calcularan i ensenyaran resultats. I per executar aquestes ordres el què hem de fer és seleccionar-les (seleccionar el text) i després prémer el botó del play [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf5.JPG (figura 5)]. I el què passa és que ara ja si importem realment la base de dades. Ho podem anar a comprovar mirant la finestra de les ''dades'' de l'SPSS [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf6.JPG (figura 6)]. Si veieu asteriscs a la data és que la columna és massa estreta, l'heu de fer més gran.
*Per importar-les de veritat hem d'aprendre un nou concepte de l'SPSS: ''executar o tirar la sintaxi''. La sintaxi son ordres escrites que el què faran és importar la base de dades, crearan variables o ens calcularan i ensenyaran resultats. I per executar aquestes ordres el què hem de fer és seleccionar-les (seleccionar el text) i després prémer el botó del play [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf5.JPG (figura 5)]. I el què passa és que ara ja si importem realment la base de dades. Ho podem anar a comprovar mirant la finestra de les ''dades'' de l'SPSS [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf6.JPG (figura 6)]. Si veieu asteriscs a la data és que la columna és massa estreta, l'heu de fer més gran.
[[Imatge:SPSSf5.JPG|thumb|640px|center|Figura 5]]
[[Image:SPSSf5.JPG|thumb|640px|center|Figura 5]]
[[Imatge:SPSSf6.JPG|thumb|640px|center|Figura 6]]
[[Image:SPSSf6.JPG|thumb|640px|center|Figura 6]]
Doncs ja tenim la base de dades a l'SPSS.
Doncs ja tenim la base de dades a l'SPSS.


Línia 155: Línia 125:


Les variables tenen algunes propietats que caldrà saber. Si anem a la pestanya de ''variable view'' podrem veure-ho [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf8.JPG (Figura 8)].  
Les variables tenen algunes propietats que caldrà saber. Si anem a la pestanya de ''variable view'' podrem veure-ho [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf8.JPG (Figura 8)].  
[[Imatge:SPSSf8.JPG|thumb|640px|center|Figura 8]]
[[Image:SPSSf8.JPG|thumb|640px|center|Figura 8]]
*Primer de tot, el ''nom'' o ''name'' de la variable. És el nom curt que li donem a la variable i és de la forma que li hem de dir quan volguem escriure a la sintaxi.
*Primer de tot, el ''nom'' o ''name'' de la variable. És el nom curt que li donem a la variable i és de la forma que li hem de dir quan volguem escriure a la sintaxi.
*Una variable pot ser de varis ''tipus''. Els que més farem servir serà:
*Una variable pot ser de varis ''tipus''. Els que més farem servir serà:
Línia 172: Línia 142:


Ara tenim una pantalla amb el llistat de variables a l'esquerra i tot de sub-menús a la dreta [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf9.JPG (Figura 9)].
Ara tenim una pantalla amb el llistat de variables a l'esquerra i tot de sub-menús a la dreta [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf9.JPG (Figura 9)].
[[Imatge:SPSSf9.JPG|thumb|640px|center|Figura 9]]
[[Image:SPSSf9.JPG|thumb|640px|center|Figura 9]]
*'''NHC''': a ''label'' o ''etiqueta'' hi posarem la descripció del què és: '''Número d'història clínica'''. La resta ho deixem tal com està.
*'''NHC''': a ''label'' o ''etiqueta'' hi posarem la descripció del què és: '''Número d'història clínica'''. La resta ho deixem tal com està.
*'''datan''': a ''label'' hi posem '''Data de naixement'''. A ''type'' veiem que hi ha un desplegable amb diferents tipus de formats de data. Escollim el que més ens sigui útil `per la nostra finalitat. Agafeu sempre el que tingui l'any amb 4 xifres, que si s'agafa l'any amb 2 xifres hi poden haver problemes.
*'''datan''': a ''label'' hi posem '''Data de naixement'''. A ''type'' veiem que hi ha un desplegable amb diferents tipus de formats de data. Escollim el que més ens sigui útil `per la nostra finalitat. Agafeu sempre el que tingui l'any amb 4 xifres, que si s'agafa l'any amb 2 xifres hi poden haver problemes.
Línia 200: Línia 170:
Un cop tenim les variables definides tal com ens agrada, haurem de crear la variable '''edat''' a partir de la data de naixement i de la data d'avui [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf7.JPG (Figura 7)]. També es pot fer a partir d'una altra data que tingueu com a variable en la base de dades.  
Un cop tenim les variables definides tal com ens agrada, haurem de crear la variable '''edat''' a partir de la data de naixement i de la data d'avui [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf7.JPG (Figura 7)]. També es pot fer a partir d'una altra data que tingueu com a variable en la base de dades.  


[[Imatge:SPSSf7.JPG|thumb|640px|center|Figura 7]]
[[Image:SPSSf7.JPG|thumb|640px|center|Figura 7]]


   Anem a ''transform''  
   Anem a ''transform''  
Línia 238: Línia 208:


I ens surt aquesta pantalla [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf10.JPG (Figura 10)], on haurem de dir a la dreta els valors antics i a l'esquerra els nous. Nosaltres volem que els prims siguin els que pesen menys de 70.
I ens surt aquesta pantalla [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf10.JPG (Figura 10)], on haurem de dir a la dreta els valors antics i a l'esquerra els nous. Nosaltres volem que els prims siguin els que pesen menys de 70.
[[Imatge:SPSSf10.JPG|thumb|640px|center|Figura 10]]
[[Image:SPSSf10.JPG|thumb|640px|center|Figura 10]]


   -> empleneu segons els criteris
   -> empleneu segons els criteris
Línia 313: Línia 283:
*la mostra, que són els individus que nosaltres hem estudiat i amb els que treballarem, és a dir els que tenim a la base de dades
*la mostra, que són els individus que nosaltres hem estudiat i amb els que treballarem, és a dir els que tenim a la base de dades


Quan describim la nostra mostra, el que volem en realitat no és dir, per exemple, que la mitjana d'edat dels homes casats que hem estudiat és de X anys, sinó que volem ''extrapolar'' aquest valor per poder dir que la mitjana d'edat de ''tots'' els homes casats de Barcelona és de X anys. Per fer aquest pas necessitem els intervals de confiança, que ens diran un interval de valors entre els quals podem estar relativament segurs que hi ha el veritable valor de la mitjana d'edat dels homes casats de Barcelona. El que ens diu en realitat l'interval, és que si agafessim 100 mostres de la població que volem estudiar (totes del mateix tamany de la nostra), en 95 de les 100 el valor de la mitjana estaria dins d'aquell interval. Pot ser una mica liat, però és important entendre-ho.
Quan describim la nostra mostra, el que volem en realitat no és dir, per exemple, que la mitjana d'edat dels homes casats que hem estudiat és de X anys, sinó que volem ''extrapolar'' aquest valor per poder dir que la mitjana d'edat de ''tots'' els homes casats de Barcelona és de X anys. Per fer aquest pas necessitem els intervals de confiança, que ens diran un interval de valors entre els quals podem estar relativament segurs que hi ha el veritable valor de la mitjana d'edat dels homes casats de Barcelona. El que ens diu en realitat l'interval, és que si agafessim 100 mostres de la població que volem estudiar (totes del mateix tamany de la nostra), en 95 de les 100 el valor de la mitjana estaria dins d'aquell interval. Pot ser una mica liat, però és important entendre-ho: es tracta que confiem que el 95% de les vegades l'interval conté el paràmetre, però no sabem si el nostre interval concret pertany a aquest 95% o al 5% que falla.


Com més gran és una mostra (més persones estudiem), més estret serà l'interval de confiança i per tant més informació tindrem. No és evidentment el mateix dir que la mitjana d'edat és de 45 anys amb un interval que va de 20 a 70 anys (per això no calia fer cap estudi!), que no pas dir que és de 45 anys amb un interval de 44 a 46 anys. Per això és important treballar amb mostres grans, sempre que els diners i el temps ens ho permetin!
Com més gran és una mostra (més persones estudiem), més estret serà l'interval de confiança i per tant més informació tindrem. No és evidentment el mateix dir que la mitjana d'edat és de 45 anys amb un interval que va de 20 a 70 anys (per això no calia fer cap estudi!), que no pas dir que és de 45 anys amb un interval de 44 a 46 anys. Per això és important treballar amb mostres grans, sempre que els diners i el temps ens ho permetin!
Línia 336: Línia 306:


*Per descriure la variable edat, com que és quantitativa haurem de fer un ''explore'' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf11.JPG (Figura 11)]:
*Per descriure la variable edat, com que és quantitativa haurem de fer un ''explore'' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf11.JPG (Figura 11)]:
[[Imatge:SPSSf11.JPG|thumb|640px|center|Figura 11]]
[[Image:SPSSf11.JPG|thumb|640px|center|Figura 11]]


   Anem a ''Analyze'' ->
   Anem a ''Analyze'' ->
Línia 342: Línia 312:
   ''Explore'' -> passem la variable edat a la caixa de la dreta on posa ''dependent list''
   ''Explore'' -> passem la variable edat a la caixa de la dreta on posa ''dependent list''


*Veurem que hi ha dos botons per triar les opcions d'aquesta funció [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf12.JPG (Figura 12)]: [[Imatge:SPSSf12.JPG|thumb|640px|center|Figura 12]]
*Veurem que hi ha dos botons per triar les opcions d'aquesta funció [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf12.JPG (Figura 12)]: [[Image:SPSSf12.JPG|thumb|640px|center|Figura 12]]
**El que posa ''statistics'' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf13.JPG (Figura 13)]: amb aquest triem les opcions següents: [[Imatge:SPSSf13.JPG|thumb|640px|center|Figura 13]]
**El que posa ''statistics'' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf13.JPG (Figura 13)]: amb aquest triem les opcions següents: [[Image:SPSSf13.JPG|thumb|640px|center|Figura 13]]
**El que posa ''plots'' que son gràfics: [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf14.JPG (Figura 14)]: amb aquest triem les opcions següents: [[Imatge:SPSSf14.JPG|thumb|640px|center|Figura 14]]
**El que posa ''plots'' que son gràfics: [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf14.JPG (Figura 14)]: amb aquest triem les opcions següents: [[Image:SPSSf14.JPG|thumb|640px|center|Figura 14]]


   Fem paste ->
   Fem paste ->
   anem a la finestra de la sintaxi i executem l'ordre que ens acaba d'enganxar.
   anem a la finestra de la sintaxi i executem l'ordre que ens acaba d'enganxar.


Ja tenim els resultats. Ens hauria d'haver sortit una nova finestra, aquest cop de resultats amb la següent pinta [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf15.JPG (Figura 15)]: [[Imatge:SPSSf15.JPG|thumb|640px|center|Figura 15]]
Ja tenim els resultats. Ens hauria d'haver sortit una nova finestra, aquest cop de resultats amb la següent pinta [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf15.JPG (Figura 15)]: [[Image:SPSSf15.JPG|thumb|640px|center|Figura 15]]


Intentarem explicar una mica tots aquests números, ara. Anem per passos:
Intentarem explicar una mica tots aquests números, ara. Anem per passos:
Línia 364: Línia 334:


També ens haurien d'haver sortit uns gràfics. Aquest [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf16.JPG (Figura 16)]
També ens haurien d'haver sortit uns gràfics. Aquest [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf16.JPG (Figura 16)]
[[Imatge:SPSSf16.JPG|thumb|320px|center|Figura 16: el Box Plot]]
[[Image:SPSSf16.JPG|thumb|320px|center|Figura 16: el Box Plot]]
és un ''boxplot''. A l'eix vertical hi ha els valors de l'edat, i a l'horitzontal......... no hi ha res :) La línia horitzontal més gruixuda del mig de la caixa central representa la mediana. Les línies horitzontals que delimiten la caixa són els percentils 25 i 75 (a.k.a. quartil 1 i quartil 3). Els límits de les potes que surten cap amunt i cap avall són els valors considerats normals o no anòmals. Tot aquest dibuix, com més simètric sigui, vol dir que més normal és la nostra mostra. En aquest cas veiem que la mediana està una mica més avall del que li tocaria (no està al mig de la caixa), el que vol dir que els individus de més edat estan més dispersos que els més joves. Bueno, una mica complicat, no? La cosa és que sabem que per sota la mediana hi ha el 50% dels individus, però aquest 50% està en menys espai (menys valors diferents d'edat) que el 50% superior.
és un ''boxplot''. A l'eix vertical hi ha els valors de l'edat, i a l'horitzontal......... no hi ha res :) La línia horitzontal més gruixuda del mig de la caixa central representa la mediana. Les línies horitzontals que delimiten la caixa són els percentils 25 i 75 (a.k.a. quartil 1 i quartil 3). Els límits de les potes que surten cap amunt i cap avall són els valors considerats normals o no anòmals. Tot aquest dibuix, com més simètric sigui, vol dir que més normal és la nostra mostra. En aquest cas veiem que la mediana està una mica més avall del que li tocaria (no està al mig de la caixa), el que vol dir que els individus de més edat estan més dispersos que els més joves. Bueno, una mica complicat, no? La cosa és que sabem que per sota la mediana hi ha el 50% dels individus, però aquest 50% està en menys espai (menys valors diferents d'edat) que el 50% superior.


Línia 371: Línia 341:


Aquest altre gràfic [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf17.JPG (Figura 17)]  
Aquest altre gràfic [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf17.JPG (Figura 17)]  
[[Imatge:SPSSf17.JPG|thumb|320px|center|Figura 17: l'histograma]]
[[Image:SPSSf17.JPG|thumb|320px|center|Figura 17: l'histograma]]
és un histograma, que tots coneixem més. No és més que la freqüència de cadascun dels valors. A la dreta de tot veiem el nostre valor anòmal de 146 anys.
és un histograma, que tots coneixem més. No és més que la freqüència de cadascun dels valors. A la dreta de tot veiem el nostre valor anòmal de 146 anys.


Línia 383: Línia 353:
   posem les opcions tal com podem veure a la [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf18.JPG Figura 18] i [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf19.JPG Figura 19]
   posem les opcions tal com podem veure a la [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf18.JPG Figura 18] i [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf19.JPG Figura 19]


[[Imatge:SPSSf18.JPG|thumb|640px|center|Figura 18]]
[[Image:SPSSf18.JPG|thumb|640px|center|Figura 18]]
[[Imatge:SPSSf19.JPG|thumb|640px|center|Figura 19]]
[[Image:SPSSf19.JPG|thumb|640px|center|Figura 19]]


   paste ->
   paste ->
   anem a la sintaxi i executem l'última ordre
   anem a la sintaxi i executem l'última ordre
  Ara, repetiu el procés però en comptes de marcar ''bar chart'' com a gràfic
  marqueu ''pie chart'' perquè us faci el pastel.


Ens hauria de sortir el següent quadre [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf20.JPG Figura 20]:  
Ens hauria de sortir el següent quadre [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf20.JPG Figura 20]:  
[[Imatge:SPSSf20.JPG|thumb|640px|center|Figura 20]]
[[Image:SPSSf20.JPG|thumb|640px|center|Figura 20]]


I el següents gràfics [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf21.JPG Figura 21] i [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf22.JPG Figura 22]
I el següents gràfics [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf21.JPG Figura 21] i [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf22.JPG Figura 22]
[[Imatge:SPSSf21.JPG|thumb|320px|center|Figura 21: gràfic de barres]]
[[Image:SPSSf21.JPG|thumb|320px|center|Figura 21: gràfic de barres]]
[[Imatge:SPSSf22.JPG|thumb|320px|center|Figura 22: gràfic de sectors]]
[[Image:SPSSf22.JPG|thumb|320px|center|Figura 22: gràfic de sectors]]


I per l'anàlisi de dades:
I per l'anàlisi de dades:
Línia 462: Línia 435:
El primer que hem de fer és saber el que volem saber, per allò de quien no sabe lo que busca no interpreta lo que encuentra. La variable principal del nostre estudi és ESTÀ PRIM, que a partir d'ara l'anomenarem '''variable dependent''' ja que és la que volem explicar (volem explicar perquè alguna gent està més prima que l'altre: potser és per què són solters? o serà per què són més joves?). Les altres variables son les variables explicatives o '''variables independents'''.
El primer que hem de fer és saber el que volem saber, per allò de quien no sabe lo que busca no interpreta lo que encuentra. La variable principal del nostre estudi és ESTÀ PRIM, que a partir d'ara l'anomenarem '''variable dependent''' ja que és la que volem explicar (volem explicar perquè alguna gent està més prima que l'altre: potser és per què són solters? o serà per què són més joves?). Les altres variables son les variables explicatives o '''variables independents'''.


L'esquema de l'anàlisi de l'estudi serà en següent:
L'esquema de l'anàlisi de l'estudi serà el següent:
#Descriure la relació de la variable ESTÀ PRIM amb l'ESTAT CIVIL (objectiu principal del nostre estudi).
#Descriure la relació de la variable ESTÀ PRIM amb l'ESTAT CIVIL (objectiu principal del nostre estudi).
#I la relació de la variable ESTA PRIM amb l'EDAT (no és un objectiu, però si que volem saber si l'edat és un confusor i per això ho hem de mirar). Normalment es tenen moltes altres variables a part de l'edat, aquestes anirien aquí.
#I la relació de la variable ESTA PRIM amb l'EDAT (no és un objectiu, però si que volem saber si l'edat és un confusor i per això ho hem de mirar). Normalment es tenen moltes altres variables a part de les dues principals, aquestes anirien aquí.


Comencem amb un resum de quines proves estadístiques s'han d'utilitzar segons el tipus de variables que volguem relacionar:
Comencem amb un resum de quines proves estadístiques s'han d'utilitzar segons el tipus de variables que volguem relacionar:
Línia 476: Línia 449:
|-
|-
|'''Categòrica binària'''
|'''Categòrica binària'''
|align=center|Chi-quadrat
|align=center|Xi-quadrat
|align=center|Chi-quadrat
|align=center|Xi-quadrat
|align=center|t de student
|align=center|t de student
|-
|-
|'''Categòrica (>2)'''
|'''Categòrica (>2)'''
|align=center|Chi-quadrat
|align=center|Xi-quadrat
|align=center|Chi-quadrat
|align=center|Xi-quadrat
|align=center|ANOVA
|align=center|ANOVA
|-
|-
Línia 513: Línia 486:
#El seu valor està '''MOLT''' influit pel tamany de la mostra. Com més gent tinguem, més petita serà la ''p'' (i per tant més significativa) encara que la relació entre les variables sigui la mateixa
#El seu valor està '''MOLT''' influit pel tamany de la mostra. Com més gent tinguem, més petita serà la ''p'' (i per tant més significativa) encara que la relació entre les variables sigui la mateixa
#No dóna cap informació sobre la magnitud de la relació entre les dues variables, o sigui si estan molt o poc relaciondes
#No dóna cap informació sobre la magnitud de la relació entre les dues variables, o sigui si estan molt o poc relaciondes
#Un últim problema és que ''filosòficament'' ens dóna la informació contrària a la que nosaltres voldriem saber. Ens diu la probabilitat d'haver obtingut aquells resultats en el cas que la hipòtesi nula fos certa, però no seria més interessant saber la probabilitat que la hipòtesi nula fos certa tenint en compte els resultats que hem obtingut? El problema és que això ens fica de ple en l'estadística ''bayesiana'' (la que fem servir normalment es diu ''inferencial''), que no la saben utilitzar ni tan sols la majoria dels estadísitcs. Ja fa anys que es diu que és el futur, però el futur no acaba d'arribar...
#Un últim problema és que ''filosòficament'' ens dóna la informació contrària a la que nosaltres voldriem saber. Ens diu la probabilitat d'haver obtingut aquells resultats en el cas que la hipòtesi nula fos certa, però no seria més interessant saber la probabilitat que la hipòtesi nula fos certa tenint en compte els resultats que hem obtingut? El problema és que això ens fica de ple en l'estadística ''bayesiana'' (la que fem servir normalment es diu ''freqüentista''), que no la saben utilitzar ni tan sols la majoria dels estadísitcs. Ja fa anys que es diu que és el futur, però el futur no acaba d'arribar...




Línia 534: Línia 507:


El primer que fem és fer una descripció bivariada d'aquestes variables. Això ho fem amb una '''taula 2x2''', amb el procediment ''crosstabs'' del SPSS [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf26.JPG (Figura 26)]:
El primer que fem és fer una descripció bivariada d'aquestes variables. Això ho fem amb una '''taula 2x2''', amb el procediment ''crosstabs'' del SPSS [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf26.JPG (Figura 26)]:
[[Imatge:SPSSf26.JPG|thumb|640px|center|Figura 26]]
[[Image:SPSSf26.JPG|thumb|640px|center|Figura 26]]


   Anem a ''analyze'' ->
   Anem a ''analyze'' ->
   ''descriptive statistics'' ->
   ''descriptive statistics'' ->
   ''crosstabs'' i ens surt la següent pantalla [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf27.JPG (Figura 27)]:
   ''crosstabs'' i ens surt la següent pantalla [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf27.JPG (Figura 27)]:
[[Imatge:SPSSf27.JPG|thumb|640px|center|Figura 27]]
[[Image:SPSSf27.JPG|thumb|640px|center|Figura 27]]


   Apretem ''cells'' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf27.JPG (Figura 27)] i se'ns obre una pantalla ->
   Apretem ''cells'' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf27.JPG (Figura 27)] i se'ns obre una pantalla ->
Línia 548: Línia 521:
   ''continue'' ->  
   ''continue'' ->  
   ''paste''
   ''paste''
[[Imatge:SPSSf28.JPG|thumb|640px|center|Figura 28]]
[[Image:SPSSf28.JPG|thumb|640px|center|Figura 28]]


I obtenim tot de taules i números que explicarem per passos primer quins hem de mirar i després, què signifiquen:
I obtenim tot de taules i números que explicarem per passos primer quins hem de mirar i després, què signifiquen:
#'''La primera taula''' ens diu quants pacients son vàlids i quants missing. Si tenim un missing en qualsevol de les dues variables no s'usarà aquell pacient per als càlculs.
#'''La primera taula''' ens diu quants pacients son vàlids i quants missing. Si tenim un missing en qualsevol de les dues variables no s'usarà aquell pacient per als càlculs.
#En '''la segona taula''' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf29.JPG (Figura 29)] veiem la descripció de les dades sense res estadístic, és a dir la taula 2x2. Es percentatges que ens interessen son els que estan encerclats. [[Imatge:SPSSf29.JPG|thumb|640px|center|Figura 29]]
#En '''la segona taula''' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf29.JPG (Figura 29)] veiem la descripció de les dades sense res estadístic, és a dir la taula 2x2. Es percentatges que ens interessen son els que estan encerclats: veiem que el percentatge de prims entre els solters és molt superior al percentatge entre els casats [[Image:SPSSf29.JPG|thumb|640px|center|Figura 29]]
#'''La tercera taula''' és la famosa xi-quadrat [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf30.JPG (Figura 30)].   
#'''La tercera taula''' és la famosa xi-quadrat [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf30.JPG (Figura 30)].   
##'''Condicions d'aplicació de la xi-quadrat'''. Per poder fer una prova de xi-quadrat (que és el que toca) cal que totes les caselles de la taula tinguin almenys 5 casos esperats (això ens ho diu el peu de taula de la tercera taula). Si no es complís podriem usar el test de Fisher (només si les dues variables són binàries, a no ser que volguem assassinar el nostre PC), i si alguna variable té més de dues categories podriem intentar agrupar-les per guanyar número de casos en cada casella. [[Imatge:SPSSf30.JPG|thumb|640px|center|Figura 30]]
##'''Condicions d'aplicació de la xi-quadrat'''. Per poder fer una prova de xi-quadrat (que és el que toca) cal que totes les caselles de la taula tinguin almenys 5 casos esperats (això ens ho diu el peu de taula de la tercera taula). Si no es complís podriem usar el test de Fisher (només si les dues variables són binàries, a no ser que volguem assassinar el nostre PC), i si alguna variable té més de dues categories podriem intentar agrupar-les per guanyar número de casos en cada casella. [[Image:SPSSf30.JPG|thumb|320px|center|Figura 30]]
##Aquí el què hem de mirar és la significació de ''Pearson chi-square'' -> veure l'apartat '''valoració de la significació estadística'''.
##Aquí el què hem de mirar és la significació de ''Pearson chi-square'' -> veure l'apartat '''valoració de la significació estadística'''.
#'''La quarta taula''' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf31.JPG (Figura 31)], tenim la ''odds ratio'' (cercles)-> veure l'apartat '''valoració de la magnitud de l'associació'''.[[Imatge:SPSSf31.JPG|thumb|640px|center|Figura 31]]
#'''La quarta taula''' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf31.JPG (Figura 31)], tenim la ''odds ratio'' (cercles)-> veure l'apartat '''valoració de la magnitud de l'associació'''.[[Image:SPSSf31.JPG|thumb|640px|center|Figura 31]]


===Valoració de la magnitud de l'associació: odds ratio===
===Valoració de la magnitud de l'associació: odds ratio===
Línia 564: Línia 537:
Hi ha diverses formes de mesurar l'associació de dues variables categòriques (avís: el següent pot estar basat en experiències i/o manies personals, i no té perquè ser del tot acadèmic):
Hi ha diverses formes de mesurar l'associació de dues variables categòriques (avís: el següent pot estar basat en experiències i/o manies personals, i no té perquè ser del tot acadèmic):


#Quan una variable és causa de l'altra, o podria ser-ho. Per exemple el fet que està solter provoca que s'estigui més gordo. Malgrat en aquest cas també podem fer una diferència de proporcions (i estaria ben fet!), hi ha dues mesures clàssiques en epidemiologia que no vé malament conèixer:
#Quan una variable és causa de l'altra, o podria ser-ho. Per exemple el fet que estar solter provoca que s'estigui més prim. Hi ha dues mesures clàssiques en epidemiologia que no vé malament conèixer:
##La '''odds ratio''' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf31.JPG (Figura 31)], que és el risc relatiu a lo anglosajón (i per tant molt més usat en articles british i americans). Al principi és una mica complicats d'entendre. Una ''odds'' (sense ratio) és el número de casos en què passa una cosa entre el número de casos en què no passa. Per tant és molt semblant a un percentatge (número de casos en què passa una cosa dividit per la suma del número de casos en què passa i el número de casos en què no passa). Això seria la ''odds'' d'estar prim, i la podem calcular en els solters i en els casats. Dividint aquestes dues ''odds'' tenim la ''odds ratio''.A la ''odds ratio'' li podem donar un interval de confiança (que ens dóna l'SPSS), que si no passa per l'1 podem dir que és estadísticament significatiu. Segur que heu sentit a parlar molts cops de la ''odds ratio'': per exemple pel risc de fer un infart podem parlar de la ''odds ratio'' de fumar, de ser hipertens, etc.
##La '''odds ratio''' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf31.JPG (Figura 31)], que a ser (encara que no ho és exactament) quantes vegades més risc hi ha de malaltia en un grup que en un altre. Per exemple podriem dir que els fumadors tenen 3 cops més risc de fer un infart que els no fumadors (''odds ratio'' de 3). En el nostre cas, la ''odds'' ratio de 13,6 vol dir que els solters (serien els fumadors) tenen 13,6 vegades més ''risc'' d'estar prims (serie l'equivalent a fer un infart) que els gordos (els no fumadors). A la ''odds ratio'' li podem donar un interval de confiança (que ens dóna l'SPSS), que si no passa per l'1 podem dir que és estadísticament significatiu (cuidao que aquí és per 1, no per 0!). En aquest veieu que l'interval no passa per 1, el que vol dir que '''els solters tenen més risc d'estar prims que els casats''', i aquesta diferència (que ja haviem vist a la taula 2x2) és estadísticament significativa.
##El '''risc relatiu''' (que l'SPSS no fa i és el més entendible per nosaltres), que és la divisió entre les dues proporcions. Mirant la taula, podem calcular quin és el risc relatiu de la variable estat civil en el cas del nostre estudi, però l'SPSS no ens la dóna.
##El '''risc relatiu''' (que l'SPSS el pot fer però es lia), s'interpreta igual que la ''odds ratio'', i en aquest cas sí que és exactament quantes vegades més de risc tenen els exposats (els solters) que els no exposats (els casats) d'estar prims (la ''malaltia'' del nostre estudi)
#'''Diferència de proporcions'''. Una altra forma de valorar la magnitud de l'efecte, si no hi ha una variable que pugui ser la causa de l'altra, sinó que està al mateix nivell com per exemple les variables binàries portar sabates grogues si/no i portar camises liles si / no (els dos fets es poden associar, però un no causa l'altre ni a la inversa). En aquest cas el millor és fer la diferència entre les dues proporcions, junt amb el seu interval de confiança. Problema: l'SPSS no ho fa. Però per exemple posem que, entre tots els usuaris de sabates grogues, un 71% porta camises liles, mentre que només un 23% dels que no porten sabates grogues sí que porta camises liles. Restant aquestes dues proporcions tenim 71-23=48%, que és la diferència de proporcions. Segons la gent que tinguéssim a la mostra, aquest 48% tindria un interval de confiança més o menys ampli que ens informaria de si la diferència és molt gran o no. Si aquest interval no passa per 0, es pot dir que l'associació entre portar sabates grogues i portar camises liles és estadísticament significativa.
#'''Diferència de proporcions'''. Una altra forma de valorar la magnitud de l'efecte, si no hi ha una variable que pugui ser la causa de l'altra, sinó que està al mateix nivell com per exemple les variables binàries portar sabates grogues si/no i portar camises liles si / no (els dos fets es poden associar, però un no causa l'altre ni a la inversa). En aquest cas no es sol fer una ''odds ratio'' o un risc relatiu, sinó la diferència entre les dues proporcions, junt amb el seu interval de confiança. Problema: l'SPSS no ho fa. Si aquest interval no passa per 0, es pot dir que l'associació entre portar sabates grogues i portar camises liles és estadísticament significativa (cuidao que aquí és per 0, no per 1!)


===Valoració de la significació estadística: la ''p''===
===Valoració de la significació estadística: la ''p''===


Amb l'apartat anterior ja ho podíem fer (que l'interval de confiança de la diferència de proporcions no passi per 0, o que el del risc relatiu o la ''odds ratio'' no passin per 1). Però si volem, per un motiu desconegut, donar un valor de ''p'', tenim la prova de chi-quadrat (per tant veieu que el títol de tot l'apartat és fals, perquè hem fet moltes més coses que una simple xi-quadrat per veure la relació de dues variables categòriques: el món és més que una ''p''!):
Però si volem, per un motiu desconegut, donar un valor de ''p'' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf30.JPG (Figura 30)], tenim la prova de xi-quadrat (per tant veieu que el títol de tot l'apartat és fals, perquè hem fet moltes més coses que una simple xi-quadrat per veure la relació de dues variables categòriques: el món és més que una ''p''!):
 
[captura]


Però ens servei d'alguna cosa aquesta ''p''? Només sabem que els solters i els casats no estan igual de grassos (canviar si no és significativa.............................), però no sabem quin dels dos grups està més gras, ni quant més gras està. Sempre és molt més important mirar les dades (i entendre-les!) que mirar la ditxosa ''p''.
El valor de la ''p'' en aquest cas és 0,000 (impossible que sigui exactament 0, però en tot cas és inferior a 0,05). Però ens servei d'alguna cosa aquesta ''p''? Només sabem que els solters i els casats no estan igual de grassos (i no ho estan de forma estadísticament significativa), però no sabem quin dels dos grups està més gras, ni quant més gras està. Sempre és molt més important mirar les dades (i entendre-les!) que mirar la ditxosa ''p''. Sinó no sabriem que són els solters els que estan més prims, i que tenen un risc 13 cops superior d'estar-ho si els comparem amb els casats.


==t de student==
==t de student==
Línia 593: Línia 564:
   ''compare means'' ->
   ''compare means'' ->
   ''independent samples t-test'' que és la t d'Student [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf23.JPG (Figura 23)]
   ''independent samples t-test'' que és la t d'Student [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf23.JPG (Figura 23)]
[[Imatge:SPSSf23.JPG|thumb|640px|center|Figura 23]]
[[Image:SPSSf23.JPG|thumb|640px|center|Figura 23]]


   a ''test variables'' hi posem la variable quantitativa, ''l'edat'' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf24.JPG (Figura 24)]->
   a ''test variables'' hi posem la variable quantitativa, ''l'edat'' [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf24.JPG (Figura 24)]->
Línia 604: Línia 575:
   anem a la finestra de la sintaxi i executem el què se'ns ha copiat i obtenim el següent en els resultats [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf25.JPG (Figura 25)]:  
   anem a la finestra de la sintaxi i executem el què se'ns ha copiat i obtenim el següent en els resultats [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf25.JPG (Figura 25)]:  


[[Imatge:SPSSf24.JPG|thumb|640px|center|Figura 24]]
[[Image:SPSSf24.JPG|thumb|640px|center|Figura 24]]


[[Imatge:SPSSf25.JPG|thumb|640px|center|Figura 25: Resultats]]
[[Image:SPSSf25.JPG|thumb|640px|center|Figura 25: Resultats]]


I de tots aquests números quins en interessen?
I de tots aquests números quins en interessen?
*A la primera taula podem veure les mitjanes d'edat dels dos grups.
*A la primera taula podem veure les mitjanes d'edat dels dos grups. La mitjana d'edat dels prims és molt inferior a la dels grassos: els prims són més joves!
*A la segona taula hi hem de mirar vàries coses:
*A la segona taula hi hem de mirar vàries coses:
**Primer de tot, tenim dues opcions de resultats: la primera fila ''equal variances assumed'' o la segona fila ''equal variances not assumed''. Això és la proba de l'homogeneïtat de les variàncies. Per saber quina de les dues files hem d'usar, hem de mirar la primera significació.
**Primer de tot, tenim dues opcions de resultats: la primera fila ''equal variances assumed'' o la segona fila ''equal variances not assumed''. Això és la proba de l'homogeneïtat de les variàncies. Per saber quina de les dues files hem d'usar, hem de mirar la primera significació.
Línia 618: Línia 589:
***I en segon terme, la p.
***I en segon terme, la p.
   
   
En el nostre estudi: la diferència de mitjanes és de 23,4 anys (IC95% 15,2-31,6) amb una p inferior a 0,05. Per tant concloem que si que hi ha diferències (estadístiques i clíniques) en l'edat dels prims i els no prims ja que l'intèrval de confiança no passa pel 0 i perquè la p és inferior a 0,05.
En el nostre estudi: la diferència de mitjanes és de 23,4 anys (IC95% 15,2-31,6), el que vol dir que els prims són 23 anys més joves que els grassos. La signifiació, lògicament, és inferior a 0,05 perquè l'interval de confiança no passa pel 0. Per tant concloem que si que hi ha diferències (no només estadístiques sinó també clíniques, 23 anys són molts anys de diferència!) en l'edat dels prims i els no prims.


==ANOVA==
==ANOVA==


És similar a la t de student però enlloc de dos grups en tenim tres (per tant una variable continua i una de categòrica no binària). No tenim temps de fer un exemple, però en el SPSS està en el menú:
És similar a la t de student però enlloc de dos grups en tenim tres (per tant una variable continua i una de categòrica no binària). No tenim temps de fer un exemple, però en el SPSS està en el menú [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf32.JPG (Figura 32)].


[captura menú]
[[Image:SPSSf32.JPG|thumb|640px|center|Figura 32]]


==Correlació==
==Correlació==


Serveix per saber si dues variables continues (per exemple el pes i l'edat) estan relacionades. Com que no tenim massa temps (ni és l'objectiu del nostre estudi), dir només que el normal és fer una correlació de Pearson, però que si no es compleixen les condicions d'aplicació (.................) usem la correlació d'Spearman:
Serveix per saber si dues variables continues (per exemple el pes i l'edat) estan relacionades. Com que no tenim massa temps (ni és l'objectiu del nostre estudi), dir només que el normal és fer una correlació de Pearson, però que si no es compleixen les condicions d'aplicació (les dues variables han de ser normals o majors de 30 pacients) usem la correlació d'Spearman.
 
Aquí teniu l'exemple de relació de dues variables contínues, només perquè sapigueu que es poden fer [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf33.JPG (Figura 33)]. També és molt útil fer la representació gràfica amb un ''Scatter Plot''. La sintaxi per fer-ho seria la següent (podeu copiar-la i tirar-la directament a la sintaxi):


[captura menú]
  CORRELATIONS
    /VARIABLES=pes edat
    /PRINT=TWOTAIL NOSIG
    /MISSING=PAIRWISE .
  GRAPH
    /SCATTERPLOT(BIVAR)=edat WITH pes
    /MISSING=LISTWISE .


[captura opcions demanant Pearson i Spearman]
  Per fer que us surti la línia, heu de fer 2 clics sobre el gràfic en la finestra de resultats
  i marcar el botó on hi ha dibuixada la tendència lineal.


En aquest cas sí que ens solem quedar amb el valor de la ''p'' que ens dóna:
[[Image:SPSSf33.JPG|thumb|640px|center|Figura 33]]


[captura marcant la p?]
En aquest cas tenim el valor de la ''p'' que ens dóna i el valor de la correlació de Pearson que va de 1 a -1, i en funció del valor la correlació és més o menys forta:
*de -1 a -0,7 o de 1 a 0,7 és una correlació molt forta negativa o positiva respectivament.
*de -0,7 a -0,3 o de 0,7 a 0,3 és una correlació dèbil negativa o positiva respectivament.
*de -0,3 a 0 o de 0,3 a 0 no hi ha correlació.
 
En el nostre estudi, no era una proba que haguéssim de fer per als nostres objectius, però les conclusions serien que l'edat i el pes es correlacionen de forma positiva, tot i que dèbil (0,519), i aquesta correlació és estadísticament significativa (p<0,05).


==(Breu) introducció a l'anàlisi multivariant==
==(Breu) introducció a l'anàlisi multivariant==
Línia 644: Línia 629:
La hipòtesi principal de l'estudi era que ESTÀ PRIM s'associa amb ESTAT CIVIL, però pel mig ens ha aparegut la variable EDAT que hem vist que també s'associa a ESTÀ PRIM. Per dir que una variable és confusora (l'EDAT és una ferma candidata a ser-ho en aquest estudi i en la immensa majoria d'estudis, com ho són el sexe, la classe social, etc.) cal que s'associi tant a la variable dependent (ESTÀ PRIM) com a la variable independent principal (ESTAT CIVIL). Això segon no ho hem comprovat. Quina prova usarieu per veure la relació entre l'EDAT i l'ESTAT CIVIL? Vinga, ara us toca treballar a vosaltres!
La hipòtesi principal de l'estudi era que ESTÀ PRIM s'associa amb ESTAT CIVIL, però pel mig ens ha aparegut la variable EDAT que hem vist que també s'associa a ESTÀ PRIM. Per dir que una variable és confusora (l'EDAT és una ferma candidata a ser-ho en aquest estudi i en la immensa majoria d'estudis, com ho són el sexe, la classe social, etc.) cal que s'associi tant a la variable dependent (ESTÀ PRIM) com a la variable independent principal (ESTAT CIVIL). Això segon no ho hem comprovat. Quina prova usarieu per veure la relació entre l'EDAT i l'ESTAT CIVIL? Vinga, ara us toca treballar a vosaltres!


Quin és el resultat?
Us hauria de sortir això [http://www.traba.org/wikitraba/index.php/Imatge:SPSSf34.JPG (Figura 34)] (vigileu al posar els valors de la variable estat civil que no son 0 i 1!):
 
[[Image:SPSSf34.JPG|thumb|640px|center|Figura 34]]


Vist el resultat (assegurar.................), ja podem dir que l'EDAT és una variable confusora, és a dir que confon la relació entre ESTÀ PRIM i ESTAT CIVIL, ja que ella s'associa a totes dues. Això pot implicar que la relació que hem trobat entre ESTÀ PRIM i ESTAT CIVIL pot ser falsa, i que el que passi és que els solters estan més prims que els casats però no per aquest fet sinó perquè són més joves (cosa que hem comprovat), i els joves alhora són més prims que els grans (cosa que també hem comprovat).
Vist el resultat, ja podem dir que l'EDAT és una variable confusora, és a dir que confon la relació entre ESTÀ PRIM i ESTAT CIVIL, ja que ella s'associa a totes dues. Això pot implicar que la relació que hem trobat entre ESTÀ PRIM i ESTAT CIVIL pot ser falsa, i que el que passi és que els solters estan més prims que els casats però no per aquest fet sinó perquè són més joves (cosa que hem comprovat), i els joves alhora són més prims que els grans (cosa que també hem comprovat).


Per saber la veritable relació entre ESTÀ PRIM i ESTAT CIVIL hem d'AJUSTAR per edat (segur que heu sentit molts cops aquesta paraula!) que no vol dir res més que tenir en compte l'efecte de l'edat en la relació de les dues variables que realment ens interessen. Això és el que peremt fer l'anàlisi multivariant, que és tot el món de les regressions, en aquest cas la regressió logística que és la més freqüent en ciències de la salut. Només d0aquesta forma podriem saber si l'ESTAT CIVIL per si sol fa que la gent estigui més prima!
Per saber la veritable relació entre ESTÀ PRIM i ESTAT CIVIL hem d'AJUSTAR per edat (segur que heu sentit molts cops aquesta paraula!) que no vol dir res més que tenir en compte l'efecte de l'edat en la relació de les dues variables que realment ens interessen. Això és el que permet fer l'anàlisi multivariant, que és tot el món de les regressions, en aquest cas la regressió logística que és la més freqüent en ciències de la salut. Només d'aquesta forma podriem saber si l'ESTAT CIVIL per si sol fa que la gent estigui més prima!


Això, però, ja no ho explicarem. Alguna feina hem de deixar pels tècnics, no? :)
Això, però, ja no ho explicarem. Alguna feina hem de deixar pels tècnics, no? :)
Línia 655: Línia 640:
==Presentació de resultats i conclusions==
==Presentació de resultats i conclusions==


Un cop hem tret tots els resultats que ens interessen, és hora d'ordenar-los per poder-los presentar i treure'n conclusions.........................
Un cop hem tret tots els resultats que ens interessen, és hora d'ordenar-los per poder-los presentar i treure'n conclusions. L'objectiu de l'estudi era saber per quines variables s'associaven al fet d'estar prim, o sigui per què alguna gent de la mostra està més prima que altra (en el món real: per què alguna gent fa infarts i altres no). Hem vist que l'estat civil és un dels factors implicats, que els solters estan significativament més prims que els casats (en el món real: els fumadors tenen més infarts que no els no fumadors). Però hem vist també que l'edat s'associa al pes, en el sentit que els prims són significativament més joves que els grassos. Finalment hem comprovat que els dos factors (estat civil i edat) estan també relacionats entre sí en el sentit que els solters són significativament més joves. Amb tot això hem creat un triangle amorós (confús, en aquest cas) que només la regressió logística pot ajudar a aclarir.


==Despedida y cierre==
==Despedida y cierre==