R: diferència entre les revisions

879 bytes afegits ,  2 juny 2005
Línia 424: Línia 424:
== Manipulación de bases de datos ==
== Manipulación de bases de datos ==


La función más simple para manipular una base de datos es la función ''subset'', que creará un nuevo objeto que contendrá sólo parte de los datos del ''Data Frame'' original:
La función más simple para transformar una base de datos es la función ''subset'', que creará un nuevo objeto que contendrá sólo parte de los datos del ''Data Frame'' original:


  hombres<-subset(base1,sexo==1)
  hombres<-subset(base1,sexo==1)


Sin embargo, hay muchas otras funciones más complejas para la manipulación de bases de datos. En el ejemplo del final del artículo se muestran varias de ellas.
Sin embargo, hay muchas otras funciones más complejas para la manipulación de bases de datos. Destacaremos tres de ellas:
 
* ''aggregate'': permite partir la base de datos según un identificador, calcular distintos estadísticos para cada una de las partes y presentarlos en un registro único para cada valor del identificador. No se entiende, verdad? Pues habrá que ver el ejemplo del final del artículo.
 
* ''merge'': permite unir dos bases de datos con distintas variables y un identificador común.
 
* ''reshape'': permite ''estirar'' o ''engordar'' una base de datos. Se usa habitualmente en estudios de seguimiento donde se tienen los datos ''en vertical'' (un registro por visita) y quieren tenerse ''en horizontal'' (un registro por individuo).
 
Se recomienda consultar la ayuda correspondiente a dichas funciones para comprender correctamente su funcionamiento y todos los argumentos que pueden aceptar. Dos de ellas, ''aggregate'' y ''merge'', se utilizan en el ejemplo casi-real que se presenta al final de este artículo.


== Exploración de datos ==
== Exploración de datos ==