Buròcrates, Administradors (Semantic MediaWiki), Curadors (Semantic MediaWiki), Editors (Semantic MediaWiki), Administradors
10.883
modificacions
m (Text replacement - "[[Imatge:" to "[[Image:") |
|||
| (50 revisions intermèdies per 10 usuaris que no es mostren) | |||
| Línia 5: | Línia 5: | ||
}} | }} | ||
[[Categoria:Software]] | [[Categoria:Software]] | ||
'''Este artículo es demasiado largo. Si alguien se anima, debería segmentarse ([[Islàndia|ejemplo]]) y además usar la [[WikiTraba:Ajuda#Introducir_programas_de_R|integración]] entre [[R]] y [[MediaWiki]]'''. | |||
R es un software de análisis estadístico de código abierto basado en el lenguaje S, desarrollado a principio de los años 90. El programa [http://www.insightful.com/products/splus/default.asp $-Plus] utiliza el mismo lenguaje S, pero se trata de un software propietario y con un precio prohibitivo para la mayoría de los mortales. | R es un software de análisis estadístico de código abierto basado en el lenguaje S, desarrollado a principio de los años 90. El programa [http://www.insightful.com/products/splus/default.asp $-Plus] utiliza el mismo lenguaje S, pero se trata de un software propietario y con un precio prohibitivo para la mayoría de los mortales. | ||
Si quieres, puedes consultar también [[Trabajar|nuestra guía]] sobre como poner en funcionamiento un completo sistema de trabajo para la investigación en medicina. | |||
En la [[R#Instalaci.C3.B3n_y_ejecuci.C3.B3n|primera parte]] de este artículo (puntos 1 a 8) se muestran los principios generales de este software y la forma de instalar todos sus componentes. En la [[R#Captura_de_datos_externos|segunda parte]] (puntos 9 a 16) se explican algunas de sus principales funciones, con pequeños ejemplos para clarificar lo que se explica. Los puntos 17 y 18 se dedican a la [[R#Exportaci.C3.B3n_e_integraci.C3.B3n_con_LaTeX | exportación de resultados]] a distintos formatos. El punto 19 muestra un [[R#Un ejemplo_casi-real|ejemplo]] tomado de la realidad y que ilustra algunos de los procedimientos expuestos. Finalmente en los puntos 20 a 22 se muestra como obtener [[R#Sistema_de_ayuda|ayuda]] adicional. | En la [[R#Instalaci.C3.B3n_y_ejecuci.C3.B3n|primera parte]] de este artículo (puntos 1 a 8) se muestran los principios generales de este software y la forma de instalar todos sus componentes. En la [[R#Captura_de_datos_externos|segunda parte]] (puntos 9 a 16) se explican algunas de sus principales funciones, con pequeños ejemplos para clarificar lo que se explica. Los puntos 17 y 18 se dedican a la [[R#Exportaci.C3.B3n_e_integraci.C3.B3n_con_LaTeX | exportación de resultados]] a distintos formatos. El punto 19 muestra un [[R#Un ejemplo_casi-real|ejemplo]] tomado de la realidad y que ilustra algunos de los procedimientos expuestos. Finalmente en los puntos 20 a 22 se muestra como obtener [[R#Sistema_de_ayuda|ayuda]] adicional. | ||
| Línia 17: | Línia 21: | ||
Los binarios para la instalación en sistemas M$ se pueden descargar desde [http://cran.cict.fr/bin/windows/base/release.htm aquí]. Para entrar al programa hay que ejecutar el acceso directo a Rgui.exe situado en el menú inicio. | Los binarios para la instalación en sistemas M$ se pueden descargar desde [http://cran.cict.fr/bin/windows/base/release.htm aquí]. Para entrar al programa hay que ejecutar el acceso directo a Rgui.exe situado en el menú inicio. | ||
Debido al [[R#El_sistema_de_librer.C3.ADas sistema de librerías]] que usa R, los cambios de versión pueden parecer complicados. Lo más sencillo es desinstalar la versión antigua, instalar la nueva y volver a bajar todas las librerías que se tuvieran instaladas. Sin embargo, también es posible conservar las carpetas correspondientes a las librerías que se quieran guardar, que se encuentran en la ruta: | Debido al [[R#El_sistema_de_librer.C3.ADas sistema de librerías|sistema de librerías]] que usa R, los cambios de versión pueden parecer complicados. Lo más sencillo es desinstalar la versión antigua, instalar la nueva y volver a bajar todas las librerías que se tuvieran instaladas. Sin embargo, también es posible conservar las carpetas correspondientes a las librerías que se quieran guardar, que se encuentran en la ruta: | ||
c:/.../rw.../library | c:/.../rw.../library | ||
| Línia 107: | Línia 111: | ||
/usr/local/lib/R/site-library | /usr/local/lib/R/site-library | ||
Otra forma de proceder con análogos resultados es buscar directamente por [[Firefox|navegador]] en el [http://cran.r-project.org CRAN] la librería que nos interesa, decargarla en formato .zip y luego desde R (en un ''Root terminal'' escribir: | Otra forma de proceder con análogos resultados es buscar directamente por [[Firefox|navegador]] en el [http://cran.r-project.org CRAN] la librería que nos interesa, decargarla en formato .zip y luego desde R (en un ''Root terminal'') escribir: | ||
install.packages("rutacompleta/nombrearchivo.zip",CRAN=NULL) | install.packages("rutacompleta/nombrearchivo.zip",CRAN=NULL) | ||
| Línia 157: | Línia 161: | ||
=== El paquete Traba (tipo 4) === | === El paquete Traba (tipo 4) === | ||
En el [http:// | En el [http://www.traba.org/trabachat/ Trabachat] se han desarrollado un conjunto de funciones agrupadas en el [[Media:traba_1.4-1.zip | paquete Traba]]. El link anterior permite su descarga en formato .zip para poderlo instalar. | ||
Se puede descargar también el [ | Se puede descargar también el [[Media:source.rar | código fuente]] para ver o modificar la sintaxis de las distintas funciones que contiene. | ||
== Editores de sintaxis == | == Editores de sintaxis == | ||
| Línia 201: | Línia 205: | ||
*[http://www.sciviews.org/SciViews-R/ SciViewsR]: Disponible desde el 2 de abril de 2005 (es un desarrollo en estado alfa, solo disponible para windows de momento) esta interfaz grafica de R se asemeja a la que utiliza el programa SAS que divide la ventana en 3 secciones (una para edición de sintaxis, una para visualizar resultados y una tercera para navegar por los objetos y funciones). | *[http://www.sciviews.org/SciViews-R/ SciViewsR]: Disponible desde el 2 de abril de 2005 (es un desarrollo en estado alfa, solo disponible para windows de momento) esta interfaz grafica de R se asemeja a la que utiliza el programa SAS que divide la ventana en 3 secciones (una para edición de sintaxis, una para visualizar resultados y una tercera para navegar por los objetos y funciones). | ||
SciViews-R es un conjunto de paquetes para R (principalmente el editor de texto Tinn-R, R2HTML, el GUI Rcmdr y algunos mas) que se integran en una interfaz grafica para R | SciViews-R es un conjunto de paquetes para R (principalmente el editor de texto [http://www.sciviews.org/Tinn-R/index.html Tinn-R], R2HTML, el GUI Rcmdr y algunos mas) que se integran en una interfaz grafica para R | ||
Requiere los siguientes pasos previos: | Requiere los siguientes pasos previos: | ||
| Línia 403: | Línia 407: | ||
Las mayoría de formatos externos se pueden capturar con funciones contenidas en la librería ''foreign'' (tipo 2), mientras que para la captura de bases de datos relacionales (como [http://office.microsoft.com/es-hn/FX010857913082.aspx M$ Access]) es necesaria la libreria ''RODBC'' (tipo 3). | Las mayoría de formatos externos se pueden capturar con funciones contenidas en la librería ''foreign'' (tipo 2), mientras que para la captura de bases de datos relacionales (como [http://office.microsoft.com/es-hn/FX010857913082.aspx M$ Access]) es necesaria la libreria ''RODBC'' (tipo 3). | ||
=== Captura de [http://www.spss.com | === Captura de [http://www.spss.com $P$$] === | ||
El siguiente ejemplo muestra cómo capturar una hoja de datos de [http://www.spss.com | El siguiente ejemplo muestra cómo capturar una hoja de datos de [http://www.spss.com $P$$]: | ||
library(foreign) | library(foreign) | ||
| Línia 538: | Línia 542: | ||
length(subset(var,is.na(nombrevariable)==T)) | length(subset(var,is.na(nombrevariable)==T)) | ||
La función ''Explore'' del [ | La función ''Explore'' del [[Media:traba_1.4-1.zip | paquete Traba]] devuelve todos estos índices y algunos más, de forma parecida al procedimiento ''Explore'' de [http://www.spss.com SPSS]. | ||
=== Variables categóricas === | === Variables categóricas === | ||
| Línia 641: | Línia 645: | ||
=== Medidas de asociación === | === Medidas de asociación === | ||
Las funciones '''risc''' y '''riscagr''' del [ | Las funciones '''risc''' y '''riscagr''' del [[Media:traba_1.4-1.zip | paquete Traba]] calculan las medidas de asociación (OR y RR) a partir de datos individuales o de tablas de contingencia introducidas directamente: | ||
library(traba) | library(traba) | ||
| Línia 760: | Línia 764: | ||
summary(modelo)$coefficients[2,1] | summary(modelo)$coefficients[2,1] | ||
Los objetos de tipo ''glm'' pueden usarse com argumentos de las funciones [[R#El_ejemplo_de_la_funci.C3.B3n_interval| ''interval'']] y ''llh'', ambas contenidas en el [ | Los objetos de tipo ''glm'' pueden usarse com argumentos de las funciones [[R#El_ejemplo_de_la_funci.C3.B3n_interval| ''interval'']] y ''llh'', ambas contenidas en el [[Media:traba_1.4-1.zip | paquete Traba]] y que permiten calcular, respectivamente, los intervalos de confianza de los coeficientes y la prueba de razón de verosimilitud: | ||
library(traba) | library(traba) | ||
| Línia 798: | Línia 802: | ||
dev.off() | dev.off() | ||
[[ | [[Image:sexe.jpg]] | ||
* Ejemplo 2: Curva epidémica (histograma) de una toxinfección alimentaria: | * Ejemplo 2: Curva epidémica (histograma) de una toxinfección alimentaria: | ||
| Línia 810: | Línia 814: | ||
[[ | [[Image:corba.jpg]] | ||
== Programación de funciones == | == Programación de funciones == | ||
Otro punto fuerte de R es la posibilidad de crearse funciones propias, como es el caso de las contenidas en el [ | Otro punto fuerte de R es la posibilidad de crearse funciones propias, como es el caso de las contenidas en el [[Media:traba_1.4-1.zip | paquete Traba]]. A continuación se explica el procedimiento de creación de una función mediante el ejemplo de las funciones [[R#El_ejemplo_de_la_funci.C3.B3n_interval | interval]] y [[R#El_ejemplo_de_la_funci.C3.B3n_montehall | montehall]] de dicho [[Media:traba_1.4-1.zip | paquete]], | ||
El código completo de ambas funciones puede encontrarse en el [ | El código completo de ambas funciones puede encontrarse en el [[Media:source.rar | código fuente]] del [[Media:traba_1.4-1.zip | paquete Traba]]. | ||
=== El ejemplo de la función ''interval'' === | === El ejemplo de la función ''interval'' === | ||
| Línia 1.011: | Línia 1.015: | ||
interval(glm(vardep~varindep1+varindep2)) | interval(glm(vardep~varindep1+varindep2)) | ||
Para no tener que ejecutar cada vez la función, se recomienda incluirla en un paquete (como se hizo con el [ | Para no tener que ejecutar cada vez la función, se recomienda incluirla en un paquete (como se hizo con el [[Media:traba_1.4-1.zip | paquete Traba]]). El procedimiento para hacerlo se explica más abajo. | ||
=== El ejemplo de la función ''montehall'' === | === El ejemplo de la función ''montehall'' === | ||
| Línia 1.079: | Línia 1.083: | ||
?nombrefunción | ?nombrefunción | ||
La forma más sencilla de hacerlo es crear un nuevo fichero llamado ''nombrefunción.Rd'' (por ejemplo ''interval.Rd'') y escribir directamente la ayuda. Se aconseja que los ficheros de ayuda contengan siempre los mismos apartados (nombre de la función, parámetros, resultados, etc.), como se puede ver en el [ | La forma más sencilla de hacerlo es crear un nuevo fichero llamado ''nombrefunción.Rd'' (por ejemplo ''interval.Rd'') y escribir directamente la ayuda. Se aconseja que los ficheros de ayuda contengan siempre los mismos apartados (nombre de la función, parámetros, resultados, etc.), como se puede ver en el [[Media:source.rar | código fuente]] del [[Media:traba_1.4-1.zip | paquete Traba]]. | ||
=== Construcción de paquetes === | === Construcción de paquetes === | ||
Una vez tenemos el código fuente tanto de las funciones como de las ayudas que deseamos incluir en el paquete, debemos efectuar una serie de procedimientos para empaquetarlo de forma que sea directamente instalable en R. Dicho proceso se explica detalladamente [ | Una vez tenemos el código fuente tanto de las funciones como de las ayudas que deseamos incluir en el paquete, debemos efectuar una serie de procedimientos para empaquetarlo de forma que sea directamente instalable en R. Dicho proceso se explica detalladamente [[Media:paquets.pdf | en este ''pdf'']]. | ||
== Exportación e integración con [[Latex|LaTeX]] == | == Exportación e integración con [[Latex|LaTeX]] == | ||
| Línia 1.178: | Línia 1.182: | ||
''I've seen things you people wouldn't believe'' ([http://en.wikiquote.org/wiki/Blade_Runner#Replicants Roy Batty, Blade Runner]). | ''I've seen things you people wouldn't believe'' ([http://en.wikiquote.org/wiki/Blade_Runner#Replicants Roy Batty, Blade Runner]). | ||
Se trata de [http://franklin.imgen.bcm.tmc.edu/R.web.servers/ distintos sistemas] que permiten que usuarios remotos | Se trata de [http://franklin.imgen.bcm.tmc.edu/R.web.servers/ distintos sistemas] que permiten que usuarios remotos interactuen por intranet o internet con nuestro sistema R (instalado en un [[Servidor| servidor]]) a través de una ''interface'' web, es decir sólo usando su [[Firefox | navegador]]. Esto permite a los usuarios remotos: | ||
* Introducir datos en un formulario que hayamos diseñado nosotros, que pasará estos datos como argumentos a funciones de R que devolverán el ''output'' por pantalla al usuario remoto. Una de las formas más sencillas de realizarlo es mediante [http://www2.warwick.ac.uk/fac/sci/statistics/staff/academic/firth/software/cgiwithr/ CGIwithR]. | * Introducir datos en un formulario que hayamos diseñado nosotros, que pasará estos datos como argumentos a funciones de R que devolverán el ''output'' por pantalla al usuario remoto. Una de las formas más sencillas de realizarlo es mediante [http://www2.warwick.ac.uk/fac/sci/statistics/staff/academic/firth/software/cgiwithr/ CGIwithR]. [http://www.traba.org/derivacions/deriv.html Un ejemplo propio] y otro [http://www.traba.org/encuesta/resultats.html un poco más avanzado]. | ||
* Analizar nuestras bases de datos introduciendo ellos mismos código de R a través del [[Firefox|navegador]]. Se puede realizar, [http://franklin.imgen.bcm.tmc.edu/R.web.servers/ entre otros], mediante el [http://www.rpad.org/Rpad/ paquete RPad], que permite además su uso como [[R#GUI.27s |GUI]] si se realiza una instalación sólo local . | * Analizar nuestras bases de datos introduciendo ellos mismos código de R a través del [[Firefox|navegador]]. Se puede realizar, [http://franklin.imgen.bcm.tmc.edu/R.web.servers/ entre otros], mediante el [http://www.rpad.org/Rpad/ paquete RPad], que permite además su uso como [[R#GUI.27s |GUI]] si se realiza una instalación sólo local . | ||
La instalación y puesto en funcionamiento de estos sistemas supera los objetivos de este artículo. Las páginas web correspondientes a cada proyecto contienen abundante información sobre el tema. | La instalación y puesto en funcionamiento de estos sistemas supera los objetivos de este artículo. [[Servidor|Nuestra guía de configuración de un servidor]] contiene algunas pistas sobre la instalación de [http://www2.warwick.ac.uk/fac/sci/statistics/staff/academic/firth/software/cgiwithr/ CGIwithR]. | ||
Las páginas web correspondientes a cada proyecto contienen abundante información sobre el tema. | |||
=== Y aún más: integración con [[MediaWiki]] === | |||
En 2006 aparece una extensión de [[MediaWiki]] (el software que soporta la [http://en.wikipedia.org Wikipedia] y esta [[Portada|WikiTraba]] entre muchos otros proyectos) que permite insertar sintaxis de R en las páginas de un proyecto ''wiki''. Esta extensión está instalada en la [[Portada|WikiTraba]] y se explica en su [[WikiTraba:Ajuda#Introducir_programas_de_R|Ayuda]]. | |||
== Un ejemplo casi-real == | == Un ejemplo casi-real == | ||
| Línia 1.190: | Línia 1.200: | ||
Se parte de dos tablas distintas en formato .dbf exportadas desde [http://office.microsoft.com/es-hn/FX010858003082.aspx M$ Excel], y que se pueden descargar desde los siguientes enlaces: | Se parte de dos tablas distintas en formato .dbf exportadas desde [http://office.microsoft.com/es-hn/FX010858003082.aspx M$ Excel], y que se pueden descargar desde los siguientes enlaces: | ||
* La tabla [ | * La tabla [[Media:baixes.dbf | baixes.dbf]] ('''borrado por error, si alguien lo tiene que [[Especial:Upload|lo suba]]''') contiene un registro para cada una de las bajas laborales concedidas durante 2004 en una empresa X (a leer en catalán). Puede haber más de una baja por individuo. La base contiene la identificación del trabajador, el tipo de baja (incapacidad transitoria o baja maternal) y las fechas de inicio y finalización de la baja. | ||
* La tabla [ | * La tabla [[Media:plantilla.dbf | plantilla.dbf]] contiene los datos referentes a todos los trabajadores de la empresa X, con un sólo registro por individuo. Contiene la identificación del trabajador (permite el cruce con bajas.dbf), su fecha de nacimiento, el sexo y sus datos laborales (tipo de contrato, lugar de trabajo y categoría laboral). | ||
Las tablas provienen de un ejemplo real, pero se han eliminados todos los datos que pudieran permitir identificar a los individuos. | Las tablas provienen de un ejemplo real, pero se han eliminados todos los datos que pudieran permitir identificar a los individuos. | ||
| Línia 1.524: | Línia 1.534: | ||
[http://cran.r-project.org/doc/contrib/curso-R.Diaz-Uriarte.pdf Otra clase] en castellano. | [http://cran.r-project.org/doc/contrib/curso-R.Diaz-Uriarte.pdf Otra clase] en castellano. | ||
[http://www.ci.tuwien.ac.at/Conferences/useR-2004/program.html Las diapos] del último congreso de R (Viena 2004). | |||
== Reference card == | == Reference card == | ||