R: diferència entre les revisions

514 bytes afegits ,  3 juny 2014
m
Text replacement - "[[Imatge:" to "[[Image:"
m (Text replacement - "[[Imatge:" to "[[Image:")
 
(25 revisions intermèdies per 8 usuaris que no es mostren)
Línia 5: Línia 5:
}}
}}
[[Categoria:Software]]
[[Categoria:Software]]
'''Este artículo es demasiado largo. Si alguien se anima, debería segmentarse ([[Islàndia|ejemplo]]) y además usar la [[WikiTraba:Ajuda#Introducir_programas_de_R|integración]] entre [[R]] y [[MediaWiki]]'''.


R es un software de análisis estadístico de código abierto basado en el lenguaje S, desarrollado a principio de los años 90. El programa [http://www.insightful.com/products/splus/default.asp $-Plus] utiliza el mismo lenguaje S, pero se trata de un software propietario y con un precio prohibitivo para la mayoría de los mortales.
R es un software de análisis estadístico de código abierto basado en el lenguaje S, desarrollado a principio de los años 90. El programa [http://www.insightful.com/products/splus/default.asp $-Plus] utiliza el mismo lenguaje S, pero se trata de un software propietario y con un precio prohibitivo para la mayoría de los mortales.
Línia 159: Línia 161:
=== El paquete Traba (tipo 4) ===
=== El paquete Traba (tipo 4) ===


En el [http://acrida.2mydns.com/trabachat/ Trabachat] se han desarrollado un conjunto de funciones agrupadas en el paquete [[Media:traba_1.4-1.zip | Traba]]. El link anterior permite su descarga en formato .zip para poderlo instalar.
En el [http://www.traba.org/trabachat/ Trabachat] se han desarrollado un conjunto de funciones agrupadas en el [[Media:traba_1.4-1.zip | paquete Traba]]. El link anterior permite su descarga en formato .zip para poderlo instalar.


Se puede descargar también el [[Media:source.rar | código fuente]] para ver o modificar la sintaxis de las distintas funciones que contiene.
Se puede descargar también el [[Media:source.rar | código fuente]] para ver o modificar la sintaxis de las distintas funciones que contiene.
Línia 540: Línia 542:
  length(subset(var,is.na(nombrevariable)==T))
  length(subset(var,is.na(nombrevariable)==T))


La función ''Explore'' del [http://acrida.2mydns.com/wikitraba/arxius/traba_1.4-1.zip paquete Traba] devuelve todos estos índices y algunos más, de forma parecida al procedimiento ''Explore'' de [http://www.spss.com SPSS].
La función ''Explore'' del [[Media:traba_1.4-1.zip | paquete Traba]] devuelve todos estos índices y algunos más, de forma parecida al procedimiento ''Explore'' de [http://www.spss.com SPSS].


=== Variables categóricas ===
=== Variables categóricas ===
Línia 800: Línia 802:
  dev.off()
  dev.off()


[[Imatge:sexe.jpg]]
[[Image:sexe.jpg]]


* Ejemplo 2: Curva epidémica (histograma) de una toxinfección alimentaria:
* Ejemplo 2: Curva epidémica (histograma) de una toxinfección alimentaria:
Línia 812: Línia 814:




[[Imatge:corba.jpg]]
[[Image:corba.jpg]]


== Programación de funciones ==
== Programación de funciones ==
Línia 1.013: Línia 1.015:
  interval(glm(vardep~varindep1+varindep2))
  interval(glm(vardep~varindep1+varindep2))


Para no tener que ejecutar cada vez la función, se recomienda incluirla en un paquete (como se hizo con el [http://acrida.2mydns.com/wikitraba/arxius/traba_1.4-1.zip paquete Traba]). El procedimiento para hacerlo se explica más abajo.
Para no tener que ejecutar cada vez la función, se recomienda incluirla en un paquete (como se hizo con el [[Media:traba_1.4-1.zip | paquete Traba]]). El procedimiento para hacerlo se explica más abajo.


=== El ejemplo de la función ''montehall'' ===
=== El ejemplo de la función ''montehall'' ===
Línia 1.085: Línia 1.087:
=== Construcción de paquetes ===
=== Construcción de paquetes ===


Una vez tenemos el código fuente tanto de las funciones como de las ayudas que deseamos incluir en el paquete, debemos efectuar una serie de procedimientos para empaquetarlo de forma que sea directamente instalable en R. Dicho proceso se explica detalladamente [http://acrida.2mydns.com/wikitraba/arxius/paquets.pdf aquí].
Una vez tenemos el código fuente tanto de las funciones como de las ayudas que deseamos incluir en el paquete, debemos efectuar una serie de procedimientos para empaquetarlo de forma que sea directamente instalable en R. Dicho proceso se explica detalladamente [[Media:paquets.pdf | en este ''pdf'']].


== Exportación e integración con [[Latex|LaTeX]] ==
== Exportación e integración con [[Latex|LaTeX]] ==
Línia 1.189: Línia 1.191:


Las páginas web correspondientes a cada proyecto contienen abundante información sobre el tema.
Las páginas web correspondientes a cada proyecto contienen abundante información sobre el tema.
=== Y aún más: integración con [[MediaWiki]] ===
En 2006 aparece una extensión de [[MediaWiki]] (el software que soporta la [http://en.wikipedia.org Wikipedia] y esta [[Portada|WikiTraba]] entre muchos otros proyectos) que permite insertar sintaxis de R en las páginas de un proyecto ''wiki''. Esta extensión está instalada en la [[Portada|WikiTraba]] y se explica en su [[WikiTraba:Ajuda#Introducir_programas_de_R|Ayuda]].


== Un ejemplo casi-real ==
== Un ejemplo casi-real ==
Línia 1.194: Línia 1.200:
Se parte de dos tablas distintas en formato .dbf exportadas desde [http://office.microsoft.com/es-hn/FX010858003082.aspx M$ Excel], y que se pueden descargar desde los siguientes enlaces:
Se parte de dos tablas distintas en formato .dbf exportadas desde [http://office.microsoft.com/es-hn/FX010858003082.aspx M$ Excel], y que se pueden descargar desde los siguientes enlaces:


* La tabla [[Media:baixes.dbf | baixes.dbf]] ('''borrado por error, si alguien lo tiene que [[http://www.traba.org/wikitraba/index.php/Especial:Upload|lo suba]]''') contiene un registro para cada una de las bajas laborales concedidas durante 2004 en una empresa X (a leer en catalán). Puede haber más de una baja por individuo. La base contiene la identificación del trabajador, el tipo de baja (incapacidad transitoria o baja maternal) y las fechas de inicio y finalización de la baja.
* La tabla [[Media:baixes.dbf | baixes.dbf]] ('''borrado por error, si alguien lo tiene que [[Especial:Upload|lo suba]]''') contiene un registro para cada una de las bajas laborales concedidas durante 2004 en una empresa X (a leer en catalán). Puede haber más de una baja por individuo. La base contiene la identificación del trabajador, el tipo de baja (incapacidad transitoria o baja maternal) y las fechas de inicio y finalización de la baja.


* La tabla [[Media:plantilla.dbf | plantilla.dbf]] contiene los datos referentes a todos los trabajadores de la empresa X, con un sólo registro por individuo. Contiene la identificación del trabajador (permite el cruce con bajas.dbf), su fecha de nacimiento, el sexo y sus datos laborales (tipo de contrato, lugar de trabajo y categoría laboral).
* La tabla [[Media:plantilla.dbf | plantilla.dbf]] contiene los datos referentes a todos los trabajadores de la empresa X, con un sólo registro por individuo. Contiene la identificación del trabajador (permite el cruce con bajas.dbf), su fecha de nacimiento, el sexo y sus datos laborales (tipo de contrato, lugar de trabajo y categoría laboral).