R: diferència entre les revisions

De wikiTraba
Salta a la navegació Salta a la cerca
Cap resum de modificació
Línia 84: Línia 84:




== Algunas funciones comunes ==
== Introducción de datos ==


=== Introducción de datos ===
== Captura de datos ==


=== Captura de datos ===
== Transformación de datos ==


=== Transformación de datos ===
== Exploración de datos ==


=== Exploración de datos ===
== Pruebas estadísticas clásicas ==


=== ===
=== Ji-cuadrado ===


=== Regresión ===
=== t de Student ===


=== Gráficos ===
== Regresión ==
 
== Gráficos ==





Revisió del 15:57, 30 maig 2005

R
Area: Estadística
Web del proyecto: r-project

Introducción

R es un software de análisis estadístico de código abierto basado en el lenguaje S, desarrollado a principio de los años 90. El programa S-Plus utiliza el mismo lenguaje S, pero se trata de un software propietario.

Instalación y ejecución

Sistemas M$

Los binarios para la instalación en sistemas M$ se pueden descargar desde aquí. Para entrar al programa hay que ejecutar el acceso directo a Rgui.exe situado en el menú inicio.

Sistemas GNU/Linux

En Ubuntu la instalación se realiza mediante la aplicación Synaptic, buscando la librería R-base y aceptando la instalación de todas las librerías propuestas por el programa para resolver las dependencias. El programa se ejecuta desde una ventana Terminal tecleando simplemente R.

Lenguaje encarado a objetos

Los lenguajes estadísticos clásicos (SAS, Stata, SPSS) se basan en un marco conceptual donde a partir de unos datos, se aplican distintos procedimientos para obtener unos resultados.


Objetos, funciones, operadores, expresiones.

Tipos de objetos

El sistema de librerías

Una librería o paquete es un conjunto de funciones sobre una temática común. El sistema R-base trae las librerías diseñadas por el núcleo central de desarrolladores (core). Sin embargo, el modelo descentralizado de producción de R conlleva que muchas funciones interesantes no se instalen con el paquete básico sino que estén contenidas en paquetes o librerías externas que hay que instalar por separado.

Instalación de librerias en sistemas M$

Desde el programa existe un link para instalar paquetes desde el repositorio CRAN. También se pueden instalar paquetes a partir de ficheros .zip.

Instalación de librerias en sistemas GNU/Linux

Al igual que el sistema base, cualquier paquete de R puede instalarse desde Synaptic buscando la palabra CRAN. También se pueden instalar paquetes descomprimiendo ficheros .zip a la ubicación:

/usr/lib/R/library/nombrepaquete

Cargado de librerías

Cuando se inicia R, sólo las funciones contenidas en determinadas librerías del núcleo básico están disponibles para ser utilizadas. Incluso algunas librerías del núcleo básico no están cargadas al iniciar para ahorrar recursos. Para cargar una librería, hay que utilizar la función library(). Por ejemplo para cargar la librería 'survival' (para el análisis de supervivencia), que se instala con el paquete básico pero no se carga al inicio, habría que escribir:

library(survival)

Algunas librerías útiles

Las siguientes librerías no se cargan directamente al iniciar R, y contienen funciones que pueden resultar interesantes. Las librerías marcadas con (*) no están disponibles en el módulo base y deben instalarse desde el CRAN:

  • foreign: Permite importar bases de datos en otros formatos (SAS, Stata, Excel, SPSS, etc.).
  • survival: Funciones de análisis de supervivencia.
  • car *: Recodificación de variables.
  • xtable *: Permite exportar tablas a formato Latex.
  • Rcmdr *: Presenta una interfaz gráfica más amigable para la edición de datos y ejecución de comandos desde menús. Puede ser útil para nuevos usuarios para facilitar la curva de aprendizaje, pero disminuye la gran flexibilidad del software.

El paquete Traba

En el Trabachat se han desarrollado un conjunto de funciones agrupadas en el paquete Traba. Disponible en el Trabachat en formato .zip.

Editores de sintaxis

El programa R (a diferencia de SPSS, SAS o Stata) no cuenta con una ventana para escribir la sintaxis.

Cualquier editor de textos, como el Notepad de M$, sirve para almacenar los comandos, pero es recomendable trabajar con otros editores específicos que permitan, entre otros

  • Colorear la sintaxis para una fácil detección de errores
  • Enviar las instrucciones directamente para ser evaluadas en R (evitando asi tener que copiar/pegar cada instrucción desde el editor)

WinEdt

GNU/Emacs y XEmacs

Reglas básicas de sintaxis

Mayúsculas, espacios, paréntesis, corchetes, asignaciones, missings, nulos, #.


Introducción de datos

Captura de datos

Transformación de datos

Exploración de datos

Pruebas estadísticas clásicas

Ji-cuadrado

t de Student

Regresión

Gráficos

Programación de funciones

El ejemplo de la función 'intervals'

Construcción de paquetes

Documentación de paquetes

Sistema de ayuda