R

R es una suite open source de utilidades y un lenguaje de programación para manipulación de datos, cálculos estadisticos, analítica y visualización de gráficos.

El entorno es fácilmente ampliable con nuevos paquetes (estadisticos, de gráficos, analíticos, etc.) aportados por la comunidad de usuarios y desarrolladores de R.

Dada su flexibilidad, sus capacidades y el hecho de tratarse de software libre un gran número de aplicaciones empresariales, especialmente de software de business intelligence y analítica, están creando conectores con R, o incluso lo integran dentro de la misma herramienta.

Existen varios IDE's o entornos visuales que facilitan el trabajo con R, pero quizás el más extendido es RStudio(link is external), cuya versión Desktop se distribuye también como Open Source.

 


Recursos sobre R

Formación

Aprende R para Data Science(link is external)


Recursos

Página oficial del proyecto R(link is external)

Página de descarga de distribuciones y packages de R(link is external)

 

Manuales en español sobre R


 

Publicaciones sobre R en Dataprix

 

Libros y recursos gratuítos de R y Data Science

Recursos para aprender a trabajar con R y hacer actividades de Datamining o Data Science

 

Análisis exploratorio en R

Dentro de las actividades de análisis de datos, está el análisis exploratorio de los datos fuente. Datos fuente que se utilizarán en diferentes tipos de procesos: integración de datos, reporting, modelos predictivos, etc..

Dicho análisis se basa en gráficos y estadísticos que permiten explorar la distribución identificando características tales como: frecuencias, valores atípicos o outliers, saltos o discontinuidades, concentraciones de valores, disperión, forma de la distribución, correlaciones, etc...

 

Data Science - Breve guía para interpretar modelos cluster

En clustering se deja que los datos se agrupen de acuerdo a su similitud. Estos modelos son agrupaciones de segmentos -clusters- que contienen casos, tales como clientes, pacientes, autos, etc.

Una vez que un modelo de cluster es desarrollado, una pregunta emerge: ¿Cómo puedo describir mi modelo?

Aquí presentaremos una manera para acercarnos a la respuesta, a través de la implementación del Gráfico de Coordenadas in R (código disponible al final del post)..

 

Data Science - Análisis dinámico de outliers con R

Los outliers, (o "valores extremos"), son un tema siempre presente cuando se analizan datos, sin importar el origen de los mismos.

Aquí se presenta un análisis didáctico y visual hecho con el lenguaje R..

 

Geo Data Science con R

El siguiente análisis está realizado con el lenguaje R y la libreria Google Vis para la visualización de gráficos. Es tan importante medir la esperanza de vida así como también la calidad de la misma. Se analizarán datos de eurostat basados en las variables Healthy life years y Life expectancy..

 

Aprendiendo a crear informes automáticos desde R con rmarkdown y knitr

La semana pasada asistí a un encuentro de RugBcn, el Grupo de Usuarios de R de Barcelona, que tenía por objetivo mostrar cómo crear informes automáticos directamente desde R gracias a las librerías rmarkdown y knitr. El título del evento era 'Automatic Reporting with rmarkdown'..