By admin On Domingo, diciembre 01 st, 2013 · no Comments · In ,

Existen muchas ventajas en usar R en comparación con los paquetes comerciales y tradicionales, pero primero partamos por conocer un poco acerca de sus características y podamos entender luego por qué debemos aprender R.

¿Qué es R?

Existe una frase muy conocida en el mundo de R que fue mencionada por Norman Nie, quien es uno de los co fundadores de SPSS. Según él “R es el lenguaje de programación estadístico más potente y más flexible del planeta”. En realidad, R es más que un lenguaje de programación. Es un entorno de programación completo con un enfoque radicalmente diferente para el tratamiento de bases de datos, pues ha sido diseñado desde el principio con la finalidad de facilitar el manejo de los conjuntos de datos complejos del mundo real. Y por sobre todo, es un proyecto de código abierto que depende de una gran comunidad de desarrolladores e investigadores en todo el mundo para crecer y evolucionar.

Un poco de historia

R fue creado en 1993 por Ross Ihaka y Robert Gentleman, ambos profesores de la Universidad de Auckland en Nueva Zelanda. El objetivo principal de Ihaka y Gentleman era crear un lenguaje de programación que les
permitiera enseñar de forma fácil sus cursos introductorios de análisis de datos. Un dato curioso es que fue llamado R simplemente debido a que los primeros nombres de sus creadores empezaban con la letra “R”. Como el interés en R aumentó aceleradamente, un grupo de reconocidos investigadores estadísticos expertos en computación a nivel mundial se convirtió en el equipo líder oficial del proyecto.

Este equipo se encarga de supervisar regularmente los cambios e implementaciones de las nuevas características de R, así como de proporcionar apoyo a los usuarios de R en todo el mundo.

El favorito de los estadísticos

Debido a que R ha sido creado por estadísticos para estadísticos, está cargado con las principales y mejores características necesarias para realizar análisis de datos cotidianos. Además su diseño se describe con frecuencia como “elegante” porque está en sintonía con la manera de pensar de los científicos de datos.

Ventajas de R

En la actualidad, la comunidad de usuarios de R es tan grande y amplia que genera nuevos paquetes de
R a un ritmo asombroso
, propio de una gigantesca fábrica virtual auto organizada. Hoy existen cerca de 5,000 paquetes. Algo que no sucede con los proveedores de software comercial quienes rara vez desarrollan nuevos programas a menos que haya un mercado lo suficientemente amplio como para justificar sus costos de desarrollo, y además este proceso puede tomar años. Por el contrario, la comunidad de investigación de R desarrolla y lanza nuevo software continuamente. Una de las principales características de R es que es especialmente útil para generar tablas y gráficos de forma rápida y sencilla.

Aún aquellos que no son analistas de datos profesionales pueden crear diagramas y gráficos de alta calidad y de gran impacto. En los últimos años, R ha sido aceptado como el “lenguaje universal” para el análisis de datos, esto debido principalmente a su capacidad para transformar y evolucionar. Es un hecho que a medida que se descubren nuevas técnicas estadísticas de análisis de datos, éstas surgen como paquetes desarrollados por la gran comunidad de investigadores de R mucho antes de que sean incorporadas en el software tradicional.

Resultados de la encuesta realizada por KDnuggets.com en el 2013 sobre el lenguaje estadístico o de programación usado para un trabajo en analytics, data mining o data science.

En resumen, R es todo un fenómeno global. A diferencia de los programas de análisis de datos comerciales, R es a la vez flexible y extensible. Asimismo, se ha vuelto omnipresente e imprescindible. Y por si fuera poco posee una comunidad de investigación que apoya su desarrollo, promueve su innovación y
mejora continua, y también aporta ideas nuevas en el campo académico del análisis cuantitativo. Si bien es cierto que el futuro del análisis de datos resulta incierto el día de hoy, podemos apostar que una buena parte de él será escrito en R.

¿Dónde aprender R?

Existen numerosos recursos en Internet donde podrás encontrar recursos libres con los cuales podrás dar tus primeros pasos en R. Nosotros, en PeruStat, prometemos ir compartiendo éstos, así como tips que podrán ayudarte. Por el momento, este 8 de Noviembre iniciamos un curso muy bien estructurado y diseñado, dictado por dos excelentes instructores, quienes abordarán los fundamentos del análisis estadístico de datos, utilizando R. Si
deseas enterarte más del curso, puedes ir a nuestra sección correspondiente, a través del siguiente enlace: http://www.perustat.com/cursos/fundamentos-de-analisis-estadistico-de-datos-con-r/.

Fuentes:

http://r4stats.com/2012/05/09/beginning-of-the-end/
http://liondatasystems.com/media.html
http://www.revolutionanalytics.com/why-revolution-r/whitepapers/r-is-hot.php