análisis de datos: r vs python
TRANSCRIPT
R vs Python para el análisis de datos
Ing. Cristian Rojas
Representante miembros honorarios – GLUD
Análisis de datos
Qué es RLenguaje de
programación orientado a estadística.
Basado en S. Publicado en 1993.
Escrito en C
Lenguaje de programación
orientado a estadística.
Basado en S. Publicado en 1993.
Escrito en C
Qué es Python
Lenguaje de programación multiproposito.
Creador: Guido Van Rossem
Publicado en 1991.
Escrito en C
Licencias
Extendiendo funcionalidad
Usabilidad y facilidad de aprendizaje
Código orientado a legibilidad y facilidad
Desarrollado por estadísticos para
estadísticos.
Dataset
ca
1 carat = 200mg
Visualización de datos
Visualización de datos
Visualización de datos
Análisis estadístico (Correlación)
Modelos de regresión
Cuál es el mejor?
“The closer you are to statistics,
research and data science, the more
you might prefer R”
“The closer you are to working in a engineering
environment, the more might prefer
python”
¿Para qué se va a usar?
Sitios recomendados
Referencias
● R vs Python for Data Science, recuperado de:● R or python for data analysis, recuperado de:
http://blog.datacamp.com/r-or-python-for-data-analysis/● Pandas, recuperado de: http://pandas.pydata.org/● Introduction to dplyr, recuperado de:
http://www.kdnuggets.com/2015/05/r-vs-python-data-science.htmlhttps://cran.rstudio.com/web/packages/dplyr/vignettes/introduction.html
● Histogram demo cumulative, recuperado de:http://matplotlib.org/examples/statistics/histogram_demo_cumulative.html
● Exploring data with R, recuperado de: http://www.who.int/tb/advisory_bodies/impact_measurement_taskforce/meetings/ie_apr09_p_exporing_data_r.pdf