Download - UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1
![Page 1: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/1.jpg)
UNIDAD 1ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA
EL ALMACENAMIENTO DE BIG DATA
1
![Page 2: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/2.jpg)
2
ÍndiceIntroducción
Big Data
Arquitectura HDFS
Proceso de Lectura de datos
Proceso de Escritura de datos
Q&A
1
2
3
4
5
6
![Page 3: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/3.jpg)
3
Generamos más datos que nunca
![Page 4: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/4.jpg)
4
Usos potenciales
• Análisis de negocio• Recomendaciones de producto• Previsión de demanda• Seguridad ciudadana• Estadística• …
![Page 5: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/5.jpg)
5
Big Data
Toda esta enorme cantidad de información que se genera cada día y los sistema preparados para procesarla con el objetivo de ayudar en la toma de decisiones o análisis estadístico es lo que se conoce como Big Data.
![Page 6: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/6.jpg)
6
Dificultades técnicas principales
• Almacenamiento• Procesamiento• Heterogeneidad de los datos
![Page 7: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/7.jpg)
7
Almacenamiento
Aumento de capacidad de almacenamientoDisminución del precio por MBAumento de ratio de transferencia en porcentajes muy inferiores
![Page 8: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/8.jpg)
8
Almacenamiento - Contención
![Page 9: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/9.jpg)
9
Procesamiento
• Tradicionalmente para aumentar la capacidad de procesamiento se ha optado por aumentar los recursos disponibles en un servidor o adquirir otro de mayor capacidad.
• Sin embargo, es posible repartir el trabajo a realizar distribuyéndolo entre servidores de menor capacidad con un almacenamiento propio y un conjunto de datos único, evitando contención, SPOF y abaratando costes.
![Page 10: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/10.jpg)
10
Procesamiento
“ In pioneer days they used oxen for heavy pulling, and when one ox couldn’t budge a log, we didn’t try to grow a larger ox.”
Grace Hopper, early advocate of distributed computing (1906-1992)
![Page 11: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/11.jpg)
11
Heterogeneidad
Las soluciones tradicionales de almacenamiento y tratamiento de los datos (RDBMS con herramientas de Business Intelligence o Data Mining) no son
válidas, pues es difícil homogeneizar toda esta información en un modelo de datos que permita almacenarlo de manera estructural 
![Page 12: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/12.jpg)
12
HadoopPara cubrir esta necesidad surgió en 2005 Hadoop.
Hadoop es todo un ecosistema de aplicaciones que permite el procesamiento distribuido de largas cantidades de datos repartiéndolos entre todos los nodos de un cluster de servidores usando modelos de
programación sencillos (MapReduce)
![Page 13: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/13.jpg)
13
Arquitectura Hadoop HDFS
• BloquesBloques de gran tamaño replicados
• NameNodesMetadatos
• DataNodesDatos
![Page 14: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/14.jpg)
14
Operación de lectura
![Page 15: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/15.jpg)
15
Operación de escritura
![Page 16: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/16.jpg)
16
Más información

Oracle Big Data (https://www.oracle.com/bigdata/index.html)
Hadoop: The Definitive Guide
Cloudera (http://www.cloudera.com)
![Page 17: UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA 1](https://reader036.vdocuments.co/reader036/viewer/2022070417/5665b4291a28abb57c8fac23/html5/thumbnails/17.jpg)
17
Q&A