identificación de los requisitos que afectan al archivado de datos

25
IDENTIFICACIÓN DE LOS REQUISITOS QUE AFECTAN AL ARCHIVADO DE DATOS Mejorar el rendimiento de las consultas Si una base de datos de producción contiene datos obsoletos que no se utilizan nunca o sólo en raras ocasiones, la ejecución de las consultas puede llevar mucho tiempo. Esto se debe a que las consultas también realizan búsquedas en los datos obsoletos. Para mejorar el rendimiento, puede mover los datos obsoletos de la base de datos de producción a otro servidor y, si es necesario, ejecutar las consultas desde este último. Disminuir el uso de espacio en Disco Los datos obsoletos ocupan una gran cantidad de espacio en disco. El archivado de estos datos permite liberar este espacio para utilizarlo con otros propósitos. Si los datos obsoletos se almacenan en un costoso sistema de disco, como una red de área de almacenamiento (SAN), el archivado de estos datos puede ayudar a reducir considerablemente los costos de almacenamiento. Reducir la ventana de mantenimiento Realizar operaciones de mantenimiento, como volver a indizar o desfragmentar, en tablas de gran tamaño con una gran cantidad de datos obsoletos puede llevar mucho tiempo. Con el archivado de datos se puede reducir el tiempo necesario para estas operaciones, así como para la copia de seguridad y la restauración de bases de datos. Consideraciones para determinar la cantidad de datos que se puede archivar Para determinar cuántos datos se pueden archivar en las bases de datos, se deben tener en cuenta factores clave como los requisitos reguladores y empresariales, además de la

Upload: alejandro-ramirez

Post on 13-Jul-2016

4 views

Category:

Documents


1 download

DESCRIPTION

Solo con fines académicos.

TRANSCRIPT

Page 1: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

IDENTIFICACIÓN DE LOS REQUISITOS QUE AFECTAN AL ARCHIVADO DE DATOS

Mejorar el rendimiento de las consultas

Si una base de datos de producción contiene datos obsoletos que no se utilizan nunca o sólo en raras ocasiones, la ejecución de las consultas puede llevar mucho tiempo. Esto se debe a que las consultas también realizan búsquedas en los datos obsoletos. Para mejorar el rendimiento, puede mover los datos obsoletos de la base de datos de producción a otro servidor y, si es necesario, ejecutar las consultas desde este último.

Disminuir el uso de espacio en Disco

Los datos obsoletos ocupan una gran cantidad de espacio en disco. El archivado de estos datos permite liberar este espacio para utilizarlo con otros propósitos. Si los datos obsoletos se almacenan en un costoso sistema de disco, como una red de área de almacenamiento (SAN), el archivado de estos datos puede ayudar a reducir considerablemente los costos de almacenamiento.

Reducir la ventana de mantenimiento

Realizar operaciones de mantenimiento, como volver a indizar o desfragmentar, en tablas de gran tamaño con una gran cantidad de datos obsoletos puede llevar mucho tiempo. Con el archivado de datos se puede reducir el tiempo necesario para estas operaciones, así como para la copia de seguridad y la restauración de bases de datos.

Consideraciones para determinar la cantidad de datos que se puede archivar

Para determinar cuántos datos se pueden archivar en las bases de datos, se deben tener en cuenta factores clave como los requisitos reguladores y empresariales, además de la granularidad de los datos para archivo, como se describe en la siguiente tabla.

Requisitos empresariales

La cantidad de datos en línea que los usuarios necesitan depende del tipo de actividad empresarial que realice la organización. Por ejemplo, las organizaciones del sector médico tienen requisitos distintos a las del sector bancario.

Para identificar los requisitos de datos en línea de su organización, debe consultar con los expertos clave de la compañía. Con el asesoramiento que reciba de estos expertos podrá conocer qué datos no necesitan acceso inmediato y moverlos a dispositivos de copia de seguridad o a servidores menos costosos.

Page 2: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

Requisitos reguladores

Las regulaciones empresariales pueden estipular durante cuánto tiempo debe estar disponible en línea la información. Por ejemplo, en muchos países, la ley exige a los bancos mantener en línea determinados datos de clientes durante un número específico de años.

Por tanto, es necesario considerar el efecto de los requisitos reguladores a la hora de determinar los datos que se pueden almacenar sin conexión. Asimismo, se debe tener en cuenta el tiempo que los datos estarán disponibles en línea, si así se solicita.

Granularidad de los datos para archivo

Es posible que no necesite contar con datos detallados una vez transcurrido cierto tiempo. En estos casos, puede mantener en línea tablas de resumen y archivar los datos detallados en un almacenamiento sin conexión.

Directrices para determinar los requisitos de accesibilidad de los datos archivados

Utilice las siguientes directrices para determinar los requisitos de accesibilidad de los datos archivados:

Identificar los datos a los que no se tiene acceso. Puede resultar difícil realizar un seguimiento del uso de ciertos datos después de un período de tiempo específico. Para ello, puede utilizar herramientas como Traza de SQL y Analizador de SQL Server. Estas herramientas permiten determinar si los usuarios han tenido acceso a una tabla concreta o a un conjunto de filas de una tabla durante un período dado. Cuando utilice estas herramientas, puede que necesite examinar los argumentos de búsqueda de las consultas para conocer los datos a los que los usuarios tienen acceso. Asimismo, puede determinar los requisitos de accesibilidad de los datos mediante procedimientos almacenados para registrar los argumentos de búsqueda al consultar determinadas tablas.

Desarrollar un catálogo para las necesidades de accesibilidad. Para desarrollar un catálogo, necesita identificar un tiempo de respuesta aceptable para la recuperación de los datos archivados. A continuación, debe crear secciones de tiempo y clasificar los datos según estas secciones. Es necesario asegurarse de que la clasificación de los datos cumple con los requisitos de las consultas. En la siguiente tabla se muestra un ejemplo de estrategias de archivado para distintos requisitos de accesibilidad

Page 3: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

Requisito de accesibilidad Posible estrategia de archivado de datos

Acceso en 24 horas

Para proporcionar acceso a los datos archivados en 24 horas, puede utilizar medios de almacenamiento como cintas. Las cintas son seguras y relativamente económicas, aunque más lentas que los discos duros y los medios ópticos.

Acceso en dos horas

Para proporcionar acceso a los datos archivados en dos horas, puede utilizar servidores de archivos de almacenamiento. Estos servidores requieren menos recursos y tienen capacidades de procesamiento inferiores a las del servidor principal que aloja la base de datos de producción. La capacidad del servidor de archivos de almacenamiento es normalmente igual o superior a la del servidor principal.

Acceso inmediato

Para proporcionar acceso inmediato a los datos archivados, puede utilizar un servidor de archivos de almacenamiento independiente con suficiente capacidad de procesamiento para admitir las consultas de los datos archivados.

DISEÑO DE UNA ESTRATEGIA DE ARCHIVADO DE DATOS

Formas de estructurar los datos para archivo

Los datos para archivo se pueden estructurar mediante el uso de cuatro tipos de tablas: con particiones, normalizadas, no normalizadas y de resumen, como se describe en la siguiente tabla.

Por particiones

Las versiones anteriores de SQL Server no permitían la creación y el mantenimiento de esquemas de particiones. Como consecuencia, el uso de la característica de creación de particiones no estaba muy extendido. En su lugar, se empleaban las vistas con particiones de unión para estructurar los datos para archivo. Con los avances realizados en SQL Server 2005, se recomienda el uso de tablas con particiones para estructurar bases de datos de gran tamaño para el archivado.

Las tablas con particiones y sus índices se pueden colocar en grupos de archivos independientes. Además, es posible volver a crear automáticamente particiones de datos en varias tablas, así como agregar y quitar tablas de una partición. Una vez que se quita una tabla de una partición, la tabla y su índice se pueden mover al destino de archivo. De forma predeterminada, un índice que se crea en una tabla con particiones utiliza la misma función de partición. Como resultado, el índice se alinea con la tabla, lo que simplifica la administración de los datos. Puede cambiar la configuración predeterminada y alinear el índice con otra función de partición, o bien decidir no crear particiones en el índice. Sin embargo, estas estructuras dificultan la tarea de archivar los datos.

Ejemplo

Page 4: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

Una compañía necesita conservar las facturas del mes actual para que se puedan modificar, así como las de los últimos cinco años para posibles consultas. En este caso, el administrador de bases de datos puede crear una tabla con particiones que incluya dos grupos de archivos. Se puede utilizar un grupo de archivos de lectura y escritura para almacenar las facturas del mes actual y un grupo de sólo lectura para archivar las facturas de los cinco años anteriores hasta el mes pasado completo. Al final de cada mes, se deben realizar operaciones como las de procesos por lotes de Transact-SQL para mover los datos desde la partición del mes actual a la partición de archivo.

Normalizadas

El archivado de datos relacionados mantiene el contexto histórico de los datos y evita la duplicación. Para realizar esta operación, puede emplear tablas normalizadas para estructurar los datos para archivo. Al utilizar estas tablas, debe asegurarse de que en ellas puede incluir cambios en los valores de búsqueda o tablas relacionadas. Una forma de lograrlo es mediante la adición de la validez de intervalo de fechas a las tablas normalizadas. A continuación, puede especificar los intervalos de fechas para los valores de búsqueda válidos.

Ejemplo

En el procesamiento de pedidos, es necesario que el archivo tenga una tabla Customers con datos relacionados como CustomerID, CustomerName, CustomerFiscalID, Address, etc. Habrá también una tabla Orders que contenga campos como OrdersID, CustomerID, OrderDate y Notes, así como una tabla OrderDetails que incluya campos como OrderID, LineNumber, ProductID, Quantity, UnitPrice, Discount, además de otra información necesaria.

No normalizadas

Si no es posible archivar todos los datos relacionados, puede utilizar tablas no normalizadas para conservar el contexto histórico de los datos. Estas tablas almacenan valores reales en lugar de referencias a los datos actuales. Por tanto, resultan más útiles para optimizar consultas que incluyan combinaciones complejas.

Además de las tablas no normalizadas, puede utilizar vistas indizadas para cancelar la normalización de los datos. Debido a que las tablas no normalizadas conservan los datos físicamente, éstos se pueden recuperar más rápidamente que desde las vistas indizadas. Sin embargo, las tablas no normalizadas requieren espacio en disco adicional. Además, se deben volver a crear periódicamente y no se actualizan de forma automática como las vistas indizadas. También es probable que necesite modificar la aplicación original y los informes para consultar las tablas no normalizadas.

Ejemplo

Page 5: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

Si no es posible archivar todos los datos relacionados, puede utilizar tablas no normalizadas para conservar el contexto histórico de los datos. Estas tablas almacenan valores reales en lugar de referencias a los datos actuales. Por tanto, resultan más útiles para optimizar consultas que incluyan combinaciones complejas.

Además de las tablas no normalizadas, puede utilizar vistas indizadas para cancelar la normalización de los datos. Debido a que las tablas no normalizadas conservan los datos físicamente, éstos se pueden recuperar más rápidamente que desde las vistas indizadas. Sin embargo, las tablas no normalizadas requieren espacio en disco adicional. Además, se deben volver a crear periódicamente y no se actualizan de forma automática como las vistas indizadas. También es probable que necesite modificar la aplicación original y los informes para consultar las tablas no normalizadas.

Creación de particiones de tablas en una estrategia de archivado de datos

Una organización de venta directa precisa mantener en línea los datos de ventas de los 12 meses anteriores por motivos de consulta y de elaboración de informes. Los datos restantes se pueden archivar en una base de datos independiente en un servidor de archivos de almacenamiento.

Para poder estructurar y archivar correctamente la tabla de ventas, el administrador de bases de datos crea particiones mensuales de la misma.

Posteriormente, el administrador de bases de datos crea una tabla de archivos de almacenamiento de la que crea particiones mensuales, al igual que hizo con la de ventas. En esta tabla se almacenan datos anteriores a 12 meses.

A final de cada mes, el administrador de bases de datos transfiere los datos de ventas del mes más antiguo a la tabla de archivos de almacenamiento. Este método de creación de particiones de tablas se conoce como técnica de ventana deslizante.

Por ejemplo, a final del mes de julio de 2006, el administrador de bases de datos desea archivar los datos de ventas de agosto de 2005.

En primer lugar, crea una partición vacía para agosto de 2006 en la tabla de ventas.

A continuación, separa la partición para agosto de 2005.

Seguidamente, el administrador de bases de datos copia los datos de ventas de agosto de 2005 en una tabla en la base de datos de archivo.

Luego agrega esta tabla como nueva partición en la tabla de archivos de almacenamiento.

Por último, elimina los datos de agosto de 2005 de la tabla de ventas.

Page 6: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

Consideraciones para elegir la estructura de los datos para archivo

Al elegir la estructura de los datos para archivo, debe tener en cuenta los requisitos de accesibilidad de los datos y los costos de almacenamiento, como se describe en la siguiente tabla.

Accesibilidad de los datos

Si se va a desarrollar una nueva aplicación para tener acceso a los datos archivados, puede utilizar las tablas no normalizadas. También puede conservar sólo una parte de la información detallada y descartar los datos restantes. Si la aplicación actual tiene que utilizar el mismo mecanismo para tener acceso tanto a los datos en línea como a los que se encuentran archivados, las estructuras de ambos tipos deberán ser idénticas.

Además, los requisitos de accesibilidad influyen en la estructura de los datos, ya que determinan las reglas de archivado, las restricciones que limitan la capacidad de actualizar los datos archivados y la cantidad de espacio que se puede utilizar para almacenarlos. Asimismo, estos requisitos condicionan el margen de tiempo para la aceptación de actualizaciones en los datos archivados, que, a su vez, puede depender de requisitos reguladores.

Costos de almacenamiento

A la hora de elegir la estructura de los datos para archivo, debe tener en cuenta los costos del hardware para el almacenamiento de la información. Almacenar los datos para archivo en línea para tener acceso a ellos resulta más costoso que almacenarlos sin conexión. Cuando se utilizan tablas no normalizadas para los datos archivados, se necesita espacio adicional en disco, lo que genera un aumento en los costos de almacenamiento. Para reducir los costos de hardware, puede guardar en línea sólo los datos de resumen y almacenar sin conexión los detallados. No obstante, el almacenamiento sin conexión puede implicar ciertos costos no contemplados, como los de transporte o de recuperación que cargan las compañías de mensajería externas. Asimismo, necesita tener la garantía de que no se pone en peligro la seguridad de los datos que se almacenan sin conexión.

Nota

Si la estructura de los datos para archivo difiere de los datos de origen en línea, es probable que también haya gastos adicionales para desarrollar aplicaciones e informes que permitan tener acceso a los datos archivados.

CREACIÓN DE UN PLAN DE ARCHIVADO DE DATOS

El archivado de datos es un proceso complejo que debe planearse correctamente para que la transferencia de información de una base de datos de producción al medio de archivo no interrumpa las operaciones que se realizan normalmente. Por ello, la creación de un plan de archivado debe ser una parte integrante del diseño de una infraestructura de servidores de

Page 7: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

bases de datos. El plan debe definir el ámbito del archivado, así como la arquitectura de los datos archivados.

Proceso de creación de un plan de archivado de datos

Para crear un plan de archivado de datos, realice los siguientes pasos

Determinar los datos que se pueden archivar

Es necesario identificar los datos que se han seleccionado para archivar y justificar la selección en el plan de archivado de datos. Debe describir los criterios que ha seguido para elegir los datos. Estos criterios se basan principalmente en requisitos empresariales y reguladores. Por ejemplo, puede que una organización, debido a requisitos empresariales, necesite conservar en línea los datos de los últimos 13 meses para actualizaciones. Por otra parte, determinados requisitos reguladores podrían estipular que deben estar accesibles los últimos cinco años de datos para la elaboración de informes. Por lo tanto, se deben tener en cuenta estos dos requisitos al crear un plan de archivado.

También es necesario explicar cómo se obtienen los datos seleccionados del ámbito del proyecto de archivado.

Seleccionar un formato de almacenamiento

El formato de almacenamiento es el tipo de medio que se utiliza para almacenar los datos archivados. La elección de este formato viene determinada por los requisitos de accesibilidad y estructura de los datos para archivo.

En función de los requisitos establecidos, se puede almacenar la información en cintas o en medios ópticos o magnéticos de bajo costo. También es posible almacenarla en una base de datos independiente en el servidor de producción o utilizar un servidor dedicado para ello.

Desarrollar una estrategia de movimiento de datos

La estrategia de movimiento de datos describe la forma en la que se pueden trasladar los datos para archivo desde el servidor de producción al formato de almacenamiento de destino. Al desarrollar la estrategia, debe tener en cuenta la frecuencia del movimiento de los datos y su efecto en el tráfico de red.

Si necesita mover los datos a un servidor de archivos de almacenamiento, determine si precisa utilizar la transferencia de datos directa o indirecta; el modelo de transferencia necesario dependerá del tipo de conexión entre el servidor de producción y el servidor de archivos de almacenamiento. Por último, debe considerar los riesgos de seguridad que conlleva el movimiento de los datos y definir las medidas necesarias para protegerlos durante esta operación

Page 8: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

Directrices para decidir qué datos se deben archivar

Utilice las directrices siguientes para determinar qué datos se deben archivar

Identificar los datos obsoletos

Debe analizar las tablas pertenecientes a la aplicación principal e identificar los datos que no se actualizan nunca y que rara vez se consultan. Asimismo, necesita conocer qué datos deben estar en línea para actualizaciones y consultas. Posteriormente puede archivar los datos restantes. Al seguir este enfoque, es necesario establecer una ventana deslizante que indique el tiempo que delimita los datos en línea de los datos para archivo. Por ejemplo, puede ocurrir que algunas regulaciones empresariales requieran que una organización conserve los datos en línea de los últimos seis años. En este caso, el administrador de bases de datos puede archivar la información que tenga una antigüedad mayor.

Calcular la reducción en el costo del espacio en disco

Si con el archivado de datos se logra recuperar una considerable cantidad de espacio en disco, el ahorro en el costo de espacio es significativo. Puede que no merezca la pena archivar datos que sólo ocupen una pequeña cantidad de espacio en disco. Al calcular el ahorro en el costo de espacio en disco, debe también considerar que al archivar los datos se consiguen archivos de copia de seguridad más pequeños, lo que reduce aún más el uso del espacio en disco y otros medios de almacenamiento

Calcular las ventajas en rendimiento

El archivado de datos ayuda a reducir el uso del disco, la memoria y la CPU. Puede utilizar Monitor de sistema para determinar la mejora del rendimiento que experimentan los recursos del sistema cuando se utiliza el archivado. Tampoco debe olvidar el impacto que tiene archivar datos en las tareas de mantenimiento, como volver a indizar o desfragmentar y realizar copias de seguridad

Determinar el intervalo de archivos

Puede determinar el intervalo de archivado en función de las necesidades empresariales y la naturaleza de los datos. Por ejemplo, si necesita conservar en línea los datos de los últimos 13 meses, puede archivarlos a intervalos mensuales. Del mismo modo, si tiene que mantener en línea los datos del presente año hasta la fecha, puede archivarlos a intervalos anuales

Page 9: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

Consideraciones para seleccionar un formato de almacenamiento de los datos para archivo

Los datos para archivo se pueden almacenar en distintos formatos, como, por ejemplo, cintas, discos o medios ópticos, que difieren en características como pueden ser el costo, la accesibilidad, la vida útil, la confiabilidad, la durabilidad y la seguridad.

Tenga en cuenta los siguientes factores al seleccionar un formato de almacenamiento de los datos para archivo:

Costo. Si necesita archivar con frecuencia volúmenes considerables de datos, el costo de almacenamiento es un importante condicionante a tener en cuenta. Las cintas suelen tener un menor costo por megabyte de datos que los discos o los medios ópticos.

Accesibilidad. Si necesita el acceso rápido a la información archivada, puede utilizar discos o medios ópticos en lugar de cintas. La recuperación de los datos es más rápida con discos y medios ópticos porque estos formatos admiten el acceso aleatorio, a diferencia de las cintas, que admiten el secuencial.

Nota

En la actualidad hay disponibles dispositivos de cintas paralelas que ofrecen mejoras considerables en los tiempos de acceso, aunque su costo es elevado.

Vida útil. La vida útil hace referencia a la duración del formato de almacenamiento. Por ejemplo, las cintas tienen una vida útil más larga que los discos y los medios ópticos. Numerosos formatos de almacenamiento electrónico, como los DVD, son relativamente nuevos, por lo que no se puede determinar fácilmente su vida útil. Debe asegurarse de seguir las recomendaciones del proveedor para almacenar los datos archivados en condiciones ambientales adecuadas.

Confiabilidad y durabilidad. Algunos formatos son más delicados que otros en cuanto al manejo y uso debido de los materiales empleados. Como resultado, se pueden degradar más rápidamente. Por ejemplo, las cintas tienden a deteriorarse más fácilmente que los discos o los medios ópticos.

Seguridad. La mayoría de los formatos admiten el cifrado. Sin embargo, la carga administrativa y los productos de otros fabricantes implicados varían. Por ejemplo, hay productos de terceros para el cifrado de datos tanto en cintas como en discos. Además de cifrar los datos para archivo, debe asegurarse de que los datos se almacenan en una ubicación segura.

Sugerencia

Puede crear una tabla comparativa en la que se tengan en cuenta estas consideraciones. Esta tabla le servirá de ayuda para seleccionar el formato de almacenamiento adecuado de los datos para archivo

Page 10: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

Utilice la siguiente tabla para comparar los formatos de almacenamiento en función de las consideraciones que se deben tener en cuenta.

Formato de almacenamiento Costo Accesibilidad Vida

útilConfiabilidad y

durabilidad Seguridad

CintaDiscoAlmacenamiento óptico

Directrices para desarrollar una estrategia de movimiento de datos para archivo

Utilice las siguientes directrices para desarrollar una estrategia de movimiento de datos para archivo.

Especificar la frecuencia del movimiento de los datos

Los datos para archivo se pueden mover desde el servidor de producción al formato de almacenamiento de destino de forma programada o arbitraria. El movimiento de datos con una programación establecida permite crear un proceso que se automatiza y prueba fácilmente y que, por lo tanto, causa menos errores

Minimizar el impacto del movimiento de los datos

Al elegir la frecuencia de archivado, es preciso considerar el impacto del movimiento de datos. Es necesario porque determinados tipos de informes de datos podrían interferir con el archivado de datos programado. Por ejemplo, una organización genera informes de ventas por cada producto trimestralmente. Si el administrador de bases de datos archiva los datos cada trimestre, este movimiento de datos programado no debe afectar a la generación de informes.

El movimiento de datos se debe programar cuando la carga de usuarios sea baja. Además, se recomienda mover periódicamente conjuntos pequeños de datos en lugar de conjuntos de gran tamaño.

Asegúrese de que los datos para archivo se trasladan desde el servidor de producción al formato de almacenamiento de destino de forma óptima. Por ejemplo, puede mover primero los datos a un servidor con un buen rendimiento de disco para que el impacto en el de

Page 11: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

producción sea mínimo. A continuación, puede copiar los datos en un servidor de archivos de almacenamiento sin que se vea afectado el servidor de producción.

Decidir entre transferencia directa e indirecta

Si necesita mover los datos a un servidor de archivos de almacenamiento, debe tener en cuenta el tipo de conexión entre el servidor de producción y el de archivos de almacenamiento.

Si hay una conexión directa, puede utilizar herramientas como SQL Server Integration Services (SSIS) y la réplica para la transferencia de los datos. También puede emplear consultas para transferir datos entre los servidores vinculados.

Si la conexión es indirecta, necesita almacenar los datos en un formato intermedio, como una cinta o un DVD, antes de moverlos al servidor de archivos de almacenamiento. Para la transferencia indirecta de datos se emplean herramientas como SSIS y la utilidad bcp. También puede utilizar el comando Backup que proporciona SQL Server.

Garantizar la seguridad de los datos durante el movimiento

Debe asegurarse de que todos los formatos de almacenamiento y las conexiones de red implicadas en el movimiento de datos sean seguros.

Por ejemplo, suponga que los datos para archivo se trasladan de un servidor de producción a una cinta a través de un servidor intermedio. En este caso, el administrador de datos debe confirmar que los dos servidores y la ubicación de almacenamiento de cinta sean seguros y que las conexiones de red entre ellos estén protegidas. También debe comprobar que las conexiones de red entre la ubicación y los dos servidores son seguras, así como las propias conexiones de red entre los servidores.

Los datos almacenados en un formato portátil, como una cinta, resultan más vulnerables a los ataques de seguridad que los almacenados en un servidor de archivos de almacenamiento de un centro de datos seguro. Para conseguir mayor protección, se puede utilizar la transferencia de datos cifrados y archivos cifrados.

Recomendar los pasos para la comprobación de los datos

Debe asegurarse de que los datos para archivo se han copiado correctamente en el formato de almacenamiento de destino antes de eliminar los datos de origen. Por tanto, la estrategia de movimiento de datos también debe incluir pasos para la comprobación de los datos.

Por ejemplo, si utiliza cintas para almacenar los datos para archivo, es necesario que recupere los datos para comprobar que se han copiado correctamente. De la misma forma, puede comprobar los datos copiados en discos o medios ópticos simplemente consultándolos.

Page 12: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

Laboratorio

Escenario

Es un administrador de bases de datos en Adventure Works Cycles. El servidor de bases de datos de procesamiento de transacciones en línea (OLTP) de las oficinas centrales de la compañía almacena una gran cantidad de datos de ventas que no se actualizan nunca y rara vez se consultan. Estos datos obsoletos han ralentizado operaciones de mantenimiento del servidor como las de nueva indización o desfragmentación. Las bases de datos de las sucursales tienen un tamaño mucho menor y se pueden administrar de forma efectiva sin necesidad de recurrir al archivado. Para acelerar las operaciones de mantenimiento en el servidor OLTP, se ha solicitado al equipo de administradores de bases de datos que archiven los datos obsoletos en el servidor.

Información general de Adventure Works Cycles

Adventure Works Cycles es una gran multinacional que fabrica y comercializa bicicletas de metal y material compuesto en Europa y Asia. Esta compañía tiene sus oficinas centrales en Madrid y sucursales en Estocolmo y Bangalore. Es necesario rediseñar la infraestructura de servidores de bases de datos de la compañía para admitir el creciente número de ventas.

Infraestructura de servidores de bases de datos existente

Oficinas centrales

El servidor principal de bases de datos OLTP está situado en las oficinas centrales y aloja la base de datos AdventureWorks. El almacén de datos se encuentra en un servidor independiente. Además, los servidores de bases de datos siguientes están en varios departamentos de las oficinas centrales:

Fabricación Investigación y desarrollo (I+D) Ventas

Contabilidad

Sucursales

Los servidores de bases de datos de las dos sucursales almacenan sólo datos de ventas. Al final de cada día, los nuevos datos de ventas de las dos sucursales se cargan en el servidor OLTP. Las sucursales se comunican con las oficinas centrales por medio de dos líneas T1 dedicadas. Además, las oficinas centrales y las sucursales emplean una conexión de 100 MB para la comunicación interna.

Configuración de los servidores

Page 13: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

En la siguiente tabla se presentan los datos de configuración del servidor OLTP en las oficinas centrales y de los servidores en las sucursales:

Ubicación Servidor de bases de datos Configuración

Oficinas centrales AWDB01

4 CPU 4 GB de RAM Un depósito RAID externo con 14 unidades, cada

una de ellas de 36 GBo Archivos de copia de seguridad: 3 unidades

RAID0 en unidad N: (108 GB totales)o Archivos de registro: 2 unidades RAID1 en

unidad L: (36 GB totales)o Archivos de datos: 8 unidades RAID5 en

unidad M: (252 GB totales)o 1 matriz de unidad externa

Windows Server 2003 Enterprise Edition SQL Server 2005 Enterprise Edition

Estocolmo STAWDB01

2 CPU 4 GB de RAM Almacenamiento conectado directo interno Windows Server 2003 Enterprise Server SQL Server 2005 Enterprise Edition

Bangalore STAWDB02

1 CPU 4 GB de RAM Almacenamiento conectado directo interno Windows Server 2003 Enterprise Server SQL Server 2005 Standard Edition

Problemas de infraestructura

Los problemas siguientes se refieren específicamente al servidor de bases de datos OLTP:

El servidor no está sobrecargado, pero casi ha alcanzado el máximo de su capacidad.

Aunque el rendimiento de las consultas es correcto, algunos usuarios han comenzado a informar de retrasos.

Las unidades de disco están cargadas y el depósito RAID externo se está quedando sin espacio.

Page 14: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

El uso de la CPU llega a casi el 95% de media durante una jornada laboral normal. La base de datos contiene muchos datos históricos de ventas. Todos los informes se ejecutan actualmente desde el servidor OLTP, lo que le

agrega más carga.

Entre otros problemas con la infraestructura de servidores de bases de datos actual se incluyen:

El tamaño del almacén de datos es insuficiente. Los datos se distribuyen en muchos servidores, lo que dificulta a los

administradores de bases de datos la tarea de administrarlos. No hay un plan general global en la compañía para recuperar datos en caso de

desastre. Los estándares y convenciones de nomenclatura de las bases de datos y de la

infraestructura no son coherentes entre las oficinas.

Información sobre el diseño

Un equipo de administradores de bases de datos ha recibido la tarea de rediseñar la infraestructura de servidores de bases de datos. Los responsables de administración esperan que el equipo elabore lo siguiente:

Un cálculo para ampliar la capacidad del servidor de bases de datos OLTP Una estrategia para archivar datos históricos de ventas Una estrategia para consolidar servidores de bases de datos Una estrategia para distribuir datos de ventas Un diagrama del diseño de la infraestructura de servidores de bases de datos Una solución de recuperación de datos Estándares y convenciones de nomenclatura de las bases de datos y de la

infraestructura

En este laboratorio, diseñará una estrategia para archivar los datos obsoletos almacenados en el servidor OLTP.

Recursos

Como primer paso en el desarrollo de la estrategia, un administrador de bases de datos de las oficinas centrales de Adventure Works Cycles compiló una lista de los requisitos de archivado.

Requisitos de archivado

La base de datos almacena 15 años de datos. Sin embargo, los usuarios sólo necesitan actualizar y consultar los datos de ventas de los últimos 13 meses.

Los datos de ventas aumentan a un ritmo aproximado de un 1,5% al mes.

Page 15: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

Los informes sobre los datos archivados deben estar disponibles al siguiente día laboral una vez se solicitan.

A continuación, el administrador se entrevistó con el patrocinador del proyecto con el fin de clarificar los requisitos y obtener información aún no proporcionada.

Preguntas y respuestas de la entrevista

Éstas son las respuestas del patrocinador del proyecto a las preguntas del administrador de bases de datos.

¿Cuánto tiempo deben permanecer almacenados los datos para consultas y elaboración de informes?

Los contables de Adventure Works Cycles necesitan que se almacenen los últimos siete años de datos, tanto en línea como archivados, para que se puedan realizar consultas y elaborar informes.

¿Cuál es el presupuesto para el proyecto de archivado? Hay suficiente presupuesto para adquirir un nuevo servidor para almacenar los datos

archivados.

Ejercicio: Diseño de una solución de archivado

En este ejercicio, diseñará una estrategia para el archivado de los datos obsoletos almacenados en el servidor de bases de datos OLTP de las oficinas centrales de Adventure Works Cycles.

Para que la estrategia de archivado reciba la aprobación de la administración, es importante diseñarla con un formato estructurado. Para este fin, se proporciona una plantilla que ayudará a registrar las recomendaciones. La plantilla incluye un resumen completo de los requisitos. Asimismo, se proporcionan secciones para documentar la estructura propuesta, el formato de almacenamiento de los datos para archivo y la estrategia de movimiento de datos.

En primer lugar, imprima la plantilla. A continuación, analice los requisitos y rellene la información requerida en cada sección. Para que la estrategia sea convincente, explique los motivos de las decisiones tomadas.

Solución de archivadoRequisitos

Los requisitos completos de archivado son los siguientes:

La base de datos almacena 15 años de datos. Sin embargo, los usuarios sólo necesitan actualizar y consultar los datos de ventas de los últimos 13 meses.

Los datos de ventas aumentan a un ritmo aproximado de un 1,5% al mes.

Page 16: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

Los informes sobre los datos archivados deben estar disponibles al siguiente día laboral una vez se solicitan.

Se deben almacenar los últimos 7 años de datos, tanto en línea como archivados, para consultas y elaboración de informes.

Hay suficiente presupuesto para adquirir un nuevo servidor para almacenar los datos archivados.

Estructura de los datos para archivo

¿Cuál es su propuesta para estructurar los datos para archivo? Escriba la respuesta en el espacio que se proporciona a continuación.

_________________________________________________________________________

_________________________________________________________________________

________________________________________________________________________

_________________________________________________________________________

Formato de almacenamiento de los datos para archivo

¿Qué formatos de almacenamiento utilizará para archivar los datos? Rellene la siguiente tabla.

Origen de los datos Requisito de accesibilidad Formato de almacenamientoEn líneaArchivadosSin conexión

Explique sus motivos en el espacio que se proporciona a continuación.

_________________________________________________________________________

_________________________________________________________________________

_________________________________________________________________________

_________________________________________________________________________

_________________________________________________________________________

Page 17: Identificación de Los Requisitos Que Afectan Al Archivado de Datos

Programación del movimiento de datos

¿Cómo moverá los datos para archivo desde el servidor de bases de datos OLTP a los formatos de almacenamiento elegidos? Rellene la siguiente tabla. En el espacio situado debajo de la tabla, explique los motivos de la programación que ha planeado.

Movimiento de datos Frecuencia123

Explique sus motivos en el espacio que se proporciona a continuación.

________________________________________________________________________

_________________________________________________________________________

_________________________________________________________________________

_________________________________________________________________________