sistema paginado

54
Sistema Sistema Paginado Paginado Santiago Elizondo Mujica Pedro Henríquez Castellano Ingeniería en Informática Diseño de Sistemas Operativos Curso 2005 - 2006

Upload: quemby-stanley

Post on 03-Jan-2016

50 views

Category:

Documents


3 download

DESCRIPTION

Sistema Paginado. Ingeniería en Informática Diseño de Sistemas Operativos Curso 2005 - 2006. Santiago Elizondo Mujica Pedro Henríquez Castellano. I N D I C E T E M A T I C O. Introducción Diagrama General Estructuras de Datos Tabla de Páginas Directorio de Páginas Cachés Gestión - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Sistema Paginado

Sistema PaginadoSistema Paginado

Santiago Elizondo Mujica

Pedro Henríquez Castellano

Ingeniería en Informática

Diseño de Sistemas Operativos

Curso 2005 - 2006

Page 2: Sistema Paginado

I N D I C E T E M A T I C O

1. Introducción2. Diagrama General3. Estructuras de Datos

• Tabla de Páginas• Directorio de Páginas• Cachés

4. Gestión • Asignación y Liberación de páginas• Asignación y Liberación de zonas de memoria (núcleo)• Bloqueo de páginas en memoria

5. Tratamiento de Excepciones6. Novedades de la Version 2.6

Page 3: Sistema Paginado

Todo proceso tiene asociado un espacio de direccionamiento donde se encuentran las zonas de memoria que le han sido asignadas.

Este espacio se compone de varias regiones de memoria:

• código

• datos

• inicializados

• no inicializados

• código y datos de las bibliotecas compartidas

• pila

Memoria del Memoria del núcleonúcleo

EntornoEntorno

ArgumentosArgumentos

PilaPila

Datos (bss)Datos (bss)

Datos (data)Datos (data)

CódigoCódigo

Espacio de direccionamiento de un proceso

0xC0000000

_end

_data

_etext

0

INTRODUCCIÓN

Page 4: Sistema Paginado

Al arrancar un proceso, no siempre es necesaria toda la información del mismo

PAGINACIÓN BAJO DEMANDA

El espacio de cada región de memoria se organiza en páginas para un mejor manejo de la información.

Cada pagina es de tamaño fijo.

INTRODUCCIÓN

Memoria del Memoria del núcleonúcleo

EntornoEntorno

ArgumentosArgumentos

PilaPila

Datos (bss)Datos (bss)

Datos (data)Datos (data)

CódigoCódigo

Espacio de direccionamiento de un proceso

0xC0000000

_end

_data

_etext

0

Page 5: Sistema Paginado

mm

task_struct

count

pgd

mmap

mmap_avl

mmap_sem

mm_struct

0x0000000

0x8048000

0x8059BB8

DATA

CODE

vm_next

vm_area_struct

vm_end

vm_start

vm_flags

vm_inode

vm_ops

vm_next

vm_area_struct

vm_end

vm_start

vm_flags

vm_inode

vm_ops

Memoria física

DIAGRAMA GENERAL

Page 6: Sistema Paginado

Los procesos necesitan direcciones contiguas

DIRECCIONES VIRTUALES(no tienen porqué ser contiguas en

memoria física)

Estas direcciones son utilizadas tanto por los procesos como por el núcleo.

Para acceder a memoria es necesario convertir la dirección virtual en una dirección física.

La dirección virtual se divide en dos partes:

• número de página

• desplazamiento

direccióndirección

PaginaPagina Desplaz.Desplaz.

PaginaPagina Desplaz.Desplaz.

Dirección virtual

Dirección física

Tabla de páginas

ESTRUCTURAS DE DATOS: TABLAS DE PÁGINAS

Page 7: Sistema Paginado

El número de página se utiliza como índice de una tabla de páginas y el desplazamiento hace referencia a la posición que ocupa el dato dentro de la página en cuestión.

Todos los accesos a memoria se realizan a través de la tabla de páginas y cada proceso tiene una propia.

Para que 2 procesos compartan una página, debe aparecer el nº de marco de la página física en sus respectivas tablas de páginas.

marco es a memoria física lo que página a memoria virtual

direccióndirección

PaginaPagina Desplaz.Desplaz.

PaginaPagina Desplaz.Desplaz.

Dirección virtual

Dirección física

Tabla de páginas

ESTRUCTURAS DE DATOS: TABLAS DE PÁGINAS

Page 8: Sistema Paginado

La tabla de páginas contiene la siguiente información:

• Flag de validación

• nº de marco (memoria física)

• información de control

Cuando el contenido de una página se altera, el núcleo se encarga de actualizar la página correspondiente

TABLA DE DESCRIPTORES

Descriptor Página de memoria

direccióndirección

PaginaPagina Desplaz.Desplaz.

PaginaPagina Desplaz.Desplaz.

Dirección virtual

Dirección física

Tabla de páginas

ESTRUCTURAS DE DATOS: TABLAS DE PÁGINAS

Page 9: Sistema Paginado

La estructura page (<include/linux/mm.h>) define el formato de cada descriptor. Contiene los siguientes campos:

struct page {page_flags_t flags; atomic_t _count; atomic_t _mapcount; unsigned long private;struct address_space *mapping; pgoff_t index; struct list_head lru;

#if defined(WANT_PAGE_VIRTUAL) void *virtual;

#endif};

ESTRUCTURAS DE DATOS: TABLAS DE PÁGINAS

Page 10: Sistema Paginado

TIPOTIPO CAMPOCAMPO DESCRIPCIÓNDESCRIPCIÓN

page_flags_t flags Estado de la página

atomic_t; _count Números de referencia a la página

atomic_t _mapcount

Contador de las entradas a la tabla de páginas. Limita la busqueda reverse mapping

unsigned long private Cuando la pagina esta libre indica el orden en el buddy system.

struct address_space

*mapping Si bit menos significativo esta a 0 o NULL es un puntero a inode, sino es un puntero a anon_vma (memoria anonima) object.Esta estructura contiene métodos como set_page_dirty

pgoff_t index index Dezplazamiento dentro del mapeado.

struct list_head lru Lista paginas a salir (algoritmo lru)

ESTRUCTURAS DE DATOS: TABLAS DE PÁGINAS

Page 11: Sistema Paginado

CONSTANTE (FLAGS)

VALOR

SIGNIFICADO

PG_locked 0 La página está bloqueada en memoria

PG_error 1 Se ha producido un error en la carga de la página en memoria

PG_referenced

2 La página ha sido accedida

PG_uptodate 3 El contenido de la página está actualizado

PG_dirty 4 Indica si el contenido de la página se ha modificado

PG_lru 5

PG_reserved 11 La página está reservada para un uso futuro, no es posible acceder a ella.

PG_private 12 Contiene datos privados (something private)

PG_writeback

13 Se indica que la pagina usa el método writeback

PG_swapcache

16 Indica si la pagina esta intercambiada

PG_nosave_free

18 Pagina libre, pero no debería ser escrita.

Los valores que puede tomar el campo flags <linux/page-flags.h>) de la estructura anterior se muestran en la siguiente tabla:

ESTRUCTURAS DE DATOS: TABLAS DE PÁGINAS

Page 12: Sistema Paginado

PROBLEMAS

Es necesario mantener la tabla de páginas en memoria, sin embargo, dado el espacio de direccionamiento de cada proceso sería imposible.

Otro problema que surge con este tipo de tablas tiene que ver con la velocidad. Si la tabla de un proceso es muy grande, acceder a ella ralentizaría la ejecución del mismo.

SOLUCIÓN

Como solución, Linux descompone la tabla de páginas original en distintos niveles. Este conjunto de tablas se denomina directorio de páginas.

CAT PAG DESPLAZAMIENTO

PAG OFFSET

addr

addr

ESTRUCTURAS DE DATOS: TABLAS DE PÁGINAS

Page 13: Sistema Paginado

El directorio de tablas de páginas contiene en cada entrada la dirección base de la tabla de páginas correspondiente. Se utilizan los 10 bits de mayor peso de la dirección lineal (31-22) como índice en el directorio.

Cada tabla de páginas contiene en cada entrada la dirección base de una página física o marco. Se utilizan los siguientes 10 bits de la dirección lineal (21-12) como índice en la tabla.

Los restantes 12 bits de la dirección lineal se utilizan como desplazamiento dentro del marco de página.

CAT PAG DESPLAZAMIENTO

PAG OFFSET

addr

addr

ESTRUCTURAS DE DATOS: DIRECTORIO DE PÁGINAS GLOBAL

Page 14: Sistema Paginado

Linux soporta tipos de arquitecturas basadas en 3 niveles, por lo que introduce una tabla intermedia para darles soporte.

Si la arquitectura pertenece a la familia x86, Linux utiliza la tabla intermedia que contiene un único descriptor.

Los siguientes tipos están declarados en <asm/page.h> y son los tipos de datos utilizados en las entradas de las tablas de páginas.

L1L1 L2L2 L3L3 offsetoffset

Directorio

Intermedio

Paginas

Memoria fisica

typedef struct { unsigned long pte_low, pte_high; } pte_t; typedef struct { unsigned long long pmd; } pmd_t; typedef struct { unsigned long long pgd; } pgd_t;

ESTRUCTURAS DE DATOS: DIRECTORIO DE PÁGINAS GLOBAL

Page 15: Sistema Paginado

countpgd

mmapmmap_avlmmap_sem

mm_struct

mm

task_struct

Cada proceso (task_struct) tiene un campo mm de tipo mm_struct que almacena la información de su espacio de direcciones.

El campo pgd es del tipo pgd_t:

typedef struct { unsigned long long pgd; } pgd_t;

Mantiene el directorio de páginas utilizado para resolver la dirección física dada una dirección virtual.

ESTRUCTURAS DE DATOS: DIRECTORIO DE PÁGINAS GLOBAL

Page 16: Sistema Paginado

countpgd

mmapmmap_avlmmap_sem

mm_struct

mm

task_struct

Para localizar una dirección (addr), es necesario saber a que pgd_t pertenece:

pgd = mm->pgd[addr >> 22];

y determinar la entrada correspondiente en la tabla de descriptores intermedia:

pmd = (pmd_t *) pgd;

Una vez sabemos a qué entrada pmd_t corresponde la dirección, se consulta el último nivel del árbol: un arreglo de PTRS_PER_PTE (1024) objetos de tipo pte_t asociado a la estructura pmd_t:

pte = pmd[(addr>>PAGE_SHIFT) & (PTRS_PER_PTE - 1)];

ESTRUCTURAS DE DATOS: DIRECTORIO DE PÁGINAS GLOBAL

Page 17: Sistema Paginado

La mejor forma de obtener un buen rendimiento consiste en mantener en memoria caches de las páginas que se utilizan muy a menudo.

Las páginas pueden corresponder a:

- Código ejecutado por los procesos - Contenido de archivos proyectados en memoria

Linux emplea unas cuantas caches para la gestión de la memoria:

- Buffer Cache - Cache de Páginas - Cache de Intercambio

(swap)- Caches Hardware

La caché se gestiona dinámicamente.

DATA

CODE

paginapagina

Proceso

Memoria

Disco

ESTRUCTURAS DE DATOS: CACHÉ DE PÁGINAS

Page 18: Sistema Paginado

Buffer Cache

Contiene buffers de datos que son utilizados por los manejadores de dispositivos de bloques.

Un dispositivo de bloques es aquel sobre el que sólo se pueden realizar operaciones de lectura o escritura de bloques de tamaño fijo.

Si un bloque se puede encontrar en el buffer cache, no es necesario leerlo del dispositivo de bloques físico.

Cache de Páginas

Se utiliza para acelerar el acceso a imágenes y datos en disco.

Guarda el contenido lógico de un fichero de página en página. Conforme las páginas se leen en memoria, se almacenan en la page cache.

DATA

CODE

paginapagina

Proceso

Memoria

ESTRUCTURAS DE DATOS: CACHÉ DE PÁGINAS

Page 19: Sistema Paginado

Cache de Intercambio (swap)

Solo las páginas que han sido modificadas (dirty) son guardadas en el fichero de intercambio.

Evita muchas operaciones de disco innecesarias y costosas producidas en un sistema con mucho trasiego de páginas.

Caches Hardware

Es una cache normalmente implementada en el propio procesador; la cache de entradas de tabla de página.

El procesador no necesita siempre leer la tabla de páginas directamente, sino que guarda en esta cache las traducciones de las páginas conforme las va necesitando.

Son los Translation Look-aside Buffers (TLB) que contienen copias de las entradas de la tabla de páginas de uno o más procesos del sistema.

DATA

CODE

paginapagina

Proceso

Memoria

ESTRUCTURAS DE DATOS: CACHÉ DE PÁGINAS

Page 20: Sistema Paginado

Linux utiliza el principio del Buddy system para asignar y liberar eficientemente bloques de páginas.

El núcleo mantiene una lista de grupos de páginas disponibles.

El tamaño de los grupos es fijo, siendo asignados un número de páginas igual a potencias de 2.

• 0 Grupos de 1 página• 1 Grupos de 2 páginas...• 5 Grupos de 32 páginas

Cada grupo hace referencia a páginas contiguas en memoria.

paginapaginapaginapagina

paginapagina

ASIGNACIÓN Y LIBERACIÓN DE PÁGINAS

Page 21: Sistema Paginado

BUDDY SYSTEM:

Petición de asignación

busca un grupo disponible dentro de la lista que contiene grupos de páginas de tamaño igual o inmediatamente superior al especificado.

El grupo se divide en 2 partes:

• tantas páginas como tamaño de memoria especificado• resto de páginas que continúan disponibles

ASIGNACIÓN Y LIBERACIÓN DE PÁGINAS

Page 22: Sistema Paginado

Las páginas que no son utilizadas se insertan en las otras listas.

Dentro de cada lista, se comprobaría si el grupo de páginas adyacentes se encuentra disponible, en ese caso se fusionan los grupos y pasan a la lista de grupos de tamaño inmediatamente superior. Así sucesivamente hasta llegar al tope.

Este proceso se repite si en vez de ser páginas que sobran de una asignación, son páginas que han sido liberadas.

ASIGNACIÓN Y LIBERACIÓN DE PÁGINAS

Page 23: Sistema Paginado

55

00

11

22

33

44

zone

456

page pageNr_free

0

pagenr_free

page

free_area

ASIGNACIÓN Y LIBERACIÓN DE PÁGINAS

Page 24: Sistema Paginado

La tabla free_area (linux/mmzone.h) contiene la dirección del primer descriptor de grupo de páginas para cada tamaño de grupo:La estructura zone (linux/mmzone.h) contiene un vector de areas libres (free_area.

La estructura zonelist (linux/mmzone.h) contiene un vector de estructuras zones:

La memoria física se divide en multiples zonas:

0- ZONE_DMA < 16 MB ISA DMA capable memory 1- ZONE_NORMAL 16-896 MB direct mapped by the kernel 2- ZONE_HIGHMEM > 896 MB only page cache and user processes 3- MAX_NR_ZONES

struct free_area { struct list_head free_list; unsigned long nr_free; };

struct zonelist { struct zone *zones[MAX_NUMNODES * MAX_NR_ZONES + 1];

};

ASIGNACIÓN Y LIBERACIÓN DE PÁGINAS

Page 25: Sistema Paginado

struct zone {112 unsigned long free_pages;113 unsigned long pages_min, pages_low, pages_high;122 unsigned long lowmem_reserve[MAX_NR_ZONES];126 /* Diferentes tamaños de area libre */130 struct free_area free_area[MAX_ORDER];

133 ZONE_PADDING(_pad1_)

135 /* Fields commonly accessed by the page reclaim scanner */136 spinlock_t lru_lock; 137 struct list_head active_list;138 struct list_head inactive_list;139 unsigned long nr_scan_active;140 unsigned long nr_scan_inactive;141 unsigned long nr_active;142 unsigned long nr_inactive;143 unsigned long pages_scanned; 144 int all_unreclaimable;

166 ZONE_PADDING(_pad2_) ....

212 }

ASIGNACIÓN Y LIBERACIÓN DE PÁGINAS

Page 26: Sistema Paginado

#define get_free_page get_zeroed_page

fastcall unsigned long get_zeroed_page(unsigned int gfp_mask)

{

struct page * page;

BUG_ON(gfp_mask & __GFP_HIGHMEM);

page = alloc_pages(gfp_mask | __GFP_ZERO, 0);

if (page)

return (unsigned long) page_address(page);

return 0;

}

fastcall unsigned long __get_free_pages(unsigned int gfp_mask, unsigned int order)

{

struct page * page;

page = alloc_pages(gfp_mask, order);

if (!page)

return 0;

return (unsigned long) page_address(page);

}

ASIGNACIÓN Y LIBERACIÓN DE PÁGINAS

Page 27: Sistema Paginado

Se distinguen dos tipos de paginas:Se distinguen dos tipos de paginas: Hot: La pagina esta en la cache del procesador.Hot: La pagina esta en la cache del procesador. Cold: La pagina esta en la memoria principal.Cold: La pagina esta en la memoria principal.

    void free_hot_page(struct page *page);void free_hot_page(struct page *page); void free_cold_page(struct page *page);void free_cold_page(struct page *page);

ASIGNACIÓN Y LIBERACIÓN DE PÁGINAS

Page 28: Sistema Paginado

900 fastcall void __free_pages(struct page *page, unsigned int order) {

902 if (!PageReserved(page) && put_page_testzero(page)) {

903 if (order == 0)

904 free_hot_page(page);

905 else

906 __free_pages_ok(page, order);

907 }

908 }

912 fastcall void free_pages(unsigned long addr, unsigned int order)

913 {

914 if (addr != 0) {

915 BUG_ON(!virt_addr_valid((void *)addr));

916 __free_pages(virt_to_page((void *)addr), order);

917 }

918 }

ASIGNACIÓN Y LIBERACIÓN DE PÁGINAS

Page 29: Sistema Paginado

Linux ofrece 2 tipos de funciones para asignar zonas de memoria del espacio de direccionamiento propio del núcleo:

• kmalloc y kfree: páginas contiguas en memoria central

- Útiles para la gestión de zonas pequeñas. - Es más apropiada para el manejo de memoria utilizada por dispositivos o tareas en tiempo real.

- Ineficaces con zonas de grandes tamaños - Bloques de tamaño fijo

• vmalloc y vfree: páginas no contiguas en memoria central

- El tamaño de la memoria “desperdiciada” es menos importante.

ASIGNACIÓN Y LIBERACIÓN DE PÁGINAS (NÚCLEO)

Page 30: Sistema Paginado

En la implementación de kmalloc y kfree, Linux utiliza listas de zonas disponibles. Existe una para cada tamaño de zona.

Aunque kmalloc pida un tamaño específico, Linux busca dentro de la lista de tamaño inmediatamente superior.

El número de páginas varía según el tamaño de los bloques almacenados en la lista. Como mínimo se establece tantas como sean necesarias para formar un bloque.

firstfree

........

......

......

next

firstfree bh_next

Listas de bloques de memoria disponibles

firstfree

ASIGNACIÓN Y LIBERACIÓN DE PÁGINAS (NÚCLEO)

Page 31: Sistema Paginado

Linux, al arrancar un proceso, evita cargar todas las páginas que forman parte del espacio de direccionamiento de éste utilizando la paginación bajo demanda.

De la misma forma, cuando el núcleo necesita memoria central puede decidir liberar aquellas páginas que no han sido utilizadas en un periodo de tiempo, escribiéndolas en memoria secundaria (en caso de haber sido modificadas).

Para evitar que un proceso se vea suspendido por el núcleo mientras espera por la carga de sus páginas, Linux permite a los procesos privilegiados bloquear ciertas páginas en memoria. Existen diversas llamadas al sistema que permiten a un proceso especificar que sus páginas no deben ser descartadas de la memoria.

DATA

CODE

paginapagina

Proceso

Memoria

Disco

BLOQUEO DE PÁGINAS EN MEMORIA

Page 32: Sistema Paginado

Cuando el núcleo necesita memoria resuelve el problema eliminando páginas. Si estas páginas han sido modificadas, será necesario guardarlas en disco:

• Archivo proyectado en memoria

se rescribe en el archivo.

• Datos

se guarda en un dispositivo swap.

Linux puede llegar a utilizar varios dispositivos swap; por este motivo, cuando se ha de guardar una página, se exploran los dispositivos de swap activos hasta encontrar un lugar donde escribirla.

Funciones utilizadas:

• Inicialización de dispositivo

mkswap

• Activación de dispositivo

swapon

• Desactivación de dispositivo

swapoff

• Descartar páginas de la memoria

kswapd

DISPOSITIVOS DE SWAP

Page 33: Sistema Paginado

Copy-on-write es una técnica para realizar eficientemente la copia de páginas. Cuando se invoca a la primitiva fork, Linux no duplica las páginas de memoria que son necesarias para el nuevo proceso, sino que hace apuntar las entradas de la tabla de páginas del nuevo proceso a las páginas del proceso padre. Cuando alguna de las páginas es modificada por alguno de los procesos, entonces el núcleo pasa a realizar la duplicación de dicha página. Así, Linux se evita la copia de páginas de memoria que no van a ser utilizadas (p.e. el código situado antes de la primitiva fork, en muy probable que no sea utilizado por el proceso hijo), ahorrando la memoria correspondiente y el tiempo necesario para copiarlas. La forma de llevar a cabo este proceso consiste en establecer los permisos de estas páginas a sólo-lectura pero sabiendo que dichas páginas se pueden modificar (indicándolo en el vma correspondiente). Cuando ocurre una violación de acceso a estas páginas (uno de los procesos intenta escribir) es cuando se realiza la duplicación propiamente dicha.

COPY ON WRITE

Page 34: Sistema Paginado

COPY ON WRITE

Page 35: Sistema Paginado

Es el procesador (a través del MMU) quien provoca las excepciones en ciertos accesos a memoria:

• Acceso incompatible con la protección asociada a una página en memoria.

• Acceso a una pagina no presente en memoria.

Las funciones usadas en el tratamiento de una excepción se definen en mm/memory.c:

• do_wp_page

• do_swap_page

• do_no_page

Valores devuelto:Valores devuelto:#define VM_FAULT_OOM -1#define VM_FAULT_OOM -1#define VM_FAULT_SIGBUS 0 #define VM_FAULT_SIGBUS 0 #define VM_FAULT_MINOR 1 #define VM_FAULT_MINOR 1 #define VM_FAULT_MAJOR 2#define VM_FAULT_MAJOR 2

•handle_pte_fault

•handle_mm_fault

•do_page_fault

TRATAMIENTO DE EXCEPCIONES

Page 36: Sistema Paginado

S – SelectorD – DesplazamientoA – AtributosB – BaseL - Limite

EAX

EBX

ECX

...

CS

FLG

TSSDescriptor 1

Descriptor 2

Descriptor 3

Descriptor n

Descriptor

LDT

MEMORIANÚCLEO

Base

Limite

Desplazamiento

+S D A

S D A

S D A

S D A

S D A

S D A

S D A

S D A255

i

33

2

1

0

IDT

B L

IDTR

B L A

B L A

B L A

B L A

B L A

B L A

B L A

B L A

GDT

B L

GDTR

CPU genera una excepción con un fallo de página

TR

LDTR

TRATAMIENTO DE EXCEPCIONES

Page_fault{ pushl $do_page_fault jmp error_code}

Page 37: Sistema Paginado

Esta función se encarga de manejar los fallos de pagina do_page_fault, se encuentra en el archivo /arch/i386/mm/fault.c

La funcionalidad en resumen es:

1- Determinar la dirección de memoria que ocasiono la interrupción.

2- Determina el problema y llama a la rutina apropiada

Si se trata de un acceso indebido el núcleo avisa al proceso mediante una señal.

Puede ocurrir que sea el núcleo el que genero la interrupción.

fastcall void do_page_fault(struct pt_regs *regs, unsigned long error_code) error_code:

bit 0 == 0 means no page found, 1 means protection fault

bit 1 == 0 means read, 1 means write

bit 2 == 0 means kernel, 1 means user-mode

Segmentation fault se envia señal al proceso: Force_sig(SIGSERV,task);

Error del núcleo no ha podido tratar -> Detención del sistema. do_exit(SIGKILL);

TRATAMIENTO DE EXCEPCIONES

Page 38: Sistema Paginado

Se obtiene el descriptor de la región de memoria afectada mediante la función

find_vma, y luego comprueba el tipo de error:

Si el error lo ha causado una pagina no presente en el segmento de la pila, se llama

a la función expand_stack, para aumentar el tamaño de ésta.

Si el error se debe a un acceso en escritura en una región protegida en lectura, el

error se señala enviándole al proceso actual la señal SIGSEV.

Si se accede a una página para escribir y esta compartida con protegida de lectura,

se llama a la función do_wp_page.

Si el error se debe a una página no presente en memoria, se llama a la función

do_no_page, para cargarla.

TRATAMIENTO DE EXCEPCIONES

Page 39: Sistema Paginado

do_wp_page: Gestiona la copia en escritura.

Cuando un proceso accede en escritura a una página compartida y protegida en lectura exclusiva, se asigna una nueva página, y se comprueba si la página afectada es compartida por varios procesos.

En caso afirmativo se copia su contenido en la nueva página, y se inserta en la tabla de páginas del proceso. El número de referencias a la anterior página se decrementa por la llamada a liberar la pagina.

En el caso de que la página afectada no sea compartida, su protección simplemente se modifica para hacer posible la escritura.

TRATAMIENTO DE EXCEPCIONES

Page 40: Sistema Paginado

static int do_wp_page(struct mm_struct *mm, struct vm_area_struct * vma, unsigned long address, pte_t *page_table, pmd_t *pmd, pte_t pte) {struct page *old_page, *new_page; unsigned long pfn = pte_pfn(pte); pte_t entry;

//Se obtiene la pagina vieja.old_page = pfn_to_page(pfn);

//comprueba la pagina no esta compartida if (!TestSetPageLocked(old_page)) {int reuse = can_share_swap_page(old_page);//se desbloquea la pagina ya que no esta compartida.unlock_page(old_page); if (reuse) {//se inserta en la tabla de paginas del procesoptep_set_access_flags(vma, address, page_table, entry, 1); update_mmu_cache(vma, address, entry); pte_unmap(page_table); return VM_FAULT_MINOR; //devuelve 0 } }…… /* se copia la pagina porque tiene protección */new_page = alloc_zeroed_user_highpage(vma, address); if (!new_page) goto no_new_page;

TRATAMIENTO DE EXCEPCIONES

Page 41: Sistema Paginado

……………..…………./* se recomprueba que la pagina que queremos traer no esta bloqueada. *///se bloquea la tabla de paginas spin_lock(&mm->page_table_lock);page_table = pte_offset_map(pmd, address); if (likely(pte_same(*page_table, pte))) {…. new_page = old_page; }//se inserta en la tabla de paginas del proceso

pte_unmap(page_table); //pone en la cache la pagina page_cache_release(new_page); page_cache_release(old_page); spin_unlock(&mm->page_table_lock); return VM_FAULT_MINOR; //devuelve 0

no_new_page: page_cache_release(old_page); return VM_FAULT_OOM; //devuelve -1 }

TRATAMIENTO DE EXCEPCIONES

Page 42: Sistema Paginado

do_swap_page: Carga en memoria el contenido de una pagina situada en el espacio de swap.

Si una operación swapin está asociada a la región de memoria que contiene la página, se llama a esta función, en caso contrario se llama a la función swap_in.

En ambos casos, la página asignada se inserta en el espacio de direccionamiento del proceso actual.

TRATAMIENTO DE EXCEPCIONES

Page 43: Sistema Paginado

static int do_swap_page(struct mm_struct * mm,1689 struct vm_area_struct * vma, unsigned long address,1690 pte_t *page_table, pmd_t *pmd, pte_t orig_pte, int write_access) {1692 struct page *page;1693 swp_entry_t entry = pte_to_swp_entry(orig_pte);1694 pte_t pte;1695 int ret = VM_FAULT_MINOR;

1697 pte_unmap(page_table);1698 spin_unlock(&mm->page_table_lock);

//se comprueba que se tiene la pagina especifica1699 page = lookup_swap_cache(entry);1700 if (!page) {

//se lee desde el area de swap un grupo de 2n paginas1701 swapin_readahead(entry, address, vma);1702 page = read_swap_cache_async(entry, vma, address);1703 if (!page) {1704 1708 spin_lock(&mm->page_table_lock);1709 page_table = pte_offset_map(pmd, address);1710 if (likely(pte_same(*page_table, orig_pte)))1711 ret = VM_FAULT_OOM;1712 else1713 ret = VM_FAULT_MINOR;1714 pte_unmap(page_table);1715 spin_unlock(&mm->page_table_lock);1716 goto out;1717 }1719 /* tiene que leer la pagina del area de swap Major fault */1720 ret = VM_FAULT_MAJOR;1721 inc_page_state(pgmajfault);1722 grab_swap_token();1723 }

TRATAMIENTO DE EXCEPCIONES

Page 44: Sistema Paginado

do_no_page: Acceso a una página no presente en memoria.

Se comprueba si la pagina ha sido descartada de la memoria y esta en el espacio swap:

- do_swap_page

En caso negativo se comprueba si existe una operación de memoria nopage asociada a la región que contiene la página.

En caso afirmativo se usa esta operación para cargar el contenido en memoria, insertando la página en la tabla de páginas correspondiente.

En caso negativo se asigna una nueva pagina rellenada con 0’s.

TRATAMIENTO DE EXCEPCIONES

Page 45: Sistema Paginado

1852 static int do_no_page(struct mm_struct *mm, struct vm_area_struct *vma,1853 unsigned long address, int write_access, pte_t *page_table, pmd_t *pmd)1854 {1855 //declaran variables para la nueva estructura

struct page * new_page;1856 struct address_space *mapping = NULL;1857 pte_t entry;1858 unsigned int sequence = 0;1859 int ret = VM_FAULT_MINOR;1860 int anon = 0;

...

1867 //se localiza la pagina de memoria virtual1868 if (vma->vm_file) {1869 mapping = vma->vm_file->f_mapping;1870 sequence = mapping->truncate_count;1871 smp_rmb(); /* serializes i_size against truncate_count */1872 }

TRATAMIENTO DE EXCEPCIONES

Page 46: Sistema Paginado

1873 retry:1874 cond_resched();

//obtenemos la nueva pagina1875 new_page = vma->vm_ops->nopage(vma, address & PAGE_MASK, &ret);1876 1883 1884 /* pagina no disponible */1885 if (new_page == NOPAGE_SIGBUS)1886 return VM_FAULT_SIGBUS;1887 if (new_page == NOPAGE_OOM)1888 return VM_FAULT_OOM;1889 1893 //se copia la pagina en memoria y en la cache de paginas

copy_user_highpage(page, new_page, address);1902 page_cache_release(new_page);//pone pagina en cache1903 new_page = page;1904 anon = 1;1905 }1906 }

TRATAMIENTO DE EXCEPCIONES

Page 47: Sistema Paginado

.....

1919 page_table = pte_offset_map(pmd, address);1920 1932 if(anon) {1944 lru_cache_add_active(new_page);1945 page_add_anon_rmap(new_page, vma, address);1946 } else

// marcara la pagina como usada por este proceso1947 page_add_file_rmap(new_page);1948 pte_unmap(page_table);1949

1958 update_mmu_cache(vma, address, entry);1959 spin_unlock(&mm->page_table_lock);

1960 out:1961 return ret;

1962 oom:1963 page_cache_release(new_page);1964 ret = VM_FAULT_OOM;1965 goto out;1966 }

TRATAMIENTO DE EXCEPCIONES

Page 48: Sistema Paginado

En interrupción o

Kernel thread

Acceso de escritura

Pertenece a laPila del modo

usuario

Pertenece a Una región

Región legible oejecutable

Pagina presente

Región con permiso de escritura

En Modo usuarioDirección incorrecta

En una llamada al sistema

SiSi

No

No

Si

Copy on

Write

PaginacionPor demanda

EnviarSIGSEGV

Matar el procesoY kernel “Ops” Fixup Code

SiNo

NoSi

Si No

No

Si

No

No

No

Si

TRATAMIENTO DE EXCEPCIONES

Page 49: Sistema Paginado

Large Memory Page

La página fisica en Linux 2.6 puede tener un tamaño de 4MB o 2 MB.

Para 1 GB de memoria física:

Page size Page size Page table Page table entriesentries

Memory Memory space space

consumed consumed

(8 bytes /page (8 bytes /page table entry)table entry)

4 KB4 KB 262,144 262,144 2 MB2 MB

4 MB4 MB 256256 2,048 bytes 2,048 bytes

NOVEDADES VERSION 2.6

Page 50: Sistema Paginado

Reverse Mapping:

Proporciona un mecanismo para encontrar que procesos están usando la página física de la memoria.

Physical

Page PTE Chain

PagePage

TableTable

(Process 1)(Process 1)

PagePage

TableTable

(Process 2)(Process 2)

NOVEDADES VERSION 2.6

Page 51: Sistema Paginado

/* Comprueba si la pagina ha sido referenciada */

393 int page_referenced(struct page *page, int is_locked, int ignore_token) {395 int referenced = 0;396 397 if (!swap_token_default_timeout) ignore_token = 1;400 if (page_test_and_clear_young(page)) referenced++;403 if (TestClearPageReferenced(page)) referenced++;406 if (page_mapped(page) && page->mapping) {407 if (PageAnon(page))408 referenced += page_referenced_anon(page, ignore_token);409 else if (is_locked)410 referenced += page_referenced_file(page, ignore_token);411 else if (TestSetPageLocked(page))412 referenced++;413 else {414 if (page->mapping)415 referenced += page_referenced_file(page, ignore_token);417 unlock_page(page);418 }419 }420 return referenced;421 }

REVERSE MAPPING

Page 52: Sistema Paginado

423 /* Añade a la entrada de la tabla de pagina en memoria para una pagina anonima */431 void page_add_anon_rmap(struct page *page,432 struct vm_area_struct *vma, unsigned long address)433 {434 struct anon_vma *anon_vma = vma->anon_vma;435 pgoff_t index;436 437 BUG_ON(PageReserved(page));438 BUG_ON(!anon_vma);439 440 vma->vm_mm->anon_rss++;441 442 anon_vma = (void *) anon_vma + PAGE_MAPPING_ANON;443 index = (address - vma->vm_start) >> PAGE_SHIFT;444 index += vma->vm_pgoff;445 index >>= PAGE_CACHE_SHIFT - PAGE_SHIFT;446 447 if (atomic_inc_and_test(&page->_mapcount)) {448 page->index = index;449 page->mapping = (struct address_space *) anon_vma;450 inc_page_state(nr_mapped);451 }452 /* else checking page index and mapping is racy */453 }

REVERSE MAPPING

Page 53: Sistema Paginado

/* Añade a la entrada de la tabla de pagina en memoria para un fichero de pagina */461 void page_add_file_rmap(struct page *page)462 {463 BUG_ON(PageAnon(page));464 if (!pfn_valid(page_to_pfn(page)) || PageReserved(page))465 return;466 467 if (atomic_inc_and_test(&page->_mapcount))468 inc_page_state(nr_mapped);469 }

471 /* Quitar de la memoria el pte de una pagina */477 void page_remove_rmap(struct page *page)478 {479 BUG_ON(PageReserved(page));480 481 if (atomic_add_negative(-1, &page->_mapcount)) {482 BUG_ON(page_mapcount(page) < 0);492 if (page_test_and_clear_dirty(page))493 set_page_dirty(page);494 dec_page_state(nr_mapped);495 }496 }

REVERSE MAPPING