gpgpu programazioa: txartel grafikoa erabiliz programatu

GPGPU programazioaTxartel grafikoa erabiliz programatu

Mikel Iturbe Urretxa

UniEncounter, 2013ko Martxoak 21

Irudiaren egiletza: CC-BY 2.5 Christian Prade (cprade@Flickr)

Edukiak

Sarrera: GPUak

Plataforma desberdinakOpenMP & OpenACCCUDAOpenCL

Non erabiltzen da?

zer da txartel grafikoa?

“oinarrizko plakako zirrikituetako batean

konektatzen den barruko osagaia da. Bere

helburu nagusia monitoreari azaldu behar

diren datuak zuzen bidaltzea da.”

Iturria: CC-BY-SA 3.0 Euskarazko Wikipedia. http://eu.wikipedia.org/wiki/Txartel grafiko

zer da GPUa?

“a specialized electronic circuit designed to

rapidly manipulate and alter memory to

accelerate the building of images in a frame

buffer intended for output to a display”

Iturria: CC-BY-SA 3.0 Ingelesezko Wikipedia. http://en.wikipedia.org/wiki/Graphics processing unit

zerekin lotzen ditugu?

eboluzio handia

Jatorrizkoaren egiletza: GPLv3 Gang Garrison 2

Jatorrizkoaren egiletza: GPLv2 Xonotic

grafikoak+

fisika

paraleloan aritzeko egokiak

</sarrera>

<gpgpu?>

denok ezagutzen dugunadibidea

Jatorrizkoaren egiletza: CC-BY-ND Pavol Davorsky (˜PAulie-SVK@devianART)

Jatorrizkoaren egiletza: CC-BY-SA 3.0 OpenStreetMap & Euskalmapa.com

Jatorrizkoaren egiletza: CC-BY-SA 3.0 OpenStreetMap, Euskalmapa.com & Amazon Web Services

Jatorrizkoaren egiletza: CC-BY-SA 3.0 Janine Arriaga

Jatorrizkoaen egiletza: CC-BY-SA 3.0 Janine Arriaga & Guudmorning!@Flickr

Jatorrizkoaren egiletza: CC-BY-SA 3.0 Janine Arriaga, Angelica Castillo & Chris Covarrubias

Jatorrizkoaren egiletza: CC-BY-SA 3.0 Nikki Ibanez

Jatorrizkoaren egiletza: CC-BY-SA 3.0 Christophe Dang Ngoc Chan & PD Charles B. King

Moore-ren legea

“bi urterik behin, zirkuitu integratuetako

transistore kopurua bikoiztu egiten da”

Jatorrizkoaren egiletza: CC-BY-SA 3.0 Wgsimon@Wikimedia Commons

eta erlojuaren maiztasuna?

Jatorrizkoaren egiletza: CPU DB. http://cpudb.stanford.edu/visualize/clock frequency

zergatik?

Jatorrizkoaren egiletza: CC-BY-SA 3.0 RRZEicons@Wikimedia Commons & PD Clker.com

(2) & (3)

Jatorrizkoaren egiletza: CC-BY 3.0 NVIDIA CUDA Programming Guide version 3.0

bakoitza bere lanerako egokia

hau baliatzen duenprogramazio eredua

general-purpose computing ongraphics processing units

orotariko konputazioa grafikoakprozesatzeko unitateetan

</gpgpu?>

begiztetanzentratua

Jatorrizkoaren egiletza: CC-BY 2.5 Val Kerry (art makes me smile@Flickr)

industri-estandarrak

adibidea

1 int main(int argc , char *argv []) {

const int N = 500;

3 int i, a[N];

//a[N] bete

for (i = 0; i < N; i++)

7 a[i] = 2 * i;

9 return 0;

OpenMP

int main(int argc , char *argv []) {

2 const int N = 500;

int i, a[N];

4 //a[N] bete

6 #pragma omp parallel for

for (i = 0; i < N; i++)

8 a[i] = 2 * i;

10 return 0;

OpenACC

const int N = 500;

3 int i, a[N];

//a[N] bete

#pragma acc parallel kernels

7 for (i = 0; i < N; i++)

a[i] = 2 * i;

return 0;

zer paralelizatu nahi denadierazten da

nola egiten den jakin beharrikgabe

migrazioa errazagoa

OpenMP oso erabiliaOpenACC ez hainbeste

</OpenMP & OpenACC>

harietanzentratua

Jatorrizkoaren egiletza: CC-BY 2.5 Val Kerry (art makes me smile@Flickr)

<CUDA>

sakonago

gpgpu produktu helduena

NVIDIAk garatua

eta propietarioa... :-(

Jatorrizkoaren egiletza: CC-BY 3.0 Tosaka@Wikimedia Commons

kernelak

paraleloan exekutatuko direnfuntzioak

ezin dute baliorik bueltatu

global

CUDA C

Jatorrizkoaren egiletza: PD Clker.com & Seamas O Brogain

Jatorrizkoaren egiletza: CC-BY 3.0 Tor proiektua

Jatorrizkoaren egiletza: CC-BY-SA 3.0 Ricardas.marozas@Wikimedia Commons

</CUDAren egitura>

eta kernelak exekutatzeko?

(1)zeren gainean egingo du lan?

cudaMalloc()

cudaFree()

cudaMemcpy()

(2)nola exekutatuko da?

kernela<<<exek param>>>(f param)

hariak

blokeak

hariak

Jatorrizkoaren egiletza: CC-BY 3.0 Jorge Barrios (jorgebarrios@Wikimedia Commons)

3D array bat(dim3)

hardware-ak mugatzen dukopurua

threadIdx

(threadIdx.x, threadIdx.y, threadIdx.z)

blokeak

hari taldeak

Jatorrizkoaren egiletza: CC-BY 2.5 Novita Estiti (verypurpleperson@Flickr)

3D array bat(dim3)

blockIdx

(blockIdx.x, blockIdx.y, blockIdx.z)

Jatorrizkoaren egiletza: CC-BY 2.5 Dennis Brekke (dbrekke@Flickr)

kernela<<<hariak, blokeak>>>(f param)

(3)eta harien artekokoordinazioa?

memoria

synchthreads()

adibidea

const int N = 500;

3 int i, a[N], b[N], c[N];

//a eta b edukiz bete

for (i = 0; i < N; i++)

7 c[i] = a[i]+b[i];

9 return 0;

int main(int argc , char *argv []) {

2 const int N = 500;

int a[N], b[N], C[N];

4 //a eta b edukiz bete

6 cudaMalloc ((void **) &d_a , N*sizeof(int));

cudaMalloc ((void **) &d_b , N*sizeof(int));

8 cudaMalloc ((void **) &d_c , N*sizeof(int));

10 cudaMemcpy(d_a , a, N*sizeof(int), cudaMemcpyHostToDevice);

cudaMemcpy(d_b , b, N*sizeof(int), cudaMemcpyHostToDevice);

dim3 hariak (25, 10, 1);

14 dim3 blokeak (2, 1, 1);

kernel <<<blokeak , hariak >>>(*d_a ,*d_b ,*d_c);

cudaMemcpy(c, d_c , N*sizeof(int), cudaMemcpyDeviceToHost);

cudaFree(d_a);

20 cudaFree(d_b);

cudaFree(d_c);

return 0;

__global__ kernel (int *d_a , int *d_b , int *d_c) {

2 int indizea = (threadIdx.x + 25 * threadIdx.y) * (

blockIdx.x + 1);

d_c[indizea] = d_a[indizea] + d_b[indizea ];

tresnak

CUDA-GDB

</CUDA>

GPGPUrako estandar irekia

kodea hainbat gailutanexekutatu daiteke

CUDArekin antzekotasunak etadesberdintasunak

maila baxuagokoa

oraindik ez CUDA bezain osoabaina...

etorkizuna izango da

</OpenCL>

</arkitekturak>

<non? zelan? zertarako?>

Jatorrizkoaren egiletza: CC-BY 2.5 ChrisDag@Flickr

Jatorrizkoaren egiletza: PD AEBko energia departamendua

baita gailu txikiagotan ere

segurtasunaren esparruan...

WPA, hash... “ikuskaritza”

</non? zelan? zertarako?>

eskerrik asko.

lizentzia: CC-BY 3.0http://creativecommons.org/licenses/by/3.0/deed.eu

(kontrakoa adierazita duten irudiena izan ezik.)

LATEXeko Beamer klase librearekin eginiko aurkezpena

http://slideshare.net/janfri

http://hamahiru.org

mikel@hamahiru.orgpgp gakoa: 0x8141DED2

@azken tximinoa

gpgpu programazioa: txartel grafikoa erabiliz programatu

Technology

txartel irakurgailuaren-instalazioa kz ikastaroa

bitoriano iraola aristiguieta o r o i t z a k...orla debalde...

informatikaren oinarriak 2005-2006 ikasturtea · 1...

primeros pasos con cuda -...

jazzaldia.eus · web viewzehatzago esanda, urtarriletik...

u100 - euskaltel › 2017-10 › 35681703_eusk.pdf · •...

oolleennttzzeerroo eettaa - etakitto.eus · tren geltokiko...

gpu: arquitectura -...

proiektuetarako jarduerak | 1. blokea: aurkezpena eta...

investigación - programación en paralelo gpgpu … · 107...

monte carlo en modelos de spin aplicación en gpgpu

oinarrizko currÍculo diseinua - harrobia5. egokitzapen...

presentación de powerpoint -...

presentación de powerpoint -...

kontsumobide · 4 kontsumobide aldizkaria 28.zk...

mismo código corre en cpu...

oinarrizko curriculum diseinua - ivac-eei.eus · pdf...

bioteknologiako gradua zientzia eta teknologia fakultatea...

integrales, reducción y...

primeros pasos con cuda - argentina.gob.ar › gpgpu ›...