Hilos en CUDA

Problema 1

Un estudiante ha mencionado que es capaz de multiplicar dos matrices de 1024x1024 utilizando un código basado en tiling y utilizando 1024 hilos por bloque en la arquitectura G80 con Compute Capability 1.3. Además ha mencionado que cada hilo es capaz de calcular un elemento de la matriz resultante. ¿Cuál sería tu reacción y por qué?

Problema 2

Relacionado con el ejercicio 1, para la multiplicación de matrices utilizando tiling, ¿deberíamos utilizar bloques de hilos de tamaño 8x8, 16x16, o 32x32 suponiendo que tenemos disponible una tarjeta con arquitectura GT200 con Compute Capability X.X?

Problema 3

Imagina que subdivimos el espacio 3D en vóxels. Queremos calcular de forma paralela una primitiva sobre cada uno de los vóxels que componen el espacio 3D. ¿Cómo organizarías los hilos para llevar a cabo la ejecución? ¿Por qué? Si guardamos el resultado de cada uno de los hilos en un vector unidimensional, ¿cómo calcularías el índice global?

results matching ""

    No results matching ""