La Comunidad de HARDWARE mas grande de México

Análisis Geforce GTX 1060 6GB FE vs Radeon RX580 8GB

0 11,791

Arquitectura AMD Polaris

La RX580 tiene en su corazón a Polaris la cual representa la 4ta Generación de GCN (Graphics Core Next), el cual incorpora nuevas características, a la ya bien conocida y probada arquitectura GNC, tal es el caso de renderizado de resolución variable, modificaciones del proceso de computo asíncrono, procesamiento de geometría (usando más eficientes elementos de compresión, entre otras.

Aunque los nombres sean diferentes y propuestas sean distintas, existe una sola cosa en común en ambas propuestas de AMD y NVIDIA. Y es que ambas son arquitecturas unificadas, o procesadores paralelos, y obviamente, cada una tiene su set de tecnologías únicas.

La arquitectura de AMD presenta 36 unidades de computo (Compute Units), 2304 procesadores de flujo, (Stream Processors) (4 Motores asíncronos computacionales (ACE), 144 unidades de textura, 32 ROPs, dos Agendadores de tareas independientes.

Entrando al detalle de cada unidad computacional, AMD mejoro muchísimo el tema de consumo/eficiencia vs R9 290 (Hawaii). Cada unidad de compute tiene su agendador independiente, registradores escalares y vectoriales con sus respectivas unidades Vectoriales y escalares, 4 filtros de textura, Cache. Y módulos de memoria compartida para cada unidad de cómputo.

AMD, como parte de una evolución natural, sigue tratando de acortar la distancia en el tema geométrico, que es donde NVIDIA sigue siendo el rey. AMD incluyó en esta arquitectura mejoras en algoritmos relacionados a la geometría, tal es el caso de eliminar la necesidad de dibujar triángulos en lugares ocultos, (según Angulo y perspectiva) esta tecnología la llamo AMD como descarte de aceleración primitiva (Primitive Discard Aceleration) y ciertamente ofrece una mejora en el rendimiento de importancia si se compara vs Hawaii (R9 290X), obviamente esta inclusión afecta también al uso de filtrados como los populares como el MSAA, en donde la mejora se hace exponencial a medida que se va aumentando los factores de cálculo, o la complejidad de la escena, esto también trae un efecto deseable de ahorro de energía, dado que no trabajará donde no se necesite.

Computo Asíncrono:

Esta característica muy presente en la arquitectura de AMD, y recientemente en NVIDIA, (solo Pascal puede competir con el computo asíncrono dinámico ofrecido por AMD)

El cómputo asíncrono permite hacer cálculos gráficos y computacionales de forma simultánea. En el caso de AMD Esta es una característica heredada desde al menos segunda generación de GNC, y mejorada conforme la arquitectura ha ido madurando/evolucionando (Entendiendo que GNC de 4ta y 3ra comparten el mismo set de instrucciones.

Compute Preemtion of Graphics: esta característica permite la interrupción de la tarea (en este Caso) Grafica para ser cambiada a otra tarea totalmente distinta. Entiéndase que cada ACE es totalmente independiente. Y pude cambiar su capacidad de cómputo según la aplicación lo necesite.

Además, GPU preemtion es capaz de reducir la latencias y mejorar el número de cuadros por minuto, esto en gran medida gracias a la flexibilidad que ofrece la arquitectura de cambiar granularmente las tareas según la prioridad que establezca la aplicación , especialmente útil para tareas de realidad aumentada, y también para post procesamiento.

Buscando maneras más claras de explicar cómo funciona el Preemtion, usamos una imagen de un muy completo artículo: http://www.imgtec.com/blog/importance-fine-grained-gpu-preemption-support-vr/

En la gráfica de arriba se ve un ejemplo de cambio de tareas, de forma inteligente para no sacrificar la tasa de cuadros por minuto, estos cambios de tareas son controlados por dos objetivos, mantener la más alta tasa de cuadros por minuto de forma constante, sin dejar de ejecutar múltiples tareas según la necesidad de la aplicación o el caso.

El autor, incremento artificialmente la carga de trabajo al rendereo de contenido, para ver como influenciaba el post-procesamiento. (Ver imagen arriba) Se puede ver como el hilo de la creación de contenido entrega un cuadro cada 32ms, la tarea de post-procesamiento de Realidad aumentada entrega su tarea cada 16.7ms, de modo de poder mantener una tasa de 60 cuadros por segundo de forma constante.

El contenido de rendereo (marcado en verde), se ve interrumpido por la tarea de post procesamiento (marcado en azul) como se ve en la fila donde esta “GPU: 3D”. En un punto específico, la tarea de rendereo # 2 se ve interrumpida 3 veces por múltiples tareas azules (post-procesamiento), esto asegura que las tareas de post-procesamiento azules puedan terminar a tiempo para poder mantener el número de cuadros por minuto deseado.

Lo de arriba explica características que están presentes en la arquitectura Polaris, como también en Pascal, dicho esto, la granularidad de cambios rápidos expresados en estas arquitecturas, no estaba presente en la pasada arquitectura de NVIDIA, conocida como maxwell. O serie 9.

Aclaramos Maxwell permite cambios de tareas (no granulados), es decir en determinados puntos, más nunca de una manera aleatoria según la necesidad del caso.

Quick response Queue: esto define la granularidad para hacer el cambio, es decir, que tan rápido puede el GPU hacer el cambio de tarea, Polaris mejora un tanto la latencia en el cambio de tarea.

Arriba se puede ver la diferencia entre un proceso de interrupción de tarea para procesar otra diferente (es en CPU, pero este concepto aplica también para GPU)

 

(En inglés) http://www.embedded.com/design/operating-systems/4204740/Getting-real–time–about-embedded-GNU-Linux

 

En el caso de AMD, su arquitectura es altamente granular, lo mismo que en el caso de NVIDIA con Pascal, dicho lo anterior para maxwell y Kepler, el cambio de tarea (no granular) era terriblemente taxante para la arquitectura.

RX 480 RX580
Reloj nucleo 1120 1257
Reloj boost 1266 1340
Arquitectura GCN 1.3 polaris 20 XTX GCN 1.3 Ellesmere XT
Memoria var 1 8gb 8gb
Memoria var 2 4gb 4gb
Velocidad de memoria 2000 2000
Ancho de banda memoria 256 GB/seg 256 GB/seg
Tipo de memoria GDDR5 GDDR5
L2 Cache 2MB 2MB
Procesadores de Flujo 2304 2304
Proceso de manufactura 14nm finfet 14nm finfet
Unidades de textura 144 144
Tasa de textura 161.3 Gtexeles/seg 181 Gtexeles/seg
Unidades de renders 32 32
Tasa de pixeles 35.8 Gpixeles/seg 42.2 Gpixeles/seg
Energia 150W 180W

La arquitectura de la RX480 y RX580, es exactamente la misma, la única diferencia que notamos entre la RX480 y la RX580 son relojes más agresivos en la RX580, obviamente, al subir la frecuencia se incrementa el consumo de energético, aumentando unos 30 watts adicionales.

Comentarios
Cargando...
%d bloggers like this:
Abrir la barra de herramientas