La Comunidad de HARDWARE mas grande de México

Análisis Geforce GTX 1060 6GB FE vs Radeon RX580 8GB

0 11,793

El Posicionamiento de la GTX 1060 dentro de PASCAL.

La GTX 1060, es uno de los hermanos “del medio “de la familia de GPUs basadas en Pascal. Y tradicionalmente es justo este segmento el que tiene más recepción en el mercado de jugadores con presupuestos relativamente holgados, y que pretendan jugar a resoluciones típicas 1080p.

NOTA: La forma cómo funciona la selección de modelos, es usualmente sencilla, todos los chips que están basados en Silicio, y esto incluyen a CPUs, Chips de memoria, y por supuesto los GPUs , entre otros, la selección empieza por obtener los chips más puros (sin impurezas) que usualmente se ubican en el centro de la oblea de silicio, estos de mayor pureza son los que son escogidos para los modelos de alta gama , llamados también chips completos, seguidos por otros, los cuales usualmente se deshabilitan parte del chip , es común en el caso de las tarjetas NVIDIA que se deshabiliten SMs (más adelante sobre esto) que encierran un número de núcleos, y es así como van saliendo los productos de gamas medias y bajas, entiéndase que durante el proceso de manufactura , pueden salir obleas que no tienen problema alguno y los chips son recortados por la necesidad de cumplir con las órdenes, esto es bastante común en situaciones donde el proceso de manufactura está maduro y los “yields” son bastante favorables, también entiéndase que en el 99% de los casos , los chips son “cortados” y no se pueden reactivar de nuevo.

 

Comparativa de Maxwell y Pascal
UNIDAD DE PROCESAMIENTO GRAFICO GeForce GTX 960 (Maxwell) GeForce 1060 6g FE (Pascal)
SMs 8 10
Núcleos CUDA 1024 1280
Relojes base 1126MHZ 1506MHZ
Relojes Boost GPU 1178MHZ 1708MHZ
Unidades textura 64 80
Radio de llenado de Texeles 72 Gigatexteles/Seg 120.5 Gigatexteles/Seg
reloj de memoria 7000MHZ 8000MHZ
Ancho de banda de memoria 112 GB/Seg 192 GB/Seg
ROPS 32 48
Memoria Cache L2 1024KB 1536KB
TDP 120 120
conteo de transistores 2.94 Billones 4.4 Billones
Tamaño del Die 227mm2 200 mm2
Proceso de manufactura.

Tamaño típico de la tarjeta Founders

28nm

241mm

16nm

249mm

 

En esta mirada de maxwell vs Pascal , vemos un poco de lo que ocurre, cuando el proceso de manufactura baja de los 28 nm a los 16nm, en primer lugar vemos que el tamaño del chip de Pascal es más pequeño, aun cuando tiene casi 1.5 billones más de transistores que la arquitectura de Maxwell, la otra ventaja, al usar procesos de manufactura de menor tamaño, es que permite operar el chip con menor consumo de energía, permitiendo mucha mayor complejidad y por supuesto mayor rendimiento por watt.

Este es el diagrama del GP104, de este mismo diseño se desprende el GP106. Que no es más que otra cosa que un solo GPC habilitado de 4 que ofrece el GP104.

El diagrama de arriba muestra que esta exactamente habilitado en el GP106, el corazón de la Geforce 1060 FE es decir un conteo de 1280 núcleos CUDA y 80 unidades de textura. En el caso de todas las tarjetas 1060 de 3GB, uno de los 10 SM viene deshabilitado.

GPC: Graphics processor Cluster en GeForce GTX 1060 6gb. (GP106)

GPC comprende la agrupación de bloques de procesamiento completos llamados SMs.

En la GTX 1060 trae un solo GPC Habilitado, que incluye 10 SMs para un total de 1280 núcleos CUDA, y 80 unidades de textura disponibles. En las GTX1060 de 3GB cuentan con 9 de 10 SM habilitados para un conteo final de 1152 núcleos Cuda, y 72 unidades de textura disponibles

Nota: En pascal, cada SM tiene un total de 128 núcleos, los cuales están particionado en dos bloques de 32 núcleos de precisión simple, o FP32, (FP = Floating point o punto flotante), lo que lo hace capaz de Ejecutar instrucciones/cálculos en FP16, cada partición del SM trae una memoria de instrucciones compartida, un agendador warp, dos unidades de despacho y 2 unidades de mapeo de texturas

 

Tipos de cálculo y su operación.

Entrando en el campo del FP64 o cálculos de precisión doble, las tarjetas gráficas modernas de consumo, y en especial Pascal, son capaces de ejecutarlo, pero como es lógico en tarjetas de consumo muchas de las características están deshabilitadas por drivers, o bien podrían estar muy disminuidas, por lo que, salidas de la caja no suelen ser eficientes para esta tarea, entiéndase que estas tarjetas fueron creadas para estar enfocadas a juegos y entretenimiento, aunque incidentalmente se han hecho también populares en el minado, que por fortuna no hace uso de los cálculos de precisión doble, dicho lo anterior , el FP 64 es solo capaz de correr a la mitad de la velocidad de la precisión simple es decir FP64 = FP32 x 2. (es muy posible que esta característica pueda ser manipulada siempre que se tengan las llaves de los candados, al fin y al cabo, no es comercialmente viable que una tarjeta como la 1070, funcione con las mismas capacidades que una mucho más costosa Quadro P4000.

Motor ‘Polymorph’ 4.0: al igual que otras arquitecturas, el motor polymorph. es el encargado de la teselación, y en el caso de pascal se Agrega un motor polymorph para cada TPC.

 

Motor ‘Polymorph’ 4.0: al igual que otras arquitecturas, el motor polymorph es el encargado de la teselación, y en el caso de pascal existe un motor polymorph habilitado para cada TPC

 

Motor de Migración de Página (Page Migration Engine):

Esta tecnología permite que tanto el GPU como el CPU, tengan acceso a la información contenida en la memoria del sistema como la del GPU. Permitiendo un flujo más acelerado de intercambio de datos y mejorando la interconexión de datos entre ambos procesadores.

NVLINK: tecnología que permite un ancho de banda muy extenso, capaz de mejorar el flujo de datos entre el CPU y múltiples GPUs.

Registradores: Doble la capacidad disponible de registradores por núcleo CUDA si se compara con Maxwell.

NVLINK: tecnología que permite un ancho de banda muy extenso, capaz de mejorar el flujo de datos entre el CPU y múltiples GPUs.

Multi-proyección simultanea (Simultaneous multi – projection)

Nueva Característica agregada al motor polymorph 4.0 de las tarjetas bajo la arquitectura pascal, en la que bajo la carga de un ciclo de rasterización entrega hasta 16 proyecciones bajo ángulos distintos, sin la necesidad de cargar datos geométricos otra vez, en arquitecturas pasadas, requerida por cada ángulo, hacer una carga de la data geométrica en la arquitectura, en pascal no, (en teoría) permitiendo una mejora en rendimiento, aparentemente esta característica es más usada en el mundo de realidad virtual/realidad aumentada (VR Works)

Sistema de memoria de la GeForce 1060 FE

La arquitectura habilita 6 controladores de 32 bits, sumando un total de ancho de banda de 192 bits, en el caso de la 1060FE, trae 6gb de GDDR5. Ahora en la GTX 1060 de 3GB, el sistema de memoria queda idéntico a la de su hermana mayor siendo el único cambio la memoria física disponible, (6gb vs 3GB).

 

Comentarios
Cargando...
%d bloggers like this:
Abrir la barra de herramientas