Destacado
   
Inicio - Noticias - Hardware - AMD introduce su arquitectura “Jaguar” para PCs de siguiente generación: APUs Kabini, Temash

AMD introduce su arquitectura “Jaguar” para PCs de siguiente generación: APUs Kabini, Temash

La competencia también se consigue con alta eficiencia

AMD-Jaguar-Kabini-Die-

Las tendencias de la industria están llevando a que las principales compañías de semiconductores doblen esfuerzos en desarrollar mejores tecnologías que permitan a los procesadores x86 ser más eficientes en consumo de energía y no tanto aumentando frecuencias o la cantidad de núcleos.  Claro, esto no es nada nuevo, pero tampoco ha significado que avancen por el mismo camino.  En el caso de Intel han optado por dominar el segmento de alto rendimiento con sus procesadores Core i Series, mientras que AMD se ha concentrado en ofrecer mejores alternativas de bajo consumo con grandes capacidades gráficas comenzando con sus APUs Llano para escritorio y su plataforma “Brazos” para portátiles. A casi dos años de dar este paso, AMD ha encontrado que es momento apropiado para introducir su arquitectura “Jaguar” la cual encontraremos en APUs Tamash de bajo consumo para portátiles y APUs Kabini de ultra bajo consumo para tabletas y otros dispositivos móviles, y si les suena conocida es porque también en la que se encuentran basados los APUs del Play Station 4 y Xbox One.

AMD combina APUs “Jaguar con GPUs GCN

Un rediseño masivo para un núcleo x86 de bajo consumo

Comencemos mencionando que la arquitectura “Jaguar” se fundamenta en los principios que definieron a “Bobcat” con la que vimos APUs Zacate y Ontario de 40nm; sin embargo no es una “mejora menor” como ocurrió con la plataforma Brazos 2.0 con la que se presentaron APUs únicamente con frecuencias más altas conservando el mismo TDP. Lo que hace diferente a “Jaguar” es su diseño SoC (System on Chip) que está fabricado mediante proceso de manufactura HKMG/SOI por TSMC a 28nm, y porque incorpora importantes mejoras en IPC (instructions executed per clock), funciones ISA para cumplir con estándares actuales, y la adición de un nuevo juego de instrucciones incluyendo SSE4.1/4.2 y AVX.

AMD-bobcat-jaguar

La ventaja de hacer la transición a 28nm y no detenerse con el nodo a 32nm fue para enfocar esfuerzos en mejorar el rendimiento pero conservando los mismos niveles de consumo sub-15W a los que Intel se ha acercado peligrosamente con sus nuevos procesadores de 22nm, y si mencionar que Intel se ha vuelto un peligroso jugador en gráficos integrados. En otras palabras, “Jaguar” será usada en APUs que serán designadas a portátiles ultra delgadas y tabletas que es, a final de cuentas, donde se esta moviendo la industria. Cabe mencionar que por ahora AMD ha definido su estrategia en móviles únicamente con Windows 8, por lo que no se esperan tabletas Android de parte de AMD para este 2013.

jag_02

Tomando ésto en cuenta, pasemos entonces a los engranes que harán mover a los APUs basados en “Jaguar” que son Kabini y Temash. En primer lugar, estamos hablando de un núcleo notablemente más pequeño que ocupa un área de 3.1 mm2 comparado con “Bobcat” que es de 4.9mm2, nativamente cuenta con un quad-core con 2MB de caché L2, un controlador de memoria de 64-bits y puede soportar memoria LPDDR-3 de hasta 1600 MHz y lo que es la mejora más importante, es el primero APU que cuenta con gráficos basados en la arquitectura GCN que hemos conocido en tarjetas de video Radeon HD 7000 Series.

Jaguar-Die

En la primera sección donde se hacen visibles las primeras mejoras es en la denominada “Front end” donde podemos encontrar que se sigue usando el mismo juego de instrucciones i-caché de 32 KB que vimos con “Bobcat”. La diferencia reside en que ha sido rediseñado al utilizar un proceso de lectura selectiva basado en un buffer de ciclo que solamente se activa cuando es detectado un ciclo de 4x 32 bytes con la finalidad es evitar el estar buscando instrucciones en el ciclo desde el i-caché L2 una y otra vez. De esta manera, al incrementar un 30% el buffer de instrucciones y modificar el prefetcher IC (instruction cycle) han conseguido reducir el consumo en hasta un 75% y mejorar el IPC aún cuando esto ha significado agregar nuevas etapas del decodificador y aumentar frecuencias al usar un proceso de manufactura más pequeño a 28nm.

jag_03

De igual forma, otro apartado que permanece muy parecido al de “Bobcat” es en la ejecución de enteros donde se siguen encontrando dos ALUs (Arithmetic logic unit), un LD AGU (load address generation unit) y un ST AGU (store address generation unit). La mejora radica en que se ha añadido una unidad divisora como la que utiliza la arquitectura “Stars” de APUs “Llano” que ha sido modificada para soportar un número de instrucciones complejas incluyendo CRC32/SSE4.2, BMI1, POPCNT y LZCNT, así como unidades CRC para mejorar la eficiencia de ejecución de código x86. Así mismo los programadores (o Schedulers, en Inglés) se han vuelto entre 30 a 70% más grandes para mejorar la ejecución de código paralelo.

jag_04

En lo que se refiere a los motores de cálculo de punto flotante, ahora están compuestos de unidades nativas de 128-bits y no de unidades dobles de  64-bits como “Bobcat”. Esto permite entregar cuatro operaciones de múltiplos de simple precisión o cuatro sumas de simple precisión, o bien una operación de múltiplos de doble precisión y dos sumas de doble precisión. También cuenta con soporte a instrucciones AVX de 256-bits al duplicar unidades de 128-bits. Al final, ésto debería mejorar el rendimiento en cálculo de operaciones de tipo entero y de doble precisión, pero podría impactar en su eficiencia de consumo de energía.

jag_05

Para Jaguar, AMD también ha introducido la segunda generación de unidades de carga/almacenamiento OoO (out-of-order) que debutó con “Bobcat” en la que una vez más la mejora principal se ha concentrado en el rediseño para ayudar a que las mejoras en el caché L2 sean más útiles. Y esto se ha conseguido añadiendo un selector OoO (out-of-order) mejorado, se ha mejorado el STLF, y se ha añadido un buffer más grande para evitar crear latencias al cargar información almacenada. Todo esto ha sido con la finalidad de mejorar el rendimiento de operaciones enteras y de punto flotante comparado con lo que se hizo con Bobcat, con lo que se espera mejoras de alrededor de 15% en el procesamiento IPC.

jag_06

jag_07

Como parte de las mejoras que corresponden a la comunicación con el caché L2 y el northbridge, se ha añadido ocho instrucciones miss/prefetch de caché de información, tres miss/prefetch de caché de información, y se ha mejorado la combinación de escritura con cuatro buffer WCB (write combine buffer). Otro aspecto importante es su nuevo caché L2 completamente rediseñado y más grande de 2MB de 16 vías que ahora es compartido al estar conectado con todas las conexiones desde la memoria I/O hasta el GPU. Cabe mencionar que el caché L2 trabaja a la mitad de la frecuencia máxima del CPU, mientras que la interfaz del núcleo a toda la frecuencia. Según explica AMD, su nuevo caché L2 representa uno de los aspectos más importantes al representar un 5-10% de las mejoras IPC que entrega Jaguar con respecto a Bobcat.

 jag_08

AMD “Jaguar”: El primer APU con diseño SoC

A diferencia de “Bobcat” que únicamente integra un CPU y un GPU en el mismo encapsulado, la arquitectura “Jaguar” representa un paso importante para AMD en la integración de componentes al adoptar un diseño SoC (System on Chip) que ha permitido unificar el Northbridge y el controlador de memoria para que tanto el CPU como el GPU tengan acceso. De esta manera, el northbridge está compuesto  con diversos componentes importantes como el SRI (System Request Interface), la Crossbar, el Controlador enlace que es el encargado de conectar el GPU con el FCL (Fusion Control Link) de 128-bits, y finalmente el controlador de memoria. En este punto podemos ver que “Jaguar” cuenta con un controlador de memoria que está conectado al controlador DRAM, y el GPU a la interfaz del controlador DRAM mediante una unidad bidireccional de 256-bits.

jag_09

El southbridge por otra parte cuenta con soporte para ocho puertos USB 2.0, dos USB 3.0 y dos SATA 6.0Gbps. En lo que se refiere a opciones de conectividad cuenta con líneas PCI-E y cuatro líneas PCI-e x1, también cuenta con soporte a salida de video eDP (DisplayPort embebido), la salida convencional DisplayPort, HDMI y hasta VGA.

jag_10

APUs estrenan GPUs basados en arquitectura GCN

El apartado gráfico es uno de los más importantes de “Jaguar” debido a que finalmente se ha implementado la arquitectura GCN que conocemos de las tarjetas Radeon HD 7000 “Southern Islands”. De esta manera, estamos hablando que los APUs “Kabini” y “Temash” cuentan con dos CUs (compute units), cada uno con 4 unidades vectoriales, que a su vez se traduce en 16 ALUs. Todo esto combinado da lugar a un GPU Radeon con 128 núcleos o una cuarta parte de una Radeon HD 7750, lo cual es todavía mejor que los 80 núcleos basadas en la arquitectura VLIW5 usados en Brazos.

AMD-Jaguar-GPU-GCN-CU

Por lo tanto, las APUs “Jaguar” cuentan con un GPU con soporte a APIs que ya conocemos en variantes discretas, incluyendo DirectX 11.1, OpenGL 4.3, y OpenCL 1.2. También cuentan con un nuevo motor VCE (Video Codec Engine), decodificador de video basado en hardware y codificador basado en H.264, y ofrecen soporte a configuraciones multi-monitor EyeFinite con soporte hasta para resoluciones 4K x 2K. Con éstas mejoras, AMD indica que hay importantes mejores en aplicaciones 3D, y hasta un 75% en aplicaciones GPGPU.

jag_12

Eficiencia y manejo de energía

El secreto detrás de la eficiencia de APUs basadas en “Jaguar” se debe a la adición de monitores individuales para el CPU, GPU, interfaz de pantalla y FCH, los cuales tienen la capacidad de calcular instantáneamente y monitorear el consumo de energía y reportarle a un control denominado Turbo Core Manager, el cual será el encargado de calcular la temperatura del sistema y el consumo total del dispositivo para no exceder el TDP de 15W, al mismo tiempo que evalúa cuál es el componente que está recibiendo más energía o de qué manera puede incrementarse su frecuencia.

jag_13

Esto significa que si el GPU necesita más potencia tiene oportunidad de aumentar su consumo de energía, mientras que el CPU puede estar trabajando con 5W. O bien, si se trata de una tarea intensiva de un hilo, el control de energía puede hacer que un núcleo trabaje al máximo de su frecuencia mientras apaga los otros tres.

AMD-Jaguar-CPU-utilization

Pero eso no es todo. Una de las importantes adiciones de AMD para mejorar su eficiencia es mediante el diseño híbrido basado en el dock desmontable denominado Turbo Dock, el cual no solo sirve para aumentar la duración de la batería sino también para mejorar las temperaturas y eficiencia del sistema completo.

AMD-jaguar-power-consumption

Últimos comentarios

Habiendo alcanzado este punto, se tiene la impresión que AMD no ha tenido que ir lejos con la arquitectura “Jaguar”. Únicamente han corregido los puntos débiles que sufrió “Bobcat” añadiendo hasta un 20% de mayor rendimiento IPC en aplicaciones de un hilo, han implementado la arquitectura GCN, y sobre todo han conseguido conservar el mismo bajo consumo de 15W con un nuevo manejo inteligente de energía. elementos que impidieron que “Bobcat”. ¿Serán suficientes? Para competir cara a cara contra Intel, ciertamente no. Al menos no en el segmento high-end.

La ventaja que tiene AMD es que podría continuar con el legado de las netbooks que fueron bien recibidas en su momento, pero ahora dirigiendo esfuerzos al mercado de tabletas basadas en Windows 8. Por lo tanto, si, AMD consigue posicionarse con productos a precio, fácilmente podríamos esperar que AMD se haga de un lugar privilegiado al que Intel esta buscando entrar con procesadores Haswell. Al final, todo dependerá del apoyo que tenga AMD por parte de los partners OEM.

Por otro lado, aunque la arquitectura “Jaguar” aún esta lejos de ser lo que lo que han prometido con la unificación de su Tecnología hUMA, su nueva generación de APUs debería servir para darnos una idea de lo que estaríamos viendo una vez que sea posible que el CPU y GPU tengan acceso al mismo espacio de memoria física y virtual.

Fuente: PCPER, Tom’s Hardware, Anandtech

Ver la entrada en el foro

Acerca de Victor Padró

Apasionado por la tecnología y el aprendizaje, observador, feliz padre, ultra fan de Atari y Star Wars, apasionado por el Fútbol y amante del buen cine. Head Manager de HardwareMX.

Destacado

Indra_INTECO_CloudCERT_nube
ASRock Killer Series Motherboards
GDATA_sitios_web_peligrosos_categoria
AXIS_Q6042-S_44-S_45-S_PTZ_Dome_Network_Camera_hi
tecnocom-universidades-mexico
panasonic-digitalizar-documentos
Estadio Mineirão
alcatel-lucent-smart-cities
reduccion-costos