UltraSPARC IIi

UltraSPARC IIi
Processeur UltraSPARC IIi

L'UltraSPARC IIi, successeur de l'UltraSPARC, est un microprocesseur 64 bits de Sun Microsystems dont la distribution commença en 1997.

L'UltraSPARC IIi est basé sur les spécifications SPARC version 9, et équipe notamment les stations Sun allant de l'Ultra 5 à l'Ultra 60 ainsi que les premiers modèles de Sunblade.

Sommaire

Principaux blocs fonctionnels

Les principaux composants formant l'UltraSPARC IIi sont :

  • IEU : Integer Execution Unit, effectue les opérations arithmétique grâce à ses 2 ALUs ;
  • FPU : Floating Point Unit, effectue les opérations arithmétiques sur des nombres à virgule ;
  • GRU : GRaphic Unit, exécute les instructions graphiques (voir Jeu d'instructions) ;
  • LSU : Load/Store Unit, accède à la mémoire ;
  • PDU : Prefetch, Prediction and Dispatch Unit, contient la Prefetch queue et la logique pour le groupement des instructions ;
  • I-Cache & D-Cache : caches de données et d'instructions ;
  • I-MMU & D-MMU : Memory Management Unit, traduit les adresses virtuelles

Registres

L'UltraSPARC IIi implémente la technique de la fenêtre de registres, c'est-à-dire qu'il met à disposition de l'utilisateur plusieurs jeux de registres interchangeables.

En plus des 8 registres globaux (%g0 à %g7), qui sont dupliqués selon le mode de fonctionnement du microprocesseur (4 modes sont disponibles), l'utilisateur a accès à une fenêtre coulissante de 24 registres :

  • les registres d'entrée (%i0 à %i7), utilisés pour récupérer les arguments d'une fonction et lire la valeur de retour ;
  • les registres locaux (%l0 à %l7), offrant un stockage pour les variables locales ;
  • les registres de sortie (%o0 à %o7), permettant le passage d'argument à une fonction.

La fenêtre de registres est dite coulissante car dans le prologue d'une fonction, on fait appel à une instruction qui transforme les registres de sortie en registres d'entrée, et qui libère un nouveau jeu de 16 registres locaux et de sortie. Dans l'épilogue, on revient à l'ancienne fenêtre, ce qui à pour effet de restaurer les registres locaux et d'entrée.

L'UltraSPARC IIi offre 8 fenêtres de registres, au delà, c'est au système d'exploitation d'assurer la sauvegarde des fenêtre précédentes contre l'écrasement. En effet, la fenêtre fonctionne de manière circulaire : une fois sur la dernière fenêtre, on reprend à la première.

La FPU offre 32 registres pouvant contenir soit des flottants simple précision soit des flottants double précision (IEEE754).

Pipeline

Le pipeline de l'UltraSPARC IIi est composé de 9 étages :

  • fetch : lit un maximum de 4 instructions depuis le I-Cache ;
  • decode : pré-décode et identifie les instructions ;
  • group : choisi les instructions à exécuter (voir description ci-dessous) ;
  • execute : exécute les instructions arithmétiques (à l'aide des 2 ALUs) ;
  • cache : effectue la traduction d'adresse (voir Unité de gestion de la mémoire) ;
  • N1 : résolution des caches-misses au niveau du D-Cache ;
  • N2 : accès mémoire ;
  • N3 : résolution des traps ;
  • write-back : écriture des résultats finaux dans les registres.

L'UltraSPARC IIi est superscalaire de degré 4, c'est-à-dire qu'il peut exécuter selon certaines contraintes 4 instructions simultanément. Parmi ces contraintes :

  • la présence de 2 ALUs permet l'exécution simultanée de deux instructions arithmétiques au maximum par groupe ;
  • la FPU et la GRU permettent l'exécution d'un maximum de deux instructions simultanées, selon la nature des instructions dont il est question ;
  • une instruction de branchement peut être exécutée, seulement si elle est la dernière du groupe d'instructions ;
  • une instruction d'accès mémoire peut être exécutée par groupe.

Dans le cas des instructions FPU ou des instructions graphiques, la fin du pipeline diffère :

  • register : accède aux registres flottants ;
  • X1 : début de l'exécution des instructions ;
  • X2 : continue l'exécution ;
  • X3 : fin de l'exécution ;
  • write-back : idem que dans le pipeline classique.

Chaque instruction de branchement est suivi d'un delay slot, c'est-à-dire une instruction qui sera systématiquement exécutée même si le branchement est pris. Il est possible d'annuler l'effet du delay slot, en utilisant des instructions particulières.

Caches

  • Le cache d'instructions (I-Cache) est un cache set associative de degré 2, contenant des blocs de 32 octets. Il y a 16 kilo-octets au total.
  • Le cache de données (D-Cache) est un cache direct mapped avec 2 sous blocs de 16 octets par ligne de cache. La politique de write-hit est de type write-through. Le D-Cache mesure 16 kilo-octets, à l'instar de l'I-Cache.

Jeu d'instructions

Le jeu d'instructions de l'UltraSPARC IIi est le Visual Instruction Set de Sun. Il offre :

  • les instructions arithmétiques et logiques classiques ;
  • les comparaisons et branchements ;
  • les accès à la mémoire ;
  • des instructions SIMD pour accélérer les traitements graphiques et sonores.

Exemple en assembleur

La fonction suivante calcule la somme des entiers 64 bits d'un tableau.

sum:
        save %sp, -192, %sp   /* sauve l'ancienne fenêtre de registre */
                                /* à cet instant :                      */
                                /* %i0 = nombre de cases du tableau        */
                                /* %i1 = adresse du tableau                */
        sllx %i0, 3, %l0      /* calcule la taille du tableau en mémoire      */
                                /* il s'agit d'une multiplication par 8         */
                                /* (décalage de 3 bits vers la gauche)          */
        add %i1, %l0, %l0        /* calcule l'adresse de fin du tableau dans %l0    */
        mov %i1, %l1          /* copie l'adresse du tableau dans %l1             */
        clr %i0                    /* on utilise le registre %i0 pour la somme        */
                                /* car registre est le registre de retour       */
        /* maintenant, on va parcourir les adresses de %l1 (début du tableau) à    */
        /* %l0 (fin du tableau) et additionner les valeurs                 */
.loop:  ldx [%l1], %l2             /* lit la valeur courante du tableau dans %l2      */
        add %l1, 8, %l1               /* avance dans le tableau d'une case (8 octets)        */
        cmp %l1, %l0          /* compare l'adresse courante à l'adresse de fin*/
        blt .loop               /* si %l1 < %l0, saute au label loop                  */
         add %i0, %l2, %i0       /* additionne la valeur à la somme              */
        ret                     /* restaure l'ancienne fenêtre de registre      */
         restore                /* instruction en delay-slot                    */

On observe que l'addition juste après le branchement est exécutée même quand le branchement est pris. Mettre une instruction utile dans le delay slot permet ici de gagner un cycle par itération.

Unité de gestion de la mémoire

La MMU de l'UltraSPARC IIi est formée par la LSU (Load/Store Unit) et les Translation Lookaside Buffers (TLB) : I-TLB et D-TLB.

La gestion de la mémoire virtuelle fait appel à deux TLB de 64 entrées de type full associative. Chaque entrée dans un TLB est divisée en 2 :

  • le tag : contient l'adresse virtuelle, le flag Global et le numéro de contexte ;
  • les données : précisent l'adresse physique, la taille de la page et les permissions.

Lorsqu'une adresse doit être traduite, les tags du TLB correspondant (I-TLB pour la lecture d'instructions, D-TLB pour les accès mémoire faits par la LSU), est parcouru à la recherche d'une adresse correspondante. Si une telle entrée est trouvée, le numéro de contexte est alors comparé au numéro de contexte courant, ou si la page est globale, alors cette comparaison n'est pas faite. Une fois l'entrée identifiée, la partie données est lue et l'adresse est traduite.

En cas de TLB-miss (c'est-à-dire si aucune entrée ne convient), le microprocesseur entame une recherche dans un cache placé en mémoire par l'utilisateur : le Translation Storage Buffer (TSB). Cette recherche est évidemment plus longue car il y a de nombreux accès mémoire. Cependant, l'utilisation du TSB est optionnelle.

Enfin, s'il n'existe aucune entrée ni dans le TLB ni dans le TSB, une exception est déclenchée. De la même manière, s'il existe une entrée mais que les permissions sont insuffisantes, une exception est aussi déclenchée. C'est alors au système d'exploitation :

  • soit de remplir le TLB avec l'entrée manquante ;
  • soit de changer les permissions pour autoriser l'opérations ;
  • ou encore d'avertir l'utilisateur d'une erreur irrécupérable (Segmentation fault sous UNIX) et d'interrompre le programme.

Bien entendu, il faut très soigneusement maintenir les TLB, afin d'optimiser les performances et d'éviter les plantages.

Il est possible de contourner le mécanisme de traduction d'adresse, en utilisant 2 identifiants d'espace d'adressage spécifiques (Bypass ASIs). Cette opération est cependant réservée au superviseur.


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article UltraSPARC IIi de Wikipédia en français (auteurs)

Игры ⚽ Нужен реферат?

Regardez d'autres dictionnaires:

  • UltraSPARC III — Процессорный модуль с UltraSPARC III Cu 1200 МГц для Sun Blade 2000 UltraSPARC III (кодовое имя «Cheetah»)  микропроцессор с системой команд SPARC V9, разраб …   Википедия

  • UltraSPARC III — Superscalare 64Bit RISC Prozessorfamilie von Sun Microsystems, Inc. von 1999 mit bis zu 900MHz Taktrate …   Acronyms

  • UltraSPARC III — Superscalare 64Bit RISC Prozessorfamilie von Sun Microsystems, Inc. von 1999 mit bis zu 900MHz Taktrate …   Acronyms von A bis Z

  • UltraSPARC T1 — Sun UltraSPARC T1 (Niagara 8 Core) Produced 2005 Designed by Sun Microsystems Common manufacturer(s) …   Wikipedia

  • UltraSPARC T2 — Micrograph Produced 2007 Designed by Sun Microsystems Common manufacturer(s) …   Wikipedia

  • UltraSPARC IV — («Jaguar») и последовавший за ним UltraSPARC IV+ («Panther»)  это микропроцессоры, разработанные Sun Microsystems и произведённые Texas Instruments. Это четвёртое поколение микропроцессоров UltraSPARC, они используют систему команд SPARC V9 …   Википедия

  • UltraSPARC T2 — («Niagara 2»)  многоядерный многопотоковый микропроцессор от Sun Microsystems. Является представителем семейства процессоров SPARC и последователем UltraSPARC T1. Sun начала продажи серверов с процессорами T2 в октябре 2007 года. В апреле… …   Википедия

  • UltraSPARC T1 — UltraSPARC T1  многоядерный микропроцессор с аппаратной поддержкой многопоточности, разработанный Sun Microsystems, до анонса 14 ноября 2005 г. известен как Niagara. Процессор базируется на RISC архитектуре UltraSPARC Architecture 2005… …   Википедия

  • UltraSPARC — Version 200 Mhz de l UltraSPARC L UltraSPARC est un micro processeur développé par Sun Microsystems et fabriqué par Texas Instruments. Il implémente le jeu d instructions SPARC V9. Il a été mis sur le marché en 1995. Il fut le premier micro… …   Wikipédia en Français

  • UltraSPARC T1 — Le micro processeur UltraSPARC T1 de Sun Microsystems, est un processeur (CPU) multicœur et multithread. Il est aussi dénommé Niagara. C est un micro processeur UltraSPARC constitué de 8 cœurs, chacun pouvant gérer 4 files d exécution, soit 32 au …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”