QR code per la pagina originale

L’architettura Fermi della GPU GF100 in dettaglio

,

All’inizio del mese di ottobre dello scorso anno, nVidia ha mostrato una scheda video Tesla basata sulla prima revisione del chip GF100, focalizzando l’attenzione sul mercato HTPC e sul GPU Computing.

La versione desktop GeForce sarà probabilmente annunciata durante il prossimo CeBIT di Hannover in programma nel mese di marzo, ma l’effettiva disponibilità in commercio potrebbe slittare ad aprile. ATI, nel frattempo, avrà già completato tutta la serie Radeon HD 5000.

nVidia ha rilasciato ulteriori dettagli della architettura Fermi con riferimento al settore dei videogiochi e alla tecnologia 3D Vision Surround. Non sono note le frequenze di funzionamento di GPU, stream processors e memoria video, né i valori di temperature e consumi, ma diciamo subito che il chip GF100 consumerà di più del chip RV870 alla base delle GPU ATI e che non sarà possibile realizzare configurazioni a tre monitor con una sola scheda (sono attive solo due uscite video).

Il chip è suddiviso in 4 GPC (Graphics Processing Cluster), ognuno dei quali contiene 4 SM (Streaming Multiprocessor). Ogni SM è costituito da 32 CUDA Core (stream processors), per un totale di 512 CUDA Core. Oltre ai 32 core, in un SM ci sono anche 4 Texture Unit e 64 KB di memoria configurabile come 16 KB di cache L1 e 48 KB di memoria condivisa oppure come 48 KB di cache L1 e 16 KB di memoria condivisa.

All’interno di ogni CUDA core è presente un’unità di elaborazione in virgola mobile in doppia precisione IEEE 754-2008, in grado di eseguire 256 operazioni FMA (Fused Multiply Add) per ciclo di clock.

La gerarchia della memoria prevede anche una cache L2 da 768 KB unificata tra gli SM, un secondo blocco di cache L1 da 64 KB per le operazioni di load/store, una cache da 12 KB per ogni Texture Unit e memoria GDDR5 gestita da 6 controller da 64 bit per un totale di 384 bit.

Notizie su: