L'architettura Fermi della GPU GF100 in dettaglio

All’inizio del mese di ottobre dello scorso anno, nVidia ha mostrato una scheda video Tesla basata sulla prima revisione del chip GF100, focalizzando l’attenzione sul mercato HTPC e sul GPU Computing.

La versione desktop GeForce sarà probabilmente annunciata durante il prossimo CeBIT di Hannover in programma nel mese di marzo, ma l’effettiva disponibilità in commercio potrebbe slittare ad aprile. ATI, nel frattempo, avrà già completato tutta la serie Radeon HD 5000.

nVidia ha rilasciato ulteriori dettagli della architettura Fermi con riferimento al settore dei videogiochi e alla tecnologia 3D Vision Surround. Non sono note le frequenze di funzionamento di GPU, stream processors e memoria video, né i valori di temperature e consumi, ma diciamo subito che il chip GF100 consumerà di più del chip RV870 alla base delle GPU ATI e che non sarà possibile realizzare configurazioni a tre monitor con una sola scheda (sono attive solo due uscite video).

Il chip è suddiviso in 4 GPC (Graphics Processing Cluster), ognuno dei quali contiene 4 SM (Streaming Multiprocessor). Ogni SM è costituito da 32 CUDA Core (stream processors), per un totale di 512 CUDA Core. Oltre ai 32 core, in un SM ci sono anche 4 Texture Unit e 64 KB di memoria configurabile come 16 KB di cache L1 e 48 KB di memoria condivisa oppure come 48 KB di cache L1 e 16 KB di memoria condivisa.

All’interno di ogni CUDA core è presente un’unità di elaborazione in virgola mobile in doppia precisione IEEE 754-2008, in grado di eseguire 256 operazioni FMA (Fused Multiply Add) per ciclo di clock.

La gerarchia della memoria prevede anche una cache L2 da 768 KB unificata tra gli SM, un secondo blocco di cache L1 da 64 KB per le operazioni di load/store, una cache da 12 KB per ogni Texture Unit e memoria GDDR5 gestita da 6 controller da 64 bit per un totale di 384 bit.

[nggallery id=1930]

Uno degli obiettivi che nVidia intende raggiungere è il realismo geometrico, migliorando la qualità visiva nei videogiochi e contemporaneamente le prestazioni. Ciò può essere fatto utilizzando la tecnologia di tessellation, supportata dalle librerie DirectX 11 presenti in Windows 7. I componenti hardware dedicati sono il PolyMorph Engine (uno per ogni SM) e il Raster Engine (uno per ogni 4 SM). È stato inoltre implementato il Coverage Sampling Anti-Aliasing 32x (CSAA) per aumentare i dettagli e quindi il realismo delle scene.

nVidia crede molto nella tecnologia 3D Vision Surround che permette di utilizzare 3 schermi identici (con refresh rate di 120 Hz) affiancati orizzontalmente, ottenendo una risoluzione di 5760×1080 pixel con monitor full HD. Ma, come detto all’inizio dell’articolo, sarà necessario realizzare una configurazione SLI con due schede video, in quanto una GeForce Fermi può gestire solo due uscite video in contemporanea. Per la tecnologia ATI Eyefinity invece basta una sola scheda.

Non è possibile ancora valutare le reali prestazioni della GPU GF100, in quanto tutti i benchmark sono stati forniti dalla stessa nVidia. Sicuramente la nuova architettura introdurrà novità interessanti, ma la sua complessità comporterà consumi e temperature elevate, oltre ad un prezzo di vendita abbastanza alto.

[youtube]QLu8DyzoVMs]

[youtube]uEieu-OKVvs]

[youtube]XJWKe9YccG0[/youtube]

L'architettura Fermi della GPU GF100 in dettaglio

Ti consigliamo anche