Napsal: pát 27. říj 2006, 13:49
Diskuze o hardware, software a overclockingu
https://forum.pctuning.cz/
Alle Infos sind zusammengefasst aus dem PCGH Special 'Geforce 8800' Ausgabe 12/2006 S54ff
Hier ein paar Facts:
- 681mio Transen
- neue ROPs mit FP32 + MSAA
- 128 Steam Prozzies mit 1350Mhz (1 Skalar pro Takt) = 518,4GFLOP/s
- WUAF
- besseres Dynamic Branching
- besseres Early Z
Streaming Proc.:
Bisher konnten GPUs (Verktorprozzies) einen RGBA Wert auf einemal berechnen. Da aber nicht immer vier Vektoren benötigt werden müssen die ALUs nicht mehr 3:1 oder 2:2 aufgeteilt werden. Somit steigert die die effizeinz. Ein skalar ist im Prinzip ein einkanaliger Vektor. Der Shader-Compiler hat somit einen einfacheren Job.
Die 128 Streaming Proc. sind aus gründen der Cacheverwaltung zu 16ALUs zusammengefasst. Jede dieser ALUs kann pro Takt eine MADD und eine MUL ausführen.
Wenn man die reine MADD Leistung vergleicht kommt man auf 345,6GLOP/s
Textureinheiten:
Acht Bilineare Textureinheiten sind integriert. Allerdings nur 4 Textur Address Proc. pro Gruppe. Insgesamt können daher 64 bi-Texel pro Takt berechnet werden, aber nur 32 adressiert. Die restlichen TMUs können per Koordinaten Offset zusätzlkiche Daten samplen, wenn wenigstens eine Dimension mit der ersten übereinstimmt (z.B. 2:1 Bi-AF).
TMUs haben eine eigene Adresseinheit, es muß nicht mehr der Pixel-Shader verwendet werden. -> TMU Latenz entschärft.
ROPs:
Es gibt 6 ROP Cluster, jeder Cluster ist mit 64bit bei 900Mhz angebunden. Somit die 384bit.
Bei der GTS ist es ein Cluster weniger. Je ROP vier Pixel mit Farb- und Texturinfo.
Z-und Stencil-Ops weiter getuned.
AA:
Es wir 4/8/16 MSAA geben.
Neu ist zuschaltbares 'Coverage Sampling AA'. Dies ist ein Kopressionsverfahren, welches aber nicht immer Kompatibelsein soll. Die 16 Zufällig verteilten Subpixel verden auf den Bedekungsgrad als Booleanwert (Wahr/Falsch) gespeichert. Das ergebnis wird auf 4x oder 8x MSAA Kompromiert.
681 milionů tranzistorů- 681mio Transen
- neue ROPs mit FP32 + MSAA
- 128 Steam Prozzies mit 1350Mhz (1 Skalar pro Takt) = 518,4GFLOP/s
- WUAF
- besseres Dynamic Branching
- besseres Early Z
Streaming Proc.:
Bisher konnten GPUs (Verktorprozzies) einen RGBA Wert auf einemal berechnen. Da aber nicht immer vier Vektoren benötigt werden müssen die ALUs nicht mehr 3:1 oder 2:2 aufgeteilt werden. Somit steigert die die effizeinz. Ein skalar ist im Prinzip ein einkanaliger Vektor. Der Shader-Compiler hat somit einen einfacheren Job.
Die 128 Streaming Proc. sind aus gründen der Cacheverwaltung zu 16ALUs zusammengefasst. Jede dieser ALUs kann pro Takt eine MADD und eine MUL ausführen.
Wenn man die reine MADD Leistung vergleicht kommt man auf 345,6GLOP/s
texturovací jednotky - je jich 64, ale nejsou srovnatelné se současnými; polovina je "plnohodnotná", každá TMU z této poloviny má vlastní ALU pro adresování textur (G7x tohle neměla, pro tyhle účely využívala primární ALU pixel shaderu - G80 tedy už pro pro adresování textur vlastní jednotku a neubírá při těchto operacích výkon pixel shaderu). Druhých 32 TMUs nemá vlastní jednotku pro texture adressing a jsou výrazněji vytíženy především při náročnější filtraci textur. TMUs běží na stejné frekvenci, jako jádro, tedy 575MHz.Textureinheiten:
Acht Bilineare Textureinheiten sind integriert. Allerdings nur 4 Textur Address Proc. pro Gruppe. Insgesamt können daher 64 bi-Texel pro Takt berechnet werden, aber nur 32 adressiert. Die restlichen TMUs können per Koordinaten Offset zusätzlkiche Daten samplen, wenn wenigstens eine Dimension mit der ersten übereinstimmt (z.B. 2:1 Bi-AF).
TMUs haben eine eigene Adresseinheit, es muß nicht mehr der Pixel-Shader verwendet werden. -> TMU Latenz entschärft.
AA - režimy 4/8/16x s novým systémem komprese, jehož výsledkem je (při AA 16x) snížení objemu dat na úroveň jako při AA 4x nebo 8x = nižší propad výkonu.AA:
Es wir 4/8/16 MSAA geben.
Neu ist zuschaltbares 'Coverage Sampling AA'. Dies ist ein Kopressionsverfahren, welches aber nicht immer Kompatibelsein soll. Die 16 Zufällig verteilten Subpixel verden auf den Bedekungsgrad als Booleanwert (Wahr/Falsch) gespeichert. Das ergebnis wird auf 4x oder 8x MSAA Kompromiert.
ROPs jsou uspořádány v 6 skupinách po čtyřech. ROPs běží na stejné frekvenci, jako paměti.ROPs:
Es gibt 6 ROP Cluster, jeder Cluster ist mit 64bit bei 900Mhz angebunden. Somit die 384bit.
Bei der GTS ist es ein Cluster weniger. Je ROP vier Pixel mit Farb- und Texturinfo.
Z-und Stencil-Ops weiter getuned.
dvacet plus mínus autobusCirrus píše:Nemáte někdo představu kolik GF 8800GTX bude stát? aspon priblžně
ale 8800 je cenou asi dost jinde nez X1800GTO ) jinak nejlepsi volba dneska je asi X1950PRO za ty prachy nema konkurenciCirrus píše:uh... to je tedy síla!
Jsem právě přemýšlel, jestli mám jít bud do Radeonu X1800GTO kterej je ted docela levnej a přitom docela výkonej nebo počkat na GF8800... takže je to asi jasný
Díky za kvalitní názor
Cirrus
Ale 8800GTS bude 2x až 3x dražší než X1950 proCirrus píše:no jo,to je pravda,ale zas tolik nemam a navic je furt nedostupná.
Toho se jistě nedočkáme. Zákon o zachování energie platí i u PC. Pokud by počítač měl spotřebu 2 kW, pak si opravdu nedokážu představit jak by se to chladilogerimo píše:Spis nez na vykon, by se meli zacit vyrobci zamerit na snizeni spotreby.Jestli to pujde timto krokem, tak za 10let bude pc zrat jako rychlovarna konvice.Coz uz pri tomto zatizeni el. site by bylo velmi zajimave...