PCTuning fórum

Preview: G80 - PCShow.net

link

(preklad do angličtiny)

už se vi co je ten malej chip na začatku te karty?nebo stale špekulujete?

No myslim ze je to nezavisly RAMDAC cip s integrovanym TMDS, ktory uz netvori sucast jadra co vyrazne znizuje elektromagneticku interferenciu...

patent nVidie...

Obrázek

...na kterém vidíme výpočetní jednotku složenou ze 4 unifikovaných procesorů. Pokud má být v G80 128 streaming procesorů, znamenalo by to, že se G80 skládá z 32 těchto výpočetních jednotek.

Jinak docela zajímavá je tahle diskuse, Demirug má zřejmě podrobné informace a občas nezapomene něco "utrousit"

Alle Infos sind zusammengefasst aus dem PCGH Special 'Geforce 8800' Ausgabe 12/2006 S54ff

Hier ein paar Facts:
- 681mio Transen
- neue ROPs mit FP32 + MSAA
- 128 Steam Prozzies mit 1350Mhz (1 Skalar pro Takt) = 518,4GFLOP/s
- WUAF
- besseres Dynamic Branching
- besseres Early Z

Streaming Proc.:
Bisher konnten GPUs (Verktorprozzies) einen RGBA Wert auf einemal berechnen. Da aber nicht immer vier Vektoren benötigt werden müssen die ALUs nicht mehr 3:1 oder 2:2 aufgeteilt werden. Somit steigert die die effizeinz. Ein skalar ist im Prinzip ein einkanaliger Vektor. Der Shader-Compiler hat somit einen einfacheren Job.
Die 128 Streaming Proc. sind aus gründen der Cacheverwaltung zu 16ALUs zusammengefasst. Jede dieser ALUs kann pro Takt eine MADD und eine MUL ausführen.
Wenn man die reine MADD Leistung vergleicht kommt man auf 345,6GLOP/s

Textureinheiten:
Acht Bilineare Textureinheiten sind integriert. Allerdings nur 4 Textur Address Proc. pro Gruppe. Insgesamt können daher 64 bi-Texel pro Takt berechnet werden, aber nur 32 adressiert. Die restlichen TMUs können per Koordinaten Offset zusätzlkiche Daten samplen, wenn wenigstens eine Dimension mit der ersten übereinstimmt (z.B. 2:1 Bi-AF).
TMUs haben eine eigene Adresseinheit, es muß nicht mehr der Pixel-Shader verwendet werden. -> TMU Latenz entschärft.

ROPs:
Es gibt 6 ROP Cluster, jeder Cluster ist mit 64bit bei 900Mhz angebunden. Somit die 384bit.
Bei der GTS ist es ein Cluster weniger. Je ROP vier Pixel mit Farb- und Texturinfo.
Z-und Stencil-Ops weiter getuned.

AA:
Es wir 4/8/16 MSAA geben.
Neu ist zuschaltbares 'Coverage Sampling AA'. Dies ist ein Kopressionsverfahren, welches aber nicht immer Kompatibelsein soll. Die 16 Zufällig verteilten Subpixel verden auf den Bedekungsgrad als Booleanwert (Wahr/Falsch) gespeichert. Das ergebnis wird auf 4x oder 8x MSAA Kompromiert.

Toje mi na 2 veci, kdyz neumim nemecky

Muze to nekdo strucne prelozit?

Zhruba preklad do anglictiny....google nie je dokonaly....

All information is summarized 12/2006 S54ff from the PCGH Special “Geforce 8800” expenditure
Here a few Facts:
- 681milion of Transistors
- new ROPs with FP32 + MSAA
- 128 Steam Prozzies with 1350Mhz (1 scalar per clock) = 518,4GFLOP/s
- WUAF
- better dynamic Branching
- better Early Z

Streaming Proc.:
So far GPUs (Verktorprozzies) could compute a RGBA value on one times. Since however always four vectors to be needed do not have to be divided the ALUs no more 3:1 or 2:2. Thus those increases effizeinz. Scalarly is in principle a single-channel vector. The Shader compiler has thus a simpler job.
The 128 Streaming Proc. are out base the Cacheverwaltung into 16ALUs combined. Everyone this ALUs can implement a MADD and a MUL per clock.
If one the pure MADD achievement compares comes one on 345,6GLOP/s

Texture units:
Eight Bilineare texture units are integrated. However only 4 texture ADDRESS Proc. per group. Altogether therefore 64 bi-Texel per clock can be computed, but only 32 addresses. The remaining TMUs can samplen by coordinates offset zusätzlkiche data, if at least one dimension agrees with first (e.g. 2:1 Bi-AF).
TMUs do not have their own address unit, it must any more the pixel Shader be used. - > TMU latency defuses.

ROPs:
There are 6 ROP cluster, each cluster is tied up with 64bit with 900Mhz. Thus the 384bit. With the GTS is less it a cluster. For each ROP of four pixels with color and texture info. Z-and Stencil Ops further getuned.

AA:
It we give to 4/8/16 MSAA. Insertable “Coverage Sampling AA” is new. This is a Kopressionsverfahren, which however always compatible its is not. The 16 coincidental distributed Subpixel verden on the Bedekungsgrad as logical value (true/wrong) stored. The result becomes on 4x or 8x MSAA Kompromiert.

pár faktov o 8800GTX :
- 681 miliónov tranzistorov
- nové ROPs, ktoré dokážu FP32 + MSSAA
- 128 streaming procesors s taktom 1350MHz = 518,4 GFLOPs
- HQ AF ako u ATi
- lepší Dynamic Branching
- lepší Early Z

zdroj: časopis - PCGH

přeložit to snad není problém, ne?

- 681mio Transen
- neue ROPs mit FP32 + MSAA
- 128 Steam Prozzies mit 1350Mhz (1 Skalar pro Takt) = 518,4GFLOP/s
- WUAF
- besseres Dynamic Branching
- besseres Early Z

Streaming Proc.:
Bisher konnten GPUs (Verktorprozzies) einen RGBA Wert auf einemal berechnen. Da aber nicht immer vier Vektoren benötigt werden müssen die ALUs nicht mehr 3:1 oder 2:2 aufgeteilt werden. Somit steigert die die effizeinz. Ein skalar ist im Prinzip ein einkanaliger Vektor. Der Shader-Compiler hat somit einen einfacheren Job.
Die 128 Streaming Proc. sind aus gründen der Cacheverwaltung zu 16ALUs zusammengefasst. Jede dieser ALUs kann pro Takt eine MADD und eine MUL ausführen.
Wenn man die reine MADD Leistung vergleicht kommt man auf 345,6GLOP/s

681 milionů tranzistorů
podpora FP16/FP32 HDR včetně FSAA
128 unifikovaných stream-procesorů s 1D (=skalární) architekturou - předchozí čipy měly shader jendotky s architekturu 3D:1D (=vektorovou část pro operace se třemi komponentami a skalární pro operace s jednou komponentnou), příapdně 2D:2D. Rozdělení na samostatné 1D (skalární) ALUs umožňuje rovnoměrnější vytížení zátěže a zvýšení efektivity. S tím souvisí i efektivnější dynamic branching (jemnější granularita). Stream-pr. jsou uspořádány ve skupinách po 16ti. Každý SP umí operaci MUL a MADD.

stream-procesory běží na 1350MHz

Textureinheiten:
Acht Bilineare Textureinheiten sind integriert. Allerdings nur 4 Textur Address Proc. pro Gruppe. Insgesamt können daher 64 bi-Texel pro Takt berechnet werden, aber nur 32 adressiert. Die restlichen TMUs können per Koordinaten Offset zusätzlkiche Daten samplen, wenn wenigstens eine Dimension mit der ersten übereinstimmt (z.B. 2:1 Bi-AF).
TMUs haben eine eigene Adresseinheit, es muß nicht mehr der Pixel-Shader verwendet werden. -> TMU Latenz entschärft.

texturovací jednotky - je jich 64, ale nejsou srovnatelné se současnými; polovina je "plnohodnotná", každá TMU z této poloviny má vlastní ALU pro adresování textur (G7x tohle neměla, pro tyhle účely využívala primární ALU pixel shaderu - G80 tedy už pro pro adresování textur vlastní jednotku a neubírá při těchto operacích výkon pixel shaderu). Druhých 32 TMUs nemá vlastní jednotku pro texture adressing a jsou výrazněji vytíženy především při náročnější filtraci textur. TMUs běží na stejné frekvenci, jako jádro, tedy 575MHz.

AA:
Es wir 4/8/16 MSAA geben.
Neu ist zuschaltbares 'Coverage Sampling AA'. Dies ist ein Kopressionsverfahren, welches aber nicht immer Kompatibelsein soll. Die 16 Zufällig verteilten Subpixel verden auf den Bedekungsgrad als Booleanwert (Wahr/Falsch) gespeichert. Das ergebnis wird auf 4x oder 8x MSAA Kompromiert.

AA - režimy 4/8/16x s novým systémem komprese, jehož výsledkem je (při AA 16x) snížení objemu dat na úroveň jako při AA 4x nebo 8x = nižší propad výkonu.

ROPs:
Es gibt 6 ROP Cluster, jeder Cluster ist mit 64bit bei 900Mhz angebunden. Somit die 384bit.
Bei der GTS ist es ein Cluster weniger. Je ROP vier Pixel mit Farb- und Texturinfo.
Z-und Stencil-Ops weiter getuned.

ROPs jsou uspořádány v 6 skupinách po čtyřech. ROPs běží na stejné frekvenci, jako paměti.

--------------------------------------------------------------

V podstě totéž, o čem se diskutovalo na B3D, jen to máme potvrzený i z jiný strany.

Tradá... máme tu fotku jádra G80 bez HS... resp. fotku 118 jader G80

http://www.redaktori.cz/?q=node/228

pokud dobře počítám a zhruba jsem odhadl okraj, tak mi to vychází cca na 22mm široký čip - pro srovnání:

R300: 14,5 x 15 mm
NV40: 16 x 18 mm
R420: 17 x 16,5 mm
G70: 18,6 x 17 mm
G71: 13,5 x 14,5 mm
R520: 16 x 18 mm
R580: 18,5 x 18,5 mm

Nemáte někdo představu kolik GF 8800GTX bude stát? aspon priblžně

Cirrus

Cirrus píše:Nemáte někdo představu kolik GF 8800GTX bude stát? aspon priblžně

dvacet plus mínus autobus

Pokud bude dostupná a vynecháme takový ty přehnaný úlety prodejců v prvních dnech, tak by se podle mě měla do dvaceti vejít. Případně bude i výrazně levnější GTSka, která se podle mě vejde pod patnáct.

Přepočítával jsem velikost jádra a vychází mi to zatím cca na 21,5 x 23mm, tedy zhruba 500mm2. To je 2,5x víc, než na G71.

uh...

to je tedy síla!

Jsem právě přemýšlel, jestli mám jít bud do Radeonu X1800GTO kterej je ted docela levnej a přitom docela výkonej nebo počkat na GF8800... takže je to asi jasný

Díky za kvalitní názor

Cirrus

Cirrus píše:uh... to je tedy síla!

Jsem právě přemýšlel, jestli mám jít bud do Radeonu X1800GTO kterej je ted docela levnej a přitom docela výkonej nebo počkat na GF8800... takže je to asi jasný

Díky za kvalitní názor

Cirrus

ale 8800 je cenou asi dost jinde nez X1800GTO

) jinak nejlepsi volba dneska je asi X1950PRO za ty prachy nema konkurenci

no jo,to je pravda,ale zas tolik nemam a navic je furt nedostupná.

Cirrus

Cirrus píše:no jo,to je pravda,ale zas tolik nemam a navic je furt nedostupná.

Ale 8800GTS bude 2x až 3x dražší než X1950 pro

http://www.theinquirer.net/default.aspx?article=35385

Spis nez na vykon, by se meli zacit vyrobci zamerit na snizeni spotreby.Jestli to pujde timto krokem, tak za 10let bude pc zrat jako rychlovarna konvice.Coz uz pri tomto zatizeni el. site by bylo velmi zajimave...

gerimo píše:Spis nez na vykon, by se meli zacit vyrobci zamerit na snizeni spotreby.Jestli to pujde timto krokem, tak za 10let bude pc zrat jako rychlovarna konvice.Coz uz pri tomto zatizeni el. site by bylo velmi zajimave...

Toho se jistě nedočkáme. Zákon o zachování energie platí i u PC. Pokud by počítač měl spotřebu 2 kW, pak si opravdu nedokážu představit jak by se to chladilo

PCTuning fórum

nVidia G80 - informace, spekulace...