Napsal: čtv 15. kvě 2008, 15:49
to je jasnéOBR píše:název je autentický a jsem rád že ho někdo propálil, já si na to netroufal ... nvidia by mě konkrétně zabila.
Diskuze o hardware, software a overclockingu
https://forum.pctuning.cz/
to je jasnéOBR píše:název je autentický a jsem rád že ho někdo propálil, já si na to netroufal ... nvidia by mě konkrétně zabila.
NVIDIA je na každý detail strašně háklivá, oni se dají srovnat s buňkami Al Kájdy, takové konspirační podmínky v jejich PR panují ... je to asi nejhysteričtější firma na únik informací ... nejbenevolentnější je kupodivu Intel, těm je úplně jedno jestli jejich CPU/desku ukážeš třeba i měsíc před koncem NDA ... ale NVIDIA si na to potrpí, ani recenze nesmí jít na web třeba o minutu dříve ...beardie píše:co robia vsetci saskaren z nazvu? keby testy tak chapem, ale nazov?
Jenže "zdvojené adresování", což je ve skutečnosti návrat k standardu (protože G80 měla "poloviční adresování"), používají všechny čipy nVidia G8x/G9x krom právě té G80. Tudíž i G92. Takže tohle žádný "náskok" oproti G92 přinést nemohlo.BudyShine píše:Sorry že se do toho pletu ale nedalo mi to.mají přece nový způsob komprese(u ROP jednotek) a jinak "nastavené" SP jednotky(jestli se dobře pamatuji tak SP jednotky mají zdvojené adresování oproti předchozí mainstream generaci) .Díky tomu to při menším množstí SP může atakovat starou G92 s vyším počtem SP.
To je přání, domněnka, nebo pro to máš nějaký podklad?Herkis píše:Těch 240 SP má o čtvrtinu větší výkon než těch 256.
Samozřejmě, že není. Počet SPs a ROPs se zdvojnásobil, ale co počet TMUs? Myslíš, že nVidia udělá tu stejnou chybu, aby do čipu "nacpala" tolik TMUs, že jich bude téměř polovina permanentně nevyužitá a bude jen zvyšovat teplotu a velikost čipu? GT200 je určena pro vysoká rozlišení, kde jsou (poměrově oproti aritmetice) nároky na filtraci textur nižší. Těžko můžete odhadovat chování a výkon, pokud neznáte počet texturovacích jednotek.Herkis píše:GT 200 není jen zvýšení počtu SP jednotek.
Mám podklad:no-X píše:To je přání, domněnka, nebo pro to máš nějaký podklad?Herkis píše:Těch 240 SP má o čtvrtinu větší výkon než těch 256.![]()
Těch 256 SPs (GX2) je na 1512MHz.no-X píše:A nějaké info od zdroje, který není pod NDA, ale zároveň ho nemohu jmenovat:
* 10 clusters with 3 SIMDs that are 8-wide per cluster
* ~1940MHz shader clock, if counting FLOPs the same way as G80
Právě, že to s GT200 souvisí mnohem více, než se v současné době může zdát. Protože - jak je vidět na G92 (a jak zmínil Ache), je to karta, která je brutálně přidušená šířkou paměťové sběrnice. Z důvodu úzké sběrnice je "zúžen" i počet ROPs. Naproti tomu 64 texturovacích jednotek je zcela nevytížených a buďto pro ně nezbývá bandwidth, nebo SPs. G8x/G9x totiž používá SPs jako interpolátory texturovacích jednotek, což znamená, že texturovací jednotky samy pro svoji režiji konzumují výkon shader core. G84 (GeForce 8600), která měla poměr SPs:TMUs stejný jako G92, ale poměr frekvencí byl nižší, než na G92 (jen 2,2:1 oproti 2,5:1) dokonce v určitých případech dokázala zkonzumovat výkon celého svého shader core pro texturing dříve, než došlo na vytížení jejích 16 texturovacích jednotek. Což znamená, že pokud bylo shader core ve hře vytíženo ještě nějakým shader kódem, nemohly být texturovací jednotky využity o moc víc, než z poloviny, protože už nezbýval výkon pro interpolaci (malý příklad - GeForce 8600 i Radeon 3870 mají 16 texturovacích jednotek, ale výkonem jsou jinde - příčina = výše popsaný problém).BudyShine píše:jej sorry to jsem se překecl.ne vyší ale přirovnatelný (9600GT ztrácí na 8800GT 10-20% není-li tak ). no pěkně tu OTečkujeme tak když tak dále po SZ okey?
Díky, našel jsem i ty dokumenty o kombinované SFU/interpolátor u sebe na disku.no-X píše:Ne, nejsou zvlášť, provádí je shader core. Řešilo se to třeba tady:
http://forum.beyond3d.com/showthread.php?t=44666
no-X píše:...Protože - jak je vidět na G92 (a jak zmínil Ache), je to karta, která je brutálně přidušená šířkou paměťové sběrnice. Z důvodu úzké sběrnice je "zúžen" i počet ROPs. Naproti tomu 64 texturovacích jednotek je zcela nevytížených a buďto pro ně nezbývá bandwidth, nebo SPs.
G92 je opravdu hodně limitovaná paměťovou propustností (mám ji doma). Ale rozhodně se nedá říci, že by 64 texturovacích jednotek bylo zcela nevytížených. nebo vytížených na 50%.no-X píše:...A je faktem, že pokud ani ve speciálně napsaném syntetickém testu není možné z těch texturovacích jednotek dostat přes 75% jejich teoretického výkonu, tak v reálných hrách bude jejich vytíženost obvykle pod 50%.
Jak jsem psal výše, v případě využívání AF a trilineárního filtrování zůstane nevyužitá jen TA (adresovací jednotka), která je určitě levnější (na počet tranzistorů) než TF nebo SP.no-X píše:Těžko říct, jak u G9x, ale u R5xx byla texturovací jednotka 2x větší, než ALU blok včetně registru (tedy vec3+scalar MADD + vec3+scalar ADD/SFU + registery). TMUs G9x jsou větší, protože podporují vyšší sub-pixel precision, nižší úhlovou optimalizaci, podporují HW FP16 TF atd. a naopak SPs budou menší, protože jsou pouze dual-issue. Což znamená, že nevyužitá texturovací jednotka konzumuje prostor, který mohl být využit pro možná osm SPs... Jenže poměr výpočetních jednotek v těhle čipech byl hotový někdy v roce 2004. Vývoj GT200 začal až v roce 2005, takže nVidii už muselo být jasné, kam požadavky her směřují a podle toho poměr u GT200 upravit.
Skutečně to není tak jednoduché. Texturovací jednotky u G94 jsou opravdu velmi málo vytížené. Stačí se podívat na průměrné výsledky ve hrách - ideálně při 4xAA/16xAF, kdy se díky nárokům AA vyloučí vliv zbytku sestavy a zároveň se díky AF vytíží texturovací jednotky na praktické maximum a výsledek je takový, že G94 s 32 bilineárními TMUs dává v průměru tentýž herní výkon, jako RV670 se 16 bilineárními TMUs. U G92 je to ještě umocněno limitem v podobě šířky sběrnice, takže dvojnásobek TMUs oproti G94 (a čtyřnásobek oproti RV670) vede pouze k o třetinu vyššímu výkonu.Herkis píše:G92 je opravdu hodně limitovaná paměťovou propustností (mám ji doma). Ale rozhodně se nedá říci, že by 64 texturovacích jednotek bylo zcela nevytížených. nebo vytížených na 50%.
V případě G92 (i G94) se určitě dá počítat s tím, že ve většině her se bude využívat trilineární a anizotropní filtrování, tím bude filtrační část (TF) využita mnohem více, v některých případech i na 100%. Diskutabilní je to u low endu (G84/86), ale i tam má poměr TA (adresovací jednotka) : TF, který je 1:1, své opodstatnění. Kdyby totiž zůstal stejný, jako u G80 (1:2), mohly by se TF plně využívat pouze u triF a AF. Vzhledem k tomu, že např. G84 je jen 1/4 G80 (kromě ROP a sběrnice - 1/3) nemají karty šanci na tak velké využití AF a triF a je lepší doplnit TA na poměr 1:1 s tím, že v případě použití (a jsme u toho) brilineárního filtrování dojde k "rozumnému" využití TF.