richie08: podívej se na první stránky všech prezentací DX10-DX11 čipů ATi... mezi prvními slovy a prvními grafy tam vždy je, že mají nejvyšší efektivitu (teoretický aritmetický výkon na plochu nebo na watt) na trhu... tohle je pro ně velmi podstatné
ArgCZ: V DP ano. U her to úplně jednoznačné nebude a myslím, že ta efektivita bude tak o 5-10% nižší. 5D myslím ATI zvolila ze dvou důvodů (možná jich bylo víc...): první jsou geometry shadery, kterým 5D uspořádání nejvíc vyhovovalo (naopak G80 moc dobře nedělaly, proto o nich nikdy nebylo slyšet tolik, jako je třeba teď slyšet o teselaci) a druhá věc bylo SF - special functions. Zatímco R300-R5x0 byly organizované jako:
[ □□□ | □ ] = hlavní ALU
[ ■■■ | ■ ] = mini ALU
□ = MAD
■ = ADD + SF
...tak ATI potřebovala zachovat funkcionalitu hlavní ALU (tzn. 4D MAD), ale zároveň potřebovali SF jednotku. Ta ale byla v případě R300-R5xx zbytečně komplexní, takže její vec3 část vypustili a zbylo:
□□□ | □ | ■
u Xenosu (xbox) to seskupili jako vec4 + skalární jednotku:
[ □□□□ | ■ ]
u R600, kvůli lepší efektivitě, jako superskalární jednotku:
[ □ | □ | □ | □ | ■ ]
□ = MAD (+ u RV670 přibylo 1/4 DP MAD)
■ = MAD + SF
tím pádem měli 5D jednotku extrémně efektivní pro geometry shading, zároveň tím vyřešili podporu SFU a krom toho měli jistotu, že pokud bude hra z hlediska aritmetiky úzce optimalizvaná pro Xbox, poběží skvěle i na R600. Stejně tak že na R600 dobře poběží kód optimalizovaný pro R300-R500, protože 4D MAD jednotka v podstatě zůstala. Cayman by v podstatě měl mít:
[ □ | □ | □ | □ ]
...kde každá jednotka umí MAD + 1/4 DP MAD a navíc jsou společně schopny "emulovat" SF... takže v okmažiku, kdy by se objevil kód, který intezivně využívá SF nebo geometry shading, by efektivita ALU byla nižší, než u současných čipů (protože celá ALU bude zafláknutá tím, co původně zvládala pátá jednotka). Pro kód, který obojí využívá málo, zase bude výhodnější konfigurace Caymanu. Takže se nedá říct jednoznačně, že to bude lepší... někdy lepší, někdy horší. Jednoznačně lepší to bude pouze u DP
yuri.cs píše:Ovsem prechod z 5 slozkovych na 4 slozkove se v prumeru pozitivne projevi i pri grafickych operacich.
V pameti me lezi nejaky test /snad na B3D/, kde sledovali vyuziti vsech slozek v ALU v realnem nasazeni. IIRC se pocet vytizenych jednotek 5 ani nepriblizil, naopak v tehdy protezovane DX10 Lost Planet to bylo and pod 3 - proto R600 Lost Planet fiasko.
To byl opět marketing, kdy se nVidia snažila mocímermo prosadit, že každý čip, který nemá skalární architekturu, je neefektivní, protože nemůže být efektivně vytížený (mimochodem, GF104 není skalární, ale je superskalární, jako čipy ATI, jen se tím nVidia nechlubí). Naopak Jawed z B3Df ukázal pár simulací, podle kterých bylo možné unifikované jádro R600 vytížit efektivněji. Ono když si vezmeš, jaký měla R600 aritmetický výkon, tak i kdybys ho 2/5 nevyužil, zůstane pořád vyšší, než aritmetický výkon 8800GTS, proti které R600 stála, takže ani teoreticky by to neměl být problém způsobující nějaké fiasko. LostPlanet a HAWX jsou hry, ke kterým nVidia zamezila ATI přístup, takže trvalo dlouho, než ATI přišla s optimalizacemi v driverech. To byl celý problém. Když se podíváš na pozdější test na
ComputerBase, je HD2900XT v Lost Planet nad 8800GTS dokonce i se zapnutým anti-asliasingem.