no-X píše:Taky mi nepřipadá moc logické z rychlosti L1 cache nebo teoretického triangle-rate usuzovat, jak moc vhodná bude GF100 pro DX11. DX11 je sama o sobě nadstavba DX10.1 a DX10, takže už z principu požadavků nic nenaznačuje tomu, že by na DX11 měla být třeba od základu nová architektura.
Konkrétně pak distribuovaná geometrie je podle mě docela nešťastné řešení, které nemá v současné době opodstatnění. Vždyť i u RV870 je patrné, že v syntetických testech zaměřených na teselaci jsou propady výkonu mnohem nižší, než v komplexním testu, jako je Unigine Heaven, kde není limitem výkon samotného teselátoru (a trianglerate), ale celkový výkon čipu, na který jsou po zapnutí teselace kladeny větší nároky. 4-násobný geometrický výkon je pak jen overkill, který nedojde využití jinde než v teoretických testech.
Dovol, abych ti k tomu ocitoval části článku jistého Součka

a Fialy:
Teselací jakožto nejdůležitější inovací v Direct3D 11 jsme se na ... zabývali zatím jenom stručně.
Použití teselace jako prostředku ke zlepšení kvality obrazu znamená skokové navýšení počtu trojúhelníků scény a vytváří vysokou zátěž na triangle setup. ... Dosud byla jeho rychlost s velkou rezervou dostačující i pro high-endové čipy.
...Díky tomu, že Fermi obsahuje šestnáct jednotek PolyMorph, se nVidia může chlubit několikanásobným výkonem teselace oproti ATI v bezejmenných syntetických testech.
...Ideální podmínky jsou takové, kdy jsou trojúhelníky malé – tedy přesně situace, která nastává s využitím teselace. Prakticky se nVidii při interních testech podařilo dosáhnout rychlosti 3,2 trojúhelníků za takt.
...ATI problém s triangle rate neřešila. Cypress má jeden triangle setup se zdvojeným rasterizérem.
Jestliže i podle tebe je teselace
nejdůležitější inovací DX11 a i podle tebe
vytváří vysokou zátěž na triangle setup a i moc dobře víš, proč je na GF100 4 x triangle setup a rasterizer, nevěš nám teď bulíky na nos, že se jedná o overkill. Co se týká propadu výkonů, jak to bude s GTX360/380 nám ukáží až testy.
Takže ačkoliv ti v tomto vlákně "nepřipadá moc logické z rychlosti L1 cache nebo teoretického triangle-rate usuzovat, jak moc vhodná bude GF100 pro DX11" sám jinde potřebu vysokého geometrického výkonu pro DX11 vyzdvihuješ.
Rychlost L1 je pak stejně tak potřebná pro další důležitou inovaci DX11 - dle tebe pouhé "nadstavby DX10" (ty jsi jak marketing Nvidia - DX11 není důležité

) - Direct Compute. Je známo, že právě díky relativně nízké rychlosti L1 u Radeonů HD4 a HD5 vůči špičkovému výpočetnímu výkonu je velmi těžké tento vysoký výpočetní výkon využít. Spousta běžných úloh - např. násobení matic (transformace prostorů) - vyžaduje pečlivou optimalizaci pro dosažení více než 50% teoretického výkonu. Proto tady tuto vlastnost architektury Fermi vyzdvihuji a myslím si, že z hlediska výpočetního výkonu a datové propustnosti je mnohem lépe vyvážená než např u HD5xxx, kde je výpočetní výkon skutečný overkill, když je silně omezován datovou propustností.
A také jsem již výše psal, že architektura Fermi určitě bude mít i nějaké nedostatky. Zda-li budou podstatné, či ne, ukáží až praktické testy.