nVidia GF100 - spekulační thread

raym0n · Příspěvek od **raym0n** » pát 29. led 2010, 09:42

Coololooser píše:
Federmann píše:cca 240 x 238mm ???
pochybuju ze jadro bude vetsi nez karta

urcite se upsal, ale mel by se krotit,

#Federmann pises porad do kola to same... neber to jako insult, ale vsechno je na tema
"i kdyz opravdu bude mit nami ocekavana GF100 vykon jako Cypres, tak diky 'zmetkovite vyrobe' chipu by si nV nemela dovolit cenu Cypresu podobnou"
ale at ti jen nekrivdim, ten nazornej napad s trojclenkou nebyl vubec zlej

Federmann píše:1. 60chyb při 6tis čipech je naprosto bezvýznamné číslo, při 600čipech je to 10%, ale při 90čipech je to 66%.
2. Ztráta jednoho krajního čipu při 6tis čipech je naprosto bezvýznamné číslo, při 600čipech je to 0,166%, ale při 90čipech je to 1.11%. nyní stačí spočítat kolika krajních čipů, se to týká.

ale my nevime, jake jsou presne naklady na vyrobu cypresu, tedy nevime, jak moc muze jit amd/ati dolu s cenou, predpokladejme, ze vyrazne nizsi, nez ze 14k CZK, za kterou se cypres prodava -> tzn gf100 opravdu muze vyjit na trh za cenu, kterou tu vsichni predpokladame (nekolikrat tu padlo 11-13k CZK), ale ati ma rezervy jit pri vyssim vykonu s cenou dolu, tak asi pujde

Federmann · Příspěvek od **Federmann** » pát 29. led 2010, 10:20

raym0n píše:ale my nevime, jake jsou presne naklady na vyrobu cypresu,

Za chybu se omlouvám.

Neberu v potaz samotný návrh, to je věcí AMD či Nvidie, beru v potaz jen samotnou výrobu v TSMC a ta je cca 5tic USD/300mm křemíkovou desku vyrobenou 40nm výrobním procesem.

Je naprosto jedno jak je veliký čip, jde jen o počet operací, které se provádí a pochybuji, že by měla Nvidia výrobních operací méně, ale není pravděpodobné, že by jich mělo AMD méně, tedy cena je pro oba stejná. Předpokládám, že oba výrobci dali 100% předlohy a pak je to jen a jen o velikosti čipu. Kdybych vzal pravděpodobnost chyb na předlohách bylo by to ještě horší.

Nvidia se obrovsky okrádá o plochu desky a výtěžnost, tím, že jsou čipy velké. Je to přesně to na čem těžil a stále těží Intel při slepenci dvou dvoujádrových procesorů.

Lukfi · Příspěvek od **Lukfi** » pát 29. led 2010, 10:55

Když to napíšeš takhle obecně, tak nám jenom opakuješ, co už všichni víme.

no-X · Příspěvek od **no-X** » pát 29. led 2010, 10:58

HrdinaJan: To se týkalo myslím ještě 90nm procesu a G80 to využila téměř nadoraz. 65nm proces už měl limit trochu výš.

Nicméně je myslím jedno, jestli GF100 bude mít něco málo pod 500mm², nebo něco málo nad.

Taky mi nepřipadá moc logické z rychlosti L1 cache nebo teoretického triangle-rate usuzovat, jak moc vhodná bude GF100 pro DX11. DX11 je sama o sobě nadstavba DX10.1 a DX10, takže už z principu požadavků nic nenaznačuje tomu, že by na DX11 měla být třeba od základu nová architektura.

Konkrétně pak distribuovaná geometrie je podle mě docela nešťastné řešení, které nemá v současné době opodstatnění. Vždyť i u RV870 je patrné, že v syntetických testech zaměřených na teselaci jsou propady výkonu mnohem nižší, než v komplexním testu, jako je Unigine Heaven, kde není limitem výkon samotného teselátoru (a trianglerate), ale celkový výkon čipu, na který jsou po zapnutí teselace kladeny větší nároky. 4-násobný geometrický výkon je pak jen overkill, který nedojde využití jinde než v teoretických testech.

Další podivnost distribuované geometrie vidím v tom, že high-end bude mít (více než?) dvojnásobný geometrický výkon než mainstream. Nedává to smysl, protože geometrické nároky jsou stejné, ať hru hrajete v 1440*900 na mainstream kartě, nebo 1920*1200 na high-endu...

thomasblue · Příspěvek od **thomasblue** » pát 29. led 2010, 11:32

no-X píše:Další podivnost distribuované geometrie vidím v tom, že high-end bude mít (více než?) dvojnásobný geometrický výkon než mainstream. Nedává to smysl, protože geometrické nároky jsou stejné, ať hru hrajete v 1440*900 na mainstream kartě, nebo 1920*1200 na high-endu...

Jaktože jsou stejné? To co se mění není přece jenom rozlišení, ale také spousta dalších nastavení. V každé hře si můžeš nastavit různou úroveň detailu (low/mid/high, apod.) a to už na geometrické nároky mít vliv může.

no-X · Příspěvek od **no-X** » pát 29. led 2010, 12:40

Dokud se nemění samotné objekty, ale jen množství různých efektů, tak jsou nároky stejné.

U většiny moderních her jsou objekty navržené tím způsobem, že se vytvoří geometrický model s určitým (velmi vysokým) počtem polygonů. Z toho se pak zjednodušením vytvoří geometrický model, který se použije ve hře a rozdíly mezi oběma modely se zanesou do normálové mapy, která je pak ve hře na jednodušší model použita, aby vypadal co nejblíže originálnímu modelu.

Hry, které jsou vytvářené tímhle způsobem, neumožňují snadné snížení úrovně geometrických detailů, protože by na ten horší model už neseděla normálová mapa a výsledek by vypadal dost hnusně. Proto bylo výhodné, že všechny grafické karty měly zhruba stejný geometrický výkon - jeden model byl použitelný od high-endu až po mainstream.

Nezávisle na tom; pokud máme určitou hru a budeme jí hrát v 640*480 a 1600*1200, jsou nároky na geometrii taktéž identické. Vzrůstají nároky na fillrate a pixel shading. Proto nemá smysl, aby se ˇ(na rozdíl od aritmetického výkonu a fill-rate) geometrický výkon v různých segmentech výrazně lišil.

richie08 · Příspěvek od **richie08** » pát 29. led 2010, 15:15

No jo no-xi, ale to platilo až dosud, kdy se nepoužívala tesselace a tedy počet polygonů byl konstantní. Nyní tesselace naopak dokáže zvýšit počet polygonů dynamicky - v závislosti na nastavení úrovně detailů. Řekl bych, že pak i nároky na geometrickou jednotku stoupnou úměrně zvolenému stupni tesselace - tedy výšší výkon geometrické jednotky GF100 najde využití, protože bude zvládat vyšší stupně tesselace zatímco mainstremová karta bude mít geom. jednotku mnohem slabší. Ale, možná jsem jen špatně pochopit princip tesselace. Když tak mne opravte.

Federmann · Příspěvek od **Federmann** » pát 29. led 2010, 15:59

Zase to není tak jednoznačné, AMD, potažmo ATI má na Tessellaci řadu patentů a nejenom ona, uvedu jen poslední http://www.federmann.cz/images/stories/ ... 423644.pdf

Nvidia šla svou vlastní cestou a použila odlišný způsob tessellace http://www.federmann.cz/images/stories/ ... 697063.pdf , který způsob bude lepší, kterému bude více vyhovovat DX11 a mnoho dalších otázek zůstane ještě dlouho nezodpovězených.

Mám ale pocit, že Nvidia již hází hráče pes palubu http://pc.watch.impress.co.jp/docs/news ... 45703.html a mluví jen o superpočítačích. Tam si ale myslím začíná mít AMD výrazně navrch.

Přestože AMD Nvidii za poslední půlrok úplně „deklasovalo“ tak to na tržbách není moc poznat, setrvačnost trhu je tak obrovská, že se nějaké zásadní, převratné a rychlé změny nedají čekat, je to spíše záležitost dlouhodobá.

Herkis · Příspěvek od **Herkis** » pát 29. led 2010, 16:17

no-X píše:Taky mi nepřipadá moc logické z rychlosti L1 cache nebo teoretického triangle-rate usuzovat, jak moc vhodná bude GF100 pro DX11. DX11 je sama o sobě nadstavba DX10.1 a DX10, takže už z principu požadavků nic nenaznačuje tomu, že by na DX11 měla být třeba od základu nová architektura.

Konkrétně pak distribuovaná geometrie je podle mě docela nešťastné řešení, které nemá v současné době opodstatnění. Vždyť i u RV870 je patrné, že v syntetických testech zaměřených na teselaci jsou propady výkonu mnohem nižší, než v komplexním testu, jako je Unigine Heaven, kde není limitem výkon samotného teselátoru (a trianglerate), ale celkový výkon čipu, na který jsou po zapnutí teselace kladeny větší nároky. 4-násobný geometrický výkon je pak jen overkill, který nedojde využití jinde než v teoretických testech.

Dovol, abych ti k tomu ocitoval části článku jistého Součka

a Fialy:

Teselací jakožto nejdůležitější inovací v Direct3D 11 jsme se na ... zabývali zatím jenom stručně.

Použití teselace jako prostředku ke zlepšení kvality obrazu znamená skokové navýšení počtu trojúhelníků scény a vytváří vysokou zátěž na triangle setup. ... Dosud byla jeho rychlost s velkou rezervou dostačující i pro high-endové čipy.
...Díky tomu, že Fermi obsahuje šestnáct jednotek PolyMorph, se nVidia může chlubit několikanásobným výkonem teselace oproti ATI v bezejmenných syntetických testech.
...Ideální podmínky jsou takové, kdy jsou trojúhelníky malé – tedy přesně situace, která nastává s využitím teselace. Prakticky se nVidii při interních testech podařilo dosáhnout rychlosti 3,2 trojúhelníků za takt.
...ATI problém s triangle rate neřešila. Cypress má jeden triangle setup se zdvojeným rasterizérem.

Jestliže i podle tebe je teselace nejdůležitější inovací DX11 a i podle tebe vytváří vysokou zátěž na triangle setup a i moc dobře víš, proč je na GF100 4 x triangle setup a rasterizer, nevěš nám teď bulíky na nos, že se jedná o overkill. Co se týká propadu výkonů, jak to bude s GTX360/380 nám ukáží až testy.

Takže ačkoliv ti v tomto vlákně "nepřipadá moc logické z rychlosti L1 cache nebo teoretického triangle-rate usuzovat, jak moc vhodná bude GF100 pro DX11" sám jinde potřebu vysokého geometrického výkonu pro DX11 vyzdvihuješ.

Rychlost L1 je pak stejně tak potřebná pro další důležitou inovaci DX11 - dle tebe pouhé "nadstavby DX10" (ty jsi jak marketing Nvidia - DX11 není důležité

) - Direct Compute. Je známo, že právě díky relativně nízké rychlosti L1 u Radeonů HD4 a HD5 vůči špičkovému výpočetnímu výkonu je velmi těžké tento vysoký výpočetní výkon využít. Spousta běžných úloh - např. násobení matic (transformace prostorů) - vyžaduje pečlivou optimalizaci pro dosažení více než 50% teoretického výkonu. Proto tady tuto vlastnost architektury Fermi vyzdvihuji a myslím si, že z hlediska výpočetního výkonu a datové propustnosti je mnohem lépe vyvážená než např u HD5xxx, kde je výpočetní výkon skutečný overkill, když je silně omezován datovou propustností.

A také jsem již výše psal, že architektura Fermi určitě bude mít i nějaké nedostatky. Zda-li budou podstatné, či ne, ukáží až praktické testy.

Lukfi · Příspěvek od **Lukfi** » pát 29. led 2010, 16:45

Herkis píše:Jestliže i podle tebe je teselace nejdůležitější inovací DX11 a i podle tebe vytváří vysokou zátěž na triangle setup a i moc dobře víš, proč je na GF100 4 x triangle setup a rasterizer, nevěš nám teď bulíky na nos, že se jedná o overkill. Co se týká propadu výkonů, jak to bude s GTX360/380 nám ukáží až testy.

Co tě vede k přesvědčení, že citovanou pasáž psal zrovna Jirka? Psal jsem to já.
A snad je jasné, že bude-li možné používat volitelné úrovně teselace, bude mít vyšší geometrický výkon u high-endu smysl. Naopak pokud půjdou vývojáři a grafici tou cestou, co naznačil Jirka, tedy budou používat vedle teselace ještě normal mapping, na normal mappovaných objektech nebude možno různé úrovně teselace použít a geometrický výkon bude potřeba stejný u levných i drahých karet.

thomasblue · Příspěvek od **thomasblue** » pát 29. led 2010, 17:22

no-X píše:U většiny moderních her jsou objekty navržené tím způsobem, že se vytvoří geometrický model s určitým (velmi vysokým) počtem polygonů. Z toho se pak zjednodušením vytvoří geometrický model, který se použije ve hře a rozdíly mezi oběma modely se zanesou do normálové mapy, která je pak ve hře na jednodušší model použita, aby vypadal co nejblíže originálnímu modelu.

Zapomínáš na spoustu věcí. Stačí třeba na slabší kartě nastavit nižší vzdálenost do které se vykreslují objekty a bum, hned máš míň modelů a tedy i polygonů.

EDIT: Navíc typicky se při nižší úrovni detailů spousta objektů přestane úplně vykreslovat. Nebo se některé (např. tráva) vykreslují řidší, apod. Jak razantně se počty polygonů mění je otázka, ale v žádném případě není pravda, že by byly konstantní při všech nastaveních.

richie08 · Příspěvek od **richie08** » pát 29. led 2010, 19:32

technické OT: tesselace a normálové mapy nejdou použít dohromady?

Lukfi · Příspěvek od **Lukfi** » pát 29. led 2010, 19:42

Podle toho, co nám do článku napsal SamanCZ, tak jdou a na příkladu tam používá displacement mapping (který vytváří novou geometrii) společně s normal mappingem, který tam přidá drobné detaily, které modelovat displacement mappingem by bylo zbytečně náročné na výkon bez přínosu ke kvalitě. Teď je otázka, jestli se jedna bump/normal mapa dá použít na různé LOD úrovně jednoho modelu...

Federmann · Příspěvek od **Federmann** » sob 30. led 2010, 07:39

Přiblížili jsme se o další den k uvolnění GF100, obchody se již jistě začínají plnit.

Zbývá 30dní.

beardie · Příspěvek od **beardie** » sob 30. led 2010, 08:20

plnit sa budu najskor tyzden pred planovanym uvedenim, urcite nie skor

Smeli · Příspěvek od **Smeli** » sob 30. led 2010, 09:14

beardie píše:plnit sa budu najskor tyzden pred planovanym uvedenim, urcite nie skor

Co tak použít na Federmanna a jeho posty taky nějaký "displacement"?

vendo007 · Příspěvek od **vendo007** » sob 30. led 2010, 09:42

Smeli píše:
beardie píše:plnit sa budu najskor tyzden pred planovanym uvedenim, urcite nie skor
Co tak použít na Federmanna a jeho posty taky nějaký "displacement"?

suhlasim

//beardie: kludne mozete pouzit ignorelist

Federmann · Příspěvek od **Federmann** » ned 31. led 2010, 08:07

Nvidia s universitou v Illinois chce vydat první učebnici programování na světě, 256 stran textu o CUDA má zřejmě pomoci i prodeji GF100 http://news.moneycentral.msn.com/ticker ... d=11067949

Zbývá 29dní.

no-X · Příspěvek od **no-X** » ned 31. led 2010, 13:27

marjapanno, to je zas nesmyslů...

1. na trávu, listy a 90% vegetace prakticky ve všech hrách se používají alpha-textury; polygonů stačí tolik, aby se na ně dala alpha textura natahnout, tzn. 2 na list/větev/rostlinu, případně o několik víc, pokud je složitější... na plygony pro alpha-textury je navíc úplně zbytečně používat teselaci, protože to nemá přínos

2. nároky na trianglerate s teselací stoupají, ale ta závislost je naprosto stejně úměrná ve vztahu k mainstreamu i high-endu... navíc s počtem polygonů rostou nároky i na výkon zbytku čipu (a tam je úměra také stejná pro mainstream i high-end)... zvýšit geometrický výkon 4-8x je overkill, protože ho reálně není možné využít - a to ze tří důvodů:

I. jak už tu padlo, s počtem polygonů narůstají i požadavky na výkon všech ostatních částí čipů... k čemu je dobré zvýšit geometrický výkon např. 6x, když výkon zbytku čipu byl zvýšen sotva o 50%? čipu dříve dojde fillrate a aritmetický výkon, než by mohl být tak vysoký triangle-rate využít

II. spočítejte si, kolik polygonů by bylo třeba, aby se vykryla obrazovka v 1920*1200 tak, aby 1 polygon odpovídal třem pixelům... je to méně, než 800 tisíc polygonů na obrazovku... jistě tam bude i nějaký over-draw faktor, jenže stejně tak na spoustu povrchů (stěny, podlahy, vegetace přes alpha-textury...) se takové množství nepoužívá, protože to nemá efekt... když čip nabízí výkon 850 milionů polygonů za vteřinu, bude to těžko ve významném procentu situací limitující prvek, aby ho mělo smysl zvyšovat

III. nelze čekat, že by nVidia tlačila vývojáře do nějakých extrémně komplexních modelů, kde by vycházelo víc, než 1 polygon na 3 pixely, protože při dosažení 1 polygonu na 1 pixel by každý polygon blokoval čtyři thready, takže by šel aritmetický výkon čipu (resp. pixel shaderu) 4x dolů a kompletně by to zabilo výkon

Takže bych chtěl požádat Herkise, aby - než zase bude kritizovat - uvedl nějaký konkrétní příklad, jak se takový teoretický trianglerate dá na čipech současné architektury a současného výkonu uvést do praxe v reálných hrách.

Prozatím jsme viděli 60% nárůst oproti RV870/HD5870 v geometricky nejnáročnější scéně Unigine Heaven. 60% je hezkých, ale ona je celá GF100 zhruba o těch 60% větší, než RV870, takže to pořád není nic víc, než rozdíl výkonu odpovídající rozdílu velikosti čipů.

Je bezpochyby hezké, že nVidia dokázala vyřešit geometrický výkon svých čipů, ale nelze očekávat, že by se tenhle rozdíl mohl promítnout i do praxe. Teselace sama o sobě je řešením jednoho limitu pro kvantitu polygonů - výkonu CPU a propustností sběrnic. Takže sice můžeme mít polygonů více, ale tím zase narážíme na další limity. Skutečně nechápu jaký smysl (krom syntetických testů) má dimenzovat teselátor a triangle setup na takové množství polygonů, které zbytek čipu nezvládá dál zpracovat (ať už hrubým výkonem, nebo vlivem architektury).

Reptile · Příspěvek od **Reptile** » ned 31. led 2010, 18:26

2 federman: jsem zvědavej jestli pak až bude offiko lunch karet a nebudou k sehnání, budeš taky počítat dny než budou vůbec skladem

nechápu tvoji pointu...

nVidia GF100 - spekulační thread

Jaký bude podle Vás průměrný výkon karet s GF100 v plných recenzích?

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread

Re: nVidia GF100 - spekulační thread