Stránka 1 z 50

R6x0 - technologie, spekulace...

Napsal: ned 16. dub 2006, 17:24
od no-X
Výsledky předchozích anket:

Obrázek

Obrázek


-----------------------------------------------------------------
Na přání několika osob zakládám obdobu G80 threadu...

Obrázek

R6x0
80nm výroba
unifikovaná architektura pro SM4.0
geometry shader
sběrnice RingBus
podpora GDDR4

Vzhledem k výkonu unifikovaných jednotek v Xenosu je pravděpodobné, že v případě zachování jejich architektury, jich R6x0 bude oproti Xenosu obsahovat zhruba dvojnásobek. Ovšem těžko říct, jestli jednotky R6x0 nebudou komplexnější. Celkově budou unifikované jednotky zastávat pixel a vertex shading; nový geometry shader by měl být oddělený.

Co se týká 80nm výroby, měla by podle vyjádření ATi spíš snižovat spotřebu a plochu jádra, než navyšovat dosažitelné frekvence. Pokud se nakonec ATi nerozhodne pro 65nm, čekal bych tak kolem 725MHz.

Datum vydání: neznámý, totéž jako u G80.

Napsal: ned 16. dub 2006, 18:00
od snapcase
asi to sem moc nepatri, ale aky je rozdiel medzi vertex a geometry shadery?nezastavaju v dnesnych cipoch geometriu prave vertex units?co bude potom robit vertex, ak tieto funkcie bude vykonavat geometry shader?

Napsal: ned 16. dub 2006, 18:58
od no-X
O geometry shader jsem se zatím nijak moc nezajímal (dlouho se diskutovalo o to, jestli ho bude SM4.0 vůbec vyžadovat), takže ti určitě někdo odpoví líp, než já. Vertex shader je v podstatě program přiřazený určitému vrcholu (vertexu), který s ním může provádět různé operace. Geometry shader by měl být mj. schopen provádět operace s celými polygony (resp. trojúhleníky), jako s objekty. Krom toho je specifikací WGF volitelný samostaný tesselator, tzn. že by bylo možné generovat nové vrcholy na úrovni GPU. V současné době vrcholy generuje CPU a jedinými výjimkami je Radeon 8500 a jeho hardwarový truform, nebo pár techdem pro R2VB (render to vertex buffer) a displacement mapping. Tesselator by v kombinaci s geometry shaderem nabízel širší možnosti. Třeba různé vylepšené efekty jako motion blur s nižšími nároky na pixel shader, nebo snížení nároků na zbytek systému (vertices, případně i triangles generované přímo v GPU), možnosti pro vývojáře - např. použití "něčeho" jako je truform přímo ze strany vývojáře hry -> oblejší méně hranaté objekty.

Stručně by se dalo říct, že do vertex shaderu vstoupil jeden vertex (vrchol) a výsledkem byl opět jeden vertex (upravený). Pro geometry shader ale tohle pravidlo neplatí, může vyprodukovat tolik vrcholů, kolik programátor určí. Další výhodou je, že může používat vlastní buffer, do kterého ukládá zpracovahná data, která může znovu vzít a dál zpracovávat. A pak převezme celkem slušnou porci práce za CPU (zmíněné generování vertexů, do určité míry by měl být schopen samostatně řídit rendering)

No... radši zapomeň, co jsem napsal a podívej se na tyhle schémata :-)

Obrázek

Obrázek

Obrázek

Obrázek

Napsal: ned 16. dub 2006, 19:04
od short24
ja bych to rekl jinak - kazda hra ma jiny pomer shaderu a diky tomu neni vzdy cip plne vytizeny. v pripade unifikovanych shaderu a hry, ktera to bude umet vyuzit dojde k navyseni vykonu
jinak no-x dik, muzu spekulovat jak u ati, tak u nvidie :wink:

Napsal: ned 16. dub 2006, 19:45
od snapcase
to samozrejme chapem, ze pri unifikovanych shaderoch im moze byt pridelena robota takpovediac za letu a to aj taka, ktora im bola doteraz cudzia(bude mozne menit pomer pixel a vertex shaderov)...lenze ma zaujimalo, ze no-X spomenul, ze geometry shader/y bude/u zvlast.

no-X:bude este vobec treba vertex jednotky, ked geometry shadere toho zvladnu viac?alebo nebudu moct byt unifikovanej architekture pridelene funkcie geometry shaderu?zjednodusene:nebudu unifikovane jednotky zastavat aj pixel aj geometry, s tym, ze vertexu odzvonilo?je to iste, ze geometry bude zvlast?

Napsal: ned 16. dub 2006, 20:47
od no-X
Geometry shader bude zastávat jiné úkony, než jaké dosud zastával vertex shader. Vertex shaderu odzvonilo v tom slova smyslu, že nebude dál rozšiřován a úroveň jeho funkčnosti se už nebude výrazně měnit. Díky tomu taky bude snazší unifikace. Geometry shader pak bude samostatný. Pořadí:

Geometry shader (vygeneruje vertexy, kolik bude třeba) -> vertex shader -> pixel shader

Měli jsme tu TnL jednotku a vertex shadery, obojí ale byla více-méně slepá vývojová ulička - totiž, jak se to vezme, záleží na úhlu pohledu:
- některé čipy po HW stránce TnL jednotku vynechaly a její oprace realizovaly přes Vertex shader (tzn. samostatná TnL jednotky vlastně už jako taková není po HW stránce třeba)
- v současné době se upouští od per-vertex lighting (to prováděla TnL jednotka) a přechází se na kvalitnější per-pixel lighting (to provádí pixel shader)
- Radeon 8500 podporoval hardwarový truform, obsahoval tedy tesselator schopný generovat nové polygony. To se příliš neujalo, neboť tato technologie byla pouze volbou DX8, nikoli povinnou součástí. Protože konkurence tuto technologii nepodporovala, nehnali se vývojáři her do jejího využití. Až nyní bude podpora (ve velimi rozšířené podobě) součástí specifikace pro geometry shader. Dostane to nové jméno, podpora bude povinná, půjde o klíčovou záležitost DX10 = bude to úspěšné.
- technologie displacement mapping - vytvoření polygonového modelu na základě single-channel textury - součást vertex shaderu SM3.0. nVidia technologii implementovala rozšířením vertex shaderu o texturovací jednotku, což vede ke zvýšení jeho komplexnosti spotřebě tranzistorů; ati technologii implementovala přes render to vertex buffer (R2VB), tedy s využitím pixel shaderu pro rendering výškové textury, které je následně použita vertex shaderem - výsledek je takový, že výkon řešení ATi je vyšší a ani nebylo třeba upravovat vertex shader...

dá se říct, že TnL jednotka je mrtvá a i "rozvoj" vertex shaderu ztrácí smysl, protože některé jejich základní operace zvládne lépe pixel shader a lepší než rozvíjet umírající jednotky bude jejich ponechání v současné podobě a vytvoření nové, která bude konat to, co je dnes potřeba.

Vertex shader tedy zůstane tam, kde je tzn. bude aplikovat vertex program pro jednotlivé vrcholy, které ale vygeneruje a zpracuje geometry shader

Napsal: ned 16. dub 2006, 22:06
od Lukfi
no-X píše:Co se týká 80nm výroby, měla by podle vyjádření ATi spíš snižovat spotřebu a plochu jádra
http://pctuning.cz/index.php?option=com ... &Itemid=67
Já (Šampón) píše:Nutno však dodat, že ATi má dva 80nm postupy - ten první bude nasazen do praxe již letos v létě a jeho primárním účelem bude snížit cenu jader řady R5xx, zatímco ten druhý bude uplatněn až u R6xx a bude orientován na maximální výkon. Je velmi nepravděpodobné, že by ATi pro jakýkoliv next-gen čip použila 90nm výrobu.

Napsal: úte 18. dub 2006, 21:22
od short24
ATi zrušila 80nm čipy - dnesni novinka na pctuningu, pochazi z http://www.digitimes.com/news/a20060417PR220.html dal cituji preklad:
"Co se však týče jader R600 další generace, pro ty stále platí plánovaný 80nm proces (ten, který bude optimalizován spíše na výkon) a zůstává i předsevzetí přejít na 65nm technologii počátkem roku 2007."

Napsal: úte 18. dub 2006, 21:29
od no-X

Napsal: úte 18. dub 2006, 22:14
od Lukfi
Heh, to bylo rychlý :) nu což, doplním to do tý newsky 8-)

Napsal: úte 2. kvě 2006, 20:19
od no-X
Tohle je velice zajímavá prezentace ATi. A nepřímo se tam mluví o R600... skoro to vypadá, že i geometry shader bude unifikovaný.

Napsal: úte 2. kvě 2006, 20:43
od Lukfi
Hezký. Ráno jdu do školy pozdějc takže o tom můžu napsat newsku.
btw netýká se to těch SDK co ATi nabízí na webu? Některý servery totiž informovaly, že ATi nabízí "DX10 SDK" což je blbost, ale v tý prezentaci se píše něco v tom smyslu že "tyto dema ukazují možnosti DX10 na DX9"

Napsal: čtv 25. kvě 2006, 22:21
od no-X
ATI Promotes Forthcoming DirectX 10 Graphics Chip.

http://www.xbitlabs.com/news/video/disp ... 04243.html

Napsal: pát 26. kvě 2006, 06:54
od Lukfi
ptipi píše:A nechtějí to rovnou porovnávat s případem, kdy fixně nastaví 1PS a 47 VS? Ten poměr 2:1 co zvolili je směšný (resp velice prospěšný pro reklamní masáž) - všechny dnešní grafiky mají poměr PS:VS cca 5:1 tzn pro případ Xenosu 40:8 - takže tu bychom měli těch chybějících 25% výkonu...
A jinak by bylo celkem divné, kdyby to ATI netvrdila (to samé vám určitě řeknou i u nv, když se zeptáte, jestli budou mít to nejvýkonnější) - prozatím jsou to jen plané reklamní kecy, spíše se těším na skutečné vydání.

Napsal: pát 26. kvě 2006, 12:01
od Smeli

Napsal: pát 26. kvě 2006, 13:34
od Lukfi
no moc bych těm 1GHz nevěřil...
(i když proč ne, R520 taky zvládne GHz... s dusíkem...)

Napsal: pát 26. kvě 2006, 13:43
od sh
to ing samo prehnal jako vzdy... proste srajdy, bude mit kolem 800-900mhz, 1ghz je blbost..

Napsal: pát 26. kvě 2006, 21:13
od no-X
Lukfi píše:
ptipi píše:A nechtějí to rovnou porovnávat s případem, kdy fixně nastaví 1PS a 47 VS? Ten poměr 2:1 co zvolili je směšný (resp velice prospěšný pro reklamní masáž) - všechny dnešní grafiky mají poměr PS:VS cca 5:1 tzn pro případ Xenosu 40:8 - takže tu bychom měli těch chybějících 25% výkonu...
A jinak by bylo celkem divné, kdyby to ATI netvrdila (to samé vám určitě řeknou i u nv, když se zeptáte, jestli budou mít to nejvýkonnější) - prozatím jsou to jen plané reklamní kecy, spíše se těším na skutečné vydání.
Poměr 2:1 není směšný, je to prostě taký poměr, jaký je. ptipimu nedochází, že poměr 5:1, který je v dnešních čipech, nemusí být optimální pro všechny hry. A skutečně optimální není. Kdyby byl optimální, aby ho mohl použít jako předpoklad pro argumentaci, neměla by ATi důvod vyvíjet unifikovaných čip, který poměr PS:VS dokáže dynamicky měnit. Takže ptipi nám tu pouze předložil argument bludného kruhu - na špatném předpokladu (=poměr PS:VS 5:1 je ideální) staví důkaz, jehož výsledkem má být zřejmě diskreditace R600 (nebo informace od ATi?).

Další věc je ta, že v některých situacích je i poměr 2:1 MNOHEM optimálnější, než poměr 5:1. Viděl jsem pár grafů analýzy nároků na výpočetní jednotky čipu při vykreslování jednoho snímku a skutečně jsou tam velmi významné výkyvy a objeví se i situace, kdy jsou na geometrii kladeny vyšší nároky, než na pixel shading. I v případě, že by to bylo jen nějakých 10% z času vykreslování framu, by to znamenalo o 10% kratší dobu pro vykreslení jednoho framu, tedy o 10% vyšší framerate při stejném počtu výpočetních jednotek (není to moc, ale proč toho nevyužít?). Teď ještě můžeme přibrat v úvahu celé scény - jedna může být náročnější na to, druhá na ono (např. výbuchy vs. vlnící se tráva...) a to už se unifikace projeví mnohem výrazněji.

A abych ještě na závěr vše popřel, dodám, že ptipiho srovnávání poměrů 5:1 a 2:1 je úplně mimo místu, protože vertex shadery a pixel shadery na současných čipech mají naprosto jinou architekturu než jakou mají výpočetní jednotky na unifikovaných čipech, takže i poměr 5:1 na R580 může znamenat NAPROSTO jiné rozložení zátěže, než poměr 5:1 na R600. Dokud nevíme, jak se konkrétně jedna unifikované jednotky bude chovat oproti jedné fixní jednotce (zda bude výkonnější, nebo méně výkonná, nebo jí budou sedět spíš PS operace, nebo spíš VS operace), tak je přeci naprostý nesmysl srovnávat jejich poměry. Je to asi jako tvrdit, že pět zrníček máku a jeden meloun je stejný hmotnostní poměr jako pět melounů a jedno zrníčko máku :roll: (a my navíc ani nevíme, kolik máků a kolik melounů bude a ani jestli náhodou ty máky nebudou dokonce větší, než melouny :sad: )

Napsal: pát 26. kvě 2006, 21:23
od Smeli
sh píše:to ing samo prehnal jako vzdy... proste srajdy, bude mit kolem 800-900mhz, 1ghz je blbost..
No, blbost, nevím když by to měli na 65nm?
Když
Lukfi píše:...(i když proč ne, R520 taky zvládne GHz... s dusíkem...)

a je na 90nm...

Napsal: pát 26. kvě 2006, 22:16
od no-X
První verze R600 by měla být vyráběná na 80nm a Orton psal cosi ve smyslu, že 80nm nebude pro vysoké frekvence právě to nej... Třeba 130nm low-k výroba měla při frekvencích nad 500Mhz mnohem vyšší výtěžnost, než 110nm produkce. A 130nm non-low-k na tom bylo asi tak stejně jako 110nm. Takže 80nm low-k by mohlo dát tak o 50MHz víc, než 90nm low-k. Vzhledem k tomu, že 90nm čipy ATi mají určité rezervy na frekvencích, kterých není využito hlavně kvůli množství odpadního tepla, bych 80nm R600 viděl na 725MHz (+-4%) Jiné hodnoty by mě velmi překvapily.

Prostě si nějak nedokážu připustit, že by R600 mohl být malý čip s 64 unifikovanými jednotkymi běhající na 900MHz+.