Vtipny prispevek. Tak si zkus na sve uzasne karte zahrat v dx10 treba Lost Planet nebo Company Of Heroes chytraku. Jede pomalu? Smula co? Nvidia zduvodnuje uplne neco jineho a to umele snizovani vykonu jejich karet. Jestli ma pravdu to tezko rict. Spis asi ne, vyvojari si muzou delat co chteji.Stratos píše:nj nvidie si zase musi nak zduvodnit proc sou horsi nez ATI
R600 - technologie, možnosti architektury
Moderátoři: morke, Walker1134, Wilik
- thomasblue
- Začátečník
- Registrován: 01. led 2007
- spajdr
- Středně pokročilý
- Registrován: 14. bře 2004
- Bydliště: Ostrava Poruba
- Kontaktovat uživatele:
No lost planet i kdyby nejel pomalu, tak hratelný není i tak, takové chyby co to předvádí se jenom tak nevidí
Mimochodem Company of Heroes přes DX10 je pomalý, ale na GTX není o moc rychlejší, ty min.fps jsou taky dost nízké.Ono i porovnávat kvalitní ovladače NVIDIE který tuní pro G80 už od vánoc a ATI co nedávno teprve vydala R600 a ovladače stojí za prd, počkal bych si měsíc nebo dva a třeba to bude jiné a jestli ne, tak karty letí do světa
Mimochodem Company of Heroes přes DX10 je pomalý, ale na GTX není o moc rychlejší, ty min.fps jsou taky dost nízké.Ono i porovnávat kvalitní ovladače NVIDIE který tuní pro G80 už od vánoc a ATI co nedávno teprve vydala R600 a ovladače stojí za prd, počkal bych si měsíc nebo dva a třeba to bude jiné a jestli ne, tak karty letí do světa
- SNowie
- Začátečník
- Registrován: 14. led 2006
- Bydliště: Praha, Teplice
umělé snižování výkonu použitím AA přes shadery, kteréžto je součástí DX10 to jsou mi věci to jsou mi věci jako by fanATik brečel, že ve většině her se používáfixní AA, ve kterém má R600 propady ... nechápu proč jsou lidé vlastnící nvidii tak skálopevně přesvědčeni, že je to standard a ladit hry by se měly podle ní a ATi nechť je "kompatibilní"thomasblue píše:Vtipny prispevek. Tak si zkus na sve uzasne karte zahrat v dx10 treba Lost Planet nebo Company Of Heroes chytraku. Jede pomalu? Smula co? Nvidia zduvodnuje uplne neco jineho a to umele snizovani vykonu jejich karet. Jestli ma pravdu to tezko rict. Spis asi ne, vyvojari si muzou delat co chteji.Stratos píše:nj nvidie si zase musi nak zduvodnit proc sou horsi nez ATI
- no-X
- Středně pokročilý
- Registrován: 24. úno 2004
- Bydliště: Č.Budějovice
Než začnete soudit, zkuste si nejdřív o celé situaci něco zjistit...
Toto je vyjádření Techlandu
- předchozí verze AA byla matematicky i vizuálně nekorektní
- nová verze benchmarku přinesla vykreslovánís tínů dov ětší vzdálenosti (extraquality), větší využití geometry shaderu (extraquality) a umožnění použití anizotropní filtrace pro větší množství povrchů
- (Techland") divíme se, že si nVidia stěžuje - vždyť právě větší množství anizotropní filtrace by jí mělo naopak hrát do karet, protože propad výkonu při její aktivaci je na G80 velmi nízký
----
dále si zjistěte, proč kombinace DX10 + HDR + tone-mapping + MSAA + fixed resolve nemůže fungovat korektně - pokud na to nemáte čas, vysvětlím to stručně:
DX10 + HDR + tone-mapping + fixed resolve:
fixní resolve je možné kvůli hardwarové limitaci provést pouze předtím, než se provede tone-mapping - tone mapping nelineárně zesvětlí lineárně zpracované pixely po MSAA, takže odstíny na hranách, které jsme získali použitím MSAA, nám de-facto zmizí:
DX10 + HDR + tone-mapping + DX10 (shader-assisted) resolve:
DX10 resolve je možné provést až po tone-mappingu, což vede k barevně korektnímu výsledku a o odstíny na hranách vypočtené díky MSAA již nepřijdeme:
http://www.gdconf.com
A na závěr si projděte specifikace DX10, jejichž součástí právě HDR-corect resovle je (stejně jako DX10 vyžadují ze strany hardwaru podporu pro např. geometry shader, tak vyžadují podporu pro HDR-correct resolve. Pokud nVidii připadá, že propad výkonu tohoto režimu FSAA je na G80 vyšší, než na R600, neměla by hledat chybu u ATi, ale v kvalitě vlastní implementace této DX10 feature.
Jak je vidět, nVidii je naprosto jedno, jak výsledek vypadá - hlavně když to běhá rychleji, než na konkurenčním HW... pokud výrobce hry chce, aby hra vypadala stejně dobře na všech kartách a provede nezbytné úpravy (v rámci specifikací DX10), což u nVidie vede k propadu ve výkonu, je najednou špatná ATi(?)
Takhle... v první verzi benchmarku nefungoval AA vůbec. Následně byl při AA problém se screen-door artefakty a absenci vyhlazení na některých hranách. Pokud bez použití shader-resolve není možné implemenotvat plnohodnotný AA, tak je to bohužel jediná cesta... (například v novém UT podle dosavadních informací MSAA bez shader resolve nebude fungovat vůbec)Changes to shaders that deflate NVIDIA performance by approximately 10-14%, without improving visual quality on either NVIDIA or ATI GPUs.
...NVIDIA discovered that the early build of the game that was distributed to the press has an application bug that violates DirectX 10 specifications by mishandling MSAA buffers, which causes DirectX 10 compliant hardware to crash...
Toto je vyjádření Techlandu
stručný překlad nejpodstatnějších částí:In this message we would like to comment some disputable information that was recently published by nVidia and that is related to the DirectX 10 benchmark mode in Call of Juarez.
Before the arrival of DirectX 10, previous graphics APIs only allowed automatic Multi-Sample Anti-Aliasing (MSAA) resolves to take place in interactive gaming applications. This automatic process always consisted of a straight averaging operation of the samples for each pixel in order to produce the final, anti-aliased image. While this method was adequate for a majority of graphic engines, the use of advanced High Dynamic Range rendering and other techniques such as Deferred Rendering or anti-aliased shadow buffers require programmable control over this operation due to the nature of the mathematical operations involved. I.e. The previous approach using a simple average can be shown to be mathematically and visually incorrect (and in fact it produces glaring artefacts on occasions).
All DirectX 10 graphics hardware which supports MSAA is required to expose a feature called 'shader-assisted MSAA resolves' whereby a pixel shader can be used to access all of the individual samples for every pixel. This allows the graphics engine to introduce a higher quality custom MSAA resolve operation. The DirectX 10 version of 'Call of Juarez' leverages this feature to apply HDR-correct MSAA to its final render, resulting in consistently better anti-aliasing for the whole scene regardless of the wide variations in intensity present in HDR scenes. Microsoft added the feature to DirectX 10 at the request of both hardware vendors and games developers specifically so that we could raise final image quality in this kind of way, and we are proud of the uncompromising approach that we have taken to image quality in the latest version of our game.
"ExtraQuality" is a visual quality setting enabled by default in the DX10 version of Call of Juarez. In benchmark mode, "ExtraQuality" mode does two things. First, it increases shadow generation distance in order to apply shadowing onto a wider range of pixels on the screen, resulting in better quality throughout the benchmark run. Second, it increases the number of particles rendered with the geometry shader in order to produce more realistic-looking results, like for example waterfall, smoke and falling leaves. The attached screenshot illustrates those differences when ExtraQuality is disabled. ExtraQuality is designed as a default setting to reflect the visual improvements made possible by DX10 cards and is not meant to be disabled in any way.
All updates to shaders made in the final version of the Call of Juarez benchmark were made to improve performance or visual quality or both, for example to allow anisotropic texture filtering on more surfaces than before. This includes the use of more complex materials for a wider range of materials. At the same time we implemented shader code to improve performance on the more costly computations associated with more distant pixels,. Some materials were also tweaked in minor ways to improve overall image quality. One of the key strengths of NVIDIA's hardware is its ability to perform anisotropic filtering at high performance so we are puzzled that NVIDIA complains about this change when in effect it plays to their strengths.
Default settings were chosen to provide an overall good user experience. Users are encouraged to modify the settings in the CoJDX10Launcher as required. Using larger shadow maps is one option that we would encourage users to experiment with, and in our experience changing this setting does not affect NVIDIA's comparative benchmark scores greatly.
We are disappointed that NVIDIA have seen fit to attack our benchmark in any way. We are proud of the game that we have created, and we feel that NVIDIA can also be proud of the hardware that they have created. Nonetheless these artistic decisions about the settings of a game rightly belong in the hands of the games developer, not the hardware manufacturer.
Thank you and don't hesitate to contact us if you have any questions.
- předchozí verze AA byla matematicky i vizuálně nekorektní
- nová verze benchmarku přinesla vykreslovánís tínů dov ětší vzdálenosti (extraquality), větší využití geometry shaderu (extraquality) a umožnění použití anizotropní filtrace pro větší množství povrchů
- (Techland") divíme se, že si nVidia stěžuje - vždyť právě větší množství anizotropní filtrace by jí mělo naopak hrát do karet, protože propad výkonu při její aktivaci je na G80 velmi nízký
----
dále si zjistěte, proč kombinace DX10 + HDR + tone-mapping + MSAA + fixed resolve nemůže fungovat korektně - pokud na to nemáte čas, vysvětlím to stručně:
DX10 + HDR + tone-mapping + fixed resolve:
fixní resolve je možné kvůli hardwarové limitaci provést pouze předtím, než se provede tone-mapping - tone mapping nelineárně zesvětlí lineárně zpracované pixely po MSAA, takže odstíny na hranách, které jsme získali použitím MSAA, nám de-facto zmizí:
DX10 + HDR + tone-mapping + DX10 (shader-assisted) resolve:
DX10 resolve je možné provést až po tone-mappingu, což vede k barevně korektnímu výsledku a o odstíny na hranách vypočtené díky MSAA již nepřijdeme:
http://www.gdconf.com
A na závěr si projděte specifikace DX10, jejichž součástí právě HDR-corect resovle je (stejně jako DX10 vyžadují ze strany hardwaru podporu pro např. geometry shader, tak vyžadují podporu pro HDR-correct resolve. Pokud nVidii připadá, že propad výkonu tohoto režimu FSAA je na G80 vyšší, než na R600, neměla by hledat chybu u ATi, ale v kvalitě vlastní implementace této DX10 feature.
Jak je vidět, nVidii je naprosto jedno, jak výsledek vypadá - hlavně když to běhá rychleji, než na konkurenčním HW... pokud výrobce hry chce, aby hra vypadala stejně dobře na všech kartách a provede nezbytné úpravy (v rámci specifikací DX10), což u nVidie vede k propadu ve výkonu, je najednou špatná ATi(?)
Nejlepší moderátor ve výslužbě
- no-X
- Středně pokročilý
- Registrován: 24. úno 2004
- Bydliště: Č.Budějovice
nějaké info k tesselatoru a jeho výkonu...
http://www.beyond3d.com/content/articles/89/2Tesselation
The R6-family tesselator's light burned strongly in Richard's presentation. A programmable primitive tesselator will become part of the official D3D spec with DirectX 11, however AMD are the first out of the gate with a pre-11 implementation. AMD look to expose it first in D3D9 applications if developers are interested, with D3D10 support provided to the ISVs probably closer to 2008.
Richard said the tesselator's main use is for added graphical fidelity, rather than situations where the tesselated geometry might interact in a crucial game-changing way. The unit's performance was also mentioned, where triangle throughput upwards of a billion per second is pretty trivial for the tesselator to push down to the rest of the hardware.
Nejlepší moderátor ve výslužbě
- no-X
- Středně pokročilý
- Registrován: 24. úno 2004
- Bydliště: Č.Budějovice
hmm, zvláštní...Rys@B3D píše:10.1 compatibility is a bit of a grey area as far as currently available GPUs go. I think it's technically impossible for NVIDIA to support 10.1 in hardware with the three G8x GPUs they've released so far, whereas AMD would have more luck with RV6xx, but not R600. As to whether AMD will qualify and officially support 10.1 with any RV6xx products, we'll have to wait and see.
I don't think HD 2900 XT will ever support it sadly.
Nejlepší moderátor ve výslužbě
- spajdr
- Středně pokročilý
- Registrován: 14. bře 2004
- Bydliště: Ostrava Poruba
- Kontaktovat uživatele:
- no-X
- Středně pokročilý
- Registrován: 24. úno 2004
- Bydliště: Č.Budějovice
- spajdr
- Středně pokročilý
- Registrován: 14. bře 2004
- Bydliště: Ostrava Poruba
- Kontaktovat uživatele:
- no-X
- Středně pokročilý
- Registrován: 24. úno 2004
- Bydliště: Č.Budějovice
- no-X
- Středně pokročilý
- Registrován: 24. úno 2004
- Bydliště: Č.Budějovice
V současné době je jasné, že ATi očekávala výraznější růst poměru ALU:TEX, něž k jakému došlo. Takže připravovala takovou architekturu, u které bude navyšování počtu SIMDs (množství ALUs) přinášet jen minimální nárůst v počtu tranzistorů.Lukfi píše:Zajímavé. Každopádně jediné, co jsem tam zjistil nového, se týká RV670, respektive údajně změněného poměru ALU:TEX ve prospěch texturovacích jednotek.
R520 vypadala nějak takhle:
4x (ALU - TMU)
4x (ALU - TMU)
4x (ALU - TMU)
4x (ALU - TMU)
R580 asi takto:
4x (ALU - ALU - ALU - TMU)
4x (ALU - ALU - ALU - TMU)
4x (ALU - ALU - ALU - TMU)
4x (ALU - ALU - ALU - TMU)
architektura byla přizpůsobená tak, aby bylo možné přidávat další SIMDs (sloupce), přičemž řídící logika prakticky nenarůstala a množství tranzistorů stoupalo minimálně. Naproti tomu bylo nevýhodné přidávat celé quady (řádky), protože tím narůstala i řídící logika a prakticky vše...
R600:
4x (ALU - ALU - ALU - ALU - TMU)
4x (ALU - ALU - ALU - ALU - TMU)
4x (ALU - ALU - ALU - ALU - TMU)
4x (ALU - ALU - ALU - ALU - TMU)
Nevím, nakolik se to změnilo u R600, ale myslím si, že nijak extrémně ne a na ALU:TEX 4:1 je vidět, že přidávání celých quadů je stále mnohem nákladnější na počet tranzistorů.
Takže, pokud má mít RV670 nižší poměr ALU:TEX, je několik možností:
1. zkrouhnout jeden SIMD (3:1):
4x (ALU - ALU - ALU - TMU)
4x (ALU - ALU - ALU - TMU)
4x (ALU - ALU - ALU - TMU)
4x (ALU - ALU - ALU - TMU)
rozdíl ve výkonu oproti R600 bude minimální a s velikostí čipu to skoro nehne -> na první pohled nepravděpodobné, i když na druhé straně, při použití 55nm procesu, by takový čip mohl mít pod 200mm2
2. zkrouhnout dva SIMDs (2:1):
4x (ALU - ALU - TMU)
4x (ALU - ALU - TMU)
4x (ALU - ALU - TMU)
4x (ALU - ALU - TMU)
jenže SIMDs podle všeho (je-li to stejné jako u R5xx) nejsou náročné na počet tranzistorů, takže se tím nic moc neušetří (počet quadů je stejný) a navíc se připravíme o výkon shader core, které se u R6xx používá nejen pro pixel shading, ale i vertex shading a MSAA resolve.
3. zkrouhnout jeden quad a jeden SIMD (3:1):
4x (ALU - ALU - ALU - TMU)
4x (ALU - ALU - ALU - TMU)
4x (ALU - ALU - ALU - TMU)
Vzniká obdoba R570. ALU:TEX je podle mě docela optimální, vypuštěním quadu klesá zároveň i velikost čipu, hodí se k tomu 256bit sběrnice... Jenže na 55nm výrobě by takový čip měl plochu asi 160mm2, což je pro 256bit sběrnici (alespoň podle velikostí dosavadních čipů) málo
RV670 by měla mít ještě nějaká vylepšení, takže by tranzistorů bylo více, ale otázka je jestli dost na to, aby se třetí možnost dostala na nějakých 200mm2 typických jako minimum pro 256bit čip.
Nejlepší moderátor ve výslužbě
- Lukfi
- Mírně pokročilý
- Registrován: 04. črc 2005
- Bydliště: Praha
- Kontaktovat uživatele:
No, teoreticky by připadala v úvahu kterákoliv z těch možností. Mě by spíš zajímalo, jak to bude s R600 PRO, což je vlastně ta varianta číslo 2. Poměr ALU:TEX je oproti R580 dokonce nižší, a to i přesto, že shader core počítá i vertex shading a AA resolve, jak tam sám zmiňuješ. Podle toho, jestli R600 PRO bude v novejch hrách OK nebo propadák myslím docela odhadneme, jak bude vypadat RV670
Výkaly prosím umisťujte do záchodové mísy a nikoliv diskuzního fóra.
- žabka
- Začátečník
- Registrován: 01. srp 2007
tvuj prispevek je jeste vtipnejsi a je videt ze o tom nic nevis hlavne ze vetsina DX10 her beha lepe na ATI nez na Nvidi, viz test na svethardware kde v prumeru vysla 2900XT o 3% rychlejsi nez 8800GTX a to testovaly ve vsech v te dobe dostupnych her tusim ze 4 hry to byly, a neni to tak starej test asi 1mesic )thomasblue píše:
Vtipny prispevek. Tak si zkus na sve uzasne karte zahrat v dx10 treba Lost Planet nebo Company Of Heroes chytraku. Jede pomalu? Smula co? Nvidia zduvodnuje uplne neco jineho a to umele snizovani vykonu jejich karet. Jestli ma pravdu to tezko rict. Spis asi ne, vyvojari si muzou delat co chteji.
Asus A8JP
Core 2 Duo T5600, X1700,2GB,120GB,14" 1440x900, 2.39Kg
Core 2 Duo T5600, X1700,2GB,120GB,14" 1440x900, 2.39Kg
- no-X
- Středně pokročilý
- Registrován: 24. úno 2004
- Bydliště: Č.Budějovice
Tomu už nevěřím. Jeví se mi jako pravděpodobnější, že R600PRO bude mít plný počet shader jednotek a snížená bude jen frekvence a/nebo sběrnice.Lukfi píše:No, teoreticky by připadala v úvahu kterákoliv z těch možností. Mě by spíš zajímalo, jak to bude s R600 PRO, což je vlastně ta varianta číslo 2.
Pokud by totiž takhle rapidně snížili ALU:TEX, snížili by výkon, ale spotřeba by se imho moc nepohla, takže čemu by pak konkurovali? Na konkurenci pro GF8600GTS by to bylo moc žravý a na konkurenta GTS-320 moc pomalý (pokud nVidia vyřeší memory management)
Nejlepší moderátor ve výslužbě
- Lukfi
- Mírně pokročilý
- Registrován: 04. črc 2005
- Bydliště: Praha
- Kontaktovat uživatele:
No... každopádně TechConnect Mag přinesl další slovo do pranice:
http://www.tcmagazine.com/comments.php?id=15701&catid=2
stručně: bude Radeon HD2900 Pro a GT, Pro bude mít 320 SPs a 512MB VRAM, GT 240 SPs a 256MB VRAM. A je tam i nějaký další info. Večer se na to podívám a napíšu newsku...
http://www.tcmagazine.com/comments.php?id=15701&catid=2
stručně: bude Radeon HD2900 Pro a GT, Pro bude mít 320 SPs a 512MB VRAM, GT 240 SPs a 256MB VRAM. A je tam i nějaký další info. Večer se na to podívám a napíšu newsku...
Výkaly prosím umisťujte do záchodové mísy a nikoliv diskuzního fóra.
- Digitaldoom
- Mírně pokročilý
- Registrován: 29. srp 2004
- Bydliště: Jirkov nebo Plzeň
- Kontaktovat uživatele:
jo, na to mě už dával včera echo jeden reader celkem vzato by to dávalo smysl - ATI potřebuje konkurenci k 8800GTS 320MB a obávám se, že by 240SPs verze HD2900PRO na to nestačila ... na druhou stranu by plně stačila na bestseller v cenové relaci 4500-6000Lukfi píše:No... každopádně TechConnect Mag přinesl další slovo do pranice:
http://www.tcmagazine.com/comments.php?id=15701&catid=2
stručně: bude Radeon HD2900 Pro a GT, Pro bude mít 320 SPs a 512MB VRAM, GT 240 SPs a 256MB VRAM. A je tam i nějaký další info. Večer se na to podívám a napíšu newsku...
- flanker
- Moderátor
- Registrován: 13. pro 2005
- Bydliště: Brno
- Kontaktovat uživatele:
a to bude to GT cko...Uz aby byly potvurky na svete...
ROG Power PC1:AMD Ryzen 7 5700X, Crosshair VII Hero, ROG Ryuo II 360, 512GB NVMe+500GB Samsung SSD, 2x 16GB GSkill TridentZ Neo RGB 3600 MHz, Dual RTX 2060,CM V750, Lian Li O11 Dynamic XL. PC2:AMD FX-8370, Silentium Fera, Asus 970 Pro Gaming/Aura, 240GB SSD HyperX 3K, R9-270X OC, 2x 4GB GSkill RipjawsX 2400 MHz, Corsair AX750, Bitfenix Pandora
- no-X
- Středně pokročilý
- Registrován: 24. úno 2004
- Bydliště: Č.Budějovice
Myslím, že tu ještě nepadla ani zmínka o Cloud9 od NHN, který by měl konečně využívat některé specifické technologie R6xx/R7xx.
S demonstračními videy je trochu problém - první je bohužel v nízké kvalitě, takže až na tesselované vlny a lightshaft si člověk musí skoro domýšlet, co rozmazala komprese. Druhý web má mít videa ve vyšší kvalitě, ale nejdou mi přehrát (při některých pokusech mi zamrzl prohlížeč, tak radši varuju předem)
http://www.truveo.com/...
http://s2day.com/2008/06/19/nhn-games-c ... emo-video/
pokud by se vám podařilo ta druhá nějak přehrát, dejte vědět.
Seznam prezentovaných technologií a technik:
S demonstračními videy je trochu problém - první je bohužel v nízké kvalitě, takže až na tesselované vlny a lightshaft si člověk musí skoro domýšlet, co rozmazala komprese. Druhý web má mít videa ve vyšší kvalitě, ale nejdou mi přehrát (při některých pokusech mi zamrzl prohlížeč, tak radši varuju předem)
http://www.truveo.com/...
http://s2day.com/2008/06/19/nhn-games-c ... emo-video/
pokud by se vám podařilo ta druhá nějak přehrát, dejte vědět.
Seznam prezentovaných technologií a technik:
- tesselation
- soft-particle volume cloud
- screen-space ambient occlusion
- screen-space global illumination
- light-shaft
Nejlepší moderátor ve výslužbě
- Lukfi
- Mírně pokročilý
- Registrován: 04. črc 2005
- Bydliště: Praha
- Kontaktovat uživatele:
- Sanchez
- Začátečník
- Registrován: 01. dub 2005
- Bydliště: Lutánia Valachia
Endžojno-X píše:pokud by se vám podařilo ta druhá nějak přehrát, dejte vědět.
Light Shaft
Volume Cloud
SS ambient occlusion a global illumination
Rock Tessel
Water Tessel
Vyhrabal jsem to z tohoto webu ale tam se to načítá strašně pomalu tak sem to (trochu na úkor kvality) šoupl na jútúb