Napsal: sob 4. lis 2006, 13:20
A zase když se zapne Advanced Catalyst AI, tak mají někdy dvě X1950XTX skóre více jak dvojnásobný než jedna X1950XTX (např shader 16)
jak to?
Diskuze o hardware, software a overclockingu
https://forum.pctuning.cz/
Potom by ma dost zaujimalo preco ma G71 v 3D marku 2006 castokrat vyssie alebo rovnake SM 3 score ako R580Lukfi:
v čistě SM3.0 výpočtech (ShaderMark) je R580 asi 2-3x rychlejší než G71 a 3DMark05 nepoužívá SM3.0 ani okrajově
3DMark 2006 je v mnoha směrech optimalizovaný pro G7x. To jsme tu rozebírali už několikrát - tady máš seznam všech "aférek":MichiGen píše:Potom by ma dost zaujimalo preco ma G71 v 3D marku 2006 castokrat vyssie alebo rovnake SM 3 score ako R580Lukfi:
v čistě SM3.0 výpočtech (ShaderMark) je R580 asi 2-3x rychlejší než G71 a 3DMark05 nepoužívá SM3.0 ani okrajově
extremetech píše:The decision to use the 24X8 texture format for the depth stencil texture favors current Nvidia cards heavily with a significant reduction in required bandwidth.
We have since learned from ATI that only R520 cards (Radeon X1800) lack support for DF24. Last-generation ATI cards don't support the feature, either. Radeon X1300 and X1600 cards, as well as upcoming ATI hardware, support the 24-bit depth stencil textures and Fetch4, so they use the hardware shadow-mapping technique in 3DMark06.
2. Skóre s použitím FSAA:no-X píše:dost lidí se divilo, proč má X1800 výsledky relativně špatné (oproti situaci ve hrách), když X1300 a X1600 dopadají dobře. Tady je odpověď: 3DMark 2006 pro stíny (depth stencil textures) používá 24bit formát, který podporuje nVidia. Tento formát ale není povinný ani v DirectX 9.0C (SM3.0) a není zrovna logické, proč ho Futuremark použil, když z hlediska DirectX není požadovaný. Zvlášť pokud se přihlédne k tomu, že standardní 16bit DST nabízejí stejnou vizuální kvalitu (ono je to docela i logický - na co je třeba pro stín používat 24bit hloubku). R520 tedy pro stíny musí použít 32-bitovou (!!!) texturu, což vede ke snížení výkonu.
3. Filtrace shadow-mapno-X (leden 2006) píše:* Testujeme s X850XT-PE -> projede pouze SM2.0-> vyhodí výsledek založený na SM2.0 testech - "protože nepodporuje SM3.0/HDR"
* Testujeme s X1800XT -> projede všechny testy -> vyhodí skóre
* Testujeme s GF7800GTX -> projede pouze SM2.0 -> nevyhodí žádné skóre "protože nepodporuje SM3.0/HDR"
Proč se 3DMark06 ve stejné situaci (=nelze provést SM3.0 testy) chová rozdílně k ATi hardwaru a k nVidia hardwaru? Proč v případě GF7 nevyhodí skóre založené na testech, které je karta schopna projet, jako se děje v případě X850XT-PE? Třeba proto, že by pak skóre GF7 bylo výrazně nižší, než skóre X1800? Proč je ATi penalizována za to, že X1800 nepodporuje D24X8, zatímco nVidii se absence podpory HDR+FSAA toleruje?
Bear in mind that fetch4 is available on every single channel texture format, while in the test is only used in the PS2.0 tests... why not in the other ones? (maybe because nvidia PCF wouldn't work?)
4. Použití partial precision (snížené přesnosti výpočtů) na hardwaru nVidieno-X píše:Tak, hledal jsem nějaký info holedně toho, proč nVidia PCF ani ATi fetch4 není použito v SM3.0 testech a našel jsem důvod. Futuremark použil pro filtraci rotated-grid, tedy mřížku, kterou není možné použít v kombinaci s nVidia PCF ani ATi fetch4.
Rotated grid je samozřejmě lepší než ordered grid (při stejném množství vzorků), ale pokud počítám dobře, ATi by díky fetch4 akceleraci měla zvládnout ordered grid o čtyřnásobném množství vzorků (tedy např. 16x) se stejným výkonem, jako základní rotated grid (např. 4x) bez fetch4, přičemž čtyřnásobné navýšení v počtu vzorků je dostatečně vysoké na to, aby dalo vyšší kvalitu, než rotated-grid (to platí obecně, stejně jako u FSAA).
Mě osobně z toho vyplývá takový závěr, že kdyby bylo použito ordered-grid, klidně o vyšším počtu vzorků, vycházely by z toho karty z podporou fetch4 výrazně lépe (buďto by byl vyšší výkon, nebo kvalita, ale každopádně by šlo o výrazné plus). Použití rotated-grid mi v tomto případě připadá jako cílená záležitost, která má zaručit, aby karty bez podpory fetch4 nedávaly výrazněji slabší výsledky...
zhruba 50% používá na kartách nVidie partial preicision, výpis najdeš tadyJawed píše:Here Nick kindly identified a 3DMk06 shader that uses dynamic branching.
Additionally, sections of the code use partial precision (_PP at the end of the instruction name).
What's interesting, in my view, is:To be honest, if you're a half-decent programmer, then an awareness of precision is right there at the time the algorithm is cast and the data structures formed, so I don't think it's actually that difficult to say these "variables are _PP". It's not much different from choosing texture formats, I guess.
- clearly this is an optimisation for NVidia hardware - and who knows whether the driver will even respect this and instead just change every instruction to _PP
- the complexity in identifying the portions of shader code that can withstand _PP
I can imagine the lead graphics engine developer will have laid-down the parameters for _PP, too - so the code monkeys can get on without having to think too much.
I suppose where it might get interesting is in artist-configured shaders - but again I imagine the lead dev will have identified the conditions under which precision is at risk.
Arguably, I suppose, it would be nice as a dev to be able to think "FP32 all the way, no need to worry about the precision of my variables" - like when I used to program finance stuff I knew my money fields were always 15.4 and life was simple, I just had to be careful about when I rounded, etc. etc.
Jawed
HEXUS.net píše:3DMark06 is too inconsistent and doesn't do as much as it should. Or indeed it does entirely too much! Futuremark chose to go down the direction of per-vendor support and multiple code path maintenance, but don't extend that to encompass all the target vendors (where reasonable for them to do so, of course) and implement what they maybe should.
V tom případě nevim co by víc chtěli. Stačí nahrát minutovej replay jak válcuješ nepřátelskou základnu, pak přehrát replay s tim že nebudeš hejbat kamerou a změříš to FRAPSem. Oproti tomu jak se měří v Oblivionu nebo F.E.A.R. EP mi to zas tak složitý nepřijde.no-X píše:Zřejmě asi nebude samotný proces testování uživatelsky přívětivý
Obivion s 16HQAF @8800GTX: