PCTuning fórum

Hmm, na tom je vidět, že ATi neoptimalizuje pro shader mark - když se zapne Advanced Catalyst AI, je to hned o něčem jiným

Jaktože v tom shader marku bez Advanced Catalyst AI má někdy single X1950XTX vyšší skóre než CF X1950XTX (např. shader 24)?
A zase když se zapne Advanced Catalyst AI, tak mají někdy dvě X1950XTX skóre více jak dvojnásobný než jedna X1950XTX (např shader 16)

jak to?

S Catalyst AI default to jede přes super-tiling a s Catalyst AI advanced to jede přes AFR. ATi pro syntetický testy neoptimalizuje, takže je defaultně použit pro některé shadery nevhdoný super-tiling. Přepnutím na advanced se zapne alternate-frame rednering (AFR), který skóre zvyšuje prakticky na dvojnásobek.

Rozdíl u shaderu 16 jsou dvě procenta, tzn. v rámci chyby měření (při testování na single mohl např. swapnout disk, což v daném testu mohlo nepatrně snížit skóre; tohle jsou syntetické testy, ne hry, takže takovéhle věci ovlivňují skóre mnohem víc)

http://www.diskusjon.no/index.php?s=6c7 ... &p=7214505

Zostava: Core 2 Duo@4.5Ghz 8800GTX@660/1030

tak to je hodne husty, hrubej vykon vyssi nez 7900GTX SLI

ale oboje grafika i 8800 byly taktovane, vic nez vykon mne zaujalo OC, pomalu se zacina rysovat, kam to az pujde

21000 v 3DMarku05 ti daji taky jen brutalne pretaktovane 7900GTX v SLi

Ale 3DMark05 je SM2.0 test a neprojeví se tam jak je G80 rychlá v SM3.0... v čistě SM3.0 výpočtech (ShaderMark) je R580 asi 2-3x rychlejší než G71 a 3DMark05 nepoužívá SM3.0 ani okrajově

Lukfi:
v čistě SM3.0 výpočtech (ShaderMark) je R580 asi 2-3x rychlejší než G71 a 3DMark05 nepoužívá SM3.0 ani okrajově

Potom by ma dost zaujimalo preco ma G71 v 3D marku 2006 castokrat vyssie alebo rovnake SM 3 score ako R580

MichiGen píše:
Lukfi:
v čistě SM3.0 výpočtech (ShaderMark) je R580 asi 2-3x rychlejší než G71 a 3DMark05 nepoužívá SM3.0 ani okrajově
Potom by ma dost zaujimalo preco ma G71 v 3D marku 2006 castokrat vyssie alebo rovnake SM 3 score ako R580

3DMark 2006 je v mnoha směrech optimalizovaný pro G7x. To jsme tu rozebírali už několikrát - tady máš seznam všech "aférek":

1. Podpora formátu D24X8 - toto je specifický formát pro textury nVidie (depth stencil), který není součástí specifikací DirectX a tudíž ho X1800 nepodporuje. Proč 3DMark06, jako benchmark API DX9.0c, vyžaduje technologii, která vůbec s DX9.0c nesouvisí?

extremetech píše:The decision to use the 24X8 texture format for the depth stencil texture favors current Nvidia cards heavily with a significant reduction in required bandwidth.

We have since learned from ATI that only R520 cards (Radeon X1800) lack support for DF24. Last-generation ATI cards don't support the feature, either. Radeon X1300 and X1600 cards, as well as upcoming ATI hardware, support the 24-bit depth stencil textures and Fetch4, so they use the hardware shadow-mapping technique in 3DMark06.

no-X píše:dost lidí se divilo, proč má X1800 výsledky relativně špatné (oproti situaci ve hrách), když X1300 a X1600 dopadají dobře. Tady je odpověď: 3DMark 2006 pro stíny (depth stencil textures) používá 24bit formát, který podporuje nVidia. Tento formát ale není povinný ani v DirectX 9.0C (SM3.0) a není zrovna logické, proč ho Futuremark použil, když z hlediska DirectX není požadovaný. Zvlášť pokud se přihlédne k tomu, že standardní 16bit DST nabízejí stejnou vizuální kvalitu (ono je to docela i logický - na co je třeba pro stín používat 24bit hloubku). R520 tedy pro stíny musí použít 32-bitovou (!!!) texturu, což vede ke snížení výkonu.

2. Skóre s použitím FSAA:

no-X (leden 2006) píše:* Testujeme s X850XT-PE -> projede pouze SM2.0-> vyhodí výsledek založený na SM2.0 testech - "protože nepodporuje SM3.0/HDR"

* Testujeme s X1800XT -> projede všechny testy -> vyhodí skóre

* Testujeme s GF7800GTX -> projede pouze SM2.0 -> nevyhodí žádné skóre "protože nepodporuje SM3.0/HDR"

Proč se 3DMark06 ve stejné situaci (=nelze provést SM3.0 testy) chová rozdílně k ATi hardwaru a k nVidia hardwaru? Proč v případě GF7 nevyhodí skóre založené na testech, které je karta schopna projet, jako se děje v případě X850XT-PE? Třeba proto, že by pak skóre GF7 bylo výrazně nižší, než skóre X1800? Proč je ATi penalizována za to, že X1800 nepodporuje D24X8, zatímco nVidii se absence podpory HDR+FSAA toleruje?

3. Filtrace shadow-map

Bear in mind that fetch4 is available on every single channel texture format, while in the test is only used in the PS2.0 tests... why not in the other ones? (maybe because nvidia PCF wouldn't work?)

no-X píše:Tak, hledal jsem nějaký info holedně toho, proč nVidia PCF ani ATi fetch4 není použito v SM3.0 testech a našel jsem důvod. Futuremark použil pro filtraci rotated-grid, tedy mřížku, kterou není možné použít v kombinaci s nVidia PCF ani ATi fetch4.

Rotated grid je samozřejmě lepší než ordered grid (při stejném množství vzorků), ale pokud počítám dobře, ATi by díky fetch4 akceleraci měla zvládnout ordered grid o čtyřnásobném množství vzorků (tedy např. 16x) se stejným výkonem, jako základní rotated grid (např. 4x) bez fetch4, přičemž čtyřnásobné navýšení v počtu vzorků je dostatečně vysoké na to, aby dalo vyšší kvalitu, než rotated-grid (to platí obecně, stejně jako u FSAA).

Mě osobně z toho vyplývá takový závěr, že kdyby bylo použito ordered-grid, klidně o vyšším počtu vzorků, vycházely by z toho karty z podporou fetch4 výrazně lépe (buďto by byl vyšší výkon, nebo kvalita, ale každopádně by šlo o výrazné plus). Použití rotated-grid mi v tomto případě připadá jako cílená záležitost, která má zaručit, aby karty bez podpory fetch4 nedávaly výrazněji slabší výsledky...

4. Použití partial precision (snížené přesnosti výpočtů) na hardwaru nVidie

Jawed píše:Here Nick kindly identified a 3DMk06 shader that uses dynamic branching.

Additionally, sections of the code use partial precision (_PP at the end of the instruction name).

What's interesting, in my view, is:

clearly this is an optimisation for NVidia hardware - and who knows whether the driver will even respect this and instead just change every instruction to _PP

the complexity in identifying the portions of shader code that can withstand _PP
To be honest, if you're a half-decent programmer, then an awareness of precision is right there at the time the algorithm is cast and the data structures formed, so I don't think it's actually that difficult to say these "variables are _PP". It's not much different from choosing texture formats, I guess.

I can imagine the lead graphics engine developer will have laid-down the parameters for _PP, too - so the code monkeys can get on without having to think too much.

I suppose where it might get interesting is in artist-configured shaders - but again I imagine the lead dev will have identified the conditions under which precision is at risk.

Arguably, I suppose, it would be nice as a dev to be able to think "FP32 all the way, no need to worry about the precision of my variables" - like when I used to program finance stuff I knew my money fields were always 15.4 and life was simple, I just had to be careful about when I rounded, etc. etc.

Jawed

zhruba 50% používá na kartách nVidie partial preicision, výpis najdeš tady

HEXUS.net píše:3DMark06 is too inconsistent and doesn't do as much as it should. Or indeed it does entirely too much! Futuremark chose to go down the direction of per-vendor support and multiple code path maintenance, but don't extend that to encompass all the target vendors (where reasonable for them to do so, of course) and implement what they maybe should.

a tak mam dotaz na no-xe: co nejlip a neutralne otestuje grafiky s sm3.0? 3dmark05 se nehodi a 3dmark06 je ceska fotbalova liga

. to asi skutecne budu muset sledovat konkretni hru a vysledky v ni. nebo zeby Oblivion? a pak Crysis?

seznam her tady no-X postoval... tak mě napadá, proč vlastně nikdo netestuje v Earth 2160?

Testují s tím některé severo- a západo-germánské servery (3Dcenter.de, ATI-news.de, 64bits.se). Nevím, proč se tomu ostatní vyhýbají. Hra je technologicky náročná a vypadá dobře. Zřejmě asi nebude samotný proces testování uživatelsky přívětivý

no-X píše:Zřejmě asi nebude samotný proces testování uživatelsky přívětivý

V tom případě nevim co by víc chtěli. Stačí nahrát minutovej replay jak válcuješ nepřátelskou základnu, pak přehrát replay s tim že nebudeš hejbat kamerou a změříš to FRAPSem. Oproti tomu jak se měří v Oblivionu nebo F.E.A.R. EP mi to zas tak složitý nepřijde.

Obivion s 16HQAF @8800GTX:

http://img220.imageshack.us/my.php?imag ... ionyw3.jpg

http://img220.imageshack.us/my.php?imag ... on2yd8.jpg

Zdroj&viac: http://www.hardforum.com/showpost.php?p ... tcount=412

(aj keď to nemusí byť GeForceka ...)

Obivion s 16HQAF @8800GTX:

oooooooooooooo nice

GF8800GTX s s Intel Q6600 a D Mark 06 http://vic.expreview.com/read.php?56

Problemy:
We have received news that all the 8800GTX cards out in the channel are being recalled due to manufacturing defect. We heard it is probably due to a resistor controlling 2D/3D switching and that leads to 3D corruption. However, the defect doesn't affect the 8800GTS cards. This issue probably could delay the launch, if not, there could be no availability of 8800GTX cards at launch but just GTS.

Update #1 : No affect on launch date as yet
Update #2 : NVIDIA will handle the necessary hardware changes (changing of resistors)
Update #3 : Only some 8800GTX cards are affected due to wrong resistor value by a contract manufacturer but to be safe, all the card makers are recalling their cards

jj zrovna jsem to chtěl postnout =)

http://www.vr-zone.com/?i=4253

typicke .) a lidi si divej proc zmizeli z ceniku z VO.. a posunul se datum dodani o 2 tydny .) maji ale dojit MSI ktere jsou v pohode

PCTuning fórum

nVidia G80 - informace, spekulace...