Stránka 23 z 63

Napsal: pát 16. kvě 2008, 20:35
od Herkis
no-X, věc TMU na GT200:
Že to není jednoduché, s tím souhlasím. Že to je overkill, s tím taky souhlasím. Ale jak už psal Jawed (B3D, myslím, že v threadu o RV770) - volně přeloženo - má to své výhody v menším výkyvu výkonu (fps), které mají čipy NV oproti ATI (alespoň u současných her).
Takže vždycky platí něco za něco, a pokud má něco někde dnes limitu, určitě tě napadne, jak to vyřešit lépe. Můj příspěvek vycházel ze současného stavu G8x/9x, jak byl navržen někde před 4 až 6 lety. Jaký je počet TMU u G200 už ty pravděpodobně víš (i další zajímavé podrobnosti), já se nechám překvapit (vánoce po půl roce nejsou špatný :) ).

Napsal: pát 16. kvě 2008, 21:33
od no-X
Nevšiml jsem si, že by současné Radeony měly větší výkyvy. Ano, třeba taková RV670 je pomalejší, než G80, ale je celkově pomalejší - nedá se říct, že má větší výkyvy. Pokud bys za výkyvy považoval rozdíl mezi min-FPS a max-FPS, pak by rychlejší G80 vyšla jako méně vyrovnaná.

Výkyvy jsou, ale na duálních kartách či v SLI/CF. To bývá občas způsobeno ovladačem, ale mnohem častěji prostým faktem, je třeba všechny textury nahrát do grafické paměti 2x (do každé karty jednou), což více (nebo na delší dobu) zatíží sběrnici. To se vyřeší až okamžikem, kdy bude uvedena sdílená paměť. Nijak to ale nesouvisí s poměrem ALU:TEX.

Napsal: pát 16. kvě 2008, 23:14
od Herkis
Nevím, nemám chuť se hádat. Jen jsem ti volně přeložil Jawedův povzdech nad nedostatkem TMU u RV670 (pohádej se s ním :) ).

Pro zajímavost: Provedl jsem pár testů s 8800GTS512 v 3DM06 v multitexturingu. Pro dosažení maximálního texelrate (>97% teoretického) je potřeba alespoň 2,8x vyšší frekvence SP. Paměť je limitující, pokud je frekvence paměti nižší než 1,25x frq. jádra - tj. < 750/1500 Mhz při frq. jádra 600 Mhz. Přesto je u her patrný větší vliv přetaktování pamětí, než shaderů.

Napsal: pát 16. kvě 2008, 23:25
od no-X
To je tím, že zvýšením výkonu SPs bys více vytížil TMUs, ale ty by pro zvýšení výkonu své činnosti potřebovaly vyšší propustnost, které se jim nedostává.

Jinak nevím, proč bych se s ním měl hádat, vycházíme spolu velice dobře. RV670 a G94, pokud by byly vyráběné stejným procesem, by byly stejně velké, tedy stejně (na výrobu) nákladné čipy. Při AA/AF jsou i stejně výkonné. Nevím tedy, proč by zrovna RV670 měla mít špatný poměr ALU:TEX, když není o nic pomalejší, než G94.

Napsal: pát 16. kvě 2008, 23:37
od Herkis
Nojo, ale tvojí logikou v tom případě nemá špatný poměr ALU: TEX ani 9600GT. Přesto mají poměry jiné a tedy obě ne zrovna optimální.

Napsal: sob 17. kvě 2008, 07:57
od no-X
Pokud jde čistě o poměr ALU:TEX bez limitace prospustností sběrnice, tak se stačí podívat na výsledky bez FSAA, kdy je RV670 zhruba o 15% rychlejší.

Krom toho - grafický čip se neskládá pouze z TMUs a ALUs - RV670 oproti G94 podporuje DX10.1, HDMI audio, tesselator, powerplay a další features, které samozřejmě konzumují tranzistory a die-space, což znamená, že pro samotné výpočetní jednotky zbývá méně prostoru. Pokud i s tímto omezením RV670 výkonnostně za G94 nezaostává, pak je zřejmé, který čip nabízí výhodnější poměr ALU:TEX a jakým směrem se budou ubírat čipy budoucí - i ty velmi blízké budoucí :wink:

Napsal: sob 17. kvě 2008, 08:11
od blekota je boss
vzhledem k tomu, ze se drtiva vetsina vyvojaru her zameruje na konzole, bylo by imho nejrozumnejsi drzet ten pomer na stejny urovni jako je v pripade Xenosu...
btw je trochu skoda, ze konzole brzdej vyvoj grafiky, ale zase je usmevny, jak ted vsem chodej multiplatformni hry na maximum i na prumernych sestavach :) kupovat si highend ma ted o dost mensi smysl nez driv...

Napsal: sob 17. kvě 2008, 10:13
od BudyCZ
flanker píše:leto bude HW-rove krasne :-D , vubec posledni rok byl na gf jeden z nejlepsich.
Kdy myslite vyplynou prvni benchamrky a unikle vykony?Behem Computexu?
myslím že až v den uvedení na trh pač toto by si asi nikdo netroufl.

Napsal: sob 17. kvě 2008, 10:57
od OBR
čínani to pustěj, hned jak to budou mít v ruce ... ovšem asi s podivnými ovladači ...

Napsal: sob 17. kvě 2008, 11:01
od Aros
blekota je boss píše:vzhledem k tomu, ze se drtiva vetsina vyvojaru her zameruje na konzole, bylo by imho nejrozumnejsi drzet ten pomer na stejny urovni jako je v pripade Xenosu...
btw je trochu skoda, ze konzole brzdej vyvoj grafiky, ale zase je usmevny, jak ted vsem chodej multiplatformni hry na maximum i na prumernych sestavach :) kupovat si highend ma ted o dost mensi smysl nez driv...
Zas je pěkný, že v době, kdy se už naráží na hranici toho, kam až jde zmenšovat, tzn. výkon tímto směrem už navíc moc nebude, se detailnost grafiky přiblížila zase k hranici, že víc už to "nemá cenu" Třeba takové Crysis na full je tak max, co bych třeba já ocenil, nedovedu si představit, že by ještě něco mohlo být detailnější tak abych si řekl: Hm, tak to ještě stojí za to...

Napsal: sob 17. kvě 2008, 11:10
od BudyCZ
OBR píše:čínani to pustěj, hned jak to budou mít v ruce ... ovšem asi s podivnými ovladači ...
no ty jejich předběžné testy jsou právě na dvě věci.

Napsal: ned 18. kvě 2008, 11:17
od Kamikadze
co vyrobni proces? vim, ze ste to nekde vzadu resili, ale na webu jsem nic urciteho nevystaral....
Pokud se ale podivam na specifikace, tak 240SP na nakych 1940MHz, 512-bit sbernice, to prece nemuze byt na 65nm, jak byste to chteli chladit? Ten chladic, co tady byl prezentovan to nikdy nemuze uchladit, navic by to bylo cilene velke. Nebo se mylim?

Podle mne to bude 55nm a pak se mi nabizi otazka co frekvence samotneho jadra? 750MHz ci este vic?

Napsal: ned 18. kvě 2008, 11:24
od dexterav
no má byť 55nm

Napsal: ned 18. kvě 2008, 11:33
od no-X
Kamikadze: A 90nm u G80 ti před vydáním nereálných nepřipadalo? :) Když si uvědomíš, co v architektuře G8x/G9x hřeje nejvíc a kolik toho v GT200 bude, pak by to neměl být problém :)

Napsal: ned 18. kvě 2008, 11:39
od Kamikadze
no-X píše:Kamikadze: A 90nm u G80 ti před vydáním nereálných nepřipadalo? :) Když si uvědomíš, co v architektuře G8x/G9x hřeje nejvíc a kolik toho v GT200 bude, pak by to neměl být problém :)
uznavam, GeForce 8800GTX/Ultra jsou mega karty a dodnes se divim, ze se dokazi uchladit, ale stejne mne to prijde jako hrozne silene, aby to bylo na 65nm. O 10nm mene by tomu cipu sluselo daleko mene.

Ale porad jsme se nak nedobrali k odpovedi na frekvenci jadra. Pokud by to bylo porad 65nm, tak se asi nad 650 ci 700MHz nehnem, ale co na 55nm? 750 ci jeste vic?

Napsal: ned 18. kvě 2008, 12:17
od no-X
Kamikadze: Netvrdím, že to přímo souvisí s frekvencí GT200, ale dělalo 800MHz 65nm RV630 nějaké problémy? Pokud se pamatuju, tak nemálo výrobců šlo i na 830MHz a nebyl to problém ani pro mainstreamovou kartu, kde je vyžadována vysoká výtěžnost. A RV630 byl první 65nm čip, navíc vydaný před rokem.

Přechod 90->65nm zmenšuje plochu jádra teoreticky téměř na polovinu... 55nm proces snižuje plochu jádra, ale vliv na frekvenci moc nemá.

Napsal: ned 18. kvě 2008, 12:41
od Kamikadze
no-X píše:Přechod 90->65nm zmenšuje plochu jádra teoreticky téměř na polovinu... 55nm proces snižuje plochu jádra, ale vliv na frekvenci moc nemá.
Jakto? muzes prosim vysvetlit? Ja mel za to, ze diky mensi plose jadra to muze mit mensi napeti, mene to topi a daji se tomu cpat vyssi frekvence

Napsal: ned 18. kvě 2008, 12:53
od no-X
Základní výrobní procesy jsou:

130nm
90nm
65nm

každý existuje v několika variantách, u nichž se liší dosažitelné frekvence, spotřeba, cena, výtěžnost...

pak jsou half-nodes, neboli optical-shrinks, což jsou zmenšeniny zmíněných procesů - nebývají nijak specificky optimalizované, jde pouze o zmenšení předchozího procesu, není třeba kompletních úprav návrhů čipů pro jejich použití, proto jsou velmi oblíbené. Hlavním důvodem je snížení ceny, tzn.

130nm -> 110nm
90nm -> 80nm
65nm -> 55nm

Od těchto půlkroků nelze čekat žádné zázraky, frekvence zvyšují jen mírně (v některých případech vůbec, nebo i snižují), spotřebu snižují taky jen mírně, ale snižují hlavně cenu (protože zvyšují počet čipů na waffer) a obvykle mají dobrou výtěžnost.

Napsal: ned 18. kvě 2008, 13:42
od socket
ja si myslim ze nvidia tomu da 65nm. :oops:

Napsal: ned 18. kvě 2008, 13:44
od Herkis
no-X píše:Pokud jde čistě o poměr ALU:TEX bez limitace prospustností sběrnice, tak se stačí podívat na výsledky bez FSAA, kdy je RV670 zhruba o 15% rychlejší.

Krom toho - grafický čip se neskládá pouze z TMUs a ALUs - RV670 oproti G94 podporuje DX10.1, HDMI audio, tesselator, powerplay a další features, které samozřejmě konzumují tranzistory a die-space, což znamená, že pro samotné výpočetní jednotky zbývá méně prostoru. Pokud i s tímto omezením RV670 výkonnostně za G94 nezaostává, pak je zřejmé, který čip nabízí výhodnější poměr ALU:TEX a jakým směrem se budou ubírat čipy budoucí - i ty velmi blízké budoucí :wink:
Zase jako obvykle vybíráš jen to, co se hodí do krámu. Nikde nepíšu, že poměr ALU:TEX se nebude ubírat směrem k vyššímu, právě naopak. Ale pokud je RV670 dnes výhodnější a není rychlejší (těch 15% máš z konkrétní aplikace nebo z DDsvěta? - ve verzi HD3850 je pomalejší při cca stejné spotřebě na menším procesu, při srovnatelnější datové propustnosti) někde u tvé argumentace je něco špatně. Máš dostatečné znalosti na to, abys věděl co to je. Nemusíš potom přeskakovat z jednoho argumentu na druhý, jen abys prosadil tu svoji pravdu.

Ale dost diskuse na téma RV670 a G94, i když to s tématem částečně souvisí.

K GT200:
Takže momentálně je odhad (v závorce pravd. údaje pro slabší variantu):
1/ ROP
32 (28 ) ROPs, v 8 (7) skupinách po čtyřech, každá skupina 64 bit MC -> 512 (448 ) bit šířka paměťové sběrnice, paměť GDDR3 512- 1024 MB (448 -896???)
Vylepšení ROPs ???
2/Procesor ( skupina SPs+TMUs)
10 (8 ) procesorů - skupin - každá 3 x 8 SPs, k tomu 8 TMUs
celkem 240 (192) SPs
80 (64) TMUs