ATI/AMD R9xx informace, spekulace, novinky

webwalker · Příspěvek od **webwalker** » úte 23. lis 2010, 09:10

richie08 píše:
webwalker píše:Kde jsem jen já hlupák udělal chybu?
K mým hodnotám jsem dospěl takto:

1. SP = 30/20 SIMD * 890/850 MHz = 1.57
2. DP = 30/20 SIMD * 890/850 MHz * 1.25 = 1.96

(za předpokladu, že SP výkon 5D ALU je stejný jako 4D)

BTW: Nejsou ty frekvence pamětí nějak malé? Pokud vím mluvilo se o vysokorychlostních GDDR5 až na 6GHz. Takhle nejsou o moc vyšší než u Cypressu...

Můj výpočet:
HD5870
1. SP 20SIMDs * 16 * 5 * 2Flops * 850Mhz = 2,72GFlops
2. DP 20SIMDs * 16 * 2 * 1Flops * 850Mhz = 0,544GFlops
HD6970
1. SP 30SIMDs * 16 * 4 * 2Flops * 890Mhz = 3,41GFlops
2. DP 30SIMDs * 16 * 2 * 1Flops * 890Mhz = 0,854GFlops
Poměry
1. SP 3,41/2,72 = 1,25
2. DP 0,854/0,544 = 1,57

Butch · Příspěvek od **Butch** » úte 23. lis 2010, 09:12

Zub píše:Já bych se rád orientoval v tom udaji TDP. HD 3870 měla 107W, ve finále si v zázěži o těch 100W řekla.
6850 má TDP 150W a když se spočítá spotřeba sestavy zhruba po dílech, tak vychází, že si karta o těch 150W v zátěži taky řekne. Logicky by se dalo říct, že pokud má HD 6950 TDP 220W, tak proč by to tentokrát mělo být jinak a o těch 200W by si v zátěži neměla říct?

6850 ma TDP 127W, ale vezme si v zatezi 120-150W
6870 ma TDP 151W, ale vezme si az kolem 140-170W +/-

Podle ruznych testu na netu

Pokud bude mit 6950 TDP 220W, myslim si ze si o tech 250W prikonu muze klidne rict.

webwalker · Příspěvek od **webwalker** » úte 23. lis 2010, 09:51

To: Butch
Podle xbitlabs jsou spotřeby na Crysis následující:
6850 = 91W
6870 = 125W

Zub · Příspěvek od **Zub** » úte 23. lis 2010, 09:54

Butch píše:
6850 ma TDP 127W, ale vezme si v zatezi 120-150W
6870 ma TDP 151W, ale vezme si az kolem 140-170W +/-

Podle ruznych testu na netu

Pokud bude mit 6950 TDP 220W, myslim si ze si o tech 250W prikonu muze klidne rict.

díky, v tom případě s mojim zdrojem (seansonic 430W) nemá smysl čekat na novou řadu.
Podle velmi hrubého odhadu si v přetaktu může vzít 270W, připočtu k tomu můj PC kterej papá 100W, tak olizuju hranici 400W

Což mě asi utvrdilo o koupi 6850. Zatim nikam nepospícham, v klidu si počkam zda se někde objeví pod hranici 4k. Přijde mi tragikomický, jak v czc mají safíra za 4700kč a už dva dny mají stále 10ks. Nikdo je od nich nekupuje

Butch · Příspěvek od **Butch** » úte 23. lis 2010, 10:12

webwalker píše:To: Butch
Podle xbitlabs jsou spotřeby na Crysis následující:
6850 = 91W
6870 = 125W

Jasny, ale vsude pisou neco jineho.
Zalezi podle konktetniho kusu karty i podle testu. Zubovi jde predpokladam o maximum(spicky) kvuli zdroji a ne prumernou spotrebu.

Napriklad http://www.techpowerup.com/reviews/HIS/ ... 70/27.html
6870 max odber 163W

http://www.techpowerup.com/reviews/ASUS ... Cu/26.html
6850 max odber 125W

Vsude jsou ty udaje ruzne, proto jsem napsal rozmezi. Nekde vyzdimaji z 6850tky az 150W(nejspis po OC)

Radsi ale zpet k tematu o 69XX

richie08 · Příspěvek od **richie08** » úte 23. lis 2010, 11:16

webwalker píše: Můj výpočet:
HD5870
1. SP 20SIMDs * 16 * 5 * 2Flops * 850Mhz = 2,72GFlops
2. DP 20SIMDs * 16 * 2 * 1Flops * 850Mhz = 0,544GFlops
HD6970
1. SP 30SIMDs * 16 * 4 * 2Flops * 890Mhz = 3,41GFlops
2. DP 30SIMDs * 16 * 2 * 1Flops * 890Mhz = 0,854GFlops
Poměry
1. SP 3,41/2,72 = 1,25
2. DP 0,854/0,544 = 1,57

Právě proto nemám rád tyhle teoretické hodnoty - vůbec totiž nevypovídají o reálném výkonu. Z tvého teoretického výpočtu vyplývá, že 4D jednotka je o 20% pomalejší než 5D. To ale není vůbec pravda a s realitou to nemá nic společného. Ve skutečnosti má mít 4D jednotka výkon stejný nebo o něco vyšší než 5D. Tedy reálný aritmetický výkon a tedy i výkon ve hrách vzroste cca přímou úměrou k počtu SIMDs a frekvenci.

Jinak tvoje výpočty samo platí, jenom to nic absolutně neříká jaký bude karta grafický výkon. A nám jde o to zjistit reálný nárůst grafického výkonu a ne řešit teoretické hodnoty v marketingových slajdech.

no-X · Příspěvek od **no-X** » úte 23. lis 2010, 11:19

k aritmetickému výkonu... počítá se vždy maximální teoretický, tzn.:

frekvence čipu * počet výpočetních jednotek * množství operací (které je daná jednotka schopna provést) v taktu

HD5870:
850 (MHz) * 1600 (SPs) * 2 (umí MAD, tzn. MUL+ADD, tedy vynásobení a sečtení v jednom taktu) = 2,72 TFLOPS

HD6870:
900 (MHz) * 1120 (SPs) * 2 (MAD) = 2,02 TFLOPS

HD6970 (spekulace):
890 * 1920 * 2 = 3,42 TFLOPS (tzn. asi 26% nad HD5870)

Sranda to byla třeba u X1900 / R580. Zatímco u současných čipů jsou výpočetní jednotky z hlediska základního aritmetického výkonu rovnocenné, u starších čipů tomu tak nebylo. Pixel shader procesor R580 se skládal z:

vec3 (3D) jednotky, z nichž každá uměla MAD (tzn. MUL+ADD)
1D (skalární) jednotky, která k ní byla přidružená a uměla MAD
vec3 (3D) SFU jednotky, z nichž každá uměla ADD
1D (skalární) SFU jednotky, která byla přidružená k předešlé a uměla ADD

tzn. ve stejném pořadí:
6 FLOPS (3x dvě operace)
2 FLOPS (1x dvě operace)
3 FLOPS (3x jedna operace)
1 FLOP (1x jedna operace)
celkem: 12 FLOPS

A těchto procesorů měla R580 celkem 48, tzn. 48 * 12 * 650 (MHz) = 374,4 GFLOPS pro pixel shading. Pak měla R580 ještě samostatné procesory pro vertex shading, ale jejich specifikace si nepamatuju... asi 8 (počet) * 5 (vec5?)... takže asi ještě + 26 GFLOPS pro vertex shading(?)

richie08 · Příspěvek od **richie08** » úte 23. lis 2010, 11:47

Absurdní situace je, když je Cayman ve všech důležitých částech narostl o těch 50% než Cypress. A jediné co pokulhává je teoretický aritmetický výkon, který narostl jen o 26%. Pochybuju že by si inženýři v ATi zabili výkon tím, že by poddimenzovali ALUs. Tedy pokud je relevantní jen reálný výkon i pro inženýry ATi, tak pak pokud chceme odhadnout jejich záměr s návrhem čipu, je pro nás také relevantní jen reálný výkon.

Teoretické hodnoty jsou jenom informativní, nic víc neříkají. Stejný problém je dělat závěry z nižšího teoretického výkonu čipů nV. Porovnávat má smysl pouze aplikační výkon.

no-X · Příspěvek od **no-X** » úte 23. lis 2010, 12:02

Paradoxně jim imho jde o teoretický výkon na mm², případně teoretický výkon na watt. Jenže jejich cíl je HPC, takže DP. A se 4D ALUs nacpou na stejnou plochu vyšší teoretický DP výkon než s 5D ALUs, které byly z 20% nevyužité.

yuri.cs · Příspěvek od **yuri.cs** » úte 23. lis 2010, 12:12

Ovsem prechod z 5 slozkovych na 4 slozkove se v prumeru pozitivne projevi i pri grafickych operacich.

V pameti me lezi nejaky test /snad na B3D/, kde sledovali vyuziti vsech slozek v ALU v realnem nasazeni. IIRC se pocet vytizenych jednotek 5 ani nepriblizil, naopak v tehdy protezovane DX10 Lost Planet to bylo and pod 3 - proto R600 Lost Planet fiasko.

ArgCZ · Příspěvek od **ArgCZ** » úte 23. lis 2010, 12:29

takže je dost možné že 480 4D jednotek udělá to samé co 480 5D jednotek?

richie08 · Příspěvek od **richie08** » úte 23. lis 2010, 13:12

IMHO dnes inženýry teoretický výkon nezajímá. Stejně jako spalovací motor a jeho výkon můžeš navrhnout podle nějakých teoretických středních tlaků ve válci a obejmu válce (což se před 10 lety a dříve skutečně dělalo a bylo to šíleně nepřesné), tak dnes máš simulační software, který ti spočítá reálný výkon s přesností do 5%. Nejsem sice žádný odborník na návrhy čipů, ale navrhovat dnes čip bez simulace jeho reálného výkonu by byla sebevražda. Pokud vím tak AMD používá podobný software už od dob K7.

Takže podle mne jim ze simulace vypadlo, že 4D jednotka má reálný výkon na setu instrukcí +3% v SP, +15% v DP a to vše při menším počtu tranzistorů -10%. Celkově je lepší než 5D -> OK nasadíme ji. IMHO vůbec neřešili že si pohorší v nějakých teoretických hodnotách SinglePrecision.

BTW, jestli tomu době rozumím, tak výkon v DP tedy je stejný, protože potřebuje celou ALU na dva takty (ať už obsahuje 5 nebo 4 SPs)?

ArgCz: JJ, právěže 4D jednotka je stejně výkonná jako 5D. Dokonce by měla být i v něčem lehce výkonnější.

no-X · Příspěvek od **no-X** » úte 23. lis 2010, 13:41

richie08: podívej se na první stránky všech prezentací DX10-DX11 čipů ATi... mezi prvními slovy a prvními grafy tam vždy je, že mají nejvyšší efektivitu (teoretický aritmetický výkon na plochu nebo na watt) na trhu... tohle je pro ně velmi podstatné

ArgCZ: V DP ano. U her to úplně jednoznačné nebude a myslím, že ta efektivita bude tak o 5-10% nižší. 5D myslím ATI zvolila ze dvou důvodů (možná jich bylo víc...): první jsou geometry shadery, kterým 5D uspořádání nejvíc vyhovovalo (naopak G80 moc dobře nedělaly, proto o nich nikdy nebylo slyšet tolik, jako je třeba teď slyšet o teselaci) a druhá věc bylo SF - special functions. Zatímco R300-R5x0 byly organizované jako:

[ □□□ | □ ] = hlavní ALU
[ ■■■ | ■ ] = mini ALU

□ = MAD
■ = ADD + SF

...tak ATI potřebovala zachovat funkcionalitu hlavní ALU (tzn. 4D MAD), ale zároveň potřebovali SF jednotku. Ta ale byla v případě R300-R5xx zbytečně komplexní, takže její vec3 část vypustili a zbylo:

□□□ | □ | ■

u Xenosu (xbox) to seskupili jako vec4 + skalární jednotku:

[ □□□□ | ■ ]

u R600, kvůli lepší efektivitě, jako superskalární jednotku:

[ □ | □ | □ | □ | ■ ]
□ = MAD (+ u RV670 přibylo 1/4 DP MAD)
■ = MAD + SF

tím pádem měli 5D jednotku extrémně efektivní pro geometry shading, zároveň tím vyřešili podporu SFU a krom toho měli jistotu, že pokud bude hra z hlediska aritmetiky úzce optimalizvaná pro Xbox, poběží skvěle i na R600. Stejně tak že na R600 dobře poběží kód optimalizovaný pro R300-R500, protože 4D MAD jednotka v podstatě zůstala. Cayman by v podstatě měl mít:

[ □ | □ | □ | □ ]

...kde každá jednotka umí MAD + 1/4 DP MAD a navíc jsou společně schopny "emulovat" SF... takže v okmažiku, kdy by se objevil kód, který intezivně využívá SF nebo geometry shading, by efektivita ALU byla nižší, než u současných čipů (protože celá ALU bude zafláknutá tím, co původně zvládala pátá jednotka). Pro kód, který obojí využívá málo, zase bude výhodnější konfigurace Caymanu. Takže se nedá říct jednoznačně, že to bude lepší... někdy lepší, někdy horší. Jednoznačně lepší to bude pouze u DP

yuri.cs píše:Ovsem prechod z 5 slozkovych na 4 slozkove se v prumeru pozitivne projevi i pri grafickych operacich.

V pameti me lezi nejaky test /snad na B3D/, kde sledovali vyuziti vsech slozek v ALU v realnem nasazeni. IIRC se pocet vytizenych jednotek 5 ani nepriblizil, naopak v tehdy protezovane DX10 Lost Planet to bylo and pod 3 - proto R600 Lost Planet fiasko.

To byl opět marketing, kdy se nVidia snažila mocímermo prosadit, že každý čip, který nemá skalární architekturu, je neefektivní, protože nemůže být efektivně vytížený (mimochodem, GF104 není skalární, ale je superskalární, jako čipy ATI, jen se tím nVidia nechlubí). Naopak Jawed z B3Df ukázal pár simulací, podle kterých bylo možné unifikované jádro R600 vytížit efektivněji. Ono když si vezmeš, jaký měla R600 aritmetický výkon, tak i kdybys ho 2/5 nevyužil, zůstane pořád vyšší, než aritmetický výkon 8800GTS, proti které R600 stála, takže ani teoreticky by to neměl být problém způsobující nějaké fiasko. LostPlanet a HAWX jsou hry, ke kterým nVidia zamezila ATI přístup, takže trvalo dlouho, než ATI přišla s optimalizacemi v driverech. To byl celý problém. Když se podíváš na pozdější test na ComputerBase, je HD2900XT v Lost Planet nad 8800GTS dokonce i se zapnutým anti-asliasingem.

yuri.cs · Příspěvek od **yuri.cs** » úte 23. lis 2010, 14:45

Skoda, ze ten test nemuzu najit :/
Samozrejme, ze to byla nV hra, kazdopadne diky za ten na CB.de "HD2900XT s odstupem casu"

Takze otazkou vysledne realne efektivity zustava, jak dalece se v praxi vyuziva GS a kolik je v kodu ins pro SF jednotku /pokud to dobre chapu, tak: sin, cos, sqrt, log, pow, .../? Simulace a pozorovani musi dat inzenyrum v ATi jasnou odpoved.

tfoltynek · Příspěvek od **tfoltynek** » úte 23. lis 2010, 15:13

Dobry den panove. Muzete mi prosim vyvratit muj nazor.
Muj odhad vykonu 6970:
Pocitam s tim ze vykon 4D a 5D je +-stejny potom 6850 v CF ma presne 1920SP.
6850CF vykonove vyrovna 5970 pak 6970 ji musi predehnat bez problemu. Duvodem bude jeste vyssi frekvence jadra nez 6850 a snad vyhoda lepsiho skalovani jednoho jadra.

Podobne to funguje i u 5770CF proti 5870

no-X · Příspěvek od **no-X** » úte 23. lis 2010, 15:26

yuri.cs: Ano, je to tohle

tfoltynek: CF dvou HD5770 je v mnoha hrách výkonnější, než jedna HD5870. To je dáno dvojnásobným geometrickým výkonem. Jenže geometrický výkon HD5970 a 6970 je zhruba stejný, takže v tom žádná výhoda, která by mohla citelně posunout 6970 dopředu, nebude.

Další věc je, že HD6800 má dva rasterizéry, stejně jako HD6970. Takže v tomhle ohledu taky nebude mít moc náskok. A počet ROPs taktéž zůstává stejný, stejně tak i šířka sběrnice.

Pro dosažení dvojnásobného výkonu je třeba zdvojnásobení všech částí čipu. Tady se ale zdvojnásobila jen část (a to menší část, než při přechodu z HD4800 na HD5800)

webwalker · Příspěvek od **webwalker** » úte 23. lis 2010, 16:12

no-X píše:Další věc je, že HD6800 má dva rasterizéry, stejně jako HD6970. Takže v tomhle ohledu taky nebude mít moc náskok. ...

Podle leaku HD6990 (pokud je pravdivý) to vypadá, že by HD6970 měl mít prakticky dvojnásobný geometry throughput než HD6870? IMHO

no-X · Příspěvek od **no-X** » úte 23. lis 2010, 16:20

Ano, Cayman má dvakrát triangle setup.

crux2005 · Příspěvek od **crux2005** » úte 23. lis 2010, 16:38

tá fólia s údajmi HD 6990 je fake: http://www.3dcenter.org/blog/leonidas/d ... ionsfolien
ale veľmi dobrý...

teraz mi zaplo, že na odhalenie stačilo prepočítať aritmetický výkon

3840 * 2 * 775 = 5,952 TFLOPs a nie uvedených 6 TFLOPs

no-X · Příspěvek od **no-X** » úte 23. lis 2010, 17:45

Ale tam není napsáno nic o 775MHz

775MHz je údaj, který z tohohle byl vypočten...

ATI/AMD R9xx informace, spekulace, novinky

O kolko percent bude Cayman vykonnejsi ako Cypress?

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky

Re: ATI/AMD R9xx informace, spekulace, novinky