R600 - technologie, možnosti architektury

Grafické karty s libovolným GPU firmy AMD/ATI (např. Rage, Radeon).

Moderátoři: morke, Walker1134, Wilik

no-X
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 24. úno 2004
Bydliště: Č.Budějovice

Příspěvek od no-X »

oyza: Jen bych dodal, že mluvil o edge-detect CFAA modech a ty nárůstu výkonu se netýkají AA, ale adaptive AA (což je rozdíl).

jo jinak SirEric je fajn, občas chodí (no teď zrovna ne, důvody známe) na některé fóra a krom jiného je to ten člověk, který po vydání X1800XT/R520 udělal ring-bus patch, který v OpenGL hrách při AA4x zvýšil výkony o třetinu. Taky napsal nový OpenGL shader compiler a významně se podílel na těch nových OpenGL driverech.
Nejlepší moderátor ve výslužbě
oyza
Začátečník
Začátečník
Uživatelský avatar
Registrován: 05. úno 2007
Bydliště: Praha

Příspěvek od oyza »

no-X píše:oyza: Jen bych dodal, že mluvil o edge-detect CFAA modech a ty nárůstu výkonu se netýkají AA, ale adaptive AA (což je rozdíl).

jo jinak SirEric je fajn, občas chodí (no teď zrovna ne, důvody známe) na některé fóra a krom jiného je to ten člověk, který po vydání X1800XT/R520 udělal ring-bus patch, který v OpenGL hrách při AA4x zvýšil výkony o třetinu. Taky napsal nový OpenGL shader compiler a významně se podílel na těch nových OpenGL driverech.
- jasan od technologii ses tady ty - sem to tam doupravil .) btw bys mohl vysvetlit aa vs adaptive aa...
AMD X6 1090T cooled by Thermalright Ultra 120 Extreme + Noctua, Asus M4A78T-E, 6G OCZ XTC Platinum, Toxic HD6870, SSD, Asus Xonar D1 - live at Spire Swordfin, powered by Enermax Liberty 500W. Viewed by EIZO 22" + 19" Dell.
no-X
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 24. úno 2004
Bydliště: Č.Budějovice

Příspěvek od no-X »

AA, tedy většinou míněno jako MSAA, je vyhlazování hran (polygonů)

bez AA / s AA

Obrázek Obrázek


Adaptivní AA (AAA, AA transparentních textur) vyhlazuje transparentní textury, konkrétně přechody průhledné a neprůhledné oblasti. Transparentní textury se používají obvykle pro vykreslení plotů, listů, někdy větví, trávy atp., prostě všeude, kde by to jinak stálo moc polygonů (jeden z části průhledný obrázek to vyřeší s menšími nároky na hardware)

bez AAA / s AAA

Obrázek Obrázek

pro snazší pochopitelnost - ten plot je jen textura (obrázek) plotu a vnitřky "ok" jsou vykresleny nějakou barvou, která je při vykreslování ve hře nastavena jako průhledná, tzn. obrázek plotu zůstane viditelný a zbytek je průhledný. Problém je v tom, že každý pixel té textury je buď nastaven jako průhledný, nebo jako neprůhledný a tudíž jsou okraje neprůhledných oblastí zubaté. A právě ty Adaptivní AA vyhlazuje.

//edit: doufám, že jsem to nenapsal moc složitě... kdyžtak bych to vysvětlil ještě jinak

...jinak ten obrázek s AA vpravo nahoře, to je plnohodnotný MSAA 18x - což zatím žádný grafický čip nezvládá (ani dva čipy v SLI nebo CrossFire)
Nejlepší moderátor ve výslužbě
blekota je boss
Začátečník
Začátečník
Uživatelský avatar
Registrován: 05. črc 2006
Bydliště: okolí Hradce Králové

Příspěvek od blekota je boss »

proc se zaobiraj s AAA? ATI preci nahradi adaptivni vyhlazovani EATM ne? je preci mnohem min narocnej ze?
no-X
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 24. úno 2004
Bydliště: Č.Budějovice

Příspěvek od no-X »

Právě o tom mluví... implementovali EATM a tím získali při AAA 2x-3x lepší výsledky. Z pohledu "zvenku" je to ale pořád nazýváno AAA, ale původní algoritmus (SS) byl nahrazený rychlejším (EATM)
Nejlepší moderátor ve výslužbě
Stratos
Začátečník
Začátečník
Uživatelský avatar
Registrován: 05. zář 2003
Bydliště: Hvožďany
Kontaktovat uživatele:

Příspěvek od Stratos »

a kdy to (EATM) bude funkcni? ja to v ovladacich teda nemam jak sem koukal :)
no-X
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 24. úno 2004
Bydliště: Č.Budějovice

Příspěvek od no-X »

chjo... jinak: v ovládacím panelu se NIC NEMĚNÍ. Pouze když is zaškrtneš "Adaptive AA", tak se ti místo původní verze adaptivního AA zapne EATM.
Nejlepší moderátor ve výslužbě
Hosenfeld
Začátečník
Začátečník
Uživatelský avatar
Registrován: 01. dub 2006
Bydliště: Plzeň

Příspěvek od Hosenfeld »

no-X píše:chjo... jinak: v ovládacím panelu se NIC NEMĚNÍ. Pouze když is zaškrtneš "Adaptive AA", tak se ti místo původní verze adaptivního AA zapne EATM.
Promiň no-Xi jestli kladu nějaký stupidní dotazy, ale jestli jsem to dobře pochopil, tak na současných Catalystech 7.5 když se na HD2900XT zapne v ovladačích Adaptive AA, tak se zapne EATM a ten původní Adaptive AA už se nedá zapnou? A na R5xx je to jak se 7.5? Já když jsem to EATM zkoušel před pár týdny, tak to v dost hrách blbo.
MB: ASUS P8Z77-V LX | CPU: Intel® Core™ i5-3570K | RAM: 8x2GB DDR3 1600MHz Kingston | GPU: Gigabyte GTX680 | HDD: SSD Intel320 120GB+ 3TB HDD | Zdroj: Seasonic 620W | Case: Thermaltake Matrix VX VD3000BWA | Monitor: Dell U2410 | Sound: Creative X-Fi XtremeGamer
oyza
Začátečník
Začátečník
Uživatelský avatar
Registrován: 05. úno 2007
Bydliště: Praha

Příspěvek od oyza »

no-x stacilo mi napsat, ze adaptivni je pru pruhledny textury a hotovo .)
AMD X6 1090T cooled by Thermalright Ultra 120 Extreme + Noctua, Asus M4A78T-E, 6G OCZ XTC Platinum, Toxic HD6870, SSD, Asus Xonar D1 - live at Spire Swordfin, powered by Enermax Liberty 500W. Viewed by EIZO 22" + 19" Dell.
no-X
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 24. úno 2004
Bydliště: Č.Budějovice

Příspěvek od no-X »

V diskusi se Sirem Ericem Demersem na téma R600 (volné poračování zmíněného interview) se objevilo několik zajímavých informací, které jsou zároveň odpověďmi na otázky, které se tu v minulých týdnech a měsících objevily...

---

Q: Speaking about better library designs, do you think it would benefit you to move to AMD's tools/libraries/processes later on?

A: I won't comment on future projects, but that is now a real possibility.
---

Q: ...the merger with AMD presented situations that might have in some ways impacted the roll out of R600...

A: When we heard about it last summer, the chip was pretty much finished and on its way to manufacturing, or even back. ... We do interact with a lot of new engineers now ... From a time to launch, marketing, PR standpoint -- It's possible those were affected...
---

Q: Is there a difference in those considerations when moving from say, 90->80nm or 90->65nm?

A: Well, all physical aspects depend on the technology. This includes the elements that make up ASICs (stdcell, memories, macros, etc...). We need to re-characterize and update all libraries and models associated with those. This can mean new synthesis, new P&R rules, new macro designs, etc... This affects everything from the netlist on down, but it can even have ramifications up through the architecture, as you might need to change some functionality, re-pipeline, change your memory usage, for example. It's a lot of work. - 1/2 nodes are a little easier, as most things can be simply optically shrunk -- You have to design with that in mind, but it can be easier. Famous last words.
---

Q: Do they have a group within ATI strictly working on future technologies?

A: We sort of did at the time we started R600, but we clearly have a group for that now.
---

Q: Which team at ATI creates the requirements and how soon in the development process are they created? 1 year? 2 years? 3 years?!?

A: A new architecture like R6xx took over 3 years of design work. 36 months for a new design is probably a minimum, at this time, considering the shear number of transistors (and associated design) involved. Follow on products, typically follow within 6 months or so, and don't need a huge amount of redesign. In the last year of design, very little change occurs -- Configs, features, etc... are all locked down. Only clock can change a little afterwards.
---

Q: A13 revision was fabricated in January, but released in May...

A: Most of the work was on the drivers -- 2 OS's, new arch, DX9, DX10 and OGL. Work is still ongoing. I'm not sure on the silicon dates, off hand. But at some point, it just made more sense to launch all at the same time.
---

Q: So, can we conclude, that resolving AA samples in INT type (non-HDR type) of surfaces is actually under-utilizing overall throughput capacity of moving data, inside the chip?

A: In a way, yes. But it's not simple -- Some busses are under utilized, but that doesn't mean you could easily go faster. For example, we only filter in float; but having int doesn't make it go faster, since the number of units doesn't change (we actually promote most things to float).
---

Q: I saw that in tech specs for HD2900 there is listed "bicubic fitlering"...

A: Bicubic is supported, and was intended for some OS font features (I think). It's not exposed at this time. I don't believe that DX allows it to be exposed. It does not operate at the same rate as bilinear. Might show up in OGL.
---

Q: AF drop is very bad...

A: The AF hit can be more significant on R600 at this time. It should show higher quality in exchange (not on the LOD isotropy front, but on the mipmap transition front). I believe some of that will be addressed, in part, in future drivers. I can't promise a % improvement at this time.
---

Q: why does the MSAA algortihm cost so much frames? The memory interface is much wider than R580, the compression algoritm are better and the ROPs can do more color/z compares than R580.

A: The actual number of units working on AA wrt to R580 isn't substantially different - thought the new ones are focused on 64b pixels. There are cases where moving the resolve to the shader has hurt performance -- That's typically where the frame rate is very high (i.e. > 100fps). Those are cases we were aware of and only really show up in benchmarks, not so much in real game play. It sort of caps the max fps to 200~300 or so, depending on resolution. Again, not something we felt would seriously impact real game play. It can also be mitigated by selecting the proper AA modes.

As for workloads in various apps, yes, it can be improved in some cases. Without specifics, it's hard to say. Overall, I expect the *scaling* of AA to be similar to slightly worst than R580, for "regular" pixels, but still to be higher than R580 in absolute terms.

But anytime 64b pixels will be invoked (i.e. HDR games), I expect performance of R600 to be substantially higher than R580.

---

Q: However, you can't deny that R5xx/RV5xx are a perfect example of what you were talking about with features taking die space and going unused.

A: Nope, it's generally simply being late to the game. By then, the channel is full and the OEMs have their deals. Getting deals is simply not possible (most OEMs for mainstream and below) or very difficult (above mainstream, you need to show a huge delta). It's not a competition when you are late. R5xx was fine and price/performance was quite excellent. It was, at least, 4 months late.
---

Q: The implication is that R600's design and hardware attributes are fantastic and the drivers are poo-pooing all over performance.

A: I did not mean to imply that. It's a good and reasonable design. The drivers are very stable and deliver the expected performance in many cases. There are certainly quite a few left to address. If someone is expecting a 2x boost in all apps, well, I'm sorry, but it won't happen. There's a couple of places where that kind of delta is possible, and a lot where 10 ~30% is possible too. But we are shipping a good product at an awesome price. From a functional aspect, there's more to do too (such as more custom filters, fixing some of the video stuff, etc...)
---

Q: Where has R6xx demonstrated that its ALU:TEX ratios are more optimal than the competition's?

A: In yesterday's games, and even a lot of today's game, the ALU:TEX ratio selected is probably overkill. But when I look at some of the newest games, or some coming down the pipe, or even some of our demoes, a ratio of 4:1 seems pale -- Shaders are coming with 10:1, 20:1 ratios -- Even with the most advance filters, those apps are still ALU bound. That is more where we shot for.
---

Q: Do you have a refresh in the works?

A: Always are new products in the works. That's how this marketplace works.
---

Q: Was there ever a set of simulations run comparing R600 + R580 RBEs vs the final design, and if so what were the interesting datapoints that came out?

A: Yes, there were hundreds. Yes, a few things came out in the final design, but, in general, it was as expected. -- Resolve was moved into the shader, so that can't really get compared.
Nejlepší moderátor ve výslužbě
short24
Začátečník
Začátečník
Registrován: 07. pro 2004
Bydliště: Praha

Příspěvek od short24 »

pls. slo by to prelozit do cestiny s no-x stanoviskem/komentarem?
Intel i5-8600K GB GA-Z370 HD3P HyperX Predator 16GB (Kit 2x8GB) 3000MHz DDR4, CL15 ASUS Strix GeForce GTX 970 Corsair HX620, LOGITECH MX510, EIZO ColorEdge CS2730 (8.domaci generace - 486DX66, PentiumPro200, Athlon SlotA 550Mhz, Athlon Tbird 1400Mhz, Athlon Barton 2500+, Athlon Dual core Opteron 170,i5-2500K)

vodnik: SilentiumPC Navis Pro 240 NE VZDY JSEM ON-LINE, NENI CAS :[
no-X
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 24. úno 2004
Bydliště: Č.Budějovice

Příspěvek od no-X »

že jsem se na to nevy.... :-D
Nejlepší moderátor ve výslužbě
oyza
Začátečník
Začátečník
Uživatelský avatar
Registrován: 05. úno 2007
Bydliště: Praha

Příspěvek od oyza »

je to jako vzdy free preklad, takze chyb tam je plno :) je to vytrzeny z kontextu tak vi buh... no-x to jiste doladi a upresni a berte to s rezervou, pac tomu panovi nerozumim :)
no-X píše: Q: Speaking about better library designs, do you think it would benefit you to move to AMD's tools/libraries/processes later on?

A: I won't comment on future projects, but that is now a real possibility.
Mluvite o lepsich navrzich knihoven, myslite ze to pro vas bude vyhodou presunout je do amd nastroju/knihoven/procesu pozdeji?

Nebudu komentovat projekty, ale nyni je to skutecne mozne.
---
Q: ...the merger with AMD presented situations that might have in some ways impacted the roll out of R600...

A: When we heard about it last summer, the chip was pretty much finished and on its way to manufacturing, or even back. ... We do interact with a lot of new engineers now ... From a time to launch, marketing, PR standpoint -- It's possible those were affected...
... je na snade, ze spojeni s amd ovlivnilo v urcitych smerech vydani r600...

Kdyz jsme o tom dozvedeli minule leto, chip byl vesmes hotov a byl na sve ceste do vyroby, mozna uz i na ceste zpet... Jsme ted ovlivneni mnoha novymi inzenyry... od casu k vydani, marketingem, z hlediska PR... je mozne, ze se to na tom projevi...
---
Q: Is there a difference in those considerations when moving from say, 90->80nm or 90->65nm?

A: Well, all physical aspects depend on the technology. This includes the elements that make up ASICs (stdcell, memories, macros, etc...). We need to re-characterize and update all libraries and models associated with those. This can mean new synthesis, new P&R rules, new macro designs, etc... This affects everything from the netlist on down, but it can even have ramifications up through the architecture, as you might need to change some functionality, re-pipeline, change your memory usage, for example. It's a lot of work. - 1/2 nodes are a little easier, as most things can be simply optically shrunk -- You have to design with that in mind, but it can be easier. Famous last words.
Je zde nejaky rozdil v uvahach/navrzich kdyz se prechazi z 90->80nm nebo z 90->65nm?

Hmm, vsechno zalezi na technologii. Zahrnuje to prvky ktere tvori ASICs(stdcell, pameti, makra, atd.) Musime znovu navrhnout a predelat vsechny knihovny a modely spojene s timto. To muze znamenat nova slouceni, nova P&R pravidla, novy navrh maker atd... Ovlivni to vsechno od "netlist on down?"(tak to fakt netusim), ale muze to take vest ke zmenam architektury, predelani piplines, vyuziti pameti.... Spousta prace. polovicni nodes(uzly - osvetli asi no-x)jsou o neco "lehci" a stejne tak spousta veci muze byt jednoduse opticky zestihlena. (famous last words? no, kdybych tomu rozumnel tak mozna jo)
---
Q: Do they have a group within ATI strictly working on future technologies?

A: We sort of did at the time we started R600, but we clearly have a group for that now.
---
Maji(spis mate - asi myslel AMD) nejakou skupinu uvnitr ATI primo urcenou pro budouci technologie?

jakousi skupinu jsme meli uz kdyz jsme zacinali s r600... ted jiz mame pro to skupinu(mlzi :) )
---
Q: Which team at ATI creates the requirements and how soon in the development process are they created? 1 year? 2 years? 3 years?!?

A: A new architecture like R6xx took over 3 years of design work. 36 months for a new design is probably a minimum, at this time, considering the shear number of transistors (and associated design) involved. Follow on products, typically follow within 6 months or so, and don't need a huge amount of redesign. In the last year of design, very little change occurs -- Configs, features, etc... are all locked down. Only clock can change a little afterwards.
Ktery team v ATI stvoril pozadavky a jak brzo v procesu vyvoje se tvorili? Rok, dva, tri?

Nova architektura jako r600 zabere kolem 3 let navrharske prace. 36 mesicu pro novy navrh je pravdepodobne minimum, v soucasnosti s prihlednutim na mnozstvi tranzistoru a prislusneho navrhu. (ted fakt netusim co chtel rict... Nasledujici produkty (revize?!?), obvykle nasleduji po 6 mesicich nebo tak a nepotrebuji zadne velke predelavky.) V poslednim roce navrhu se daji delat jiz jen velmi male zmeny - configy, vychytavky, atd... vsechno je uzamceno. Pouze takty se daji menit trochu pozdeji.
---
Q: A13 revision was fabricated in January, but released in May...

A: Most of the work was on the drivers -- 2 OS's, new arch, DX9, DX10 and OGL. Work is still ongoing. I'm not sure on the silicon dates, off hand. But at some point, it just made more sense to launch all at the same time.
Revize a13 byla vyrobena v lednu, ale vysla az v kvetnu....

Bylo spousty prace na ovladacich - 2 operacni systemy, nova architektura, dx9, dx10 a opengl. Stale na tom pracujeme. (??? Ale nekde to dava vetsi smysl vydavat vse najednou...)
---
Q: So, can we conclude, that resolving AA samples in INT type (non-HDR type) of surfaces is actually under-utilizing overall throughput capacity of moving data, inside the chip?

A: In a way, yes. But it's not simple -- Some busses are under utilized, but that doesn't mean you could easily go faster. For example, we only filter in float; but having int doesn't make it go faster, since the number of units doesn't change (we actually promote most things to float).
* NO-X parketa pro tebe....AA, samples, typ int a pozdeji i float, surface - go on....

Muzeme soudit, ze "resolving AA vzorky typu INT (ne typu hdr) povrchu" momentalne nedostatecne vyuzivaji celkovou vykonovou kapacitu prenosu dat uvnitr chipu?

Svym zpusobem ano. Ale neni to jednoduchy. Nektere sbernice jsou nevytizene, ale to neznamena, ze je muzete lehce donutit pracovat rychleji. Priklad - my pouze filtrujeme ve float, ale ikdyby to byl int, nebude to rychlejsi, dokud se nezmeni pocet jednotek(momentalne prosazujeme vice float)
---
Q: I saw that in tech specs for HD2900 there is listed "bicubic fitlering"...

A: Bicubic is supported, and was intended for some OS font features (I think). It's not exposed at this time. I don't believe that DX allows it to be exposed. It does not operate at the same rate as bilinear. Might show up in OGL.
Vsiml jsem si v technicke specifikaci k HD2900 ze je vyjmenovan bikubicky filtr...

ano je podporovan a byl zamyslen pro nejakou OS "vychytavku" fontu(aspon myslim). nyni neni pristupny a neverim, ze dx dovoli aby byl pouzit. nepracuje stejne "vykonne" jako bilinearni. Mohl by predvest v OGL.??
---
Q: AF drop is very bad...

A: The AF hit can be more significant on R600 at this time. It should show higher quality in exchange (not on the LOD isotropy front, but on the mipmap transition front). I believe some of that will be addressed, in part, in future drivers. I can't promise a % improvement at this time.
tohle nechapu, pac on mu oznamuje, ze AF propad je velmi spatnej a Eric odpovida, ze AF "hit"(nechapu co to ma bejt) muze byt jeste dulezitejsi. Muze ukazat vetsi kvalitu ve vymene(ne v LOD isotropy fron, ale v mipmap transition front???) Veri, ze to bude adresovano?/zahrnotu v budoucich ovladacich, nemuze slibit % narust...
---
Q: why does the MSAA algortihm cost so much frames? The memory interface is much wider than R580, the compression algoritm are better and the ROPs can do more color/z compares than R580.

A: The actual number of units working on AA wrt to R580 isn't substantially different - thought the new ones are focused on 64b pixels. There are cases where moving the resolve to the shader has hurt performance -- That's typically where the frame rate is very high (i.e. > 100fps). Those are cases we were aware of and only really show up in benchmarks, not so much in real game play. It sort of caps the max fps to 200~300 or so, depending on resolution. Again, not something we felt would seriously impact real game play. It can also be mitigated by selecting the proper AA modes.

As for workloads in various apps, yes, it can be improved in some cases. Without specifics, it's hard to say. Overall, I expect the *scaling* of AA to be similar to slightly worst than R580, for "regular" pixels, but still to be higher than R580 in absolute terms.

But anytime 64b pixels will be invoked (i.e. HDR games), I expect performance of R600 to be substantially higher than R580.
proc algoritmus MSAA "stoji" tolik framu? pametove rozhrani(sbernice?) je mnohem sirsi nez u r580, kompresni algoritmy jsou lepsi a rops umi vice coloz/z porovnani nez r580

aktualni pocet jednotek pracujicich na AA vuci r580 neni nijak podstatne rozdilny - mysleno tak, ze nove jsou zamereny na 64b pixly. nastavaji tak pripady kde prenost vysledku k shaderum srazi vykon. to je typicke zejmena tam kde je fps vysoke(vetsi nez 100). ty jsou vsak pripady, ktere se projevi jen v benchmarcich, ne tak v realnem hrani. ??? to je jakysi strop max fps 200-300 v zavislosti na rozliseni ??? znovu rika, ze to skutecne nema dopad na hrani a takjako tak se da jeste snizit spravnou volbou aa modu.

A ohledne vytizeni v ruznych aplikacich, ano, muze byt vylepseno v nekterych pripadech. Bez specifikace je tezke rict. Celkove, ocekavam, ze *stupnovani* aa bude podobne nebo mirne horsi nez u r580, pro *regularni* pixly, ale porad bude vyzsi nez u r580 v absolutnich podminkach/clenech.

ale kdykoliv se budou pozadovat 64b pixly(hdr hry), ocekavam vykon r600 podstatne vyzsi nez u r580
---
Q: However, you can't deny that R5xx/RV5xx are a perfect example of what you were talking about with features taking die space and going unused.

A: Nope, it's generally simply being late to the game. By then, the channel is full and the OEMs have their deals. Getting deals is simply not possible (most OEMs for mainstream and below) or very difficult (above mainstream, you need to show a huge delta). It's not a competition when you are late. R5xx was fine and price/performance was quite excellent. It was, at least, 4 months late.
Nicmene, nemuze poprit ze r5xx/rv5xx jsou skvelym prikladem toho o cem jste mluvil, vlastnostech "zabirajicich misto(na chipu asi) a zustanou nevyuzity".

ne, pouze proste pozde vstoupi do hry. ???? zatim, "kanal" je plny a oems maji sve dohody/casti, ziskat je neni mozne(mnoho oems pro mainstream a pod) nebo velmi tezke(nad mainstreamem, musite ukazat velkou deltu) :) sorry totalne mi unika co chtel rict. Neni motivace/soutezivost kdyz uz je pozde. r5xx byla dobra a cena/vykon byl pomerne excelentni. To bylo, nejmene, 4 mesice pozde/zpozdeno - god knows....
---
Q: The implication is that R600's design and hardware attributes are fantastic and the drivers are poo-pooing all over performance.

A: I did not mean to imply that. It's a good and reasonable design. The drivers are very stable and deliver the expected performance in many cases. There are certainly quite a few left to address. If someone is expecting a 2x boost in all apps, well, I'm sorry, but it won't happen. There's a couple of places where that kind of delta is possible, and a lot where 10 ~30% is possible too. But we are shipping a good product at an awesome price. From a functional aspect, there's more to do too (such as more custom filters, fixing some of the video stuff, etc...)
???
muze byt, ze r600 navrh a hardwarove parametry jsou fantasticke a ovladace "hazej bobek/s*rou - slusne recenou" na vykon...

nic takoveho jsem nenaznacil. je to dobry a rozumny navrh. ovladace jsou velmi stabilni a prinasi ocekavany vykon v mnoha pripadech. ??? Jestli nekdo ocekava dvounasobny narust ve vsech aplikaci, tak sorry, ale to se nestane. Je jeste par mist kde je to takovy narust mozny a spousta jinych kde je mozny narust 10-30%. ale my "nabizime(?)" dobry produkt za strasnou cenu(?). z funkcniho hlediska, je jeste hodne co delat, jako jsou uzivatelske filtry, oprava nejakeho video materialu, atd...????

---
Q: Where has R6xx demonstrated that its ALU:TEX ratios are more optimal than the competition's?

A: In yesterday's games, and even a lot of today's game, the ALU:TEX ratio selected is probably overkill. But when I look at some of the newest games, or some coming down the pipe, or even some of our demoes, a ratio of 4:1 seems pale -- Shaders are coming with 10:1, 20:1 ratios -- Even with the most advance filters, those apps are still ALU bound. That is more where we shot for.
---
Kde predvedl r6xxx ze ALU:TEX pomery/prevody jsou optimalnejsi nez u konkurence...

ve starsich hrach, i ve spouste soucasnych her, alu:tex pomer je pravdepodobne znicujici. Kdyz se ale podivam na nektere novejsi hry, nebo nektere "jdouci dolu rourou" (boze co je zase tohle) nebo na nektera nase dema, pomer 4:1 se zda mdly - shadery prichazi s pomery 10:1, 20:1. stejne i s mnoha pokrocilymi filtry, tyto aplikace jsou stale ALU svazane.
Q: Was there ever a set of simulations run comparing R600 + R580 RBEs vs the final design, and if so what were the interesting datapoints that came out?

A: Yes, there were hundreds. Yes, a few things came out in the final design, but, in general, it was as expected. -- Resolve was moved into the shader, so that can't really get compared.
Byla vubec nejaka sada simulaci, ktera by porovnala r600 + r580 rbes s finalnim navrhem a jestli ano, jaka zajimava zjisteni z nich vysla...

Ano bylo jich stovky. Neco malo veci vyslo ve finalnim navrhu, ale v zasade, to bylo tak ocekavano. rozhodnuti padlo na shadery a to se nedalo porovnat....

... srry za veskery errory, ale tohle bylo na me moc. kdyz uz sem zacal, tak jsem to dojel, ale never ever.
AMD X6 1090T cooled by Thermalright Ultra 120 Extreme + Noctua, Asus M4A78T-E, 6G OCZ XTC Platinum, Toxic HD6870, SSD, Asus Xonar D1 - live at Spire Swordfin, powered by Enermax Liberty 500W. Viewed by EIZO 22" + 19" Dell.
short24
Začátečník
Začátečník
Registrován: 07. pro 2004
Bydliště: Praha

Příspěvek od short24 »

dik oyza, vlastne ten pan dost casto nechtene citoval :worship: no-xe, protoze potvrzoval no-xovy myslenky a to no-x neni na vyplatni pasce ATI a nema pristup k internim materialum
Intel i5-8600K GB GA-Z370 HD3P HyperX Predator 16GB (Kit 2x8GB) 3000MHz DDR4, CL15 ASUS Strix GeForce GTX 970 Corsair HX620, LOGITECH MX510, EIZO ColorEdge CS2730 (8.domaci generace - 486DX66, PentiumPro200, Athlon SlotA 550Mhz, Athlon Tbird 1400Mhz, Athlon Barton 2500+, Athlon Dual core Opteron 170,i5-2500K)

vodnik: SilentiumPC Navis Pro 240 NE VZDY JSEM ON-LINE, NENI CAS :[
no-X
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 24. úno 2004
Bydliště: Č.Budějovice

Příspěvek od no-X »

Oceňuju snahu, ale radši to přeložím sám... v těhle případech bývá lepší překládat spíš význam, než slovo od slova :oops:

do hranatých závorek dávám vlastní komentáře


Q: Když mluvíme o zlepšených knihovnách, nebylo vy výhodnější výrobu (tzn. i knihovny a nástroje) výhledově přesunout k AMD? [pozn. nyní ATi vyrábí u TSMC]

A: Nebudu se vyjadřovat k budoucím projektům, ale skutečně tu tato možnost je [pozn. tím nám Eric naznačil, že některý z budoucích čipů už je připravován na výrobu u AMD]
---

Q: Sloučení s AMD mohlo ovlivnit věci kolem vydání R600...

A: Když jsme o tom loni v létě prvně slyšeli, byl čip v podstatě hotový a odeslaný k výrobě - možná již dokonce na cestě zpět.... [pozn. to znamená, že R600 byla hotová již před rokem] Spolupracujeme nyní s mnoha novými inženýry [z AMD] Je ale možné, že sloučením bylo ovlivněno datum vydání, marketingová stránka a záležitosti související se vztahy s veřejností
---

Q: Je rozdíl v přechodu z 90nm na 80nm proces vs. 80nm na 65nm proces?

A: [zjednodušeno] Je třeba přepracovat mnoho částí čipu, mohou to být zásadní změny ve funkčnosti některých částí, upravený pipelining [pozn. funkce, které jsou řazeny za sebou a tvoří pipeline jsou zpracovávány v určitém počtu taktů - délka pipeline se tedy občas udává v minimálním počtu taktů, za který zdaná úloha projde celou pipeline. Je vcelku obvyklé, že s přechodem na novější proces je pipeline zkrácena /úspora v počtu tranzistorů vs. větší nároky na výrobní proces/]. Přechody na half-nodes [pozn. half-nodes = 150nm, 110nm, 80nm atp., tzn. mezistupně výrobních procesů; u CPU se většinou nepoužívají, je to do jisté míry specialita TSMC] jsou trochu snazší, protože jde do značné části jen o optické zmenšení původního procesu.
---

Q: Existuje v ATi skupina inženýrů, která by byla zaměřená výhradně jen na budoucí technologie (projekty)?

A: Něco takového jsme měli už v začátcích vývoje R600, nyní ale máme striktně vymezenou skupinu pro tyto účely [pozn. chápal bych to tak, že v začátcích vývoje R600 dalo pár lidí hlavy dohromady, aby odhadli, co bude třeba za X let, co bude třeba pro realizaci a jak to bude souviset s příslušnou verzí DX – nyní už existuje skupina lidí, kteří to mají čistě v popisu práce]
---

Q: [pozn. pěkně blbě položená otázka, upraveno] Kolik času zabere příprava návrhu nového čipu?

A: Práce na nové architektuře jako je R600, zaberou přes tři roky práce. 36 měsíců je v současnosti minimum, zvlášť když přihlédneme k množství tranzistorů, ze kterého se čip skládá. Následné produkty [pozn. tady jsou míněny produkty vycházející z téže architektury - ne revize, ale nové čipy... jako třeba po R300 následoval R350, R360, R380, R420, R480... z R520 vycházely třeba RV515, RV570, R580 atd.] obvykle následují zhruba do šesti měsíců a není nutné žádné extrémní přepracování původního designu

[pozn. ATi už delší dobu připravuje čipy takovým způsobem, že navrhne architekturu, která je v několika ohledech škálovatelná - předem ví, zhruba jaké čipy na ní postaví, takže má také představu, jaký "maximální" čip z ní v případě potřeby vzejde a tomu "kostru" návrhu přizpůsobí - návrhy dalších čipů z tohoto základu už nestojí mnoho práce a místo toho takto ušetřený čas může být využit na další vylepšení, která se ukázala jako vhodná či potřebná až po uzavření základního konceptu. Naproti tomu nVidia navrhne čip nové generace a čipy, které z něj vycházejí se už tolik neliší a jde jen o mírnou evoluci, přičemž se většina sil soustředí na další velký projekt, který vyjde za několik let]

V posledním roce příprav dochází již jen na minimální změny - konfigurace, vlqstnosti, to vše už je jisté - pouze frekvence je možné ještě mírně upravit.
---

Q: Revize A13 byla vyrobena v lednu, ale vydána až v květnu [pozn. hehe, to zaregoaval na můj post :roll: ]

A: Nejvíce práce [v tuto dobu] bylo na driverech: Dva OS, nová architektura, DX9/10, OpenGL. Práce [na driverech] stále pokračuje. Nejsem si jistý ohledně dat [vydání/výroby] čipů, ale z určitého hlediska dává větší smysl vydání všech produktů najednou [pozn. tady je třeba brát v úvahu, že Eric to vidí z trochu jiného úhlu pohledu - my jsme jen jedna skupina zákazníků, ale ještě jsou tu OEMs a těm podle určitých zdrojů ATi už od konce května dodává pomalejší verze RV610/RV630 postavené na starší revizi čipů.]
---

Q: Takže můžeme vyvodit, že celočíselný AA resolve* nevyužije možnou datovou přenosovou kapacitu čipu?

*[pozn. AA resolve = vypočtení barvy výsledného pixelu z příslušných AA vzorků - obvykle zprůměrování několika barev do jedné výsledné; INT = celočíselný = klasický rendering, FP = s desetinou čárkou = používaný HDR a podobné efekty... zmiňuju proto, že právě při klasickém AA na INT frame bufferu jsou výraznější ty propady výkonu]

A: Jistým způsobem ano, ale není to tak jednoduché. Některé sběrnice nejsou naplno vytížené, ale to neznamená, že by čip mohl jen tak pracovat rychleji. Například: filtrace textur provádíme s přesností plovoucí desetinné čárky (FP), ale kdybychom je prováděli celočíselně (INT), neznamenalo by to automaticky vyšší výkon, protože se nemění množství výpočetních jednotek [pozn. R600 obsahuje 16 jednotrk pro filtraci textur a ať jí provádějí s vyšší přesností nebo nižší, je jich pořád 16 a v obou případech pracují stejně rychle]. Momentálně prosazujeme zpracovávání s přesností FP [ale v tomhle bodě mi není jasné, jestli to „prosazují“ jen na úrovni čipu/driveru, nebo jestli tlačí vývojáře, aby využívali vyšší přesnost - tomu bych se nedivil - u R600 jeden INT i FP stejně rychle, kdežto u G80 je výkon při FP oproti INT poloviční]
---

Q: Ve specifikacích R600 se mluví o bikubické filtraci...

A: Bikubická filtrace je podporována, původně měla být implementována kvůli technologii související s fonty operačního systému [pozn. doufám, že tou zkratkou nemyslel něco úplně jinýho, jinak fakt netuším :-) ] Ještě není zpřístupněna a nevěřím, že by byla zpřístupnitelná přes DirectX. Možná v OpenGL. Nepracuje ale stejnou rychlostí, jako bilineární filtrace.
---

Q: Výkonnostní propad anizotrotpní fitlrace (AF) je dost zlý...

A: Propad výkonu při AF může být v současné době výraznější než u R580. Na druhou stranu ale přináší vyšší kvalitu (na přechodu mip-map). Věřím, že zčásti to bude vyřešeno v budoucích driverech. V tuto chvíli ale nemůžu slíbit žádná přesná procenta výkonu.

---

Q: Proč stojí nový algoritmus MSAA tolik výkonu [resp. proč zapnutí AA na R600 tolik snižuje výkon]? Paměťové rozhraní je mnohem širší než u R580, komprese je lepší, ROPs rychlejší...

A: Množství výpočetních jednotek pracujících na AA není v porovnání s R580 výrazně vyšší. Jednotky R600 jsou ale zaměřeny na práci s 64bit pixely [FP16, HDR atd.]. Jsou případy, pro které znamenal přesun zpracování AA resolve z ROPs na shader [pozn. u předchozích čipů se resolve prováděl fixně v ROPs, DX10 vyžaduje podporu resolve přes shader, ATi tedy u R600 fixní resolve z návrhu vyškrtla] výrazný propad výkonu. To se děje typicky v případech, kdy framerate přesahuje 100FPS . Těchto případů jsme si vědomi, ale objevují se prakticky jen v benchmarcích, nikoli při reálném hraní. Jistým způsobem to omezuje maximální framerate na 200-300FPS (v závislosti na rozlišení). Opět si nemyslíme, že by šlo o něco, co má vliv na reálné hraní. Také to lze zmírnit zvolením vhodného AA režimu.

V některých případech může být situace zlepšena, ale obecně - těžko říct. Celkově bych očekával (procentuální) propady výkonu při AA podobné, nebo mírně horší než u R580 pro "klasické" pixely [míněno situace bez FP16/HDR].

Pokud ale jde o 64bit (HDR) , očekávám výkon výrazně vyšší, než u R580.
---

Q: Nemůžeš ale popřít [pozn. řekl bych, že tady je na místě tykání - tazatel dříve pracoval v ATi, takže je možné, že se s Ericem zná], že generace R5xx je dokonalou ukázkou implementace technologií, které zaberou výraznou část čipu, ale které se během životnosti produktu [řekněme 12-18 měsíců] nijak neprojeví [upraveno, tazatel tím naráží na nízké výdělky na čipech generace R5xx - tvrdí, že byly technologicky zbytečně napřed, přičemž implementace těchto technologií zvyšovala velikost čipů a tedy i náklady na jejich výrobu]

A: Ne, problém byl v tom, že jsme se dostali pozdě do hry. (Když jsme generaci R5xx vydali) byly již distribuční kanály plné [konkurenčních produktů] a OEM partneři už měli taktéž uzavřené smlouvy [s konkurencí]. Uzavření nových obchodů už zkrátka nebylo možné (pro mainstream a low-end), nebo velmi obtížné (segment nad mainstreamem - ale tam je nutné ukázat pořádný rozdíl ve výkonu, oproti konkurenci). Pokud přijdete s produkty pozdě, není to už žádný souboj... Jako taková byla generace R5xx v pohodě a poměr cena/výkon byl vcelku vynikající. Ale šlo o minimálně 4-měsíční zpoždění...
---

Q: ...má to tedy znamenat, že hardwarová stránka R600 je fantastická, ale ovladače to pos*aly?

A: To jsem naznačit nechtěl. Čip je navržen s rozmyslem a na racionálních základech. Ovladače jsou stabilní a je dost případů ve kterých nabízejí takový výkon, jaký jsme od R600 očekávali [pozn. a také je dost případů, kdy ne :-) ]. Je ještě ["quite a few" :-) ] dost případů, které je třeba vyřešit. Pokud někdo očekává dvojnásobný nárůst výkonu ve všech aplikacích, pak se omlouvám, ale to se prostě nestane. Je pár situací, kde je nárůst podobné úrovně reálný a mnoho situací, kde můžeme čekat nárůst okolo 10-30%. Ale nabízíme uživatelům dobrý produkt za vynikající cenu.

Z funkčního hlediska tu máme ještě dost práce (třeba další filtry pro AA, nebo vyřešení nějakých problémů s videem atd.)
---

Q: kde konkrétně předvedla R600, že je její poměr ALU:TEX [aritmetické operace: texturovacím operacím - konkrétně poměr shader jednotek a texturovacích jednotek] optimálnější než ten, který nabízí konkurence?

A: Ve starých hrách a dokonce i v mnoha současných hrách je tento poměr overkill [=přehnaný]. pokud se ale dívám na nejnovější hry [pozn. musíme si uvědomovat, že Eric má k dispozici i(!) hry, které ještě nebyly vydané], nebo hry chystané, případně naše dema , tak poměr ALU:TEX 4:1 exceluje. Poměr v nových shaderech [míněno shadery ve smyslu kódu her, ne hardwaru] se dostává na 10:1, 20:1 - takže i s pokročilou filtrací textur jsme stále limitováni výkonem shader core [nikoli výkonem texturovacích jednotek]. To už je více, než kam jsme mířili...
---

Q: Prováděli jste nějaké simulace, které by porovnaly výkon R600 s ROPs typu R580 [fixní AA resolve] a výkon R600 s těmi ROPs, které nakonec dostal? [bez podpory pro AA resolve]?

A: Ano, stovky. Leccos se samozřejmě projevilo až ve finálním návrhu, ale celkově to dopadlo, jak jsme čekali. Resolve se provádí přes shader, takže to reálně nemůžeme srovnat.
Nejlepší moderátor ve výslužbě
short24
Začátečník
Začátečník
Registrován: 07. pro 2004
Bydliště: Praha

Příspěvek od short24 »

dik, obcas mne z jeho otevrenosti mrazi :fear:
Intel i5-8600K GB GA-Z370 HD3P HyperX Predator 16GB (Kit 2x8GB) 3000MHz DDR4, CL15 ASUS Strix GeForce GTX 970 Corsair HX620, LOGITECH MX510, EIZO ColorEdge CS2730 (8.domaci generace - 486DX66, PentiumPro200, Athlon SlotA 550Mhz, Athlon Tbird 1400Mhz, Athlon Barton 2500+, Athlon Dual core Opteron 170,i5-2500K)

vodnik: SilentiumPC Navis Pro 240 NE VZDY JSEM ON-LINE, NENI CAS :[
oyza
Začátečník
Začátečník
Uživatelský avatar
Registrován: 05. úno 2007
Bydliště: Praha

Příspěvek od oyza »

sry no-x, neznam pozadi a to se pak blbe preklada :) otazky byly polozeny hodne divne a Eric je docela borec a dost casto mluvi tak, ze toho pulku nerekne, ale kdyz vis o co jde, tak vis o co jde :) klidne to moje smaz, at to nedela hokej. :)
AMD X6 1090T cooled by Thermalright Ultra 120 Extreme + Noctua, Asus M4A78T-E, 6G OCZ XTC Platinum, Toxic HD6870, SSD, Asus Xonar D1 - live at Spire Swordfin, powered by Enermax Liberty 500W. Viewed by EIZO 22" + 19" Dell.
Lukfi
Mírně pokročilý
Mírně pokročilý
Uživatelský avatar
Registrován: 04. črc 2005
Bydliště: Praha
Kontaktovat uživatele:

Příspěvek od Lukfi »

http://www.xbitlabs.com/news/video/disp ... 51758.html

nVidia a Techland jsou v sobě kvůli Call of Juarez DX10. A proč to dávám sem? Protože je to kvůli shader-assisted AA resolve. Newska je v přípravě.
Výkaly prosím umisťujte do záchodové mísy a nikoliv diskuzního fóra.
Stratos
Začátečník
Začátečník
Uživatelský avatar
Registrován: 05. zář 2003
Bydliště: Hvožďany
Kontaktovat uživatele:

Příspěvek od Stratos »

Lukfi píše:http://www.xbitlabs.com/news/video/disp ... 51758.html

nVidia a Techland jsou v sobě kvůli Call of Juarez DX10. A proč to dávám sem? Protože je to kvůli shader-assisted AA resolve. Newska je v přípravě.
nj nvidie si zase musi nak zduvodnit proc sou horsi nez ATI :)
oyza
Začátečník
Začátečník
Uživatelský avatar
Registrován: 05. úno 2007
Bydliště: Praha

Příspěvek od oyza »

tak tohle me pobavilo: “The benchmark includes new code that substantially reduces performance of Nvidia hardware." a pak "Nvidia also said that a “hidden” parameter in the Call of Juarez DirectX 10 version actually degrades performance of Nvidia hardware without improving image quality." No docela dobrej clanek :) zacina to bejt zajmavy, zacinaj se hadat o konkretni benchmarky - nikoli hry jako celek(sice chapu, ze jsou vydreny z dx10 a co jako). brzo se budou hadat o to, proc pred nejakou jeskyni v te a te hre je to o 5% pomalejsi - bude tam nejspi nejakej "hidden" medved co to bude delat :) nebo bude v nejaky strilecce specialni antiATI deagle, kterej bude srazet vykon... jejich starosti bych chtel mit
AMD X6 1090T cooled by Thermalright Ultra 120 Extreme + Noctua, Asus M4A78T-E, 6G OCZ XTC Platinum, Toxic HD6870, SSD, Asus Xonar D1 - live at Spire Swordfin, powered by Enermax Liberty 500W. Viewed by EIZO 22" + 19" Dell.
Odpovědět

Zpět na „AMD/ATI grafické karty“