AMD Steamroller/Excavator (28nm)-informace, spekulace

Vše o procesorech Advanced Micro Devices.

Moderátoři: flanker, Eddward, Baneshee

Odpovědět
del42sa
Pokročilý
Pokročilý
Uživatelský avatar
Registrován: 18. lis 2009
Bydliště: Omicron Persei 8

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od del42sa »

Mark Papermaster´s PDF : http://www.hotchips.org/wp-content/uplo ... er-AMD.pdf

\\ bude potřeba počkat na detailnější popis Steamroller jádra. Zatím se jedná o hrubý popis. Podle Ananda by druhá MMX pipene měla být sdílená s 2x 128 bit FMAC. FPU by mělo mít stejný výkon jako u Bulldozeru ale při menší velikosti a menších energetických nárocích .

\\\zajímavé vysvětlení ke dvěma MMX pipelines v BD, MMX pipelines (IMAC) = XOP pipelines : http://www.amdzone.com/phpbb3/viewtopic ... 52#p187752

XOP se asi stejně většího rozšíření nikdy nedočká, takže menší počet MMX asi ničemu neuškodí 8)
Spíše je škoda , že tam místo toho nejsou 4 x + 128 bit FMAC.

\\\\
The FPU in BD has four execution pipes. Two of them could do SIMD FMAs, the other two could do integer SIMD operations (which for some reason AMD has sometimes labelled "MMX", which is highly misleading, even JF said so) - of course that doesn't cover everything they could do. While JF bragged about this execution width in practice it's pretty useless because little code mixes integer and floating point SIMD. Even when executing from two separate threads, you're not usually going to find a heavy integer SIMD thread running along a heavy floating point thread. So AMD wisely rebalanced it to three execution ports,. That doesn't mean it can't still do two integer SIMD operations per cycle - we don't know what the new execution capabilities are. Just that it can't do two FMA + two integer.
Naposledy upravil(a) del42sa dne pát 31. srp 2012, 23:15, celkem upraveno 1 x.
"The more you buy, the more you save" AI everywhere - Nvidia CEO at Computex 2023 https://www.youtube.com/watch?v=FhlE3m1trM4
Vega Primitive Shader combines the functions of vertex and geometry shader and with the right knowledge you can discard game based primitives at an incredible rate" https://pcper.com/2017/01/amd-vega-gpu- ... tecture/2/

MSI MPG GUNGNIR 110R White | CPU AMD Ryzen 7 9700X Granite Ridge | DeepCool AK500 White | GPU Sapphire Pure RX 9070 XT 16GB plus UV | MB MSI MAG X670E GAMING PLUS WIFI | 32GB DDR5 A-DATA XPG LANCER RGB Dual KIT 7200 MHz | system HDD SSD M.2 Kingston FURY Renegade NVMe 1TB | Seagate Baracuda HDD 1TB SATA III | data HDD WD RED 1TB SATA III | Quad HD VA monitor 27" MSI Optix G27CQ4 Free Sync 165 Hz 10bit HDR | Soud Blaster Audigy Fx | PSU MSI MAG A850GL 850 W 80 PLUS Gold PCIe 5 II | Win 10-64 bit Pro
THANATOS
Začátečník
Začátečník
Registrován: 14. zář 2009
Bydliště: Nové Zámky

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od THANATOS »

del42sa 1MMX a 4* 128 bit FMAC by boli urcite lepsie ako toto aj ked neviem ci namiesto FMAC by oddelene ADD a MUL neboli lepsim riesenim, lebo bez podpory FMA4 v programe FPU straca kus vykonu ako sme to videli pri vypnutom a zapnutom FMA4.
Nechapem preco Jaguar bude mat lepsie FPU ale FPU v SR bude v najlepsom pripade rovnako vykonne ako predchadzajuca generacia.
Lenovo Legion Y540-15IRH CPU: Intel Core i5 9300H GPU: NVIDIA GeForce GTX 1650 4GB RAM: 24GB 2666Mhz Micron SSD: 512GB WDC SN720 + 1TB Crucial MX500
flanker
Moderátor
Moderátor
Uživatelský avatar
Registrován: 13. pro 2005
Bydliště: Brno
Kontaktovat uživatele:

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od flanker »

možná ten důvod je, že pro servery není FPU majoritní a je důležítý integer. Většina zákazníků/odběratelů v desktopu kupuje nižší segment jako jsou APU (dvou až čtyřjádra bez L3). Výkonný CPU s L3 je serverový derivát a pokud tedy bude i Steamroller pro desktop s L3, bude to znovu jen derivát toho serverového.
ROG Power PC1:AMD Ryzen 7 5700X, Crosshair VII Hero, ROG Ryuo II 360, 512GB NVMe+500GB Samsung SSD, 2x 16GB GSkill TridentZ Neo RGB 3600 MHz, Dual RTX 2060,CM V750, Lian Li O11 Dynamic XL. PC2:AMD FX-8370, Silentium Fera, Asus 970 Pro Gaming/Aura, 240GB SSD HyperX 3K, R9-270X OC, 2x 4GB GSkill RipjawsX 2400 MHz, Corsair AX750, Bitfenix Pandora
THANATOS
Začátečník
Začátečník
Registrován: 14. zář 2009
Bydliště: Nové Zámky

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od THANATOS »

flanker Preto by sa mali v AMD prebrat, ked videli, ze tie predaje BD v serveroch boli slabe a zamerat sa aj na ostatne segmenty trhu kde silna FPU je potrebna. Pri tych zmenach v SR som si isty, ze tie 2 Fmac by v pohode stihli pridat, keby chceli, ale asi sa im nechcelo.
Takto AMD straca % vykonu a musi to riesit nizsou cenou, aby mali dobry pomer cena/vykon. Ak budeme mat stastie, tak to pochopia pri Excavatore, ale mozno chcem od nich vela.
Lenovo Legion Y540-15IRH CPU: Intel Core i5 9300H GPU: NVIDIA GeForce GTX 1650 4GB RAM: 24GB 2666Mhz Micron SSD: 512GB WDC SN720 + 1TB Crucial MX500
THANATOS
Začátečník
Začátečník
Registrován: 14. zář 2009
Bydliště: Nové Zámky

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od THANATOS »

Zaujimala by ma jedna vec. SR ma 2 dekodery a ak su rovnake s BD, tak SR obsahuje 2*4-way dekodery co je podla mna overkill.
Preco ich potom ma tolko?
Mozno SR nebude mat len 2ALU+2AGLU ale kombinovane a potom mozno uvidime aj implementovane HT.
Toto je len cista spekulacia ;-)
Naposledy upravil(a) THANATOS dne stř 29. srp 2012, 20:31, celkem upraveno 1 x.
Lenovo Legion Y540-15IRH CPU: Intel Core i5 9300H GPU: NVIDIA GeForce GTX 1650 4GB RAM: 24GB 2666Mhz Micron SSD: 512GB WDC SN720 + 1TB Crucial MX500
yuri.cs
Mírně pokročilý
Mírně pokročilý
Uživatelský avatar
Registrován: 03. led 2007
Bydliště: hl.m. piva
Kontaktovat uživatele:

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od yuri.cs »

Problem je, ze BD byl smerovan do HPC. Proc teda ubirat zdroje... sranda. AVX2 (ktere ale u SR chybi...) nejsou potvrzeny, to je spatne. Excavator je zrejme jen BD->PD, takze asi nebude mozne tohle ocekavat.

C't mag mel tedy pravdu s 2*4-way dekodery. 'No compromises two thread perf.' je doceka smesna hlaska, po tom, jak byl prezentovan BD (puste si treba i HotChips 22 s BD). Patenty o Loop detectorech se tedy tez potvrdi.

Dynamicke gatovani cache bude zajimave, hlavne v lowpower. Ne kazda aplikace vyuziva footprint 1MB. Zvetsit cache - proc ne.

Nadavani a brekot nad syntetickym navrhem casti BD se snad nebude uz opakovat.

Vsechny tyhle zmeny maji velky potencial v porovnani s PD. Kazdopadne tohle by mohlo dohnat Nehalem.

//'Greater parallelism' = do domeny dedikovanych prostredku pridan dekoder => zvysen paralelismus

//Pridavanim instrukci pro AGLU se bude jen a jen zvysovat zatez na frontend. Tyhle infa, ktere nejsou na slidech se potvrdi/vyvrati az v dobe, kdy budou zazanamy uploadnuty....
It will be amazing in case after 10GHz we will see 20GHz, 30GHz and so on, just like we witnessed the thorny way from 10MHz to 33MHz in the eighties. -xbitlabs.com
yuri.cs
Mírně pokročilý
Mírně pokročilý
Uživatelský avatar
Registrován: 03. led 2007
Bydliště: hl.m. piva
Kontaktovat uživatele:

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od yuri.cs »

Zajimavy je pocet zdroju uvnitr FPU jednotek ve svetle toho, jak AMD proklamovalo, ze cela 256b FMAC je prilis velka.

arch : rozlozeni jednotek : inst na jadro/cyklus pri plnem zatizeni

K10 : FMUL & FADD : 1x 128b FADD a 1x 128b FMUL

BD/SR : FMAC = FMUL i FADD ale FMUL | FADD : 1x 128b FADD nebo 1x 128b FMUL

SB : FMUL & FADD : 1x 256b FADD a 1x 256b FMUL

HW (pri zachovani portu, atd.) : 2x FMAC = FMUL i FADD ale FMUL | FADD : 2x 256b FADD nebo 2x 256b FMUL nebo (1x 256b FADD a 1x 256 FMUL)

HW tedy dle vseho prinese skutecne masivni FPU, ktera dokaze napr. 2x FADD/cyklus/jadro. Bude jadro obrovske? Urcite nebude. AMD v tomhle ohledu se SR hodne preslapuje na miste.
It will be amazing in case after 10GHz we will see 20GHz, 30GHz and so on, just like we witnessed the thorny way from 10MHz to 33MHz in the eighties. -xbitlabs.com
THANATOS
Začátečník
Začátečník
Registrován: 14. zář 2009
Bydliště: Nové Zámky

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od THANATOS »

yuri.cs
Vie 1 FMAC naraz vykonat ADD aj MUL alebo len jednu z nich? Ak sa dobre pamatam tak vie, cize 2 FMAC sa moze rovnat 2 FADD a 2 FMUL ak je tak napisana aplikacia.

P.S. mam chut znova riesit nejake uber jadro :P Myslim, ze sa zmestim do 30mm^2 na 32nm procese ;-)

edit: ak sa dobre pamatam, zapnute FMA pridalo ~30-40% vykonu co tiez nie je malo, ale ako vravis, ked nie je podpora v aplikaciach, tak je to zbytocne.
Naposledy upravil(a) THANATOS dne stř 29. srp 2012, 21:36, celkem upraveno 5 x.
Lenovo Legion Y540-15IRH CPU: Intel Core i5 9300H GPU: NVIDIA GeForce GTX 1650 4GB RAM: 24GB 2666Mhz Micron SSD: 512GB WDC SN720 + 1TB Crucial MX500
yuri.cs
Mírně pokročilý
Mírně pokročilý
Uživatelský avatar
Registrován: 03. led 2007
Bydliště: hl.m. piva
Kontaktovat uživatele:

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od yuri.cs »

V FMA4 instrukcich prirozene vykona MUL a zaroven ADD a to jeste s 1 (konecnym) zaokrouhlenim vysledku. Jak tusime, tak drtiva vetsina aplikaci nevyuziva FMA rozsireni a prinos rozhodne neni dvojnasobny. Cili pouziti FADD/FMUL je to, co je kazdodenni realita.
It will be amazing in case after 10GHz we will see 20GHz, 30GHz and so on, just like we witnessed the thorny way from 10MHz to 33MHz in the eighties. -xbitlabs.com
THANATOS
Začátečník
Začátečník
Registrován: 14. zář 2009
Bydliště: Nové Zámky

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od THANATOS »

Zhrnutie Hot Chips prezentacie od AMD. Ziadne HT pre integer.
http://www.theregister.co.uk/2012/08/29 ... o_opteron/
Lenovo Legion Y540-15IRH CPU: Intel Core i5 9300H GPU: NVIDIA GeForce GTX 1650 4GB RAM: 24GB 2666Mhz Micron SSD: 512GB WDC SN720 + 1TB Crucial MX500
del42sa
Pokročilý
Pokročilý
Uživatelský avatar
Registrován: 18. lis 2009
Bydliště: Omicron Persei 8

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od del42sa »

proc tam pisou ze Bulldozer nema dve MMX pipeline ale jen Piledriver ?To je prece pekny nesmysl. Skoda ze si AMD mysli,ze FP vykon neni potreba posilovat.....
"The more you buy, the more you save" AI everywhere - Nvidia CEO at Computex 2023 https://www.youtube.com/watch?v=FhlE3m1trM4
Vega Primitive Shader combines the functions of vertex and geometry shader and with the right knowledge you can discard game based primitives at an incredible rate" https://pcper.com/2017/01/amd-vega-gpu- ... tecture/2/

MSI MPG GUNGNIR 110R White | CPU AMD Ryzen 7 9700X Granite Ridge | DeepCool AK500 White | GPU Sapphire Pure RX 9070 XT 16GB plus UV | MB MSI MAG X670E GAMING PLUS WIFI | 32GB DDR5 A-DATA XPG LANCER RGB Dual KIT 7200 MHz | system HDD SSD M.2 Kingston FURY Renegade NVMe 1TB | Seagate Baracuda HDD 1TB SATA III | data HDD WD RED 1TB SATA III | Quad HD VA monitor 27" MSI Optix G27CQ4 Free Sync 165 Hz 10bit HDR | Soud Blaster Audigy Fx | PSU MSI MAG A850GL 850 W 80 PLUS Gold PCIe 5 II | Win 10-64 bit Pro
THANATOS
Začátečník
Začátečník
Registrován: 14. zář 2009
Bydliště: Nové Zámky

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od THANATOS »

del42sa Tiez nechapem. Mozno preklep, alebo sa nepochopili.
Lenovo Legion Y540-15IRH CPU: Intel Core i5 9300H GPU: NVIDIA GeForce GTX 1650 4GB RAM: 24GB 2666Mhz Micron SSD: 512GB WDC SN720 + 1TB Crucial MX500
ttxman
Začátečník
Začátečník
Registrován: 28. zář 2003

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od ttxman »

Hmm takze propracovanejsi sdileni FPU zase nic.

Nezaslech nekdo, ze by AMD zkouselo aspon pro int kod "eager execution"? Int jednotek je v modulu vic nez dost a nahradit branch prediction paralelnim vykonanim obou vetvi. Mozna by tak 4 modul sel prepnout na 4 jadro s dokonalym branch prediction :) a single thread vykonem, kterej stoji za to.
yuri.cs
Mírně pokročilý
Mírně pokročilý
Uživatelský avatar
Registrován: 03. led 2007
Bydliště: hl.m. piva
Kontaktovat uživatele:

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od yuri.cs »

Dalsi porce slidu z HC: http://pc.watch.impress.co.jp/docs/colu ... 56374.html

Uz Piledriver ma loop detector; plus AMD az ted priznava nefungujici HW int DIV jednotku v BD; usmevne pusobi marketingove upozorneni na frekvenci 30% nad Llanem; 4 jadra + L2 Jaguaru = Compute Unit - stejne oznaceni jako u modulu BD

//meh, asi jsem trefil spatnej thread
It will be amazing in case after 10GHz we will see 20GHz, 30GHz and so on, just like we witnessed the thorny way from 10MHz to 33MHz in the eighties. -xbitlabs.com
froxic
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 11. čer 2003
Bydliště: Hlučín
Kontaktovat uživatele:

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od froxic »

Velmi zajímavé počtení o Steamrolleru a Excavatoru... http://vr-zone.com/articles/amd-pushes- ... 17088.html

Obrázek
Obrázek
Obrázek
yuri.cs
Mírně pokročilý
Mírně pokročilý
Uživatelský avatar
Registrován: 03. led 2007
Bydliště: hl.m. piva
Kontaktovat uživatele:

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od yuri.cs »

Theo V píše:Excavator, 4th generation design which should increase performance and fight off Haswell-EP/EX in 2014.
SR 45% nad BD... SR nema mit novou platformu, ta ma byt ale az s prichodem XV!? Proc tedy neni SR chip pro AM3+? Znacne podezrely clanek.
It will be amazing in case after 10GHz we will see 20GHz, 30GHz and so on, just like we witnessed the thorny way from 10MHz to 33MHz in the eighties. -xbitlabs.com
flanker
Moderátor
Moderátor
Uživatelský avatar
Registrován: 13. pro 2005
Bydliště: Brno
Kontaktovat uživatele:

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od flanker »

to je klasické vr-zone :). Pár slidů a pár spekulací. SR je primárně APU a servery, pokud bude odnož do desktopu, pak ale myslím je na čase zabalit AM3+ a přijít s něčím novějším. Nevím, zda už SR a nebo až EXC bude umět DDR3, tak DDR4.
ROG Power PC1:AMD Ryzen 7 5700X, Crosshair VII Hero, ROG Ryuo II 360, 512GB NVMe+500GB Samsung SSD, 2x 16GB GSkill TridentZ Neo RGB 3600 MHz, Dual RTX 2060,CM V750, Lian Li O11 Dynamic XL. PC2:AMD FX-8370, Silentium Fera, Asus 970 Pro Gaming/Aura, 240GB SSD HyperX 3K, R9-270X OC, 2x 4GB GSkill RipjawsX 2400 MHz, Corsair AX750, Bitfenix Pandora
del42sa
Pokročilý
Pokročilý
Uživatelský avatar
Registrován: 18. lis 2009
Bydliště: Omicron Persei 8

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od del42sa »

stačí kouknout na autora a hned máš jasno :wink: Typický Theo Valich
"The more you buy, the more you save" AI everywhere - Nvidia CEO at Computex 2023 https://www.youtube.com/watch?v=FhlE3m1trM4
Vega Primitive Shader combines the functions of vertex and geometry shader and with the right knowledge you can discard game based primitives at an incredible rate" https://pcper.com/2017/01/amd-vega-gpu- ... tecture/2/

MSI MPG GUNGNIR 110R White | CPU AMD Ryzen 7 9700X Granite Ridge | DeepCool AK500 White | GPU Sapphire Pure RX 9070 XT 16GB plus UV | MB MSI MAG X670E GAMING PLUS WIFI | 32GB DDR5 A-DATA XPG LANCER RGB Dual KIT 7200 MHz | system HDD SSD M.2 Kingston FURY Renegade NVMe 1TB | Seagate Baracuda HDD 1TB SATA III | data HDD WD RED 1TB SATA III | Quad HD VA monitor 27" MSI Optix G27CQ4 Free Sync 165 Hz 10bit HDR | Soud Blaster Audigy Fx | PSU MSI MAG A850GL 850 W 80 PLUS Gold PCIe 5 II | Win 10-64 bit Pro
Baneshee
Moderátor
Moderátor
Uživatelský avatar
Registrován: 12. dub 2005
Bydliště: Brno
Kontaktovat uživatele:

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od Baneshee »

Uz to mame i na diit: http://diit.cz/clanek/steamroller-neni- ... -bulldozer
Co dodat, 45% ? Kez by. Mysim ze budou radi za 25% v prumeru proti BD a to z casti diky vyssim taktum.
Ryzen 7800X3D | Noctua C12P SE14 | 2x32GB Kingston Fury 6000MHz | Sapphire Pulse 9070XT 16GB | ASRock X870 Pro RS | Micron 2TB NVMe & Kingston KC3000 4TB | FD North Black TG | Seasonic GX 750W | Dell G3223Q
flanker
Moderátor
Moderátor
Uživatelský avatar
Registrován: 13. pro 2005
Bydliště: Brno
Kontaktovat uživatele:

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Příspěvek od flanker »

ono možná těch 45% může nastat v některých specifických situacích (a multivláknu). Defakto i Vishera bdue občas výkonnější o 25% než Zambezi, protože +400MHz takt, multithread a dobře optimalizovaná aplikace, to pak je celkem znát. Čili 45% vůči Zambezi by byol možný (dejme tomu, že Steamroller může mít +200 MHz navíc takty, mírně zas vyšší IPC a efektivnější multithread. Pak již stačí instrukce a s ním spojený software :). A máme tu možnost45%). Klasika marketing.
ROG Power PC1:AMD Ryzen 7 5700X, Crosshair VII Hero, ROG Ryuo II 360, 512GB NVMe+500GB Samsung SSD, 2x 16GB GSkill TridentZ Neo RGB 3600 MHz, Dual RTX 2060,CM V750, Lian Li O11 Dynamic XL. PC2:AMD FX-8370, Silentium Fera, Asus 970 Pro Gaming/Aura, 240GB SSD HyperX 3K, R9-270X OC, 2x 4GB GSkill RipjawsX 2400 MHz, Corsair AX750, Bitfenix Pandora
Odpovědět

Zpět na „Procesory AMD“