AMD "Piledriver" Vishera refresh Zambezi -info,spekulace atd
Moderátoři: flanker, Eddward, Baneshee
- DOC_ZENITH
- Středně pokročilý

- Registrován: 08. kvě 2010
- Bydliště: Praha
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
"padá díky zápisu do L1" je řečeno nepřesně, protože BD je první CPU od dob 486DX2 (DX4 už uměla write-back) co nepodporuje write-back L1, takže on ani nemůže zapsat do L1, vše co se zapisuje do L1 se kvůli write trough zapisuje i do L2, takže rychlost zápisu do L1 = rychlosti zápisu do L2, která je dle testů bohužel také velice latentní....
- webwalker
- Začátečník

- Registrován: 03. úno 2010
- Bydliště: Buranov vedle Prahy
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
richie08 : Sorry chlape, ale takhle obludně interpretovat článek o int výkonu BD, který jsi sám postnul, jsem opravdu ještě neviděl
Opravdu jsi ho sám četl?
Opravdu jsi ho sám četl?
Chtěl bych se stát profesionálním pískačem. Už teď jsem v tom sice hvězda, ale chtěl bych se ještě zdokonalit a začít se tím živit.
GPUreport.cz
GPUreport.cz
- richie08
- Začátečník

- Registrován: 15. říj 2006
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
Dobře, tedy ukaž mi v těch grafech jediný sloupec kde v singlu BD poráží Phenom, protože jinak nejde objektivně srovnávat výkon Bulldozeří 2ALU+2AGU vs. Phenomí 3ALU/LSU (a to ještě má BD výhodu většího front endu).webwalker píše:richie08 : Sorry chlape, ale takhle obludně interpretovat článek o int výkonu BD, který jsi sám postnul, jsem opravdu ještě neviděl![]()
Opravdu jsi ho sám četl?
- webwalker
- Začátečník

- Registrován: 03. úno 2010
- Bydliště: Buranov vedle Prahy
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
richie08: Jak tě mám přesvědčit o něčem, když tě nepřesvědčil ani autor článku.
První graf ukazuje teoretické hodnoty výkonu ALU, Samozřejmě, že kdyby měl BD 3ALU tak v těchto syntetických testech by to byla výhoda, nicméně projeví se snížení počtu ALU také v reálném světě? No asi ne, viz následující graf drystone (drystone sice není reálná aplikace, ale oni ji použili, protože je čistě int).
No a kam se najednou poděl výkon těch třetích ALU pipe v Ph? Připomínám, že je poměřováno Ph6 (18ALU) vs BD (16ALU) na stejných taktech.
BD má "výhodu" většího frontendu, protože ten zásobuje dvě core!
PS: Imho problém výkonu BD je třeba hledat jinde než v nedostatečném počtu int ALU.
První graf ukazuje teoretické hodnoty výkonu ALU, Samozřejmě, že kdyby měl BD 3ALU tak v těchto syntetických testech by to byla výhoda, nicméně projeví se snížení počtu ALU také v reálném světě? No asi ne, viz následující graf drystone (drystone sice není reálná aplikace, ale oni ji použili, protože je čistě int).
No a kam se najednou poděl výkon těch třetích ALU pipe v Ph? Připomínám, že je poměřováno Ph6 (18ALU) vs BD (16ALU) na stejných taktech.
BD má "výhodu" většího frontendu, protože ten zásobuje dvě core!
PS: Imho problém výkonu BD je třeba hledat jinde než v nedostatečném počtu int ALU.
Chtěl bych se stát profesionálním pískačem. Už teď jsem v tom sice hvězda, ale chtěl bych se ještě zdokonalit a začít se tím živit.
GPUreport.cz
GPUreport.cz
- richie08
- Začátečník

- Registrován: 15. říj 2006
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
webwalker: Autor článku mne sice přesvědčovat o kvalitách BD může jak chce, ale když evidentně dle grafů nedokáže porazit ani Phenoma, tak mám s jeho interpretací dost problém (neřku-li již vyloženě komické stavění na úroveň SB).
V reálných aplikacích je to ještě mnohem horší. BD je dokonalý propadák mezi procesory a zaslouží si jít do křemíkového pekla za P4 a VIA Centaur (všechny s nízkým IPC).
Ano, pokud testuji v Singlu, tedy jedno vlákno na celý modul, pak opravdu má BD výhodu celého plnotučného front endu, který je dimenzován pro vlákna dvě.webwalker píše:BD má "výhodu" většího frontendu, protože ten zásobuje dvě core!
Jenže ty nechápeš, že v Phenomu jsou 3ALUs svázány s 3LSU, tedy ve skutečnosti má phenom pouze 3 kombinované jednotky ALU/LSU. Je jasné, že to Phenomu přineslo nějakou výhodu, nejspíše úsporu tranzistorů, při stále slušném vykonu. Oproti tomu má BD 4 plnotučné jednotky 2ALU + 2AGU. Již dlouho před vydáním BD se odhadovalo, že reálný výkon 2ALU+2AGU by měl být i tak vyšší než u známé konfigurace z Phenomu. Jenže ouha - BD je i v tomto pomalejší. Tedy výkon té 3. jednotky se nikam neztratil!!! Naopak, pokud si vezmeme že Phenom většinu času běží v režimu 2ALU+1LSU, občas musí běžet v 1ALU+2LSU nebo se mu někdy podaří vložit cyklus 3ALU+0LSU, tak je jeho výkon kdy překonává papírově o něco silnější BD dost obdivuhodný. Vývojáři co přišli s touhle koncepcí, která započala v K7, si zaslouží hlubokou úctu.webwalker píše: První graf ukazuje teoretické hodnoty výkonu ALU, Samozřejmě, že kdyby měl BD 3ALU tak v těchto syntetických testech by to byla výhoda, nicméně projeví se snížení počtu ALU také v reálném světě? No asi ne, viz následující graf drystone (drystone sice není reálná aplikace, ale oni ji použili, protože je čistě int).
No a kam se najednou poděl výkon těch třetích ALU pipe v Ph? Připomínám, že je poměřováno Ph6 (18ALU) vs BD (16ALU) na stejných taktech.
V reálných aplikacích je to ještě mnohem horší. BD je dokonalý propadák mezi procesory a zaslouží si jít do křemíkového pekla za P4 a VIA Centaur (všechny s nízkým IPC).
- webwalker
- Začátečník

- Registrován: 03. úno 2010
- Bydliště: Buranov vedle Prahy
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
richie08: Phenom má vlastně 3 kompletní ALU pipeline - ALU a AGU/LSU jsou svázány (přístupy LS do cache ale jen 2).
U BD jsou AGU/LSU odděleny od ALU ne kvůli nějaké výhodě, ale kvůli nutnosti - oni se totiž musejí také starat o L/S FPU! Výkon samotných int ALU u BD vyšší nebo stejný je (viz Drystone). Tam navíc není započítána vyšší frekvence BD!
Prostě bych problémy BD hledal jinde, nežli v počtu int ALU - stále platí, že další int výpočty můžeš provádět na int SIMD.
U BD jsou AGU/LSU odděleny od ALU ne kvůli nějaké výhodě, ale kvůli nutnosti - oni se totiž musejí také starat o L/S FPU! Výkon samotných int ALU u BD vyšší nebo stejný je (viz Drystone). Tam navíc není započítána vyšší frekvence BD!
Prostě bych problémy BD hledal jinde, nežli v počtu int ALU - stále platí, že další int výpočty můžeš provádět na int SIMD.
Chtěl bych se stát profesionálním pískačem. Už teď jsem v tom sice hvězda, ale chtěl bych se ještě zdokonalit a začít se tím živit.
GPUreport.cz
GPUreport.cz
- richie08
- Začátečník

- Registrován: 15. říj 2006
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
webwalker: Výkon v Drystone je nižší o fous než u Phenomu, takže nevím kde vidíš opak. Fakt je, že není schopen takt na takt porazit ani Phenoma, natož SB (u něj je krásně vidět, že 3plnotučné ALU s HTT výborně škálují, dokonce i bez HTT podávají výborný výkon, takže tím bych ukončil polemiku na téma "nevyužitelné třetí ALU" - ta využitelná je a že ji BD nemá je chyba). Ale máš pravdu v tom, že BD má daleko slabší místa než je jeho slabá ALU část.
- THANATOS
- Začátečník

-
- Registrován: 14. zář 2009
- Bydliště: Nové Zámky
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
richie08
ty pozeras perf/thread a to je nepresne, lebo BD score je delene 8 ale Thuban score len 6, pricom Thuban ma 3ALU ale BD len 2 a my chceme vykon na 1 ALU.
Ak si to das dokopy tak
BD ~90 / 4 / 4 (4moduly a 4ALU na modul)=5.625
Thuban ~70 /6/3(6jadier a 3ALU na jadro)=3.9
5.625/3.9=+44%
SB:82/4/3=6.83
SB+HT: 112/4/3(4jadra a 3ALU na jadro)=9.33 Toto je vysledok pri max. vyuziti vsetkych ALU
SB+HT: ~112 137%
SB: ~82 100%
pri pouziti HT kde ALU idu naplno mas +37% vykonu.
Ked si to rozdelime rovnomerne medzi 3 ALU: 137/3=46% vykonu na ALU, ale bez HT dosahuje SB 100%, cize 100/46=2.174
Ta 3 ALU je vyuzita len na 17.4%, no fakt nic moc.
Velmi by ma zaujimalo preco nepridali aj 4ALU do SB
narast vykonu by bol velmi zaujimavy pri HT(mne to vychadza na +84%[4/2.174] vs bez HT v idealnom pripade).
P.S. hadam som to dobre zratal, ak nie tak ma opravte.
Edit: v skutocnosti nie je BD ALU o 44% vykonnejsia, problem je, ze Thuban nevyuzije 3ALU naplno. Ak ich vyuziva aspon ako SB bez HT, cize 2.174 z 3ALU tak to mame 70/6/2.174=5.37
Potom to je 5.625/5.37= +5% pre BD.
on to vidi na tom istom obrazkuVýkon v Drystone je nižší o fous než u Phenomu, takže nevím kde vidíš opak. Fakt je, že není schopen takt na takt porazit ani Phenoma,
ty pozeras perf/thread a to je nepresne, lebo BD score je delene 8 ale Thuban score len 6, pricom Thuban ma 3ALU ale BD len 2 a my chceme vykon na 1 ALU.
Ak si to das dokopy tak
BD ~90 / 4 / 4 (4moduly a 4ALU na modul)=5.625
Thuban ~70 /6/3(6jadier a 3ALU na jadro)=3.9
5.625/3.9=+44%
SB:82/4/3=6.83
SB+HT: 112/4/3(4jadra a 3ALU na jadro)=9.33 Toto je vysledok pri max. vyuziti vsetkych ALU
vyuzitelnost 3 ALU bez HT je velmi slaba.natož SB (u něj je krásně vidět, že 3plnotučné ALU s HTT výborně škálují, dokonce i bez HTT podávají výborný výkon, takže tím bych ukončil polemiku na téma "nevyužitelné třetí ALU" - ta využitelná je a že ji BD nemá je chyba).
SB+HT: ~112 137%
SB: ~82 100%
pri pouziti HT kde ALU idu naplno mas +37% vykonu.
Ked si to rozdelime rovnomerne medzi 3 ALU: 137/3=46% vykonu na ALU, ale bez HT dosahuje SB 100%, cize 100/46=2.174
Ta 3 ALU je vyuzita len na 17.4%, no fakt nic moc.
Velmi by ma zaujimalo preco nepridali aj 4ALU do SB
P.S. hadam som to dobre zratal, ak nie tak ma opravte.
Edit: v skutocnosti nie je BD ALU o 44% vykonnejsia, problem je, ze Thuban nevyuzije 3ALU naplno. Ak ich vyuziva aspon ako SB bez HT, cize 2.174 z 3ALU tak to mame 70/6/2.174=5.37
Potom to je 5.625/5.37= +5% pre BD.
Je fakt, ze BD ALU nie je dokonala a da sa tam este co vylepsovat pri pohlade na SB, ale BD ma daleko slabsie miesta ako ALU a najprv tie nech opravia a potom mozu vylepsovat aj ALU.Ale máš pravdu v tom, že BD má daleko slabší místa než je jeho slabá ALU část.
Lenovo Legion Y540-15IRH CPU: Intel Core i5 9300H GPU: NVIDIA GeForce GTX 1650 4GB RAM: 24GB 2666Mhz Micron SSD: 512GB WDC SN720 + 1TB Crucial MX500
- flanker
- Moderátor

- Registrován: 13. pro 2005
- Bydliště: Brno
- Kontaktovat uživatele:
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
Niméně Llano je spíše podobné Regoru, ne Denebu. A ta L3 dělá (teplotně) svoje. Mohu říci, že Thuban určitě jde chladit hůře než obyčejný Deneb, vše odzkoušeno se stejným chladičem. Myslím si, že by spotřeba x8 Phenomu byla cca stejná jak FX 8000, ale byl by větší problém uchladit určitá místa čipu, kdy by docházelo k vypnutí apod.richie08 píše:
Celý problém je, že oni dělají závěry z porovnání BD modul vs. Phenom core, což je kravina, protože BD modul i s L2 cache obsahuje téměř 2x víc tranzistorů než Phenom core. Adekvátnější je spíš porovnávat 1modul vs. 2Phenom jádra. Mimochodem tam připouští, že Phenom X8 by byl výkonnější než BD, ale že prý by jej určitě neuchladili a proto je BD mnohem lepší volba - to je další nesmysl, Phenom na 32nm v Llanu ukazuje stejnou spotřebu jako FX-4100, takže Phenom X8 by na tom byl spotřebou stejně při daleko vyšším výkonu. Na BD je dobrá jen FPU a MemCtlrer.
Na grafech je kouzelné to, že si z nich člověk může vyvodit závěry sám, nebo si pomocí nich ověřit závěry pisatele článku. Já nad grafy dokážu zapojit mozek a rozhodně z nich nemůžu učinit tak pozitivní závěry ohledně ALU BD. Nevím, asi hulí kvalitní matroš, jinak si to nedovedu vysvětlit.
ROG Power PC1:AMD Ryzen 7 5700X, Crosshair VII Hero, ROG Ryuo II 360, 512GB NVMe+500GB Samsung SSD, 2x 16GB GSkill TridentZ Neo RGB 3600 MHz, Dual RTX 2060,CM V750, Lian Li O11 Dynamic XL. PC2:AMD FX-8370, Silentium Fera, Asus 970 Pro Gaming/Aura, 240GB SSD HyperX 3K, R9-270X OC, 2x 4GB GSkill RipjawsX 2400 MHz, Corsair AX750, Bitfenix Pandora
- del42sa
- Pokročilý

- Registrován: 18. lis 2009
- Bydliště: Omicron Persei 8
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
http://www.fudzilla.com/home/item/26204 ... k-at-38ghz
100W TDP frekvence 3.8GHz turbo 4.2GHz + DirectX 11 HD 7660D.
ještě k upřesnění té hloubky pipeline v BD:
100W TDP frekvence 3.8GHz turbo 4.2GHz + DirectX 11 HD 7660D.
ještě k upřesnění té hloubky pipeline v BD:
Bulldozer doesn't have deep pipelines it is 15 for the Integer Portion and 20 for the Floating Point Portion
"The more you buy, the more you save" AI everywhere - Nvidia CEO at Computex 2023 https://www.youtube.com/watch?v=FhlE3m1trM4
Vega Primitive Shader combines the functions of vertex and geometry shader and with the right knowledge you can discard game based primitives at an incredible rate" https://pcper.com/2017/01/amd-vega-gpu- ... tecture/2/
MSI MPG GUNGNIR 110R White | CPU AMD Ryzen 7 9700X Granite Ridge | DeepCool AK500 White | GPU Sapphire Pure RX 9070 XT 16GB plus UV | MB MSI MAG X670E GAMING PLUS WIFI | 32GB DDR5 A-DATA XPG LANCER RGB Dual KIT 7200 MHz | system HDD SSD M.2 Kingston FURY Renegade NVMe 1TB | Seagate Baracuda HDD 1TB SATA III | data HDD WD RED 1TB SATA III | Quad HD VA monitor 27" MSI Optix G27CQ4 Free Sync 165 Hz 10bit HDR | Soud Blaster Audigy Fx | PSU MSI MAG A850GL 850 W 80 PLUS Gold PCIe 5 II | Win 10-64 bit Pro
Vega Primitive Shader combines the functions of vertex and geometry shader and with the right knowledge you can discard game based primitives at an incredible rate" https://pcper.com/2017/01/amd-vega-gpu- ... tecture/2/
MSI MPG GUNGNIR 110R White | CPU AMD Ryzen 7 9700X Granite Ridge | DeepCool AK500 White | GPU Sapphire Pure RX 9070 XT 16GB plus UV | MB MSI MAG X670E GAMING PLUS WIFI | 32GB DDR5 A-DATA XPG LANCER RGB Dual KIT 7200 MHz | system HDD SSD M.2 Kingston FURY Renegade NVMe 1TB | Seagate Baracuda HDD 1TB SATA III | data HDD WD RED 1TB SATA III | Quad HD VA monitor 27" MSI Optix G27CQ4 Free Sync 165 Hz 10bit HDR | Soud Blaster Audigy Fx | PSU MSI MAG A850GL 850 W 80 PLUS Gold PCIe 5 II | Win 10-64 bit Pro
- richie08
- Začátečník

- Registrován: 15. říj 2006
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
Thanatosi, budu reagovat jen na tuhle jakž-takž smysluplnou část kalkulací. Tak prvně bych zcela vynechal K10, protože ta má sdílené ALUs s LSU, takže je defakto neporovnatelná. Naopak BD a SB můžeme porovnat docela dobře a zde nám vychází docela zajímavá čísla.THANATOS píše: richie08on to vidi na tom istom obrazkuVýkon v Drystone je nižší o fous než u Phenomu, takže nevím kde vidíš opak. Fakt je, že není schopen takt na takt porazit ani Phenoma,![]()
ty pozeras perf/thread a to je nepresne, lebo BD score je delene 8 ale Thuban score len 6, pricom Thuban ma 3ALU ale BD len 2 a my chceme vykon na 1 ALU.
Ak si to das dokopy tak
BD ~90 / 4 / 4 (4moduly a 4ALU na modul)=5.625
Thuban ~70 /6/3(6jadier a 3ALU na jadro)=3.9
5.625/3.9=+44%
SB:82/4/3=6.83
SB+HT: 112/4/3(4jadra a 3ALU na jadro)=9.33 Toto je vysledok pri max. vyuziti vsetkych ALU
Nejprve se podívejme jak je u SB ta třetí ALU vytížená v singlu:
(vše vztaženo na jádro, protože porovnáváme jen využitelnost třetí ALU)
BD ~ 11,25
SB ~ 20,50 ..... což je 1,82x víc než BD
Jinými slovy SB dokáže podat o 84% větší výkon při o 50% více ALU jednotek. Je tedy zcela zřejmé, že třetí ALU je nutná a dokonce ty 3ALU v SB jsou více vytížené než 2ALU u BD. Zde končí veškeré povídačky o efektivitě těch dvou ALU a efektivitě BD vůbec, když je jasně vidět, že AMD neumí ani pouhé 2 ALU pořádně využít. Kdyby SB bylo jen o 30% rychlejší, tak by šlo ještě polemizovat zda je lepší mít vyšší absolutní výkon v singlu nebo je lepší mít vyšší efektivitu a ušetřit nějaké ty tranzistory. Ale bohužel, čísla jsou nekompromisní. Ze strany BD je to velká mizérie a SB je nutno pochválit za výborné zásobování svých ALUs.
A nyní se můžeme podívat na maximální vytíženost třetí ALU (multi s HT):
(vše vztaženo na jádro, protože porovnáváme jen využitelnost třetí ALU)
BD ~ 90/8 = 11,25
SB ~ 112/4 = 28..... což je 2,48x víc než BD
Jinými slovy SB dokáže podat o 148% větší výkon při o 50% více ALU jednotek za použití HT (nebo chcete-li 2,5x větší výkon při 1,5x více jednotek ALU). To už vypadá pro BD jako čistá katastrofa. Pokud podělíme výkon počtem ALU tak dostaneme Thanatosova čísla 5,625 / 9,33 = 0,603...což znamená za předpokladu 100% vyloadování ALU v SB, že ty pouhé dvě ALU v BD jsou ještě navíc využity jen z pouhých 60%.
Závěr:
Tedy AMD má pravdu o té třetí zbytečné ALU, protože BD by ji stejně nikdy nevyužilo. Zlí jazykové by při pohledu na výše zmíněná čísla mohli klidně tvrdit, že BD má velké problémy s využitím i té druhé ALU. Kdyby tu nyní s námi byla stále P4 a stála proti BD, pak by bylo možno vést spekulace na téma zda třetí ALU má smysl nebo ne. Bohužel pro AMD tu je hmatatelný důkaz u konkurence, posouvající debaty spíše do úrovně zda by nenašli využití 4ALUs s příslušnou novou technologií (4way HT atd.).
- THANATOS
- Začátečník

-
- Registrován: 14. zář 2009
- Bydliště: Nové Zámky
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
richie08
Vyssi vykon SB ALU je omnoho pravdepodobnejsi ako, ze BD vytazuje svoje 2 ALU len na 60%.
To si myslis, ze pri takto slabom vyuziti ALU by nedali HT aj tam a nie len do FlexFP?
Ja si viem predstavit, kombinaciu SMT a CMT v buducnosti. Pri pohlade na vyuzitie 3ALU v SB tam mohli dat aj 4ALU a narast mohol byt daleko lepsi aspon si myslim.
v tvojich poslednych komentaroch ti porovnanie BD a K10 nerobilo ziadny problem az teraz co sa stalo?Tak prvně bych zcela vynechal K10, protože ta má sdílené ALUs s LSU, takže je defakto neporovnatelná. Naopak BD a SB můžeme porovnat docela dobře a zde nám vychází docela zajímavá čísla.
vyuzitie 3-tej ALU je len 17.4% co som uz raz pisal, tak neviem preco zistujes vyuzitie 3ALU v SB porovanim SB vs BD, ked tam mas SB s HT a bez?Nejprve se podívejme jak je u SB ta třetí ALU vytížená v singlu:
(vše vztaženo na jádro, protože porovnáváme jen využitelnost třetí ALU)
BD ~ 11,25
SB ~ 20,50 ..... což je 1,82x víc než BD
Jinými slovy SB dokáže podat o 84% větší výkon při o 50% více ALU jednotek. Je tedy zcela zřejmé, že třetí ALU je nutná a dokonce ty 3ALU v SB jsou více vytížené než 2ALU u BD. Zde končí veškeré povídačky o efektivitě těch dvou ALU a efektivitě BD vůbec, když je jasně vidět, že AMD neumí ani pouhé 2 ALU pořádně využít. Kdyby SB bylo jen o 30% rychlejší, tak by šlo ještě polemizovat zda je lepší mít vyšší absolutní výkon v singlu nebo je lepší mít vyšší efektivitu a ušetřit nějaké ty tranzistory. Ale bohužel, čísla jsou nekompromisní. Ze strany BD je to velká mizérie a SB je nutno pochválit za výborné zásobování svých ALUs.
nenapadlo ta, ze BD moze byt vyuzita na >90% ale SB ALU je jednoducho o >=50% vykonnejsia?A nyní se můžeme podívat na maximální vytíženost třetí ALU (multi s HT):
(vše vztaženo na jádro, protože porovnáváme jen využitelnost třetí ALU)
BD ~ 90/8 = 11,25
SB ~ 112/4 = 28..... což je 2,48x víc než BD
Jinými slovy SB dokáže podat o 148% větší výkon při o 50% více ALU jednotek za použití HT (nebo chcete-li 2,5x větší výkon při 1,5x více jednotek ALU). To už vypadá pro BD jako čistá katastrofa. Pokud podělíme výkon počtem ALU tak dostaneme Thanatosova čísla 5,625 / 9,33 = 0,603...což znamená za předpokladu 100% vyloadování ALU v SB, že ty pouhé dvě ALU v BD jsou ještě navíc využity jen z pouhých 60%.
Vyssi vykon SB ALU je omnoho pravdepodobnejsi ako, ze BD vytazuje svoje 2 ALU len na 60%.
To si myslis, ze pri takto slabom vyuziti ALU by nedali HT aj tam a nie len do FlexFP?
Pre BD by bola zbytocna, ale tak isto aj pre SB ak by tam nemali HT. Slabe vyuzitie druhej ALU v BD som uz komentoval.Tedy AMD má pravdu o té třetí zbytečné ALU, protože BD by ji stejně nikdy nevyužilo. Zlí jazykové by při pohledu na výše zmíněná čísla mohli klidně tvrdit, že BD má velké problémy s využitím i té druhé ALU. Kdyby tu nyní s námi byla stále P4 a stála proti BD, pak by bylo možno vést spekulace na téma zda třetí ALU má smysl nebo ne. Bohužel pro AMD tu je hmatatelný důkaz u konkurence, posouvající debaty spíše do úrovně zda by nenašli využití 4ALUs s příslušnou novou technologií (4way HT atd.).
Ja si viem predstavit, kombinaciu SMT a CMT v buducnosti. Pri pohlade na vyuzitie 3ALU v SB tam mohli dat aj 4ALU a narast mohol byt daleko lepsi aspon si myslim.
Lenovo Legion Y540-15IRH CPU: Intel Core i5 9300H GPU: NVIDIA GeForce GTX 1650 4GB RAM: 24GB 2666Mhz Micron SSD: 512GB WDC SN720 + 1TB Crucial MX500
- richie08
- Začátečník

- Registrován: 15. říj 2006
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
Thanatosi, liskni se za ty tvoje počty a zopakuj si matiku základní školy. SandyBridge je na stejném taktu o 84% rychlejší (bez HTT) oproti BD a ty budeš stále tvrdit že 3ALU neumí využít? Vždyť BD je tak velký zmetek, že by byl neprodejný i kdyby Intel žádné HTT neměl.
- THANATOS
- Začátečník

-
- Registrován: 14. zář 2009
- Bydliště: Nové Zámky
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
richie08 ja si nepotrebujem nic zopakovat a mozes do mna rypat kolko len chces, nic to nezmeni na tom, ze podla toho testu 3ALU je vyuzita len na 17.4% pri vypnutom HT a to som porovnaval SB s HT a bez.
Naposledy upravil(a) THANATOS dne pon 19. bře 2012, 18:42, celkem upraveno 3 x.
Lenovo Legion Y540-15IRH CPU: Intel Core i5 9300H GPU: NVIDIA GeForce GTX 1650 4GB RAM: 24GB 2666Mhz Micron SSD: 512GB WDC SN720 + 1TB Crucial MX500
- Maor
- Začátečník

- Registrován: 19. bře 2010
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
richie: ale prodává se, i když je to zmetek, zkrátka ne každý potřebuje silný singlethread za každých okolností
- Hladis
- Moderátor

- Registrován: 24. čer 2004
- Bydliště: Varnsdorf - Athens
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
Ehm jo prodava se. Obcas si to nejaky neinformovany BFU koupi ,ale vyjadreno cisly je to naprosty propadak. Uz jen kvuli tomu ze to nikdo nestrka do sestav. Stejne jeste urcite % kupcu prijde ze to nefunguje. Nikdo normalni a znaly si to CPU proste nekoupi.Maor píše:richie: ale prodává se, i když je to zmetek, zkrátka ne každý potřebuje silný singlethread za každých okolností
- flanker
- Moderátor

- Registrován: 13. pro 2005
- Bydliště: Brno
- Kontaktovat uživatele:
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
na encoding videí to není špatná volba. Obecně veškerý optimalizovaný multithread (video, render, šifrování, grafika) je na FX hodně dobrý. Nevýhoda je pouze ten singl thread, který mu degraduje celkovou hodnotu. Nicméně, já jsem s FX "spokojen" jako uživatel, mohl být lepší, mohl být i horší (nedej Bůh). Krásně a jednoduše, je třeba zapracovat na "zastaralém" singl thread výkonu, který AMD tak nějak zatracovalo.
ROG Power PC1:AMD Ryzen 7 5700X, Crosshair VII Hero, ROG Ryuo II 360, 512GB NVMe+500GB Samsung SSD, 2x 16GB GSkill TridentZ Neo RGB 3600 MHz, Dual RTX 2060,CM V750, Lian Li O11 Dynamic XL. PC2:AMD FX-8370, Silentium Fera, Asus 970 Pro Gaming/Aura, 240GB SSD HyperX 3K, R9-270X OC, 2x 4GB GSkill RipjawsX 2400 MHz, Corsair AX750, Bitfenix Pandora
- Maor
- Začátečník

- Registrován: 19. bře 2010
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
ještě abys ho flankere nepochválil, marně čekám na 5modul do desktopu, ten už by byl přesvědčivější. Nebo nějakou kvalitní desku s 4xG34 paticí, to už by byl multithread, ještě k tomu dát opteron s odemčeným násobičem, to by potom mohlo drtit 4x2011 v poměru cena/výkon
- flanker
- Moderátor

- Registrován: 13. pro 2005
- Bydliště: Brno
- Kontaktovat uživatele:
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
ale i tak mi FX Zambezi připomíná něčím AMD Phenom Agenu...Prostě není to ono, něco je opravdu fajn jako např IMC silný, slušný multithread, spousta nových instrukcí, slušný OC. Chybkou je ale nevyrovnaný výkon, slabší v x87, nedoladěná výroba a rozdílnost jednotlivých kusů v topivosti a spotřebě.
VIshera snad leccos napraví, nicméně ten singl nebude o moc lepší to vypadá. Lze již nyní usuzovat, že např superpí 1M vypočítá FX-8150 na defaultu za 20.5s, Vishera na stejném taktu by jej měla vypočítat za 19-19.5s.
VIshera snad leccos napraví, nicméně ten singl nebude o moc lepší to vypadá. Lze již nyní usuzovat, že např superpí 1M vypočítá FX-8150 na defaultu za 20.5s, Vishera na stejném taktu by jej měla vypočítat za 19-19.5s.
ROG Power PC1:AMD Ryzen 7 5700X, Crosshair VII Hero, ROG Ryuo II 360, 512GB NVMe+500GB Samsung SSD, 2x 16GB GSkill TridentZ Neo RGB 3600 MHz, Dual RTX 2060,CM V750, Lian Li O11 Dynamic XL. PC2:AMD FX-8370, Silentium Fera, Asus 970 Pro Gaming/Aura, 240GB SSD HyperX 3K, R9-270X OC, 2x 4GB GSkill RipjawsX 2400 MHz, Corsair AX750, Bitfenix Pandora
- richie08
- Začátečník

- Registrován: 15. říj 2006
Re: AMD "Piledriver" refresh Zambezi - info,spekulace atd
Thanatosi, jako počítat takhle divoce procenta z procent, no nevím. Nicméně jsem si to spočítal jinak a dospěl ke stenému číslu, takže OK. Jenže interpretace není tak triviální - instruction flow v CPU neběží s konstantním tokem, tady žádné průměry neplatí. CPU je silně nestacionární systém a jeho ALU jsou vytížené dle toho jak moc dobře zafunguje OoO a scheduler - nejdou navrhnout dle průměrného toku. Proto ikdyž se zdá, že třetí ALU u SB nebo i Phenomu je téměř nevyužitá, tak ve skutečnosti je využívaná dost často, jen CPU musí občas zpracovávat i sekvenci instrukcí, které vytíží jen třeba jednu ALU a tím kazí průměr. Na závěr jedno porovnání: pokud budeme uvažovat výkon SB w/ HT za 100%, pak vytíženost obou BD ALU je 60%...což znamená jednu plně vytíženou a jednu, která je vytížená jen na 20% - a znamená to, že by BD druhou ALU nevyužívalo? Ne.
Flanker: Bulldozer nemá s Agenou nic společného, naopak je to její protiklad. Agena byla založena na velmi dobré architektuře K10 a její neúspěch způsobil opravdu nepovedený 65nm výrobní proces a TLB bug. Nicméně i přesto všechno měla K10 velkou brute force, ve FPU dokázala takt na takt drtit Core2duo, což dávalo tušit, že pokud se podaří zvednout frekvence, tak to bude dobrý CPU. BD je zoufale pomalý ve všem, takt na takt prohrává všechno. Architektura BD nemá budoucnost, neměla ji rok před tím než vyšel, Dirk Meyer to moc dobře věděl. Nezbývá než si počkat 3 roky na architekturu novou.
Flanker: Bulldozer nemá s Agenou nic společného, naopak je to její protiklad. Agena byla založena na velmi dobré architektuře K10 a její neúspěch způsobil opravdu nepovedený 65nm výrobní proces a TLB bug. Nicméně i přesto všechno měla K10 velkou brute force, ve FPU dokázala takt na takt drtit Core2duo, což dávalo tušit, že pokud se podaří zvednout frekvence, tak to bude dobrý CPU. BD je zoufale pomalý ve všem, takt na takt prohrává všechno. Architektura BD nemá budoucnost, neměla ji rok před tím než vyšel, Dirk Meyer to moc dobře věděl. Nezbývá než si počkat 3 roky na architekturu novou.