Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Vše o procesorech Advanced Micro Devices.

Moderátoři: flanker, Eddward, Baneshee

Zamčeno

Kdy podle vás uvidíme launch FX procesorů (recenze)?

Anketa končí za pát 9. pro 2011, 11:17

do poloviny září 2011
0
Žádná hlasování
do konce září 2011
8
8%
do poloviny října 2011
24
24%
do konce října 2011
28
28%
do půlky listopadu 2011
12
12%
nejspíš nikdy :-), EPIC FAIL
28
28%
 
Celkem hlasů: 100
del42sa
Pokročilý
Pokročilý
Uživatelský avatar
Registrován: 18. lis 2009
Bydliště: Omicron Persei 8

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od del42sa »

jo do nekterych desek ano pouze s upgradem biosu.
"The more you buy, the more you save" AI everywhere - Nvidia CEO at Computex 2023 https://www.youtube.com/watch?v=FhlE3m1trM4
Vega Primitive Shader combines the functions of vertex and geometry shader and with the right knowledge you can discard game based primitives at an incredible rate" https://pcper.com/2017/01/amd-vega-gpu- ... tecture/2/

MSI MPG GUNGNIR 110R White | CPU AMD Ryzen 7 9700X Granite Ridge | DeepCool AK500 White | GPU Sapphire Pure RX 9070 XT 16GB plus UV | MB MSI MAG X670E GAMING PLUS WIFI | 32GB DDR5 A-DATA XPG LANCER RGB Dual KIT 7200 MHz | system HDD SSD M.2 Kingston FURY Renegade NVMe 1TB | Seagate Baracuda HDD 1TB SATA III | data HDD WD RED 1TB SATA III | Quad HD VA monitor 27" MSI Optix G27CQ4 Free Sync 165 Hz 10bit HDR | Soud Blaster Audigy Fx | PSU MSI MAG A850GL 850 W 80 PLUS Gold PCIe 5 II | Win 10-64 bit Pro
StepanPepan
Začátečník
Začátečník
Registrován: 01. pro 2010
Bydliště: Praha

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od StepanPepan »

http://cs.twitch.tv/amd

je tu nějaký AMD live event a v chatu nějaké "oficiální info" od AMD
StepanPepan
Začátečník
Začátečník
Registrován: 01. pro 2010
Bydliště: Praha

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od StepanPepan »

okno jsem si zavřel a v tom novém nejsou staré posty z chatu, smůla! ;)
dexterav
Mírně pokročilý
Mírně pokročilý
Uživatelský avatar
Registrován: 26. pro 2003
Kontaktovat uživatele:

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od dexterav »

babenky sú tam chutné :mrgreen:
Intel Ultra 7 265k 5,6/4,9GHz,Apex Z890, 2X24GB 8,73GHz CL40 Corsair, Asus TUF 5090 3.2/34GHz , H2O + Carbide 600Q,SS Noctua Edition, 10TB 850X, Topping D50s + Tilia + T5, StrixPG32UCDP, Fold7, ITX 13700k + 5070Ti + Audinst Hud-Mx2 + THX-M50X
webwalker
Začátečník
Začátečník
Uživatelský avatar
Registrován: 03. úno 2010
Bydliště: Buranov vedle Prahy

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od webwalker »

Spojení 2 jader (prakticky reverzní HT) by imho k vyššímu výkonu BD moc nepomohlo. Ono to jen tak hezky vypadá, ale rád bych viděl jak často by byly, díky závislostem, všechny 4 ALU využity. Problém bude někde jinde a určitě se po NDA dozvíme kde.
Chtěl bych se stát profesionálním pískačem. Už teď jsem v tom sice hvězda, ale chtěl bych se ještě zdokonalit a začít se tím živit.
GPUreport.cz
flanker
Moderátor
Moderátor
Uživatelský avatar
Registrován: 13. pro 2005
Bydliště: Brno
Kontaktovat uživatele:

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od flanker »

dexterav píše:babenky sú tam chutné :mrgreen:
ten Chew se bude muset sám chladit dusíkem nakonec z těch HOT slečen :D... 4 slečna a jeden borec,aj jaj :D

GaGy píše:Jak to teda bude s buldozerem pujde do AM3 patice ?
Půjde, ale ne do všech desek-většinou ty s silnějším napájením a větším ROM pro BIOSy...problém tam bude nejspíš s OC (bude nižší než na AM3+ a méně možnoti v nastaveních)
ROG Power PC1:AMD Ryzen 7 5700X, Crosshair VII Hero, ROG Ryuo II 360, 512GB NVMe+500GB Samsung SSD, 2x 16GB GSkill TridentZ Neo RGB 3600 MHz, Dual RTX 2060,CM V750, Lian Li O11 Dynamic XL. PC2:AMD FX-8370, Silentium Fera, Asus 970 Pro Gaming/Aura, 240GB SSD HyperX 3K, R9-270X OC, 2x 4GB GSkill RipjawsX 2400 MHz, Corsair AX750, Bitfenix Pandora
Maor
Začátečník
Začátečník
Uživatelský avatar
Registrován: 19. bře 2010

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od Maor »

tak mě napadlo uplatnění pro BD, výpočetní stanice do škol atd... Pro ty systémy, kdy je jeden PC a k tomu je víc periferií. Na dělání levných pracovních stanic to bude úplně super, každý uživatel bude mít pro svoji práci třeba 1/2 modulu, což pro něj bude mnohem lepší než samostatná stanice na Atomu a k tomu třeba bude ještě jeden modul volný, kdyby se nárazově zvýšily požadavky na výkon. Viděl jsem takovýhle multipoint server systém postavený na C2D+GT8800 a to byl děs, jeden člověk si pustil rendrování krychle v blenderu a ostatní 4 uživatelé nemohli ani pohnout kurzorem, jak se systém zasekal. AMD by stačilo tohle jen protlačit marketingem a na Africkém trhu by to mělo úspěch, zvlášť s AMD grafikama, který zvládaj 6 monitorů. S možnostma výroby, by ten Africkej trh amd úplně stačil
maltra
Začátečník
Začátečník
Uživatelský avatar
Registrován: 11. říj 2010
Bydliště: Západná Stredozem

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od maltra »

Trocha humoru z toho chatu z tej AMD akcie:

Chuck Norris a Bulldozer

- Chuck Norris dokaze silnym uderom urobit z kremiku Bulldozer
- Chuck Norris pretaktoval Bulldozer na 9 GHz svojim sviezim dychom
- Chuck Norris dokaze rozbehat Nvidia SLI na dvoch Radeonoch HD 6990

Obcas to tam niekto placol a celkom sa mi to zdalo vtipne :-).
PC: 9800X3D | 64GB CL30 | X870E Aorus Pro | ZOTAC RTX 5070 Ti AMP | WD_BLACK SN850X 2TB & 4TB | Phanteks Enthoo Pro M Glass | RM1000e | Alienware AW3423DWF
Retro PC: PIII 650E Slot 1 | GA-6BXE Rev 1.9 | 128MB DDR | V4 4500 32MB AGP | SB 32 PnP CT3670 | SpinPoint 80GB>32GB
mega52
Začátečník
Začátečník
Registrován: 03. říj 2011
Bydliště: Praha

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od mega52 »

webwalker píše:Spojení 2 jader (prakticky reverzní HT) by imho k vyššímu výkonu BD moc nepomohlo. Ono to jen tak hezky vypadá, ale rád bych viděl jak často by byly, díky závislostem, všechny 4 ALU využity. Problém bude někde jinde a určitě se po NDA dozvíme kde.
4 ALU na takt sa nevyuziju nikdy a v hrach sa vyuzije priemerne menej nez 1 ALU na takt. Ale najvacsi pruser je ta dlha pipeline, asi chcu konkurovat P4. Kolko ze to ma, 20 stages?
webwalker
Začátečník
Začátečník
Uživatelský avatar
Registrován: 03. úno 2010
Bydliště: Buranov vedle Prahy

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od webwalker »

mega52: Přesně tak, já na Denebu naměřím v DukNuk průměrné IPC 0,8.
Jinak na délce pipe až tak nezáleží, pokud je tedy dobrá Branch prediction. P4 měla i i delší pipe - podle typu.
Chtěl bych se stát profesionálním pískačem. Už teď jsem v tom sice hvězda, ale chtěl bych se ještě zdokonalit a začít se tím živit.
GPUreport.cz
mega52
Začátečník
Začátečník
Registrován: 03. říj 2011
Bydliště: Praha

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od mega52 »

webwalker: Ale pokial mas v kode pamatovu zavislost premennych tak branch prediction nepomoze a zalezi najviac na dlzke pipeline. Dvojnasobna dlzka vtedy znamena takmer 2x nizsi vykon. A P4 bola vtedy voci CoreDuo 2x pomalsia na takt.
webwalker
Začátečník
Začátečník
Uživatelský avatar
Registrován: 03. úno 2010
Bydliště: Buranov vedle Prahy

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od webwalker »

mega52: Popravdě nevidím spojitost mezi délkou pipe a závislosti. Myslíš, že by závislá instrukce byla rychleji zpracována, kdyby v kratší pipe vůbec nebyla? Ale možná jsem tě dobře nepochopil.
Imo P4 byla pomalejší vůči CD2 i z mnoha jiných důvodů než je délka pipe.
Chtěl bych se stát profesionálním pískačem. Už teď jsem v tom sice hvězda, ale chtěl bych se ještě zdokonalit a začít se tím živit.
GPUreport.cz
mega52
Začátečník
Začátečník
Registrován: 03. říj 2011
Bydliště: Praha

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od mega52 »

webwalker: Tak to vysvetlim:
Ak je nasledujuca instrukcia zavisla od vysledku predchadzajucej instrukcie, tak sa z nasledujucej moze vykonat nacitanie a dekodovanie, ale dalej sa musi cakat kym sa vyhodnoti predchadzajuca instrukcia, tj. kym dojde az takmer na koniec pipeline, kedy uz je vysledok ulozeny v registri.
Ak mame pipeline dlhu 20 stage a tato kriticka cast(critical execution path) pocas ktorej sa musi cakat je dajme tomu 75% dlzky pipeline, tak sa caka tych 15 cyklov (clock cycle) kym zacne druha instrukcia.

Ak mas napr. taketo 4 zavisle instrukcie sa sebou, tak kazda trva minimalne 15 cyklov, celkovo je to teda minimalne 60 cyklov + cykly na zacatie prvej a dokoncenie poslednej instrukcie, teda spolu 65.

Ak mas ale za sebou 4 pamatovo nezavisle instrukcie, tak sa mozu vykonavat jedna za druhou, posunute o 1 cyklus. Prva sa zacne v 1. cykle a dokonci v 20. cykle. Druha zacne v 2. a dokonci v 21. cykle, ..., stvrta zacne v 4. a dokonci v 23. cykle.

Edit:
Ak mas za sebou 100 nezavislych instrukcii, tak sa dokoncia za tych 120 cyklov a priemerne IPC bude 100/120, a to je 0.83.

Edit2:
Toto je blbost: Ak mas viac ALU a FPU tak sa moze na kritickej ceste vykonavat viac instrukcii naraz.
Naraz sa mozu na viacerych ALU a FPU vykonavat len nezavisle instrukcie a tiez scheduler moze pripravit a dekodovat viac instrukcii, ci uz su zavisle alebo nie.
Naposledy upravil(a) mega52 dne sob 8. říj 2011, 23:51, celkem upraveno 2 x.
del42sa
Pokročilý
Pokročilý
Uživatelský avatar
Registrován: 18. lis 2009
Bydliště: Omicron Persei 8

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od del42sa »

webwalker píše:Spojení 2 jader (prakticky reverzní HT) by imho k vyššímu výkonu BD moc nepomohlo. Ono to jen tak hezky vypadá, ale rád bych viděl jak často by byly, díky závislostem, všechny 4 ALU využity. Problém bude někde jinde a určitě se po NDA dozvíme kde.


myslím, že reverzní hyperthreading je v podstatě nerealizovatelná věc, alespoň v podobě jak byl prezentovaný dříve u klasických CPU jako Phenom nebo Core2:
First off, there's no way this would work the way the author seems to think it would. How would the cores' pipelines support this in any phase of execution? In the fetch phase, there would have to be some arbitration mechanism whereby the two cores fetched alternate instruction blocks from the I-cache, thus distributing the instruction stream across two processors.

Then, once the instruction stream is fragmented inside the two cores, how are the register files kept in sync? If an add in one line of code writes its result to a register in one core, then how could a test instruction in the other core read that distant register to see if it needs to branch? Or how would out-of-order execution work across two cores? Would the instruction schedulers have their own separate bus to communicate over?
V modulu je to ale něco jiného, nejde o spojování dvou vláken do jednoho, jen o využití různého počtu výpočetních jednotek pro jedno vlákno. Je fakt, že 4 jednotky to už by bylo pravděpodobně moc (sotva 3 se plně využijí) Realizovat by se to dalo a nejednalo by se reverzní HT, spíš o něco jako Flex ALU. Sám jsem celkem zvědavý co v BD tak ku.ví výkon. Bude to více faktorů, ne jen ALU/AGU, ale i délka pipelines, cache latence, atd.
"The more you buy, the more you save" AI everywhere - Nvidia CEO at Computex 2023 https://www.youtube.com/watch?v=FhlE3m1trM4
Vega Primitive Shader combines the functions of vertex and geometry shader and with the right knowledge you can discard game based primitives at an incredible rate" https://pcper.com/2017/01/amd-vega-gpu- ... tecture/2/

MSI MPG GUNGNIR 110R White | CPU AMD Ryzen 7 9700X Granite Ridge | DeepCool AK500 White | GPU Sapphire Pure RX 9070 XT 16GB plus UV | MB MSI MAG X670E GAMING PLUS WIFI | 32GB DDR5 A-DATA XPG LANCER RGB Dual KIT 7200 MHz | system HDD SSD M.2 Kingston FURY Renegade NVMe 1TB | Seagate Baracuda HDD 1TB SATA III | data HDD WD RED 1TB SATA III | Quad HD VA monitor 27" MSI Optix G27CQ4 Free Sync 165 Hz 10bit HDR | Soud Blaster Audigy Fx | PSU MSI MAG A850GL 850 W 80 PLUS Gold PCIe 5 II | Win 10-64 bit Pro
webwalker
Začátečník
Začátečník
Uživatelský avatar
Registrován: 03. úno 2010
Bydliště: Buranov vedle Prahy

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od webwalker »

mega52: Imho, pokud jsem příklad pochopil správně, pak by to mělo být trochu jinak.
Pokud jsou dvě nebo více instrukcí na sobě nezávislé, mohou se výpočty provést najednou na různých výpočetních jednotkách (pokud tento typ výpočtu podporují), pak je IPC třeba 3 (ILP).
Pokud jsou však výpočty na sobě závislé např. A=3+6, B=A*8, C=B-5 pak samozřejmě nejde paralizovat a jeden výpočet trvá 1c (všechny tedy 3c), pak je IPC 1. Pokud některý z výpočtů má větší latenci IPC<1.
Vždy však pipeline běží nepřetržitě a o "výhodné" plánování pořadí provádění instrukcí se stará OoO.
Tudíž 4 závislé instrukce za sebou trvají 4c (samozřejmě pokud je latence výpočtu na výpočetní jednotce 1).
Pokud máš 100 nezávislých instrukcí, IPC je úměrné ILP, tedy v případě 3ALU IPC=3.
Pochopil jsem to správně?
Chtěl bych se stát profesionálním pískačem. Už teď jsem v tom sice hvězda, ale chtěl bych se ještě zdokonalit a začít se tím živit.
GPUreport.cz
webwalker
Začátečník
Začátečník
Uživatelský avatar
Registrován: 03. úno 2010
Bydliště: Buranov vedle Prahy

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od webwalker »

del42sa: Já to chápu takhle:
SMT: Dva thready do jedné pipe
Rev.HTT: Jeden thread do dvou pipe
Imho jestli se v případě rev.HTT jedná o dvě pipe nebo o dvojnásobek ALU, je tak trochu jedno, protože u BD mají int ALU svůj vlastní sheduler v každém int clusteru. Ale tak nějak se ptám, není to jedno? :)
Ale máš pravdu, FlexFPU je vlastně SMT, tak proč rovnou neudělali SMT taky ALU? Imho takhle asi dosáhli vyšší propustnosti pro servery, ale co DT?
Chtěl bych se stát profesionálním pískačem. Už teď jsem v tom sice hvězda, ale chtěl bych se ještě zdokonalit a začít se tím živit.
GPUreport.cz
yuri.cs
Mírně pokročilý
Mírně pokročilý
Uživatelský avatar
Registrován: 03. led 2007
Bydliště: hl.m. piva
Kontaktovat uživatele:

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od yuri.cs »

mega52 píše:najvacsi pruser je ta dlha pipeline, asi chcu konkurovat P4. Kolko ze to ma, 20 stages?
Tenhle argument je prazvlastni.
C2 ma 14 stages, Nehalem 16. SB bez vyuziti vyhody L0 cache 18. Jsou Nehalem a SB autoamticky horsi?
It will be amazing in case after 10GHz we will see 20GHz, 30GHz and so on, just like we witnessed the thorny way from 10MHz to 33MHz in the eighties. -xbitlabs.com
mega52
Začátečník
Začátečník
Registrován: 03. říj 2011
Bydliště: Praha

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od mega52 »

webwalker píše:mega52:
Pokud jsou však výpočty na sobě závislé např. A=3+6, B=A*8, C=B-5 pak samozřejmě nejde paralizovat a jeden výpočet trvá 1c (všechny tedy 3c), pak je IPC 1.
...
Tudíž 4 závislé instrukce za sebou trvají 4c (samozřejmě pokud je latence výpočtu na výpočetní jednotce 1).
Toto neplati. Az take jednoduche to nie je. Jedna samostatna instrukcia nikdy nemoze trvat 1c(cyklus), lebo musi prejst krokmi: load,fetch,decode,execute a store. A ani to "execute" netrva 1c, ale ovela viac. Pri zavislych instrukciach klesa IPC az pod 0.1, prave kvoli kritickej ceste, kedy sa caka na vysledok predchadzajucej operacie. Podla tvojho vysvetlenia by IPC takmer nikdy nekleslo pod 1 a castejsie by bolo na pocte ALU, co je realne len u tazko optimalizovanych algoritmoch bez zavislosti a cyklov.

V reale je ale ovela viac nezavislych instrukcii ako zavislych, vtedy sa vyuziju viacere ALU a IPC sa dviha ku priemeru co je okolo 1.
mega52
Začátečník
Začátečník
Registrován: 03. říj 2011
Bydliště: Praha

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od mega52 »

yuri.cs píše:
mega52 píše:najvacsi pruser je ta dlha pipeline, asi chcu konkurovat P4. Kolko ze to ma, 20 stages?
Tenhle argument je prazvlastni.
C2 ma 14 stages, Nehalem 16. SB bez vyuziti vyhody L0 cache 18. Jsou Nehalem a SB autoamticky horsi?
Lenze C2, Nehalem a SB sa nelisia len dlzkou pipeline. Ale aj velkostou cache, branch prediction + vela vela dalsich optimalizacii.
Odporucam clanok na arstechnica a dole su odkazy na dalsie 2 clanky: Pipelining part 1 a part 2 kde je to detailne vysvetlene.

Edit: ale pravda, na BD som nemusel byt az tak kriticky.
yuri.cs
Mírně pokročilý
Mírně pokročilý
Uživatelský avatar
Registrován: 03. led 2007
Bydliště: hl.m. piva
Kontaktovat uživatele:

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Příspěvek od yuri.cs »

Deneb(10h) a Zambezi (15h) se nelisi velikostou cache, branch prediction + vela vela dalsich optimalizacii (5 let vyvoje)?

//mega52:
webwalker píše:Pokud některý z výpočtů (nacpanych v pipeline) má větší latenci (nez 1T) IPC<1.
;)
It will be amazing in case after 10GHz we will see 20GHz, 30GHz and so on, just like we witnessed the thorny way from 10MHz to 33MHz in the eighties. -xbitlabs.com
Zamčeno

Zpět na „Procesory AMD“