Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

yuri.cs · Příspěvek od **yuri.cs** » pát 8. dub 2011, 10:37

...The actual number of micro-ops that are dispatched may be lower, depending on a number of
factors, such as whether the processor is executing in fast or slow mode and...

Zajimave

DB ma svou odpoved:

If there is a lot of stuff happening or lasting a multiple of 2 cycles, then we might actually look at two different clocks. A slow clock and a fast clock. So the small L1D$ has a latency of 4 fast clocks, but also 2 slow clocks (which even doesn't sound like nothing special for a 16k cache). The L2 latency could be seen as either 18-20 or 9-10 cycles.

Jinak tady je tez maly vytah:
1.6.4 Instruction Fetching Improvements
While previous AMD64 processors had a single 32-byte fetch window, AMD Family 15h processors
have two 32-byte fetch windows, from which four µops can be selected. These fetch windows, when
combined with the 128-bit floating-point execution unit, allow the processor to sustain a
fetch/dispatch/retire sequence of four instructions per cycle

1.6.6 Notable Performance Improvements
Several enhancements to the AMD64 architecture have resulted in significant performance
improvements in AMD Family 15h processors, including:
• Improved performance of shuffle instructions
• Improved data transfer between floating-point registers and general purpose registers
• Improved floating-point register to floating-point register moves
• Optimization of repeated move instructions
• More efficient PUSH/POP stack operations
• 1-Gbyte paging

2.1 Key Microarchitecture Features
AMD Family 15h processors include many features designed to improve software performance. The
internal design, or microarchitecture, of these processors provides the following key features:
• Integrated DDR3 memory controller with memory prefetcher
• 64-Kbyte L1 instruction cache and 16-Kbyte L1 data cache
• Shared L2 cache between cores of compute unit
• Shared L3 cache compute units on chip (for supported platforms)
• 32-byte instruction fetch
• Instruction predecode and branch prediction during cache-line fills
• Decoupled prediction and instruction fetch pipelines
• Four-wayAMD64 instruction decoding (This is a theoretical limit. See section 2.3 on page 31.)
• Dynamic scheduling and speculative execution
• Two-way integer execution
• Two-way address generation
• Two-way 128-bit wide floating-point execution
• Legacy single-instruction multiple-data (SIMD) instruction extensions, as well as support for
XOP, FMA4, VPERMILx, and Advanced Vector Extensions (AVX).
• Superforwarding
• Prefetch into L2 or L1 data cache
• Deep out-of-order integer and floating-point execution
• HyperTransport™ technology

ched · Příspěvek od **ched** » pát 8. dub 2011, 12:11

Čekal jsem od AGLU víc než jen CALL a LEA. Třeba nějakej shift nebo ADD ... ale asi by se moc zkomplikovala propagace flagů mezi pipelines.

Příspěvek od **flanker** » pát 8. dub 2011, 12:33

In addition to supporting previous HyperTransport interfaces, AMD Family 15h processors support a
newer version of the HyperTransport standard: HyperTransport3. HyperTransport3 increases the
aggregate link bandwidth to a maximum of 25.6 Gbyte/s (16-bit link). HyperTransport3 also adds
HyperTransport Retry

to tedy je při plných 2600 MHz a nebo dokonce až 3200 MHz ?

Chroustostroj

HyperTranspoort měl svůj význam v době prvních Athlonů. Navíc už jen ten pocit, že sběrnici navrhovali inženýři Alfy Sparc. V dnešní době vnímám zvyšování specifikace HT jen jako marketing, nebo se to snad někde výkonově projeví ? Víc bych uvítal kdyby konečně integrovali do CPU celý jižní můstek. Dokážu si představit, že by mi pak deska morálně vydržela i déle než současná se soc. AM2+, která stejně zastarala jen díky DDR2, jinak by tam teoreticky fungoval i Zambezi.

Mimochodem jak je to se serverovou verzí ? Někde jsem četl, že nebude potřeba výměna desky a upgrade bude jen výměnou CPU. Vzhledem k tomu, že Shanghai v serverech taky nepotřeboval změnu desky předpokládám, že většina serverových systému jede na DDR2. Bude tedy BD verze pro server obsahovat i DDR2 řadič ?

ched · Příspěvek od **ched** » pát 8. dub 2011, 13:07

flanker píše:In addition to supporting previous HyperTransport interfaces, AMD Family 15h processors support a
newer version of the HyperTransport standard: HyperTransport3. HyperTransport3 increases the
aggregate link bandwidth to a maximum of 25.6 Gbyte/s (16-bit link). HyperTransport3 also adds
HyperTransport Retry

to tedy je při plných 2600 MHz a nebo dokonce až 3200 MHz ?

25.6Gbyte/s a 16bit link to ukazuje na 3,2GHz takže HT 3.1. Ale mluví o technologii a ne procesoru, takže je možné, že bulldozer sice podporuje HT 3.1 ale bude používat menší než maximální frekvenci. Jestli je ale frekvence L3 odvozena od HT, tak známe její maximální hodnotu

yuri.cs · Příspěvek od **yuri.cs** » pát 8. dub 2011, 13:22

ISSCC 2011:

8MB level 3 cache (composed of 4 independent 2MB subcaches) operates above 2.4GHz at 1.1V

Takze asi tak.

Chroustostroj píše:Mimochodem jak je to se serverovou verzí ? Někde jsem četl, že nebude potřeba výměna desky a upgrade bude jen výměnou CPU. Vzhledem k tomu, že Shanghai v serverech taky nepotřeboval změnu desky předpokládám, že většina serverových systému jede na DDR2. Bude tedy BD verze pro server obsahovat i DDR2 řadič ?

Jen DDR3. Vyuzivat budou soucasne platformy s LGA Socket C32 a Socket G34, ktere uz predtim nahradily Socket F. Oboje samozrejme DDR3. Az dalsi generace BD Terramar by mela zrejme prinest zmenu socketu.

Příspěvek od **flanker** » pát 8. dub 2011, 13:42

kdyby však NB byl 3200 MHz, bylo by to jistě poznat...2.4 Ghz je relativně málo, vždyť na 2.4 Ghz je schopen v pohodě pracovat i Thuban s daným napětím...(i s 2.6GHz lepší kousky)

yuri.cs · Příspěvek od **yuri.cs** » sob 9. dub 2011, 10:38

btw jenom takova prelicka. Dle materialu k NetBurstu je minimalni penalizace pri spatne predikci vetveni 20 cyklu. U BD je to u podminenych skoku na chlup stejne. Tak doufejme, ze za tech par let udelala predikcni logika alespon nejaky ten pokrok

Chroustostroj · Příspěvek od **Chroustostroj** » sob 9. dub 2011, 12:45

yuri.cs: Tak to mně úpně zamrazilo, že by BD mohl opakovat některé chyby NetBurstu. Nevíš kolik to dělá u současné architektury Intelu ?

yuri.cs · Příspěvek od **yuri.cs** » sob 9. dub 2011, 12:54

Komentujici na DB blogu tvrdi, ze minium pro Nehalem je 15 a pro SB 14. Pro AMD 10h pak 10.

richie08 · Příspěvek od **richie08** » sob 9. dub 2011, 13:41

Zajímavé, ale nevyvozoval bych z toho hned nějaké negativní závěry pro BD typu že to bude další Netburst. Nehalem má o 5 cyklů větší penalizaci než K10 a je snad pomalejší? Není, naopak.

Jinak vše nasvědčuje že můžeme u BD očekávat vysoké frekvence. Velké latence u cache, delší pipeline, nyní větší penalizace z predikce. Myslím že to není vůbec na škodu pro AMD mít o něco delší pipeline než konkurence, a tedy možnost vyšších frekvencí. Netburst bych do toho vůbec netahal, ten měl problém že měl skoro 3x delší pipeline a byl navržen na dvojnásobné frekvence, kterých se Intelu nepodařilo nikdy dosáhnout.

yuri.cs · Příspěvek od **yuri.cs** » sob 9. dub 2011, 14:14

Presne tak. Prescott mel 31 stages v int pipeline. K8 12 stages. Intel se snazil snad v kazde iteraci NetBurstu vylepsovat branch predictor, ale prilisne zlepseni to neprineslo.

Jen jsem nikdy nepochopil, jak mohl intel dospet k tem svym 10GHz prohlasenim? To jeho materialovy inzenyri tak "prestrelili" nebo...

Kazdopadne souhlas s vysokymi frekvencemi u BD. Zatim na to vse ukazuje.

Příspěvek od **flanker** » sob 9. dub 2011, 15:46

všakl je to jasné, můžu se vám zaručit, že v případě maximálního turba procesor přesáhne hranici 4 GHz (pro nějvyšší model)

A to vše při TDP 95/125W

Příspěvek od **flanker** » sob 9. dub 2011, 16:09

http://www.overclockers.com/amd-confirm ... dozer-am3/

There are reasons for this – the new platform with the AM3+ socket will support new power management features as well as “boosting technology” (turbo boost).

ched · Příspěvek od **ched** » ned 10. dub 2011, 18:57

yuri.cs píše:Jen jsem nikdy nepochopil, jak mohl intel dospet k tem svym 10GHz prohlasenim? To jeho materialovy inzenyri tak "prestrelili" nebo...

10GHz nám slibovali i na škole, protože ze zkušenosti několikrát se opakovala situace, kdy se říkalo "200MHz je max" pak "450MHz je max" pak "1,XYGHz je max", takže se najednou začalo přestřelovat, než bylo jasné že dynamická spotřeba, leakage, tunelový efekt, nehomogenita aj to zabijou.

Edit:

yuri.cs píše:ISSCC 2011:
8MB level 3 cache (composed of 4 independent 2MB subcaches) operates above 2.4GHz at 1.1V

Takze asi tak.

Takže za předpokladu, že L3 frekvence je pořád odvozena od HT, její hodnota bude mezi 2,4GHz a 3,2 GHz.

yuri.cs · Příspěvek od **yuri.cs** » ned 10. dub 2011, 20:03

Charlie D. píše:There are tons of ESs out there, last I checked, people were waiting for the B0 step parts to come there way, and those were really late. I haven't heard about B0's in the wild yet first hand, but much more anecdotally, I have heard they fixed a lot and they suck. Both are unlikely to be true.

Jestli je to pravda, tak jsem tedy zvedav na vydani za 2 mesice. xD

Příspěvek od **flanker** » ned 10. dub 2011, 21:43

vydání je pevné a nemění se, potvrdil to člověk z AMD marketingu pro desktop při pátečním rozhovoru. Je tam jen takový výtah sepsaný. Navíc i já to mohu na základě mých kontaktu potvrdit.
http://www.overclockers.com/amd-confirm ... dozer-am3/

Maor · Příspěvek od **Maor** » pon 11. dub 2011, 01:17

nejlepší na vydání bulldozerů bude zlevnění x6 Phenomů!, těšim se, až si nějakej x6 pořídim, i když to vůbec nevyužiju

Chroustostroj

Jako nechci se rouhat, ale nejlepší na vydání BD bude zlevnění Sandy Bridge

Maor · Příspěvek od **Maor** » pon 11. dub 2011, 01:47

když mam desku s AM3, tak pro mě bude lepší x6, to bych mohl změnit rovnou celou platformu na BD,
Kdyby k tomu byla nějaká hezká mini-ITX deska, která by zvládala i procesory s TDP 125W, USB3.0, seriovej port, PCI a PCI-e 16x.

Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Kdy podle vás uvidíme launch FX procesorů (recenze)?

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace

Re: Procesory AMD 15h "Bulldozer&Bobcat"- info, testy, spekulace