
Logicky asi pod sebou bude druhá CCX identická...Nebo že by ne?
Moderátoři: flanker, Eddward, Baneshee





Google: "snoop filter"flanker píše:to nechápu, vždyt ta základní jendotka CCX má 8MB L3 cache, kterou sdílí mezi 4 jádra...

U G34 jsou cache separované. Jeden G34 jsou jen 2 AM3+ CPU u sebe, cache jsou rozdělené na 2x8MB a komunikujou mezi sebou přes HT, je to klasická numa, defakto jako kdyby v systému byly 2 CPU. Numa = tfuj, tzn AMD to tentokrát musí vymyslet jinak, protože Intel dělá monolytická CPU co těmito problémy netrpí a slepencema jim konkurovat nemůže.havli píše:Urcite obe casti jsou identicke. Treba je cast L3 pouzita pro komunikaci (nevim jak to lepsi nazvat) mezi CCX. Podobne to je u G34 Opteronu - 16 MB fyzicky, 12 MB podle cpu-z.











Ale používá jí jen mezi vícero CPU, a i tak je penalizace výkonu při nutnosti šahání do cache druhého CPU cca 1/4. Numa u SW co s ní nepočítá je prostě problém.del42sa píše:To zalezi na tom jak to bude propojene a jak rychla bude ta sbernice. Intel taky pouziva QPI sbernici, takze bych zatim zadne zavery nevyvozoval....

Asi takhle:mr.qeg píše:yuri: a jaká byla odpověď na tu WT cache?
Q: So L1 cache. Why was it WT? The perception is, that the WB is so much better. Is there a trade off between WB and WT?
A: So... ehm... a WT as far as.. ehm... there is definitely a trade of there... I mean, we are supporting ECC or ...ehm.. some sort of means of dealing with errors and the $L1 as WT... has some advantages there (viz RWT clanek o BD march)... But it also has disadvantages of sending that data both to L1 and then sending it again to the L2.
And then our previous generation... ehm... the L2 itself... was not, u know, bi-writable. And so, to merge that data in required a merging function. Which then required also power of having to read another structure to merge in that WT data.
So... ehm... well...ehm...You know, we were... The caching mechanism(?) enabled the previous generation to maintain good performance. It did take a lot of transistors and more power than the WB version of the implementation we have today.
Intel spojuje sve CCX ringbusem.zumpar1234 píše:Nebude prekažkou to prepojenie dvoch Core Complex blokov v 8 jadrovych Zen procesoroch? Predsa len to bude tahať data cez koherentne prepojenie,... mam pocit že by to mohlo byť limitujuce. Vsetkych 8 jadier nebude mat ani pristup do jednej L3 cache.

CageJ píše:praveze som sa cudoval.. ale vravel 15MB..flanker píše:15? Ne spíše 16MB?
JInak tady to je asi v záznamu či jede hotchips (po registraci)
https://pgi.webcasts.com/viewer/event.jsp?ei=1114755

Ne.CageJ píše:15MB L3 pre 8 jadro..
Z webcastu:sixteen Meg L three in that... in Summit Ridge