PCTuning fórum

Originally Posted by Thevenin

Few bits regarding Carrizo:

The design supports up to 8 compute units instead of; 3 on SR-B, 2 on SR-A, 2 on TN/RL.

Don't hold your breath seeing more than 2 compute units thou.

The memory controller supports DDR3, DDR4 and GDDR5, however only DDR3 is enabled atleast for the desktop parts (FM2+).

The design includes an FCH which effectively make it a SoC.
The FCH is an upgraded version of the Avalon FCH found in Mullins.
Only BGA (FP4 & SP2) will use the internal FCH. On FM2+ parts the internal FCH will be fused shut in order to make it compatible with existing motherboards.

The GPU belongs to the same family as Iceland (dGPU) & Samara (iGPU).

Currently Carrizo exist in A0 level silicon and it is in bring-up state.
This phase was entered in the middle of april. On Kaveri this phase lasted for 230 days until EVT (equals retail) grade silicon was available.

že by?:)
http://wccftech.com/amd-carrizo-apu-28n ... z37IYN7cpj

opět se potvrzuje minimální nárust výkonu v desktopu ( kvůli frekvenčnímu stropu) , naopak nárust výkonu a frekvencí u mobilních čipů. (podobně jako u Kaveri)

4jádra
~30% perf increase at 15W
2MB Cache L2 versus Kaveri 4MB Cache L2
8 CU - VI GPU
DX12

menší L2 cache je zajímavá, bohužel latence mají být údajně stejné jako u 2MB L2...

yuri_cs píše:Puvodni BD mel dle dokumentace 20 cyklu latenci s 2MB variantou a 18 cyklu s 1MB variantou (ktera na svetlo sveta neprisla). SR ma u 2MB varianty zrejme 19 cyklu.

Pokud by propad hit-rate u klientskych apps nebyl drasticky s 1MB L2 a naopak by se povedlo jeste vyrazneji snizit latenci...

Na Anandu se objevil nazor, ze je mozne, aby byla opravdu snizena, protoze v dobe navrhu L2 XV jiz nebylo pocitano se skutecne vysokymi takty, pro ktere byla pomala cache 15h navrzena puvodne.

Ano přesně tak. Pokud by tomu tak bylo, pak by měli udělat i všechny exekuční jednotky širší (wide exec unit) jako to v podstatě představoval ten "fake"(?) Steamroller/Excavator die shot se 4 ALU/core a native 256bit FPU. Ten by umožňoval při nižších frekvencích dosáhnout stejný nebo i vyšší výkon. Kdo ví, možná to není fake a AMD opravdu původně takové úpravy plánovala pro velké serverové Opterony. Vzhledem ke zrušení těchto serverových čipů a jejich desktopových FX klonů, zbyly jen APU čipy a pro ty se zdá takové "uber" jádro zbytečné...

Zatím to vypadá, že Carrizo bude vlastně jen Kaveri s rozšířenou instrukční sadou (AVX2,BMI2,RDRAND). A i když CPUID Programming Guide naznačovalo, že BDver4 bude mít nativní 256bit FPU, zdá se nakonec, že FPU u EXcavátoru bude zřejmě stále zpracovávat AVX jako dvě sub-128bit operace. Očekává se i "streamlined GPU", co přesně to bude znamenat není jisté. Jestli bude mít GPU méně SP jednotek, nebo jiné části GPU budou očesány na kost není zřejmé. Za všemi těmi úpravami stojí snaha dále srazit spotřebu čipu.

Ještě k té cache u BD:

Jakkoliv je myšlenka BD architektury zajímavá a revoluční, je opravdu k zamyšlení, co vlastně s tou cache hierarchií AMD při navrhování BD architektury zamýšlelo ? To jakým způsobem je ta cache hierarchie navžená nedává moc smysl, ať se na to člověk dívá z ktérékoliv strany. Malá write through L1 cache (16KB) podpořená extra velkou L2 cache (2MB) s ultra vysokýmu latencemi, extrémně slow L3 cache s 64 way asociativitou a navíc nějaký bugem, který snižuje její už tak mizerný výkon. Naproti tomu L1 instrukční cache jen 2way asociative ( Haswell má 8 way ).
Celých 41% z BD die je L2 a L3cache. Do desktopu asi úplně zbytečné. Z toho člověk snadno dospěje k názoru, že menší a efektivnější L2 cache by mohla u desktopových CPU zvednout výkon a snížit spotřebu i velikost čipu, že se člověk diví, že s tímhle nepřišli už dříve.Také latence L2 je téměř dvojnásobná oproti Phenomu II. Těžko odhadovat jak by si se stejná architektura vedla s jinou cache hierarchií. Např write- back 2x32KB L1 cache 8 way + 2x 256/512KB L2 cache 8way + efektivnější a rychlejší L3...

Stejně tak výkonu Integer operací nepomohla redukce počtu ALU, čili logicky návrat zpátky ke konfiguraci 3ALU/AGU by měl vést k vyššímu výkonu. Proč ale AMD nic z toho neudělala a proč nechávají věci tak jak jsou není úplně zřejmé. Pokud mají prostředky na tweakování BD architektury, měli by mít možnost udělat i větší změny. Je pravda, že u PD se jim za poměrně malých úprav podařilo dosáhnout poměrně výrazné zvýšení výkonu,jenže u BD byl zřejmě i nějaký bug v návrhu.
U SR bylo těch úprav už o něco více a výsledek je tak trochu sporný, někde je nárust výrazný a někde zase minimální či horší než u PD. Zatímco PD přinesl agresivnější prefetch a větší TLB buffer, SR řešil bottleneck front-endu v dekodéru a instrukční cache. Logicky by pak člověk u Excavátoru očekával , že pořeší zbytek. Tedy bottleneck u exekučních jednotek, tedy počet Integer ALU a hlavně cache latence,konkrétně latence L2 cache a také velikost cache (včetně té chyby u L3).
Steamroller má sice dynamicky vypínatelnou L2 cache, ale bohužel bez pozitivního dopadu na latenci....

BD je ukázkový příklad, jak zničit dobrý nápad a promrhat příležitost návrhem nedomyšleným až do konce.

Well, to that I say: why didn't the geniuses at AMD think of that while designing this processor?
If AMD has any level of self-awareness, they should know that building large, dense caches with low latency and high associativity is not something they can compete with. Traditionally AMD has always had relatively modest caches.

tak či tak, Carrizo je spíš důkazem toho, že opravování chyb v BD architektuře není pro AMD prioritou a tak víceméně rezignují na další tweakování tohoto tabugovaného návrhu a veškerou pozornost inženýrů a všechny svoje finance směřují na nové x86/ARM CPU a na Skybridge.

Rumour: AMD Carrizo will be mobile only

Trochu škoda, ačkoli v recenzích A10-5800K vs A10-6800K vypadal Richland jako zbytečnost, tak ve skutečnosti byl o dost lepší hlavně co se OC týče jak pamětí tak CPU.

Nevím proč chtějí na ten desktop házet bobek, nejdřív ceny na prd, teď se ani nebudou obtěžovat vydat další vývojový stupeň, vlastní rychlá paměť pro grafickou část APU taky v nedohlednu.... přitom dektop APU jim nedělali až tam malý procento, spíš naopak

dnes konečně vyšel nepapírově A8-7600, nejvýhodnější z Kaveri čipů

http://www.czc.cz/amd-kaveri-a8-7600/156049/produkt

cena výborná, takže jen... TO TO TRVALO!

tohle měl být první čip co vydali

jj, tohle bude jasně nejvýhodnější kus, ztrácí jen pár procent výkonu, v IGPU je na tom taky lépe než třeba A10-6800K, žere málo a stojí přiměřeně.

Zajímavý by mohl být ještě Athlon x4 860K :
http://www.techpowerup.com/203662/amd-a ... -cpus.html

Zajímavý být mohl, kdyby neexistovalo odemčené Pentium.

Pentium je OK, ale tohle je také OK (prostě multithread s OC pentia dorovnáš stock takty Kaveri architekturu)

Možná by ten Athlon ještě mohl mít výhodu v aktivovaných virtualizačních featurách. No uvidíme co testy a co cena a možná do něj půjdu

Jeho zásadní nevýhodou je FM2+ platforma a s tím spojené takřka nulové možnosti upgradu CPU.

ten kdo si kupuje g3258 to stejne koupi s h81 protoze to dava nejvetsi smysl a pak uz nikdy upgradovat nebude

To jest pravda že většinou ne, ale může. Jakákoliv LGA1150 desktop deska pojme jakejkoliv LGA1150 CPU. U FM2+ jsi s top CPU stále defakto v low-endu, u LGA1150 startuješ v low-endu a máš rozmach až po high end.

klasika, info post o vydani novyho amd procaku, a nastoupi zenith, ze pentium je lepsi....

proc tenhle clovek nedostal uz davno ban

ze je pentium lepsi si pis do nakupni poradny a ne sem

Možná bych si měl sypat popel na hlavu já, protože jsem s tím Pentiem začal já. Z mé strany to byl však spíše postesk, protože jsem od Kaveri bláhově čekal výraznější zlepšení IPC a plánoval právě tu Athloní odnož koupit

Klasika, staci se krive podivat na AMD a arach uz vyskakuje jak certik z krabicky.

FM2+ APU se hodi pouze do mini PC, kde se nevejde dedikovana grafika. Jinak OC Pentium + nejake smysluplne lowend GPU je jasna volba.

FM2+ bez iGPU je naprosto nesmyslna platforma.

Nuže, co ale třeba zajímavé 7600 A8? S danou iGPU je už to na familiární hraní a domácí PC bez nutnosti něco dokupovat, určitě jedna z alternativ. Pak zajímavý bude daný Athlon x4 860K, otevřený násobič, snad příjemná cena (jako třeba 750/760K) a alternativa k Pentiu G.
Desky najdeš i na FM2+ levné, Athlon si vystači klidně s 1600 MHz DDR3 a k němu nějakou 260x či 750Ti.

Uivdíme co ještě Carizzo a FM2+, neočekávám nijak výrazné změny v IPC (asi jako Trinity vs Richland), ale vyšší takty a vyšší efektivitu. Pak už nastoupí definitvně éra DDR4 a nových AMD návrhů, o kterých nelze nyní nic usoudit.

Vzhledem k pravděpodobnému použití HDL + možná použitím levnějšího procesu než 28SHP, mít Carizzo rozhodně vyšší takty nebude. Spíš to bude jen Kaveri s nižší spotřebou při stejném taktu, avšak nižším dosažitelným frekvenčním stropem, a i levnější na výrobu.

zajímavé info, korespondují s dřívějšími informacemi od Thevenina z SA.

Stilt píše:The changes in the L2 caches and manufacturing process have done horrible things to the Fmax in Carrizo.
The fused Pb0 (3400MHz) voltage for this specimen is 1.33750V, which is rather high.

To operate at 3400MHz the CPU requires <1.225V(*), however at 3600MHz the minimum voltage is already at 1.3125V. A voltage curve this steep clearly shows that either the design or the manufacturing process itself is already at it´s limits. All of the 15h designs are Fmax limited by the L2 cache, so most likely in this case it is a design limit rather than a manufacturing process limit. In Excavator the L2 cache latency was reduced from 20 cycles in Piledriver or 19 cycles in Steamroller to 17 cycles.

http://www.overclock.net/t/1560230/jaga ... t_24330899

škoda toho 28nm BULK procesu. Pro tyhle procesory to není žádná výhra....

It would definitely interesting to see what Excavator modules could do on a proper and especially proven manufacturing process (ie. 32nm SHP SOI) and in design similar to Barracuda (Orochi or Komodo).

A single Excavator CU would be around 22.23 sq.mm (estimated) on 32nm SHP SOI. A 2MB 8-way 20 cycle L2 cache takes 11.59 sq.mm on the same process. Additionally a 2MB L3 takes 10.79 sq.mm.

Excavator is far less sensitive to L2 size and latency than the previous 15h versions. It might get away with even higher latency L2 cache. On 15h designs L2 characteristic directly translate to maximum frequency capabilities of the design (much more than usual).

- Piledriver
- Bulldozer
- Excavator
- Steamroller

From the best engineered and least broken, to the worst engineered and most broken.

If AMD would have chosen to stay on 32nm SOI and would have held on on it´s key designers, the list would start with Excavator and Steamroller.

PCTuning fórum

AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace