Stránka 1 z 28
AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: čtv 10. kvě 2012, 08:48
od flanker
Steamroller-2013 vydání (asi Q2/Q3), segment hlavně APU, zda se objeví i v klasickém provedení procesoru, toť otázka. Slibuje se 15% nárust výkonu vůči Piledriver jádru. Jedná se o komplexnější refresh architektury. Dále podpora PCIe 3.0 nativně, údajně možnost více paměťových kanálů a hlavně lepší komunikace mezi CPU/iGPU a využití iGPU k výpočtům (HSA). Také FCH (jižní můstek) bude integrován do APU die. Hrubý výkon přes 1Tflop.
HSA podpora by měla být vybudována na základě standartizovaných softwarů v jazyce OpenCL a C++ AMP, jedno z nich je například Adobe, který s AMD poslední dobou spolupracuje. Takže například v Photoshopu či After Effects by nyní zpracování mohly trvat podstatně kratší dobu než přes CPU.. Jaká bude ale realita uvidíme brzy částečně s AMD Trinity.
“CPU-Assisted GPGPU on Fused CPU-GPU Architectures”
Authors: Yi Yang, Ping Xiang, Huiyang Zhou, North Carolina State University; Mike Mantor, Advanced Micro Devices
Presented: Feb. 27, 18th International Symposium on High Performance Computer Architecture, New Orleans
Abstract: This paper presents a novel approach to utilize the CPU resource to facilitate the execution of GPGPU programs on fused CPU-GPU architectures. In our model of fused architectures, the GPU and the CPU are integrated on the same die and share the on-chip L3 cache and off-chip memory, similar to the latest Intel Sandy Bridge and AMD accelerated processing unit (APU) platforms. In our proposed CPU-assisted GPGPU, after the CPU launches a GPU program, it executes a pre-execution program, which is generated automatically from the GPU kernel using our proposed compiler algorithms and contains memory access instructions of the GPU kernel for multiple threadblocks. *The CPU pre-execution program runs ahead of GPU threads because (1) the CPU pre-execution thread only contains memory fetch instructions from GPU kernels and not floating-point computations, and (2) the CPU runs at higher frequencies and exploits higher degrees of instruction-level parallelism than GPU scalar cores. We also leverage the prefetcher at the L2-cache on the CPU side to increase the memory traffic from CPU. As a result, the memory accesses of GPU threads hit in the L3 cache and their latency can be drastically reduced. Since our pre-execution is directly controlled by user-level applications, it enjoys both high accuracy and flexibility. Our experiments on a set of benchmarks show that our proposed preexecution improves the performance by up to 113% and 21.4% on average."
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: čtv 10. kvě 2012, 12:31
od yuri.cs
SR, co je tak nejak jiste:
-greater parallelism dle AMD
-radix-8 FP divider -> 3 bity za obratku misto 2 u predchozich
-podle magazinu c't bude mit 2 dekodery/modul - greater parallelism
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: čtv 10. kvě 2012, 13:03
od del42sa
dva dekodéry
to by bylo super, právě společný dekodér je jedno ze slabých míst původního BD.
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: úte 15. kvě 2012, 15:23
od flanker
Kdy tak tipujete, že vyjde v APU? Zhruba za rok, červen 2013?
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: úte 15. kvě 2012, 16:40
od del42sa
težko říct, ale můj tip je, že se AMD bude snažit o rychlejší uvedení na trh vzhledem k agresivní politice Intelu tykající se nových výrobních procesů. Nevím teď přesně kde, ale psalo se něco o konci prvního kvartálu 2013, jestli se pletu tak mě opravte
Otázkou ale bude výhodnost 28nm výrobního BULK procesu. Přece jenom technologie SOI nějaké výhody přinášela. Bez ní možná výhody 28nm nebudou až tak markantní, respektive výkonový odstup nemusí být tak velký. Co ale bude lepší určitě, je výtěžnost. Jednodušší výroba oproti SOI, menší velikost čipů = více kusů na waffer, lepší cena (?). Uvidíme.
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: úte 15. kvě 2012, 16:48
od flanker
jsem na to sám zvědav...To se Trinity moc neohřeje, pokud tu bude pouze 3/4 roku. ALe zas 28nm by pro AMD nemusel být až takový problém vůči 32nm. Bylo by obdivuhodný, kdyby se AMD podařilo tak rychle přivést na svět novou generaci APuček. Ale klasický desktop, nevím nevím...Tam to může být až klidně koncem roku 2013 a zda-li vůbec
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: úte 15. kvě 2012, 17:04
od del42sa
tentokrát si nemyslím, že by Trinity mělo tak krátký život. Ty APU, jak 32nmSOI, tak 28nm bulk budou podle mě na trhu ko-existovat. Takže se nebude opakovat situace s Llano IMHO.
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: úte 15. kvě 2012, 17:28
od flanker
ono i to Llano dle mě alespoň v noteboocích nějaký čas potáhne. V desktopu asi enchají vyprodat zásoby.
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: stř 16. kvě 2012, 14:35
od flanker
http://www.nordichardware.com/news/69-c ... -7750.html
Nneí to až tak nový článek (více než měsíc starý), ale hodí se pro nějaké spekulace
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: stř 16. kvě 2012, 14:51
od del42sa
podle mě AMD u APU začne být omezována spíše paměťovou propustností než počtem shaderů. Pokud s tím něco nezačnou dělat, tak grafický výkon bude stoupat už jen nepatrně navzdory vyššímu počtu shaderů a to by mohlo být problém. Intel tohle řeší pomocí stohovatelných pamětí s technologií silicon interposer. Doufám tedy , že Kaveri už bude mít tohle:
http://diit.cz/clanek/amd-s-amkor-pracu ... udoucnosti
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: stř 16. kvě 2012, 15:29
od yuri.cs
ad topic o DRAM
http://research.cs.wisc.edu/multifacet/ ... issmap.pdf
AMD uz to radu let zkousi na simulatorech; otazkou je fyzicka implementace
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: čtv 17. kvě 2012, 12:29
od flanker
informace z nového HWinfa
HWiNFO32 and HWiNFO64 v3.96 released
HWiNFO32 v3.96 and HWiNFO64 v3.96 available.
Changes:
Fixed GPU logo when switching between GPUs.
Improved GK1xx fan speed reporting.
Fixed reporting of GPU clocks for ATI R6xx family.
Added AMD Radeon HD 7420G, 7520G, 7620G, 7640G, 7660G, 7480D, 7540D, 7560D, 7660D models.
Added preliminary AMD Kaveri support.
Enhanced sensor monitoring on BIOSTAR A75 and TZ77 series.
Enhanced sensor monitoring on MSI X79 series.
Added nVidia GeForce GTX 670 and GeForce GTX 690.
Improved drive and SMART enumeration on systems with Intel Rapid Storage Technology drivers.
Fixed reporting of CPU DTS temperatures on multiple CPU packages.
Improved nVidia GPU voltage monitoring with nVidia R3xx drivers.
Added fan speed monitoring on ASUS G74Sx and G75VW notebooks.
Optimized performance and memory usage in Sensor-only mode.
Improved handling of RTSS.
Enhanced support of AMD Trinity.
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: sob 26. kvě 2012, 14:20
od THANATOS
zaujimave info z Catalyst 12.5 beta
"%AMD1305.1%" = ati2mtag_Kaveri_Desktop, PCI\VEN_1002&DEV_1305
"%AMD1304.1%" = ati2mtag_Kaveri_Mobile, PCI\VEN_1002&DEV_1304
"%AMD1307.1%" = ati2mtag_Kaveri_Desktop, PCI\VEN_1002&DEV_1307
"%AMD1306.1%" = ati2mtag_Kaveri_Mobile, PCI\VEN_1002&DEV_1306
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: stř 27. čer 2012, 23:32
od yuri.cs
Opterony 2014 a 2015
Boulder a nasledne Austin
Socket GC36
20(MCM)/10 Steamroller jader
24MB/12MB L3
Quad/dual DDR4, lr-dimm a lower power DDR3
HT 4.0
PCIe 3.0
http://tweakers.net/nieuws/82803/amd-vo ... cores.html
-Podpora DDR3 i 4 v jednom socketu zni nepravdepodobne. Jedine rozdilne sockety.
-HT consorcium se tvari mrtve uz radu let, takze dalsi velky udpdate je tez... nepravdepodobny.
-jestli se potvrdi narust L3/jadro, tak bude plocha hodne velika a dosti nevyhodna do desktopu
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: ned 1. črc 2012, 22:45
od flanker
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pát 6. črc 2012, 20:36
od yuri.cs
Kaveri
FM2 socket
1H 2013
15-25% vyssi IPC
DDR3 2133MHz
4MB L3
GPU vykonejsi nez HD 7750
http://wccftech.com/amds-kaveri-based-2 ... m2-socket/
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pát 6. črc 2012, 21:19
od del42sa
Richland offers 15-25% increase in Clock-Per-Clock performance.
15 -25% výkonu navíc zní pěkně, otázkou je kolik z toho celkového zvýšení tvoří frekvenční nárůst a kolik samotné IPC při srovnání takt na takt ( Bulldozer - Piledriver - Steamroller )
K integrované GCN based grafice jen tolik, že výkon do značné míry závisí na paměťové propustnosti, která je u GCN vyšší než u VLIW. Pokud nebudou používat TSV + stohované paměti nebo alespoň triple channel, tak to APU bude dost limitováno i když ty paměti poběží na 2133MHz
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: sob 7. črc 2012, 02:12
od yuri.cs
Clock-Per-Clock = IPC
Tech 15% by se dalo verit nad Trinty.
Konzervativni FM2 + DDR3 a klasicka L3 diky 28nm taky.
Jenom to GPU zni neverhodne. Jednak by tech 512SPs muselo bezet na vyssi frekvenci nez HD7750, aby ho prekonalo. Navic s tradicnim bottleneckem v pametech je vykon degradovan.
//Postnul jsem to spis jako zajimavost, az se nekdo bude prodirat timhle threadem po vlastnim launchi.
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: sob 7. črc 2012, 12:29
od froxic
yuri.cs píše:Clock-Per-Clock = IPC
Správně je to: "Instruction per Clock"
Nicméně Kaveri vypadá zajímavě, a tak jdu o něm napsat novinku na PCT.
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: sob 7. črc 2012, 13:58
od del42sa
yuri.cs píše:Jenom to GPU zni neverhodne. Jednak by tech 512SPs muselo bezet na vyssi frekvenci nez HD7750, aby ho prekonalo. Navic s tradicnim bottleneckem v pametech je vykon degradovan.
heh, oni tam dokonce píšou že to má být jen 384 SPs
