Tak ja nevim. Napda me, ze testovat se pamet da treba pomoci memcpy. AVX dovoli 256b vs 128b u SSE vs 64b x86-64. Pokud je test zkompilovany tak, ze na jednom CPU pobezi s AVX a na druhem ne, tak jsou vysledky spatne.DOC_ZENITH píše:JJ pokud test potřebuje FIX, tak toho asi moc netestuje protože test má testovat výkon/prostupnost a ten tam je nebo ne.
AMD Steamroller/Excavator (28nm)-informace, spekulace
Moderátoři: flanker, Eddward, Baneshee
- yuri.cs
- Mírně pokročilý
- Registrován: 03. led 2007
- Bydliště: hl.m. piva
- Kontaktovat uživatele:
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
It will be amazing in case after 10GHz we will see 20GHz, 30GHz and so on, just like we witnessed the thorny way from 10MHz to 33MHz in the eighties. -xbitlabs.com
- DOC_ZENITH
- Středně pokročilý
- Registrován: 08. kvě 2010
- Bydliště: Praha
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Nevim jak by AVX mohlo ovlivnit prostupnost paměti. Ta tam buďto je nebo neni. Pokud Ňáká instrukce umí specifické operace v paměti které napomohou k rychlejšímu výsledku jedná se o operace v paměti, ne o prostupnost paměti. Prostupnost paměti = bandwitch mezi CPU a RAM. To potřebujeme změřit a tam AVX žádnou roli nehraje tudiž ten test by jej v žádném případě neměl používat.
- yuri.cs
- Mírně pokročilý
- Registrován: 03. led 2007
- Bydliště: hl.m. piva
- Kontaktovat uživatele:
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
A jak tu prostupnost CPU-RAM prosim zmeris? Ze by vykonanim nejakych instrukci? Nebo snad virguli?
Copy test se da udelat za pomoci memcpy - za jak dlouhou dobu zkopiruji blok XkB zacinajici na jedne adrese na druhou adresu. Pokud manipuluji s pameti po 64b, tak logicky musim pouzit 4x tolik instruci, nez kdyz pouzivam 256b. Tudiz je test pomalejsi - skrz CPU musi protect 4x tolik instrukci.
Copy test se da udelat za pomoci memcpy - za jak dlouhou dobu zkopiruji blok XkB zacinajici na jedne adrese na druhou adresu. Pokud manipuluji s pameti po 64b, tak logicky musim pouzit 4x tolik instruci, nez kdyz pouzivam 256b. Tudiz je test pomalejsi - skrz CPU musi protect 4x tolik instrukci.
It will be amazing in case after 10GHz we will see 20GHz, 30GHz and so on, just like we witnessed the thorny way from 10MHz to 33MHz in the eighties. -xbitlabs.com
- flanker
- Moderátor
- Registrován: 13. pro 2005
- Bydliště: Brno
- Kontaktovat uživatele:
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
ten "fix" ale změnil výkon i Haswellů a taktéž výrazně SB-Eček, protože je zároveň multithreadový a bere výkon paměti subystému i v závislosti an CPU. Aidu přeci jen dne nedělá žádnej imbecil 

ROG Power PC1:AMD Ryzen 7 5700X, Crosshair VII Hero, ROG Ryuo II 360, 512GB NVMe+500GB Samsung SSD, 2x 16GB GSkill TridentZ Neo RGB 3600 MHz, Dual RTX 2060,CM V750, Lian Li O11 Dynamic XL. PC2:AMD FX-8370, Silentium Fera, Asus 970 Pro Gaming/Aura, 240GB SSD HyperX 3K, R9-270X OC, 2x 4GB GSkill RipjawsX 2400 MHz, Corsair AX750, Bitfenix Pandora
- ttxman
- Začátečník
-
- Registrován: 28. zář 2003
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
edit: Trovaricon me upozornil, ze placam vetsi nesmysly nez obvykle..
Naposledy upravil(a) ttxman dne stř 4. pro 2013, 01:49, celkem upraveno 1 x.
- DOC_ZENITH
- Středně pokročilý
- Registrován: 08. kvě 2010
- Bydliště: Praha
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Ano a přesně to nechceme, kopírovat bloky, protože co kdyby ta věc už v paměti byla a ty jsi použil instrukci co jí zkopíruje? V tu chvíli měříš efektivitu tý instrukce a ne prostupnost paměti.yuri.cs píše:A jak tu prostupnost CPU-RAM prosim zmeris? Ze by vykonanim nejakych instrukci? Nebo snad virguli?
Copy test se da udelat za pomoci memcpy - za jak dlouhou dobu zkopiruji blok XkB zacinajici na jedne adrese na druhou adresu. Pokud manipuluji s pameti po 64b, tak logicky musim pouzit 4x tolik instruci, nez kdyz pouzivam 256b. Tudiz je test pomalejsi - skrz CPU musi protect 4x tolik instrukci.
Já si to představuji tak že random generaovaná data, jejichž generaci nebrzdí CPU (je to nenáročné + se tproces vejde do cache) a rychlost jejich kopírování do ram, a pak zpátky. To jest prostupnost.
U APU by se dala změřit i prostupnost videopaměti/framebufferu.
- flanker
- Moderátor
- Registrován: 13. pro 2005
- Bydliště: Brno
- Kontaktovat uživatele:
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
https://www.youtube.com/watch?v=axyHkKn_e80
Další video ve hře BF4 s nastavením různých detailů. Vypadá to slušně...Po OC hlavně by to mohl být mazec (2666 MHZ DRAM a IGPU kolem 1 GHz...)
Další video ve hře BF4 s nastavením různých detailů. Vypadá to slušně...Po OC hlavně by to mohl být mazec (2666 MHZ DRAM a IGPU kolem 1 GHz...)
ROG Power PC1:AMD Ryzen 7 5700X, Crosshair VII Hero, ROG Ryuo II 360, 512GB NVMe+500GB Samsung SSD, 2x 16GB GSkill TridentZ Neo RGB 3600 MHz, Dual RTX 2060,CM V750, Lian Li O11 Dynamic XL. PC2:AMD FX-8370, Silentium Fera, Asus 970 Pro Gaming/Aura, 240GB SSD HyperX 3K, R9-270X OC, 2x 4GB GSkill RipjawsX 2400 MHz, Corsair AX750, Bitfenix Pandora
- Trovaricon
- Začátečník
-
- Registrován: 26. dub 2010
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
ttxman & DOC_ZENITH - prosim vas, nesirte svoje "dojmy", pretoze si to dost ludi precita a vezme za fakt.
Ocividne vecna poznamka, ktoru napisal yuri.cs:
AD CU v Kaveri - nevsimol som si ziaden leak (ono je to dost "nezaujimavy" udaj) k pripadnej uprave velkosti / rychlosti cache - vzhladom na silnu (minimalne marketingovu) orientaciu na HSA. myslim, ze v tomto smere by kaveri mohlo "zamavat" projekciami realneho vykonu.
Ocividne vecna poznamka, ktoru napisal yuri.cs:
vas vobec od vasej "intelektualnej" diskusie neodradila. programatorom pripadate presne takto: http://www.youtube.com/watch?v=I8-T4-PoRTI#t=24A jak tu prostupnost CPU-RAM prosim zmeris? Ze by vykonanim nejakych instrukci? Nebo snad virguli?
AD CU v Kaveri - nevsimol som si ziaden leak (ono je to dost "nezaujimavy" udaj) k pripadnej uprave velkosti / rychlosti cache - vzhladom na silnu (minimalne marketingovu) orientaciu na HSA. myslim, ze v tomto smere by kaveri mohlo "zamavat" projekciami realneho vykonu.
Gigabyte GA-970A-UD3, 16GB ECC DDR3, AMD FX6300, Xigmatek Loki, Asus HD7770 DirectCU, Intel 330 180GB / Seagate 7200.14 1.5TB + 2TB, Corsair CX400, CM 330K (mod), Philips 235PQ2EB + 231P4QPY, Windows 10 x64 Pro
- ttxman
- Začátečník
-
- Registrován: 28. zář 2003
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Trovaricon: moh bys mi rict, co je na mem "dojmu" spatne? Rad se naucim neco novyho a slibuju, ze pokud sirim bludy, tak je odstranim (a budu se stydet za to co sem proved).
- Trovaricon
- Začátečník
-
- Registrován: 26. dub 2010
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
ttxman - to co spominas je latencia nie priepustnost. Ked zacnes sekvence pristupovat do pamate tak aj najdementnejsi prefetch mechanizmus sa uvedomi a zacne robit svoju ulohu t.j. uz mas (takmer) vzdy "riadky" pamate v cache. Nasledne nastupuje presne to co si popisal - aj pristup do L1 trva... ak mas load jednotku, ktora vie nacitat 256 bitovy vektor a ty napriek tomu stale kazdym dotazom pytas z pamate (realne vsak uz z cache) 32 / 64 bit vektor tak asi tazko vytazis pamat... Jedine co si vytazil su L/S jednotky CPU. Dokonca ani v pripade (2x) 256bitoveho vektora loadovaneho na jednom jadre nebude pri rychlostiach dnesnych 2+ kanalovych DDR3 radicov dost.
Latenciu pristupu zamaskujes tak, ze instruction queue CPU (vdaka OoO) zaspamujes load instrukciami pouzitim optimalizacnej techniky "z dob paskovych jednotiek" @ loop unroll.
DOC_ZENITH - ad sandra na G32 - ocividne autori testu testuju nieco ine ako si ty myslis: prispendlim si n vlaken na jednotlive jadra CPU a spustim na kazdom z nich funkciu, ktora si naalokuje blok x bajtov pamate a pouzitim load instrukcie (zvycajne) s najvacsou moznou sirkou cieloveho registra prejdem naalokovany blok. Zmeram T zoptimalizovaneho prejdenia bloku na jednotlivych vlaknach a nasledne vyratam:
n * x / T
Latenciu pristupu zamaskujes tak, ze instruction queue CPU (vdaka OoO) zaspamujes load instrukciami pouzitim optimalizacnej techniky "z dob paskovych jednotiek" @ loop unroll.
DOC_ZENITH - ad sandra na G32 - ocividne autori testu testuju nieco ine ako si ty myslis: prispendlim si n vlaken na jednotlive jadra CPU a spustim na kazdom z nich funkciu, ktora si naalokuje blok x bajtov pamate a pouzitim load instrukcie (zvycajne) s najvacsou moznou sirkou cieloveho registra prejdem naalokovany blok. Zmeram T zoptimalizovaneho prejdenia bloku na jednotlivych vlaknach a nasledne vyratam:
n * x / T
Gigabyte GA-970A-UD3, 16GB ECC DDR3, AMD FX6300, Xigmatek Loki, Asus HD7770 DirectCU, Intel 330 180GB / Seagate 7200.14 1.5TB + 2TB, Corsair CX400, CM 330K (mod), Philips 235PQ2EB + 231P4QPY, Windows 10 x64 Pro
- ttxman
- Začátečník
-
- Registrován: 28. zář 2003
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Ok mas pravdu
z toho co sem navrhoval tady nevytahnu vic jak +-8GB/s na 1 vlakne i pri extremne velkym typu (2* velikost line se zda jako limit). Jdu si hrat s assemblerem, za trest si naprogramuju benchmark na propustnost pameti, high level jazyky mi zkazily smysl pro realitu, fakt sem veril tomu co sem psal
(puvodne sem myslel, ze narazis jenom na tu latenci L1, tohle je mnohem horsi).


- del42sa
- Pokročilý
- Registrován: 18. lis 2009
- Bydliště: Omicron Persei 8
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
koukal jsem na to schéma Kaveri čipu z prezentace AMD a jen tak jsem přemýšlel, kolik modulů by bylo hypoteticky možné umístnit do plochy cca 210mm2. Pokud ty poměry velikostí odpovídají obrázku, tak by do té plochy šlo umístnit:
a) buď 6 modulů/12 vláken (bez L3 cache)
b) 4 moduly/8 vláken a 4 CU (256SP)



Která varianta by pro vás byla zajímavější ? Pokud by AMD chtělo, pořád by mohli vydat vícejádrovou variantu aniž by museli nějak extra překročit velikost cca 230mm2.
PS: obrázky jsou pouze ilustrativní a velmi zjednodušené.
a) buď 6 modulů/12 vláken (bez L3 cache)
b) 4 moduly/8 vláken a 4 CU (256SP)



Která varianta by pro vás byla zajímavější ? Pokud by AMD chtělo, pořád by mohli vydat vícejádrovou variantu aniž by museli nějak extra překročit velikost cca 230mm2.
PS: obrázky jsou pouze ilustrativní a velmi zjednodušené.
"The more you buy, the more you save" AI everywhere - Nvidia CEO at Computex 2023 https://www.youtube.com/watch?v=FhlE3m1trM4
Vega Primitive Shader combines the functions of vertex and geometry shader and with the right knowledge you can discard game based primitives at an incredible rate" https://pcper.com/2017/01/amd-vega-gpu- ... tecture/2/
MSI MPG GUNGNIR 110R White, CPU AMD Ryzen 7 9700X Granite Ridge, DeepCool AK500 White, GPU Sapphire Radeon RX 7600 8GB, MB MSI MAG X670E GAMING PLUS WIFI, 32GB DDR5 Patriot Viper Elite 5 32GB KIT 6000MHz, system HDD SSD M.2 Kingston FURY Renegade NVMe 1TB, Seagate Baracuda HDD 1TB SATA III , data HDD WD RED 1TB SATA III, Quad HD VA monitor 27" MSI Optix G27CQ4 Free Sync 165 Hz 10bit HDR, zdroj Be quiet! SYSTEM POWER 9 CM700W 80 PLUS Bronze, Win 10-64 bit Pro
Vega Primitive Shader combines the functions of vertex and geometry shader and with the right knowledge you can discard game based primitives at an incredible rate" https://pcper.com/2017/01/amd-vega-gpu- ... tecture/2/
MSI MPG GUNGNIR 110R White, CPU AMD Ryzen 7 9700X Granite Ridge, DeepCool AK500 White, GPU Sapphire Radeon RX 7600 8GB, MB MSI MAG X670E GAMING PLUS WIFI, 32GB DDR5 Patriot Viper Elite 5 32GB KIT 6000MHz, system HDD SSD M.2 Kingston FURY Renegade NVMe 1TB, Seagate Baracuda HDD 1TB SATA III , data HDD WD RED 1TB SATA III, Quad HD VA monitor 27" MSI Optix G27CQ4 Free Sync 165 Hz 10bit HDR, zdroj Be quiet! SYSTEM POWER 9 CM700W 80 PLUS Bronze, Win 10-64 bit Pro
- Pavel.P.
- Středně pokročilý
-
- Registrován: 28. lis 2005
- Bydliště: UHB
- ifkopifko
- Začátečník
-
- Registrován: 16. říj 2009
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
del42sa>
Mám pre teba novinu, tie pomery nezodpovedajú skutonosti, pochopiteľne. V skutočnosti by GPU malo zaberať trochu menšiu plochu, takže zrejme by si tam v skicári mohol narvať aj 8 modulov, to už by teda bolo niečo... Alebo, tak ma napadá, koľko by sa tam zmestilo Intel Haswell jadier? To by tiež bola zaujímavá varianta.
Vieš, ono v prvom rade záleží na tom, či je ten socket FM2+ na niečo také pripravený, nie na tom, čo si sa ty naučil robiť v mspaint.
BTW: V poslednej variante si zabudol adekvátne zmenšiť pamäťový radič, keďže už nebude musieť byť HUMA, pre skúseného návrhára čipov to iste nebude problém a všetko to vieš úplne presne spočítať (tak, ako si sa kasal u Keplera, ak by si náhodou nevedel na čo narážam).


BTW: V poslednej variante si zabudol adekvátne zmenšiť pamäťový radič, keďže už nebude musieť byť HUMA, pre skúseného návrhára čipov to iste nebude problém a všetko to vieš úplne presne spočítať (tak, ako si sa kasal u Keplera, ak by si náhodou nevedel na čo narážam).
CPU: R7 7700 COOLER: Endorfy Fera 5 MB: ASUS B650M-E RAM: 2x16GB DDR5
VGA: Asus GTX 1060 3GB OC HDD: Samsung 980 Pro 1TB + Crucial MX500 1TB + WD Red 6TB
PSU: Seasonic Focus GM550 CASE: Thermaltake Swing Silver w/o window -trošku modifikovaná (skôr znásilnená) DISPLAY: Asus MX239H
VGA: Asus GTX 1060 3GB OC HDD: Samsung 980 Pro 1TB + Crucial MX500 1TB + WD Red 6TB
PSU: Seasonic Focus GM550 CASE: Thermaltake Swing Silver w/o window -trošku modifikovaná (skôr znásilnená) DISPLAY: Asus MX239H
- del42sa
- Pokročilý
- Registrován: 18. lis 2009
- Bydliště: Omicron Persei 8
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Ifkopifko ty musíš mít buď nějaký děsný mindrák z dětství a nebo nějakou jinou psychickou poruchu. Je mi tě opravdu líto....
PS: jianak to GPU opravdu menší není, řekl bych že to odpovídá tomu, co mělo AMD ve svých materiálech a to že GPU zabírá 47% Die. Možná to na první pohled tak nevypadá, ale když k modulům připočteš i řadiče a uncore část čipu, tak to sedí. ( nakonec proč by to kreslili do prezentace jinak, když tam mají přímo uvedená procenta ) To že je nákres zjednodušený ví AMD a vím to i já, ještě jsem na to schválně upozornil

PS: jianak to GPU opravdu menší není, řekl bych že to odpovídá tomu, co mělo AMD ve svých materiálech a to že GPU zabírá 47% Die. Možná to na první pohled tak nevypadá, ale když k modulům připočteš i řadiče a uncore část čipu, tak to sedí. ( nakonec proč by to kreslili do prezentace jinak, když tam mají přímo uvedená procenta ) To že je nákres zjednodušený ví AMD a vím to i já, ještě jsem na to schválně upozornil

"The more you buy, the more you save" AI everywhere - Nvidia CEO at Computex 2023 https://www.youtube.com/watch?v=FhlE3m1trM4
Vega Primitive Shader combines the functions of vertex and geometry shader and with the right knowledge you can discard game based primitives at an incredible rate" https://pcper.com/2017/01/amd-vega-gpu- ... tecture/2/
MSI MPG GUNGNIR 110R White, CPU AMD Ryzen 7 9700X Granite Ridge, DeepCool AK500 White, GPU Sapphire Radeon RX 7600 8GB, MB MSI MAG X670E GAMING PLUS WIFI, 32GB DDR5 Patriot Viper Elite 5 32GB KIT 6000MHz, system HDD SSD M.2 Kingston FURY Renegade NVMe 1TB, Seagate Baracuda HDD 1TB SATA III , data HDD WD RED 1TB SATA III, Quad HD VA monitor 27" MSI Optix G27CQ4 Free Sync 165 Hz 10bit HDR, zdroj Be quiet! SYSTEM POWER 9 CM700W 80 PLUS Bronze, Win 10-64 bit Pro
Vega Primitive Shader combines the functions of vertex and geometry shader and with the right knowledge you can discard game based primitives at an incredible rate" https://pcper.com/2017/01/amd-vega-gpu- ... tecture/2/
MSI MPG GUNGNIR 110R White, CPU AMD Ryzen 7 9700X Granite Ridge, DeepCool AK500 White, GPU Sapphire Radeon RX 7600 8GB, MB MSI MAG X670E GAMING PLUS WIFI, 32GB DDR5 Patriot Viper Elite 5 32GB KIT 6000MHz, system HDD SSD M.2 Kingston FURY Renegade NVMe 1TB, Seagate Baracuda HDD 1TB SATA III , data HDD WD RED 1TB SATA III, Quad HD VA monitor 27" MSI Optix G27CQ4 Free Sync 165 Hz 10bit HDR, zdroj Be quiet! SYSTEM POWER 9 CM700W 80 PLUS Bronze, Win 10-64 bit Pro
- ifkopifko
- Začátečník
-
- Registrován: 16. říj 2009
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Pri pohľade na tie tvoje obrázky som si skrátka nemohol pomôcť... 

Čo ti ja viem? Možno pretože je to schéma? Pre Kaveri to nie je jediná schéma, ktorá bola prezentovaná. Taktiež, napr schémy pre Trinity tiež nezodpovedajú reálnemu die, aj u Radeonov si si to mohol všimnúť... ale nič, choď ďalej "navrhovať" nejaké tie CPU/APU/GPU.del42sa píše:nakonec proč by to kreslili do prezentace jinak...
CPU: R7 7700 COOLER: Endorfy Fera 5 MB: ASUS B650M-E RAM: 2x16GB DDR5
VGA: Asus GTX 1060 3GB OC HDD: Samsung 980 Pro 1TB + Crucial MX500 1TB + WD Red 6TB
PSU: Seasonic Focus GM550 CASE: Thermaltake Swing Silver w/o window -trošku modifikovaná (skôr znásilnená) DISPLAY: Asus MX239H
VGA: Asus GTX 1060 3GB OC HDD: Samsung 980 Pro 1TB + Crucial MX500 1TB + WD Red 6TB
PSU: Seasonic Focus GM550 CASE: Thermaltake Swing Silver w/o window -trošku modifikovaná (skôr znásilnená) DISPLAY: Asus MX239H
- maltra
- Začátečník
- Registrován: 11. říj 2010
- Bydliště: Západná Stredozem
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
@ifkopifko: ale ved on len cisto spekuluje, tak ako sme aj my ostatni spekulovali ohladne inych veci, nechapem o co ti ide. A vlakno ma v nazve aj "spekulace", tak je to ok. Trochu iny ton by si si mohol zvolit pri svojej diskusii, nic v zlom
.

PC: R7 9800X3D | 64 GB DDR5 CL30 | X870E Aorus Pro | ASUS RTX 4070 Ti TUF | WD_BLACK SN850X 2TB (OS) & 4TB (Games) | Phanteks Enthoo Pro M Glass | RM1000e | Alienware AW3423DWF
Retro PC: PIII 650E Slot 1 | GA-6BXE Rev 1.9 | 128MB DDR | V4 4500 32MB AGP | SB 32 PnP CT3670 | SpinPoint 80GB>32GB[
Retro PC: PIII 650E Slot 1 | GA-6BXE Rev 1.9 | 128MB DDR | V4 4500 32MB AGP | SB 32 PnP CT3670 | SpinPoint 80GB>32GB[
- del42sa
- Pokročilý
- Registrován: 18. lis 2009
- Bydliště: Omicron Persei 8
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
ifkopifko: mezi obrázkem v prezentaci o Trinity a reálným die je jeden podstatný rozdíl . AMD v prezentaci neuvádělo, kolik procent zabírá GPU.
u Kaveri AMD přímo explicitně v prezentaci uvádí, že GPU zabírá v die 47%. Myslím, že by bylo celkém dost hloupé, kdyby nákres ukazoval , že GPU zabírá např jen čtvrtinu, když mají pod ním uvedené přesné číslo.....
Navíc když se podíváš na Trinity die, tak jak si myslíš že budou vypadat ty poměry u Kaveri ? GPU versus CPU, když AMD uvádí že GPU zabírá téměř polovinu die ?

o velikosti Kaveri jsme už diskutovali dříve tady

u Kaveri AMD přímo explicitně v prezentaci uvádí, že GPU zabírá v die 47%. Myslím, že by bylo celkém dost hloupé, kdyby nákres ukazoval , že GPU zabírá např jen čtvrtinu, když mají pod ním uvedené přesné číslo.....
Navíc když se podíváš na Trinity die, tak jak si myslíš že budou vypadat ty poměry u Kaveri ? GPU versus CPU, když AMD uvádí že GPU zabírá téměř polovinu die ?

o velikosti Kaveri jsme už diskutovali dříve tady
"The more you buy, the more you save" AI everywhere - Nvidia CEO at Computex 2023 https://www.youtube.com/watch?v=FhlE3m1trM4
Vega Primitive Shader combines the functions of vertex and geometry shader and with the right knowledge you can discard game based primitives at an incredible rate" https://pcper.com/2017/01/amd-vega-gpu- ... tecture/2/
MSI MPG GUNGNIR 110R White, CPU AMD Ryzen 7 9700X Granite Ridge, DeepCool AK500 White, GPU Sapphire Radeon RX 7600 8GB, MB MSI MAG X670E GAMING PLUS WIFI, 32GB DDR5 Patriot Viper Elite 5 32GB KIT 6000MHz, system HDD SSD M.2 Kingston FURY Renegade NVMe 1TB, Seagate Baracuda HDD 1TB SATA III , data HDD WD RED 1TB SATA III, Quad HD VA monitor 27" MSI Optix G27CQ4 Free Sync 165 Hz 10bit HDR, zdroj Be quiet! SYSTEM POWER 9 CM700W 80 PLUS Bronze, Win 10-64 bit Pro
Vega Primitive Shader combines the functions of vertex and geometry shader and with the right knowledge you can discard game based primitives at an incredible rate" https://pcper.com/2017/01/amd-vega-gpu- ... tecture/2/
MSI MPG GUNGNIR 110R White, CPU AMD Ryzen 7 9700X Granite Ridge, DeepCool AK500 White, GPU Sapphire Radeon RX 7600 8GB, MB MSI MAG X670E GAMING PLUS WIFI, 32GB DDR5 Patriot Viper Elite 5 32GB KIT 6000MHz, system HDD SSD M.2 Kingston FURY Renegade NVMe 1TB, Seagate Baracuda HDD 1TB SATA III , data HDD WD RED 1TB SATA III, Quad HD VA monitor 27" MSI Optix G27CQ4 Free Sync 165 Hz 10bit HDR, zdroj Be quiet! SYSTEM POWER 9 CM700W 80 PLUS Bronze, Win 10-64 bit Pro
- ifkopifko
- Začátečník
-
- Registrován: 16. říj 2009
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
del42sa> Ja som tím samozrejme nechcel povedať, že nezaberá tých udávaných 47%, ale to, že tie pomery na schéme tomu nezodpovedajú, a ani rozmer tých modulov nemusí zodpovedať.
Je to schéma.
maltra> Veď ja nehovorím, že to nie je OK.
Existujú špekulácie zmysluplné a nezmyselné. A čo sa tónu týka, tak poznáš to... "ako sa do hory volá..." ...aj keď to nemusí byť vidieť v tomto vlákne.
Inak, aj mňa by potešilo trojmodulové APU, ale nie ak by to príliš oslabilo iGPU. Aj vydanie silného CPU do socketu spoločného s APU by bolo fajn, toto súčasné trieštenie AMD podľa mňa dosť ubližuje. To ale nie je otázka veľkosti die takého APU/CPU, ale toho, či to tak bolo dizajnované... osobne to "silné CPU" u FM2+ nepokladám za reálne. Trojmodulové APU v pláne kedysi bolo, tak tam nádej ešte nezomrela. Obávam sa ale, že keď to bude aktuálne, tak už to nebude na 28nm.
Najviac by ma ale potešilo, ak by sa konečne výkon na jadro aspoň priblížil konkurencii, potom by aj dvojmodul mohol byť OK. A tiež keby konkurencia nebola energeticky efektívnejšia faktorom cca 1,7. To sú tie naozajstné problémy, nie počet modulov.

maltra> Veď ja nehovorím, že to nie je OK.

Inak, aj mňa by potešilo trojmodulové APU, ale nie ak by to príliš oslabilo iGPU. Aj vydanie silného CPU do socketu spoločného s APU by bolo fajn, toto súčasné trieštenie AMD podľa mňa dosť ubližuje. To ale nie je otázka veľkosti die takého APU/CPU, ale toho, či to tak bolo dizajnované... osobne to "silné CPU" u FM2+ nepokladám za reálne. Trojmodulové APU v pláne kedysi bolo, tak tam nádej ešte nezomrela. Obávam sa ale, že keď to bude aktuálne, tak už to nebude na 28nm.
Najviac by ma ale potešilo, ak by sa konečne výkon na jadro aspoň priblížil konkurencii, potom by aj dvojmodul mohol byť OK. A tiež keby konkurencia nebola energeticky efektívnejšia faktorom cca 1,7. To sú tie naozajstné problémy, nie počet modulov.
CPU: R7 7700 COOLER: Endorfy Fera 5 MB: ASUS B650M-E RAM: 2x16GB DDR5
VGA: Asus GTX 1060 3GB OC HDD: Samsung 980 Pro 1TB + Crucial MX500 1TB + WD Red 6TB
PSU: Seasonic Focus GM550 CASE: Thermaltake Swing Silver w/o window -trošku modifikovaná (skôr znásilnená) DISPLAY: Asus MX239H
VGA: Asus GTX 1060 3GB OC HDD: Samsung 980 Pro 1TB + Crucial MX500 1TB + WD Red 6TB
PSU: Seasonic Focus GM550 CASE: Thermaltake Swing Silver w/o window -trošku modifikovaná (skôr znásilnená) DISPLAY: Asus MX239H
- DOC_ZENITH
- Středně pokročilý
- Registrován: 08. kvě 2010
- Bydliště: Praha
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
To se nestane protože návrh die u AMD je vesměs kompletovanej automaticky kdežto u Intelu ručně protože na to má prostředky. Takže i na stejném výrobním procesu za stejnej podmínek by CPU intelu měl citelně lepší výkon celkově, výkon na takt, výkon na thread, a výkon na W. Samo sebou horší výroba a zbytek tomu dál přidávaj.
AMD potřebuje fixnout architekturu pak se na tom může stavět. Jak moc se to SR podaří uvidíme. Ale vzhledem k tomu že die neni tak velká tak nevidim důvod pro neexistenci mnoha jinejch čipů. Já bych to vydal takto, 4 verze.
- 2 jádra, low end GPU, minimální spotřeba. TDP 45W. Možná by se tohle dalo vyřadit a použít upravené Jaguar jádro.
- 4 jádra, silné GPU, takty co se vejde do TDP 95W.
- 6 jader, low-end GPU, takty co se vejde do TDP 95W.
- 8 jader, L3 cache, TDP co se vejde do 130W. + Níže taktované 95W modely. Tato die by taky existovala v dual-node verzi pro socket G34 a osazovala se do starejch desek skrz bios update aby se server scéna aspoň nák udržela živá. Všechny tyhle die by byly do FM2+, ta se jako platforma oproti LGA1150 nemá moc co stydět, problém neni v platformě ale výkonu těch CPU.
Ale u AMD to teď vypadá na komplet rezignaci. Ala jen 1 jádro, u kterého se budou jen vypínat SP u GPU či jeden z modulů a tim se bude strašně "ekonomicky" vyrábět low-end. Tzn top model v CPU konkurence I3ce a vše nad tim rezignace. Total stažení ze serverů, atd. Tzn nebude se vydělávat. Kdo by si koupil top model APU? ala totálně si zatrhnou jakejkoliv upgrade? A ty nišší modely se nevyplácely ever protože celeron stojí 900kč a pentium 1200. Ne, ta platforma musí nabízet možnosti se někam pohnout. Pokud top model bude občas pokud nedojde na single thread konkurovat I3ce a v GPU někde lehce pod 7750, tak to prostě neni nabídka. Je to pod tou čarou nej cena vs výkon řešení. Je to už v sféře low-endu. A pokud AMd bude nabízet jen low-end platformu kde nebude možnost upgradu CPU výše, tak sorry ale to je finish. Prodá se pár OEM sestav a pár fanoušku si to ze zoufalství koupí a budou všude tvrdit že jim APU stačí. Ake globálně přijdou o veškeré ziskové části trhu. Pokud se to snažej nahnat cenou ala 4 klacky za APU (to je vtip ?), tak toho prodaj ještě méně. Sice asi s většim ziskem ale méně takže menší penetrace trhu = menší ochota pro to optimalizovat SW, a celá huma se může jít klouzat. Atd.
AMD potřebuje fixnout architekturu pak se na tom může stavět. Jak moc se to SR podaří uvidíme. Ale vzhledem k tomu že die neni tak velká tak nevidim důvod pro neexistenci mnoha jinejch čipů. Já bych to vydal takto, 4 verze.
- 2 jádra, low end GPU, minimální spotřeba. TDP 45W. Možná by se tohle dalo vyřadit a použít upravené Jaguar jádro.
- 4 jádra, silné GPU, takty co se vejde do TDP 95W.
- 6 jader, low-end GPU, takty co se vejde do TDP 95W.
- 8 jader, L3 cache, TDP co se vejde do 130W. + Níže taktované 95W modely. Tato die by taky existovala v dual-node verzi pro socket G34 a osazovala se do starejch desek skrz bios update aby se server scéna aspoň nák udržela živá. Všechny tyhle die by byly do FM2+, ta se jako platforma oproti LGA1150 nemá moc co stydět, problém neni v platformě ale výkonu těch CPU.
Ale u AMD to teď vypadá na komplet rezignaci. Ala jen 1 jádro, u kterého se budou jen vypínat SP u GPU či jeden z modulů a tim se bude strašně "ekonomicky" vyrábět low-end. Tzn top model v CPU konkurence I3ce a vše nad tim rezignace. Total stažení ze serverů, atd. Tzn nebude se vydělávat. Kdo by si koupil top model APU? ala totálně si zatrhnou jakejkoliv upgrade? A ty nišší modely se nevyplácely ever protože celeron stojí 900kč a pentium 1200. Ne, ta platforma musí nabízet možnosti se někam pohnout. Pokud top model bude občas pokud nedojde na single thread konkurovat I3ce a v GPU někde lehce pod 7750, tak to prostě neni nabídka. Je to pod tou čarou nej cena vs výkon řešení. Je to už v sféře low-endu. A pokud AMd bude nabízet jen low-end platformu kde nebude možnost upgradu CPU výše, tak sorry ale to je finish. Prodá se pár OEM sestav a pár fanoušku si to ze zoufalství koupí a budou všude tvrdit že jim APU stačí. Ake globálně přijdou o veškeré ziskové části trhu. Pokud se to snažej nahnat cenou ala 4 klacky za APU (to je vtip ?), tak toho prodaj ještě méně. Sice asi s většim ziskem ale méně takže menší penetrace trhu = menší ochota pro to optimalizovat SW, a celá huma se může jít klouzat. Atd.