Stránka 2 z 28
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: ned 8. črc 2012, 18:20
od flanker
Not bad,ale ještě spousta času do vydání
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: ned 8. črc 2012, 20:40
od webwalker
froxic: No ono správněji by se mělo uvádět CPI, ale IPC je přeci jen "prodejnější" hodnota
PS: Těch 15-25% vypadá hezky, ale bude se to týkat také x87 instrukcí, které dnes prakticky rozhodují o herním výkonu? (bohužel)
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 08:59
od flanker
hm...na toto je to blbé, protože jednotky starající se o x87 byly z Bulldozeru ve velké míře redukovány.
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 11:27
od del42sa
ano, ale je to mimo jiné právě proto, že zastaralé x87 instrukce jsou opouštěny ve prospěch moderních jako AVX/AVX2 a protože trend je jasný a to směřování k HSA a Fusion, není důraz na FPU jednotku v AMD procesorech tak stěžejní (GPU jednotky tuhle práci zvládnou mnohem lépe a rychleji). Přestože je samotná FPU v Bulldozeru teoreticky výkonnější než ta v Phenomech především díky dual symetric FMAC jednotkám problém představuje to, že FPU jednotka Bulldozeru pracuje v režimu SMT (pro obě jádra) a že vzhledem k počtu jader je počet FPU poloviční oproti Phenomům. Limitující je také pouze jeden 128bit Load/Store port a pomalá cache s velkými latencemi.
Critically the powerful Bulldozer FPU continue to have only one store port: this choice may result in low FPU throughput in write-intensive workload, as the two threads forwarded by the integer cores will be served at a total max rate of 1X x87/SSE stored operation per clock, resulting in a per-thread store rate of 0.5 x87/SSE instruction per clock. Add this to the previous discussion about L1 write throughput and you can see that the new Bulldozer FPU can be starved for store rate
http://www.ilsistemista.net/index.php/h ... ml?start=6
Osobně si nemyslím, že se tohle s Steamrollerem nějak změní,je pravděpodobné, že FPU jednotka bude opět posílená tak aby zvládala AVX2, možná že přibyde další FMAC pipeline (asi 256bit), možná další L/S port, ale toto posílení bude markatní pouze při použítí moderních instrukcí jako AVX/AVX2 nikoliv při použítí "pure x87" instrukcí kde bude nárůst buď minimální nebo vůbec žádný.
Budoucnost je HSA, FSAIL a nahrazení FPU GPU shadery. Možná je načase, aby největší vývojáři herních enginů opustili zastaralý koncept "based on x87" a začali úplně od píky vyvíjet nové herní enginy, které budou umět profitovat z těchto nových instrukcí a ještě více využívat GPGPU a třeba i ten Multi Threaded Rendering.

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 12:57
od DOC_ZENITH
JJ ale to je Buldozeru platné asi jako SSE Pentiu 3, nebo SSE2/3 P4. Je sice hezké tam ty technologie do budoucna mít, aspoň se na tom vývojáři pomalu naučej dělat SW, ale naprosto zásadní je výkon v tom co se používá teď. Než přijde masové AVX a HSA a Fusiuon, bude celej BD nehorázně zastaralej protože už dnes není žádnej zázrak. Celá x86 platforma o tomhle je. O zpětné kompatibilitě a neustále narůstajícím výkonu ve všech podporovaných instrukcích. Jakejkoliv produklt kterej má horší výkon v některejch ohledech než jeho předchůdce je problém. Intel si to sám uvědomil moc dobře, AMD snad dostane potřebnou facku teď, protože do K10,5 tu hru hrálo dobře. BD se pokouší o to o co se pokoušel Netburst a failuje ještě mnohem více.
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 13:03
od del42sa
Právě že ten software je furt zoufale pozadu za možnostmi hardware. Vem si třeba takové Llano/Trinity. Myšlenka určitě dobrá, ale reálný software využívající výhody APU můžeš spočítat na prstech jedné ruky. O žádném masovém rozšíření nemůže být ani řeči. Já osobně problém nevidím v hardwaru (CPU/APU), ale v software ecosystému.To je největší brzda a vývojáři jsou líní něco nového programovat. Viz. Open CL, DX11, GPGPU Aplikace, CUDA....

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 13:13
od DOC_ZENITH
Ano je, SW je nehorázně pozadu. Ale paradoxně na tom AMD v minulosti vydělávalo. První K7 vůbec neuměla SSE a nevadilo to jen proto že SW byl pozadu a ještě to nepoužíval. To samé P4 vs pozdní K7 a ranná K8. Nevadilo to, protože benfity byly minimální a vyšší hrubej výkon čipů AMD urval vítězství na svou stranu, hlavně v hrách. Koukej jak se stále drží Phenom II, kterej je při stejnym počtu "jader" lepší jak FX a to je to naprosto technologicky zastaralá K10, s SSE3 ala instrukční sada z roku 2004.
Nejdůležitější je výkon, pak podpora novejch instrukcí.
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 13:16
od Hladis
del42sa píše: Možná je načase, aby největší vývojáři herních enginů opustili zastaralý koncept "based on x87" a začali úplně od píky vyvíjet nové herní enginy, které budou umět profitovat z těchto nových instrukcí a ještě více využívat GPGPU a třeba i ten Multi Threaded Rendering.

Utopie. Jedine ze bys na skolach zacal tvrde vyucovat tuhle cestu a budouci programatori podle toho i sli a po nastupu do firem tento postup prosadili. Programatori obecne si vytvori nekjaky postup a toho se drzi jen s malymi obmenami. Oni sve zpusoby neradi meni a kdyz ,tak cestou nejmensiho odporu. Staci se podivat na to ,kolik fanousku dokaze delat upravy kodu (vyhazou nesmyslna volani atd. z kodu) a zrychlit tak hru klidne o 50%. AMD jde uplne spatnou cestou ,kdy na svy CPU potrebuje presne napsany soft, ktery ale nekdo udela tak max se sebezaprenim do serverovy oblasti ,ale ne do desktopu. Tohle uz zkousel Intel a pohorel ,tak proc to zkousi AMD ? Vyvojari stale jedou tu svou pisnicku a posun v oblasti enginu je stale minimalni. Oni stale stavi na svem oblibenem postupu a max neco tem novym instrukcim prihrajou. Staci se podivat na nejuspesnejsi hry posledni doby jako SCII, Skyrim, Total War: Shogun 2............
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 13:27
od del42sa
Já to chápu Hladis, ale presne jsi vystihl co je problém. Je to neochota něco měnit, je to strnulost sw, lpění se na 20 let starých principech a proto se ten vývoj a pokrok v této oblasti v podstatě zastavil. Tohle představuje tu největší brzdu vývoje, jak CPU, tak GPU a cokoliv dalšího s tím souvisejícího. Tímhle tempem se moc dopředu nedostaneme a po počátečním boomu v IT se dopředu posunujeme hlemýždím tempem navzdory 16ti jádrovým procesorům a grafickým kartám s příkonem blížícím se přímotopu

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 13:35
od froxic
Tak tak, ono je to pouze o tom chtít napsat optimalizovaný SW. Ale v dnešní době na to každý ... a pak vznikají programy nebo hry, které mají stejné funkce, ale jsou daleko hardwarově náročnější. Krásným příkladem jsou konzole (které mimochodem taky brzdí vývoj kupředu), kde se hraje hodně na optimalizaci. Zastaralý hardware v nich dokáže "zázraky", oproti stejné PC sestavě. Další věc je fakt, že dělat optimalizace a psát paralelní kód (nedej bože ho ladit), není vůbec jednoduchá věc. Takže problém dnešní doby je dle mého spíše o lidech, než o "pomalosti" HW.
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 13:37
od DOC_ZENITH
Já si myslíjm že jsou hlavně přeceňováni. Vývojáři SW se většinou koupou v penězích i když odváděj mizernou práci, ala zabugované totálně neoptimalizované programy stavěné na principech které se naučili před 10 lety a přechod platforme řešej stylem "použiju jinej compiler". Něktří dokonce otevřeně říkají že udělat dokonalej SW je katastrofa protože pak neni co opravovat, optimalizovat, patchovat a stanete se nepotřebným. Tak by je měli vyfakovat za tě že dělaj sračky a je to. Odměnit ty co používaj ty nové technologie mnohem více, a sebrat to těm datlákům co si jen držej koryto. A Rázem by to fungovalo.... že...
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 13:39
od Hladis
No a nova generace ,pokud se prosadi (coz taky neni hned) ,tak zase ta zustane sedet na tom svem zpusobu ,dokud je nekdo opet nenahradi. I ti co je uci jsou odkojeni starym zpusobem. Podivej na Unreal engine ,kde za nej da se rici odpovida uz leta Tim Sweeney ,ktery ti klidne prohlasi ze AA je zbytecnost..........pak prijdou nejaky korejsky sasci a pomoci SDK na tom engine sestavej nejakou MMO jmenem TERA (a prevzali zpusoby ze hry kterou delali pred tim jmenem Lineage II) a je vymalovano.........Potrebujes na to Intel nejlepe na 5GHz ,abys nemel sileny fps dropy. Skyrim engine treba prosel dost evoluci ,ale stale je to na bazi Morrowindu a jen se meni omacka okolo. Taky Bethesda resi stale stejne chyby porad dokola uz mnoho let. Je malo vycvojaru ,co postavi uplne zgruntu novy engine optimalizovany na nejnovejsi technologie. Kolik ze jich stavi engine primo na DX11 ze...........Priklad Crysis 2 a pak nasledny Dx11 patch a jaky humbuk to zpusobilo a ruzna narceni na nV ,pritom to byla jen ve spechu sesita typicka vyvojarska omacka.
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 13:46
od ArgCZ
to je zajímavý, že na konzoli jde napsat soft/hra na míru, tam líný nejsou, takže je to spíš o penězích, každopádně třeba jde AMD správnou cestou pokud by mělo Sony i mrkvosoft mít jako srdce jejich APU že...
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 13:47
od del42sa
DOC_ZENITH píše:Já si myslíjm že jsou hlavně přeceňováni. Vývojáři SW se většinou koupou v penězích i když odváděj mizernou práci, ala zabugované totálně neoptimalizované programy stavěné na principech které se naučili před 10 lety a přechod platforme řešej stylem "použiju jinej compiler". Něktří dokonce otevřeně říkají že udělat dokonalej SW je katastrofa protože pak neni co opravovat, optimalizovat, patchovat a stanete se nepotřebným. Tak by je měli vyfakovat za tě že dělaj sračky a je to. Odměnit ty co používaj ty nové technologie mnohem více, a sebrat to těm datlákům co si jen držej koryto. A Rázem by to fungovalo.... že...
dnes ti píšu za 1 DOCENTE

Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 13:54
od Hladis
ArgCZ píše:to je zajímavý, že na konzoli jde napsat soft/hra na míru, tam líný nejsou, takže je to spíš o penězích, každopádně třeba jde AMD správnou cestou pokud by mělo Sony i mrkvosoft mít jako srdce jejich APU že...
Ale to taky neplati. Rozdil ve vizualu mezi konzoli a PC je propastny. Pro priklad Skyrim na PC+Mody je vizualem uplne nekde jinde ,nez orezany Skyrim na XBOXu. Prave ze diky konzolim se hry nijak vizualne nikam neposouvaji a stagnuji a to vcetne optimalizaci na nove instrukce. To co dnes vizualne na konzolich vznika je 7 let stary vizual s tim ,ze na PC se tam naroubuji efekty navic a mas v ruce paskvil.
Edit// Pokud by napriklad nejake studio vytvorilo uplne novy engine a hru ciste usitou na nejnovejsi instrukcea HW primo na PC a jeho potencial ,tak myslim ze by to byl vizualni orgasmus oproti tomu co dnes je servirovano...........
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 15:11
od DOC_ZENITH
ArgCZ píše:to je zajímavý, že na konzoli jde napsat soft/hra na míru, tam líný nejsou, takže je to spíš o penězích, každopádně třeba jde AMD správnou cestou pokud by mělo Sony i mrkvosoft mít jako srdce jejich APU že...
Těch her "na míru" je už dnes málo. Většina z nich je patřičně zplacenejch. Exclusivky pro PS3 co vypadaj skvěle (killzone, Uncharted... atd...) jsou dotované Samotnout Sony any to jejich systém ukazovalo v lepším světle. Tyhle věci je také téměř nemožné protnout protože maj neuiniverzální specifické enginy (sám jsem viděl ňákej real-time log, kde dokonce řeše jvěci jako které výpočetní bloky Cellu jsou jak vytížené a co se na něj ještě dá přesunout aby se ulehčilo GPU,atd. A do toho ti žádnej vydavatel dobrovolně nepůjde, protože prostě nejde portnout.
Jinak multiplatformí hry na konzolích vypadaj strašně. 1024x600 + FSAA 2x + megaupscaling běžnej standard + tak s odřenejma ušima medium detaily.... ono když si do PC dáš tu GF7800GTX tak to tam v tomhle nastavení kupodivu funguje také tak obdobně. Ale PCčkáři jsou zvyklí na jiné standardy, ti nemůžou mít inputlag, rozmazanej upscalovanej blivajz, atd.
Jinak co se APU týče, myslim si že AMD to měla vzít za jinej konec, ala nasadit GPGPU silné GPU k tomu CPU, a ne VLIW5 k llanu a nyní VLIW4 které je naprosto out a co se výpočetních funkcí týče naprosto zastíněno GCN. Pro tohle by dělal SW jen idiot a AMD to ví. Koncept APU tlačí jen na to že "máme nejlepší 3dmarky s integrovanou grafikou ever" vůbec ne na nasazování GPU na výpočty a taky maj důvod, protože ty GPU tam jsou na bázi zastaralé architektury kterou samo AMD už nechce SW podporovat.
Neumí třeba vůbec task switching takže nemůže zároveň počítat a 3D renderovat aniž by se výkon propadl víte kam...
Zkuste si flodding na VLIW4/5 GPU a během toho dělat i jen ve win co je to za teror. Tohle je prostě nevhodná R600-based architektura která byla optimalizována pro nanášení textur a rychlé počítání pixel shader kódů. Ne výpočty. Na to je GCN.
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 15:29
od del42sa
Ano, ale AMD dříve nic jiného než VLIW5/4 nemělo, takže nynější APU lze chápat jako "cvičný návrh" na kterém si mohou vyzkoušet jakým způsobem APU navrhovat a Trinity na tom přece jen bude výpočetně o něco lépe něž Llano a je zase o krůček blíže k HSA. Ale budoucnost APU je skutečně v GCN/GCN2 a v kombinaci s x86 unified addressing space.
Ostatně i procesory AMD jsou navrhovány tak, že mají zcela samostatné schedulery pro Int. operace a pro FPU operace. Jednotka FPU se v nich dá zcela nahradit jiným matematickým koprocesorem (rozuměj GPU) bez větších zásahů do architektury. U Intelu proběhla integrace koprocesoru FPU uplně jiným způsobem než u AMD a v Intel CPU je FPU přímo součástí int.pipelines a vše obstarává společný sheduler. Nelze je tedy od sebe tak jednoduše oddělit jako u AMD.
BD:
http://www.abclinuxu.cz/images/clanky/h ... lexfp1.jpg
SB:
http://cdn.arstechnica.net/wp-content/u ... -uarch.png
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 15:45
od nou
kedze sam pracujem ako programator tak vam poviem ako to funguje
- programatory su lenivy
- firma to chce lacno. pre firmu nie absolutne zaujimave ze zrychlite program x-krat pretoze to nie je pre nich dolezite. dolezite je aby bol hotovy produkt.
- pouzivaju sa pomalosti typu Java/C# alebo dnes este horsia zhuverilost JavaScript/HTML5 kedy sa musi vykonat tisice instrukcii na to aby ste vykonali 5+5 pretoze je to cele pochovane pod milionom vrstiev abstrakcie.
- HW je lacny. vsetci vam povedia kupi sa lepsie zelezo to je lacnejsie ako to programovat.
- optimalizacie su pre firmu len naklady navyse. nic viac to neprinesie.
- spetna kompatibilita. bozechran ak by ste ten SW nemohly spustit na 10 rokov starom CPU ktore nepodporuje SSE. to vas ukrizuju. vid neschopnost prejst na 64bit systemy co by zabezpecilo aspon SSE2.
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 15:55
od nou
DOC_ZENITH píše:Neumí třeba vůbec task switching takže nemůže zároveň počítat a 3D renderovat aniž by se výkon propadl víte kam...
Zkuste si flodding na VLIW4/5 GPU a během toho dělat i jen ve win co je to za teror. Tohle je prostě nevhodná R600-based architektura která byla optimalizována pro nanášení textur a rychlé počítání pixel shader kódů. Ne výpočty. Na to je GCN.
to je tym ze ak bezi vypocet na GPU tak sa nemoze aktualizovat obrazovka. cele GUI preto zacne sekat. ale CPU aj programy normalne bezia dalej. GCN je v tomto pokrok kedze by malo byt mozne rozdelit GPU na dve casti. jedna bude pocitat GPGPU a druha renderovat obraz.
Re: AMD Steamroller/Excavator (28nm)-informace, spekulace
Napsal: pon 9. črc 2012, 16:35
od DOC_ZENITH
del42sa píše:Ano, ale AMD dříve nic jiného než VLIW5/4 nemělo, takže nynější APU lze chápat jako "cvičný návrh" na kterém si mohou vyzkoušet jakým způsobem APU navrhovat a Trinity na tom přece jen bude výpočetně o něco lépe něž Llano a je zase o krůček blíže k HSA. Ale budoucnost APU je skutečně v GCN/GCN2 a v kombinaci s x86 unified addressing space.
Ostatně i procesory AMD jsou navrhovány tak, že mají zcela samostatné schedulery pro Int. operace a pro FPU operace. Jednotka FPU se v nich dá zcela nahradit jiným matematickým koprocesorem (rozuměj GPU) bez větších zásahů do architektury. U Intelu proběhla integrace koprocesoru FPU uplně jiným způsobem než u AMD a v Intel CPU je FPU přímo součástí int.pipelines a vše obstarává společný sheduler. Nelze je tedy od sebe tak jednoduše oddělit jako u AMD.
BD:
http://www.abclinuxu.cz/images/clanky/h ... lexfp1.jpg
SB:
http://cdn.arstechnica.net/wp-content/u ... -uarch.png
Už vidim to grafické jádro jak nám počítá x87 thread..... to je naprostá utopie.