Federmann píše:to nahore o vykonu
No uz z toho obrazku:
Intel 176M tranzistoru -> 87mm2
AMD 380M tranzistoru -> 74mm2
To je 2.5* vetsi hustota tranzistoru na mm2. To vypada na rozdil procesu 28nm vs 40 nebo tak neco.
Kdyz se podivas na L2 cache tak ta u Intelu je plochou vetsi 1.5. Pokud bude poctem tranzistoru obdobna, tak to jeste zmensuje prumernou hustotu zbytku cipu (ma vic tranzitoru nez by v prumeru mela mit).
Pak se muzes podivat na jadro atomu uvidis spousty "mezer" (plochy pravdepodobne bez tranzistoru). Podle me je tam Intel puvodne dal, aby dodrzel nejakou velikost jadra ATOMU. (marze na tom stejne mat ak velky, ze ho par mm2 nevytrhne).
Takze hustota tranzitoru v jadre AMD by mela byt minimalne 2.5* vetsi mozna i vic. A pri trose matematiky 2.5* 4,6 = 11.5mm2 s hustotou podobnou ty intelu. A to mame tedy minimalne 18.5% tranzistoru navic v CPU AMD.
Takty i u novejch atomu budou celkem nizko, takze i s podstatne vetsi hustotou je asi nebude problem vyrovnat. A pokud se jedna (a s vic jak dvojnasobnou hustotou je to takrka na 100%) o mensi vyrobni proces tak i podstatne prekonat pri zachovani slusny spotreby.
Takze mi netvrd, ze AMD s o 20% vic tranzistory a vyssim taktem bude zaostavat ve vykonu CPU za intelem.
Federmann píše:to dole o GPU
Core i7 920 .. 70GFLOS (4 jadra .. HT pri 100% vytizeni akorat brzdi)
Radeon 5870 .. 2.72 TFLOPS(1600SP)
At koukam jak koukam tak tu mam vykon pouze 40* (38*) vetsi. (2 jadrova grafika poradne neskaluje ani v grafice, natoztak v normalnich vypoctech, nemluve o tom, ze jsou i vykonejsi CPU a taky jich muzes pouzit vic)
Aby mohly SP efektivne zastoupit ALU/FPU museli by byt podstatne jine nez ty dnesni, coz tady nehrozi. Pokud vezmu ze, GPU je 40* rychlejsi (jako, ze teoretickej vykon), ale ma 400* vic jader, tak 1SP ma ve matematickejch vypoctech vykon celejch 10% maximalne (synchonizace, priprava dat pro GPU...). Uz vidim jak tady vsichni placou nadsenim, ze jim 1 vlaknovy programy behaj jak na CPU s 350MHz... (a koho zajima, ze jde o i7)
Federmann píše:to dole o hranicich
U amd neplati striktni hranice kdy si co kope za sebe pravdepodobne jenom v pristupu k pameti, ktery ma asi tak jedinou sanci pouzivat spolecne. ATI SP nejsou schopne vykonavat x86 instrukce ani mikrokod, natoztak nejak efektivne sdilet data. A uz vidim tu efektivitu prekladu instrukci z x86 do HD6000. Pokud by to v AMD umeli (a efektivne), opravdu myslis, ze by nevydali neco jako Larabee nebo se s tim aspon nevytahovali?
Edit: Jeste to muzu vzit z druhy strany: umis si predstavit ty latence kdy se od dekodovani instrukce maji data dostat z Bobcat jadra rovnomerne do vsech SP? To by krasne srazilo takty, kdyby to melo fungovat jako homogenni jadro.
Edit2: prehlid jsem, ze tam ty procesy jsou napsany. U AMD jadra je pocet tranzistoru odhadnutej podle SP se 40nm od TSMC. Proti 45nm u Intelu.