Otazka je jestli SSE instrukce maji na skalarni kod nejaky vykonostni vyznam.webwalker píše:Imho na začátek by pouze stačilo kdyby kompilátory překládaly rovnou do SSE instrukcí místo x87 instrukcí. Pokud vím, tak u VS2010 kompiler překládá do mixu x87 a SSE.
Sice musis, ale existujou v podstate 3 pristupy:webwalker píše: O vektorizaci a optimalizaci kritické části kódu se imho stejně musíš postarat sám (ale možná se pletu).
Nic nedelam sam pouzivam optimalizovany knihovny. (problem v nestandartnich situacich, a stejne musis upravovat kod tak aby sedel vstupum dane knihovny)
Napises optimalizovanej kod sam a mas neco co funguje jenom na konkretnim HW, ale zato s nejvyssim moznym vykonem. (teoreticky)
Nebo se pokusis psat kod tak, aby byl snesitelnej pro automatickou vektorizaci. Nemas zarucenej nejvyssi vykon, ale v pripade kompilace na jinou platformu, nebo jinym kompilatorem to bude nejak fungovat a nejspis to zkousne i vektorizace dane platformy.
V idealni situaci by se pouzila kombinace vsech pristupu. Jenze na to neni nikdy cas a neoptimalizovanej kod je vetsinou dostatecne rychlej.





