Hladis píše:Ja jeste trochu OT.
Ja da se rici s DOCem souhlasim ,ale ma to jeden podstatny hacek. Uz jsem psal ze i7 si maji koupit jen lide ,kteri ho opravdu nejak vyuziji a vedi jak to funguje z vyse popsanych duvodu. Flankere jen jedina hra ignoruje Core Parking a to ARMA. Tam dochazelo k poklesu s HT ,protoze ta hra pretizila vsech 8 threadu. Ostatni hry ,ale berou nastaveni z Win a dnes nikde jinde k zadnemu poklesu s HT uz nedochazi.
Zkuste ale zapremyslit ,co by se stalo pokud by tedy soft byl naprogramovan efektivneji a vytizil by i5 naplno......ano doslo by ke stejnemu efektu ,jako s HT. Cely by se to zasekalo......a nepomohlo by tomu ani nastaveni priorit ,pokud by vsechny softy byli takto udelany a poradne zdimali CPU vykon. Proste by to pretizili bez ohledu na cokoliv. HT je jen berlicka ,ktera softu umoznuje zvysit vykon pridanim dalsiho threadu a vytizit CPU na doraz. Tim ziskame 20% vykonu navic ,ale odezva systemu a multitasking jde do pekel ,kdezto na i5 je to stale svizne.
Takze co vlastne chceme ? Lepsi soft a zazdeny vsechny klasicky CPU, kdy stejne dojde na pridelovani jednotlivych threadu ,aby se to nezasekalo ? Nebo CPU ktery je na to urcen ,aby dokazal jet na doraz tam ,kde je to potreba a pripadne pridelit programum kolik threadu mohou vyuzit ?
Ne to jsi mimo. Soft kterej 100% vytíží pipeline ti PC nezaseká pokud nemá vysokou prioritu. Zaseká ho právě jen HT které pipeline přetíží aniž by o tom OS věděl, protože OS si myslí že má k dispozici 8 jader ne 4, takže když má 4 na 100% loadovaný tak to prostě bere jako fajn, mam jen 50% load a thready co něco chtěji hází na další volá jádra které ve skutečnosti volná nejsou a dochází k tomu efektu. To je ten nedluh HT, kdyby byl soft psanej tak aby plně vytížil pipeline, ala optimalizovanj na železo, nemělo by HT smysl a vše by fungovalo jak má, ale to je prostě spíš sen než cokoliv jiného.
Core parking byl vymyšlen hlavně jako součást power managementu a pomahá správné funkci turba, nebyl vymyšlen jako prostředek na boj s negativním vlivem HT, a u strojů s HT když hraješ a něco využije CPU krom té hry, jde ti framerate bez ohledu na priority procesů do kopru, což se u CPU bez HT nestane. Můžeš si to klidně zkusit, ten CPU máš. Zapni si třeba prime 95 small fft test na všechny jádra a dej mu nízkou prioritu, zapni cokoliv jiného a dej tomu vysokou a změř výkon, bude mizernej.
HT vypni, restartuj to a udělej to samé = výkon procesu s vysokopu prioritou bude vysokej tak jak má být.
Neplést si koncept HT s konceptem Buldozeru. Tam je to jedno jádro plné jedno polovičaté. U procesoru s HT je úplně jedno na které jádro šahneš, pokud neni CPU přetíženej podá na jakémkoliv z nich stejnej výkon. Pokud zatížim 3 jádra na 100% a pustim single thread apliakci, bude mít plnej výkon bez ohledu kterýmu jádro 4-8 jí přihodim.
Pokud budu mít soft kterej vyloaduje pipeline z 75% jedno jádro na jeden thread, tak při obsazení 5 threadů mam stenej boost jako kdybych tam měl o jádro navíc. Naopak když tento soft obsadí 6 a více threadů, bude nárůst výkonu defakto nulovej a sesype se svižnost systému. Navíc dojde ke snížení výkonu na thread což by v případě hry nebo jiného softu u kterého je důležité mít 1 silnej thread znamenalo problém. Dlouho jsem si tyhle věci testoval než jsem nakonec došel k závěru že HT zásadně vypínám, zapnul bych jej akorát kdybych šel dlouhodobě enkódovat a nedělal při tom nic jiného.
Webwalker: Metro je hrozně neprkatická kachličkárna optimalizovaná pro dotykové ovládání, je to fajn pro tablety, u PC budeš trávit nejvíc časi na ploše ne mezi cihlami metra protože pro ovládání klávesnicí a myší je ten koncept doslova úděsnej.
Felgy: Paraelizovat do nekonečna jdou jen některé typy úloh. U renderu je to easy protože tam můžeš ject co řádek či blok pixelů to separé jádro. U enkódingu to zas můžeš rozsekat na části obrazu pro určitá jádra. Ale jsou i věci co se daj paraelizovat extrémě těžko. Nemůžeš třeba paraelizovat fyzikální výpočet 2 těles když se samy sebe dotýkají, atd. I právě ty příklady z paraelizovaného softu jsou jasným důkazem jak to nejde, pusť si cinebench a koukej jak se to slow zobrazuje, když dáš více jader bude se to zobrazovat ale rozsekané na kusy, každé jádro si dělá svoje. To je ale blbý protože to nepotřebujem, mi by jsme potřebovaly aby se nám to vizuálně renderovalo jak 1 ale třeba 4x rychlejc. A to se prostě neděje a jen tak se tenhle problém asi nerozsekne. Dokonce i OS jako takovej má problémy s paraelizací, a sám víš jak líný jsou blbý windows na atomu či bobcatu a stejně líný by byly kdyby měl 2 nebo 80 jader. Protože když zadám příkaz je důležité jak ryachel na něj systém reguje ne že na něj za stejně slow dobu dokáže reagovat 80x... He to jak ty srovnání s vvýměnou žárovky.
Je potřeba vyměnit žárovku a mam na to jednu halzbábu, a potřebuju proces urychlit. Co si vyberu? Mít 80 hajzbab a nebo jednoho 2x lepšího technika? To je úloha neparaelizovatelná. Naopak kdybych potřeboval zorat pole, mejch 80bab to dá mnohem lépe než jeden 2x silnější technik. Rozdíl je tu ten, že 80 hajzlbab bude oproti 1 rychlejší jen ve specifickejch masovejch činnostech. Kdežto ten technik bude lepší naprosto vždy a bude se to projevovat i v situacích co se nám zdály jako solidně paraelizovatelné.
Pro tohle se AMD dostalo do průseru protože rezignovali na posun výkonu na thread. Intel se dostal do fáze že má pro nutné potřeby v nabídce Xeony s tunou jader ale u Haswellu bude běžná spotřební desktop nabídka možná končit u čtyřjader, protože více je jen mizivě využitelné.