Vícero CPU na různých taktech/ velikostech cache, atd.
Moderátoři: flanker, Eddward, Baneshee, PKBO
- DOC_ZENITH
- Středně pokročilý
- Registrován: 08. kvě 2010
- Bydliště: Praha
Vícero CPU na různých taktech/ velikostech cache, atd.
Kdysi dávno když jsem se poprvé zabýval multi-CPU systémy (zhruba léta páně 2003), jsem četl zajímavou teorii, že SMT a celá ta věc se vůbec nemusí skládat z mnoha těch samejch CPU. Teoreticky prý neni problém kombinovat CPU s různo ufrekvencí (jinej násobič) a klidně i různé velikosti cache, atd.
Ale dnes jsem něco takového viděl poprvé v praxi. Na Aukru jsem koupil 2x slot 1 desku a byly k ní přibaleny 2 naprosto různé CPU. PII 450Mhz made in Malaysie a 350Mhz made in Irreland. Oba dva FSB100 oba dva HW locknutej násobič. Jaké mé překvapení když se mi je v desce podařilo rozject oba dva najednou a na různejch taktech. Jeden CPU (ověřeno v CPU-Z) běží na 450 a druhej 350Mhz, win je normálně vidí oba dva. A krom trošku popleteného task managera kterej nedovede tuhle situaci pochopit a ačkoliv system idle process je 99% tak hlásí CPU load 50% v poměru tak 2/3 mezi jádry, tak vše funguje (při vyloadování už hlásí i poměr správně). OS je svižnej, stable, a dokonce jsem zkoušel spustit CPUmark s aifinitou na CPU0 = 18,6 bodu, CPU1 = 15,3 bodu. Takže to tak opravdu funguje. V budoucnu se chystám dále s tím experimentovat když mam tuhle desku co neřeší že se CPU nehopděj do páru, dam tam P3ku s P2 najednou, ala jeden CPU co umí SSE a druhej ne a spustim v multithreadu aplikaci co to vyžaduje (třeba dnešní FFDshow kodeky), co se stane, atd.
Ale pointa je taková že to funguje a ani se tomu niak nemusí přizpůsobovat OS či aplikace.
A i dnes už tu máme CPU které maj nevyrovnanej výkon na thread ( Intely s aktivnim HT při full loadu, nebu buldozer díky sdílenému Front endu a FPU), tak proč prostě nenavrhnout CPU co by byl defakto jako výpočetní blok skládající se z různejch čipů. Ten prototyp Larabe co byl do socketu pro CPU neni až tak nesmyslná myšlenka. Já bych si v systému dovedl představit třeba jedno čtyřjádro nebo i jen 2, které by mělo 5Ghz 2MB L2 20MB L3, široká pipeline, silná FPU, něco na stylu Inteláckejch CPU ale ještě víc optimalizovaný s decap ringem, atd. A vedle toho další křemík s třeba 32-minijádry na 2Ghz, architektury něco jako je bobcat. + Klidně to udělat modulárně, třeba na 4ALU jednu FPU. Singhle thread limited aplikace by mohly těžit z toho silného a neomezně multithread aplikace by naopak mohly těžit z tuny těch malejch co by pro takovej SW dost možná podaly lepší výkon vs WAtt vs plocha. Klidně by to šlo dát na jeden kus křemíku vše společně. Proč tohle zatím Intel nebo AMD neudělali? Technicky tam nevidim překážku a dovedu si představit poměrně fajn výkon.
Ale dnes jsem něco takového viděl poprvé v praxi. Na Aukru jsem koupil 2x slot 1 desku a byly k ní přibaleny 2 naprosto různé CPU. PII 450Mhz made in Malaysie a 350Mhz made in Irreland. Oba dva FSB100 oba dva HW locknutej násobič. Jaké mé překvapení když se mi je v desce podařilo rozject oba dva najednou a na různejch taktech. Jeden CPU (ověřeno v CPU-Z) běží na 450 a druhej 350Mhz, win je normálně vidí oba dva. A krom trošku popleteného task managera kterej nedovede tuhle situaci pochopit a ačkoliv system idle process je 99% tak hlásí CPU load 50% v poměru tak 2/3 mezi jádry, tak vše funguje (při vyloadování už hlásí i poměr správně). OS je svižnej, stable, a dokonce jsem zkoušel spustit CPUmark s aifinitou na CPU0 = 18,6 bodu, CPU1 = 15,3 bodu. Takže to tak opravdu funguje. V budoucnu se chystám dále s tím experimentovat když mam tuhle desku co neřeší že se CPU nehopděj do páru, dam tam P3ku s P2 najednou, ala jeden CPU co umí SSE a druhej ne a spustim v multithreadu aplikaci co to vyžaduje (třeba dnešní FFDshow kodeky), co se stane, atd.
Ale pointa je taková že to funguje a ani se tomu niak nemusí přizpůsobovat OS či aplikace.
A i dnes už tu máme CPU které maj nevyrovnanej výkon na thread ( Intely s aktivnim HT při full loadu, nebu buldozer díky sdílenému Front endu a FPU), tak proč prostě nenavrhnout CPU co by byl defakto jako výpočetní blok skládající se z různejch čipů. Ten prototyp Larabe co byl do socketu pro CPU neni až tak nesmyslná myšlenka. Já bych si v systému dovedl představit třeba jedno čtyřjádro nebo i jen 2, které by mělo 5Ghz 2MB L2 20MB L3, široká pipeline, silná FPU, něco na stylu Inteláckejch CPU ale ještě víc optimalizovaný s decap ringem, atd. A vedle toho další křemík s třeba 32-minijádry na 2Ghz, architektury něco jako je bobcat. + Klidně to udělat modulárně, třeba na 4ALU jednu FPU. Singhle thread limited aplikace by mohly těžit z toho silného a neomezně multithread aplikace by naopak mohly těžit z tuny těch malejch co by pro takovej SW dost možná podaly lepší výkon vs WAtt vs plocha. Klidně by to šlo dát na jeden kus křemíku vše společně. Proč tohle zatím Intel nebo AMD neudělali? Technicky tam nevidim překážku a dovedu si představit poměrně fajn výkon.
- Hladis
- Moderátor
- Registrován: 24. čer 2004
- Bydliště: Varnsdorf - Athens
Re: Vícero CPU na různých taktech/ velikostech cache, atd.
No nevim DOCu. Ja myslim ,ze takovy reseni by se libilo treba tobe ,ale Intel a AMD by na to koukali dost vyjevene a okamzite shodili ze stolu. Dle me by se mel stat standartem multithread rendering + lepsi optimalizace a ne delat takove jednostrane zamerene silenosti.
- dexterav
- Mírně pokročilý
- Registrován: 26. pro 2003
- Kontaktovat uživatele:
Re: Vícero CPU na různých taktech/ velikostech cache, atd.
myslím že NV niečo podobné má
Intel Ultra 7 265k 5,6/4,9GHz,Apex Z890, 2X24GB 8,2GHz CL38 Patriot Extreme, Asus TUF 5090 3.2/34GHz , H2O + Carbide 600Q,ROG-THOR-1600T, 10TB 850X, Topping D50s + A50s + T5, MPG 321URX QD-OLED, S23Ultra, ITX 13700k + 5070Ti + Audinst Hud-Mx2 + THX-M50X
- Mastodont
- Černá karta
-
- Registrován: 04. bře 2008
- Bydliště: Praha
Re: Vícero CPU na různých taktech/ velikostech cache, atd.
Nebylo by problém pro to programovat?
- DOC_ZENITH
- Středně pokročilý
- Registrován: 08. kvě 2010
- Bydliště: Praha
Re: Vícero CPU na různých taktech/ velikostech cache, atd.
Proč? Právě by to bylo dobré v tom že by na tom běžely jak mizerně optimalizované zastaralé enginy, tak by to bylo ok pro mass multithread enkóding, atd.
Hladis. Jop, asi proto tu máme 10-jádrové Xeony se všemi jádry plnohodnotnými, atd. Ale třeba u AMD by se to hodilo, ten její klesající výkon na thread jaksi nevidim jako cestu do budoucna. A vzhledem k tomu že existuje prototyp larabe do socketu pro Xeony, Intel o něčem takovém minimálně uvažoval. Takovej maxicore cou by se tam pároval v MultiCPU systému s normálnim Xeonem.
Nicméně jak už jsem řekl a dnes sám viděl, funguje to. + Takove jCPU by oslnil i v bencharkách, exceloval by v jak single tak multi věcech.
+ Pokud jde třeba o rendering, tak tam se scéna typicky rozdělí na krychle ( u video enkódingu zas řádky), kolik máš threadů tolik krychlí a když jeden dodělá tu svou přidělí se mu další, a až se spočítaj všechny, jde se na další frame. Nevadilo by tedy kdyby některá jádra byla mnohem silnější prostě by jen spočítala více krychlí za stejnej čas. Nestalo by se tedy u multithread optimalizovanýho SW, že by část čipu idlovala nebo nebyla plně využita.
Dokonce by šla vytvořt varianta pro mainstream. Typu max výpočetní a max grafický GPU. Oba by měly to sylné 2 (v budoucnu asi spíš 4) jádro, a jeden by měl na zbytku plochy tu tunu těch malejch pro výpočty a druhej by měl místo toho silné IGP a lidi by si vybrali podle toho co potřebujou.
Dokonce by šel napsat SW co by dokázal easy identifikovat ty silná a slabá jádra bez různejch testů výkonu, atd. Stačilo by jim dát jiný CPU ID, nebo jej udělat programovatelný, jako to třeba má VIA Nano. Kde některej SW neznající ten CPU s ním nepoužíval moderní instrukční sady a když se přeprogramoval aby se hlásil jako CPU Core2 architektury, tak se ten SW choval jinak. Tak stejny způsobem by to mohl SW identifikovat zde. Ty slabší by měly své specifické ID.
Hladis. Jop, asi proto tu máme 10-jádrové Xeony se všemi jádry plnohodnotnými, atd. Ale třeba u AMD by se to hodilo, ten její klesající výkon na thread jaksi nevidim jako cestu do budoucna. A vzhledem k tomu že existuje prototyp larabe do socketu pro Xeony, Intel o něčem takovém minimálně uvažoval. Takovej maxicore cou by se tam pároval v MultiCPU systému s normálnim Xeonem.
Nicméně jak už jsem řekl a dnes sám viděl, funguje to. + Takove jCPU by oslnil i v bencharkách, exceloval by v jak single tak multi věcech.
+ Pokud jde třeba o rendering, tak tam se scéna typicky rozdělí na krychle ( u video enkódingu zas řádky), kolik máš threadů tolik krychlí a když jeden dodělá tu svou přidělí se mu další, a až se spočítaj všechny, jde se na další frame. Nevadilo by tedy kdyby některá jádra byla mnohem silnější prostě by jen spočítala více krychlí za stejnej čas. Nestalo by se tedy u multithread optimalizovanýho SW, že by část čipu idlovala nebo nebyla plně využita.
Dokonce by šla vytvořt varianta pro mainstream. Typu max výpočetní a max grafický GPU. Oba by měly to sylné 2 (v budoucnu asi spíš 4) jádro, a jeden by měl na zbytku plochy tu tunu těch malejch pro výpočty a druhej by měl místo toho silné IGP a lidi by si vybrali podle toho co potřebujou.
Dokonce by šel napsat SW co by dokázal easy identifikovat ty silná a slabá jádra bez různejch testů výkonu, atd. Stačilo by jim dát jiný CPU ID, nebo jej udělat programovatelný, jako to třeba má VIA Nano. Kde některej SW neznající ten CPU s ním nepoužíval moderní instrukční sady a když se přeprogramoval aby se hlásil jako CPU Core2 architektury, tak se ten SW choval jinak. Tak stejny způsobem by to mohl SW identifikovat zde. Ty slabší by měly své specifické ID.
- Hladis
- Moderátor
- Registrován: 24. čer 2004
- Bydliště: Varnsdorf - Athens
Re: Vícero CPU na různých taktech/ velikostech cache, atd.
Musis si ale polozit otazku, zda trh neco takoveho potrebuje ,jake naklady by to melo a zda by jsi to prodal. I tak musis vyvinout silne jadro a z toho vychazet. Myslim ,ze pokud by vyrobci CPU umeli vytvorit jadro s tak vysokym IPC ,tak uz tu je a delali by to standartni cestou. Elegantnejsi ,levnejsi reseni je funkce Turbo ,nez nejaky HW hybrid. Stejne jako je elegantnejsi reseni HT nez to co predvedl Bulldozer.
- DOC_ZENITH
- Středně pokročilý
- Registrován: 08. kvě 2010
- Bydliště: Praha
Re: Vícero CPU na různých taktech/ velikostech cache, atd.
Já to myslim torchu jinak. Nemyslim komplet překopávat koncept ale místo 8-mi jádrového Xeonu do LGA2011 mít třeba 2x big +32x small... trh něco takového potřebuje, protože to co uspokojí určité části trhu má teď jen Intel a to neni dobré (+ za větší cenu než by bylo zdrávo). AMD se svou modulární BD architekturou zavařilo spíš samo sobě. A právě AMD by něco takového potřebovalo. Náklady na vývoj... hmm asi moc ne, protože stejně vyvíjíš tu silnou + malou úspornou architekturu (+ ta slabší zatim jak u Intelu tak AMD vychází z něčeho staršího co už je hotové a funkční, nejsou to zbrusu nové architektury. Já jenom proč je nezkombinovat.
Prodat to? Easy namaluješ obsorvské číslo protože čím více jader tím víc addidas + to bude silné i v singlu takže ti to potvrděj defakto všechny benchmarky. Prodávalo by se to myslim nádherně, protože v bencharkách i marketingu by to defakto nemělo slabé místo.
Prodat to? Easy namaluješ obsorvské číslo protože čím více jader tím víc addidas + to bude silné i v singlu takže ti to potvrděj defakto všechny benchmarky. Prodávalo by se to myslim nádherně, protože v bencharkách i marketingu by to defakto nemělo slabé místo.
- palda
- Začátečník
- Registrován: 12. čer 2004
- Bydliště: Praha
- Kontaktovat uživatele:
Re: Vícero CPU na různých taktech/ velikostech cache, atd.
Jen pro doplnění, tyhle řešení dělá (nebo dělali) od přibližně roku 2007 Altera a Xilinx
Mrsklo se to rovnou do patice pro Xeony a s klasickým x86 CPU to komunikovalo po tehdy ještě FSB. Bylo to posvěcené Intelem, který to dokonce nějakou dobu prodával pod svojí značkou jako OEM, nedávno byla dokonce jedna Altera na aukru asi za 40 tisíc (právě jako intel oem). Ta Altera byla později stejných rozměrů jako tehdejší C2D Xeony (díky integraci čipů). Některé ty moduly byly i částečně x86 kompatibilní (samozřejmě v kombinaci s x86 xeonem, kvůli licenci). Intel to i hrdě předváděl na IDF přímo na svých deskách. Mimo to to bylo plně programovatelné. Občas jsou vidět i na Folding@Home
Intelu asi došlo, že ty 8000% marže v téhle části trhu by chtěli zakusit a začali pracovat na Larrabe (nepřipomíná vám Knights Corner něco?)
Info:
http://oldwww.xtremedatainc.com/xd2000i_brief.html - tohle je jeden z prvních, později to již bylo integrované vše pod heatspreaderem
//edit: Mimochodem kombinaci dvou ruzných procesorů na Slotu 1 jsem zkoušel na střední, 350MHz PII a 450MHz PII ... fungovalo to, ale dlouho se to neohřálo, protože jsem sehnal druhý 450MHz kousek

Mrsklo se to rovnou do patice pro Xeony a s klasickým x86 CPU to komunikovalo po tehdy ještě FSB. Bylo to posvěcené Intelem, který to dokonce nějakou dobu prodával pod svojí značkou jako OEM, nedávno byla dokonce jedna Altera na aukru asi za 40 tisíc (právě jako intel oem). Ta Altera byla později stejných rozměrů jako tehdejší C2D Xeony (díky integraci čipů). Některé ty moduly byly i částečně x86 kompatibilní (samozřejmě v kombinaci s x86 xeonem, kvůli licenci). Intel to i hrdě předváděl na IDF přímo na svých deskách. Mimo to to bylo plně programovatelné. Občas jsou vidět i na Folding@Home

Intelu asi došlo, že ty 8000% marže v téhle části trhu by chtěli zakusit a začali pracovat na Larrabe (nepřipomíná vám Knights Corner něco?)
Info:
http://oldwww.xtremedatainc.com/xd2000i_brief.html - tohle je jeden z prvních, později to již bylo integrované vše pod heatspreaderem
//edit: Mimochodem kombinaci dvou ruzných procesorů na Slotu 1 jsem zkoušel na střední, 350MHz PII a 450MHz PII ... fungovalo to, ale dlouho se to neohřálo, protože jsem sehnal druhý 450MHz kousek

- damib
- Začátečník
- Registrován: 21. čer 2011
Re: Vícero CPU na různých taktech/ velikostech cache, atd.
Myslím, že jsi právě vymyslel APU. To bylo přece myšlený, jako že grafika bude dopomáhat procíku. Od toho accelerrated proccesing unit. Pokud nemám pravdu, tak mě neukamenujte.
Sem o 150 killů dopředu !!!!!!!!!!
- DOC_ZENITH
- Středně pokročilý
- Registrován: 08. kvě 2010
- Bydliště: Praha
Re: Vícero CPU na různých taktech/ velikostech cache, atd.
Ano ale ty nemůžou spolupracovat na jednom kódu a ta grafika je zatím těžce neuniverzální čip bhodnej jen pro některé operace. Toto řešení by by přineslo mnoho x86 čipů viditelnejch v OS jako klasická CPU = okamžitě by je mohly využívat aplikace co máme.damib píše:Myslím, že jsi právě vymyslel APU. To bylo přece myšlený, jako že grafika bude dopomáhat procíku. Od toho accelerrated proccesing unit. Pokud nemám pravdu, tak mě neukamenujte.
- dexterav
- Mírně pokročilý
- Registrován: 26. pro 2003
- Kontaktovat uživatele:
Re: Vícero CPU na různých taktech/ velikostech cache, atd.
tak predsa, niečo podobné aj ked nie úplne dokáže Tegra 3
na blbôstky používa 5 slabé jadro a ak treba zapracujú normálne ostatné 4 podľa potreba
nieje to úplne to isté ale podobná variácia aspoň myslím
na blbôstky používa 5 slabé jadro a ak treba zapracujú normálne ostatné 4 podľa potreba
nieje to úplne to isté ale podobná variácia aspoň myslím
Intel Ultra 7 265k 5,6/4,9GHz,Apex Z890, 2X24GB 8,2GHz CL38 Patriot Extreme, Asus TUF 5090 3.2/34GHz , H2O + Carbide 600Q,ROG-THOR-1600T, 10TB 850X, Topping D50s + A50s + T5, MPG 321URX QD-OLED, S23Ultra, ITX 13700k + 5070Ti + Audinst Hud-Mx2 + THX-M50X