Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

spajdr · Příspěvek od **spajdr** » úte 8. čer 2021, 16:40

DOC_ZENITH píše:Head - to už jsme si tu říkali asi tak 3x, nebudu to vypisovat znovu. Pokud je u produktu cena jediná dobrá vlastnost, nedělá to z něj dobrej dobrej produkt.

Spajdr podle toho jak tě poslouchám by jsi si měl dát bacha na subtimingy.

Dle toho jak jsi to popisoval že ti to jelo se 4 modulama na 3200 apak zas nejelo to vypadá že si deska vždy usmyslí jiné subtimingy během memory trainingu a pak to podle toho je stable nebo neni. Tohle neni dobrá cesta, protože by jsi to třeba stabilizoval ale pak se stane ňáká random událost (třeby vypadne elektrika) deska to zapomene, udělá si re-training a nyní bude stejná konfigurace nestabilní ač se předtim tvářila stabilně, protože položky co jsou "auto" se během trainingu nastavily jinak.

Bejt tebou to hodim na nízkej takt, třeba 2400Mhz a ručne locknu úplně všechny subtimingy, naprosto vše, ať máš jistotu že to tak zůstane a pak jít s hlavními timingy + TRFC + frekvencí vejš a uvidíš kam se dostaneš. To že ti nejdou dobře sloty 1+3 je bohužel normal, značí to že máš daizychain desku kter má délku vodičů optimalizovanou jen pro sloty 2 a 4, s tim nic neuděláš.

Diky za tip.
No ten druhy kit neni stabilni ani za prase nakonec, budu ho vracet.
Jednou to jede, pak zase ne, kazdopadne kdyz uz jsem dal timing natvrdo i na nizsi frekvenci tak oproti 2x8GB konfigu je to ve vsem o kousek pomalejsi i kdyz casovani jsem zachoval stejne.
Podle me to nejede optimalne, mozna je IMC na hovno u te 11400F co mam.
Takze vydrzim s 2x8GB kitem a pak az poresim DDR5 s novym AMD procakem nekdy pristi rok.
Kez bych aspon vedel, ktere training se daji vypnout, protoze jak pise zhor, je tam tech polozek vice nez je zdravo.

zhor · Příspěvek od **zhor** » stř 9. čer 2021, 12:53

To je prave u pameti pruser ze tech polozek jsou tuny umoznujici nastavit nejen casy a napajeni ale i signalovy hodnoty. Globalne se da vypnout Dimm ODT (On-Die Termination) Training se spoustou dalsich polozek a ktery je myslim na auto vypnuty (mozna by stalo za to ho zkusit). I kdyby se v tom clovek vyznal tak se driv zcvokne nez by vsechno manualne nastavil. Proto nezbyva nez nechat vychozi nastaveni, tedy vetsinou auto.
Nastesti se pameti daj zakladnim casovanim a napajenim vzdycky nejak ustabilizovat, akorat je treba pocitat ze clovek nemusi dosahnout ceho si predstavoval.
Docela by me taky zajimalo proc jsou ty K-radice lepsi, u Gskill si toho zrejme pri testovani vsimli a proto na non-K 11 nezarucujou u svych pameti plnou frekvenci. Intel je ovsem v klidu protoze specifikovanych 2933 pujde vzdycky.

spajdr · Příspěvek od **spajdr** » stř 9. čer 2021, 17:42

Tak dobrodruzstvi s taktovanim skoncilo. U prvniho kitu jedna z pameti zacala nahodne hlasit chyby, takze reklamace.
Dnes u druheho kitu, u ktereho jsem chtel vydrzet jeste aspon rok se jedna odporoucela uplne, s ni se ani PC nerozjelo,
takze druha reklamace. Vzal jsem nejake obycejne za 2200,- a kaslu na taktovani. Pro priste vezmu nejdriv lepsi desku,
nez zacnu trochu vice taktovat pameti.

zhor · Příspěvek od **zhor** » čtv 10. čer 2021, 12:04

Desku od Asusu jedine TUF nebo Strix, ty Prime jsou vic kompromisni i kdyz na konzervativni taktovani taky stacej. V tvym pripade to zrejme bude komplot pameti, radice procesoru a desky vcetne biosu. Je klidne mozny ze jeste vydaj novej bios se kterym to pak pujde. Neni taky na skodu zvolit pameti ktery maj uvedeny v QVL i kdyz ani s nimi to nemusi vzdycky vyjit, protoze ovlivnujicich faktoru je spousta.

Příspěvek od **Baneshee** » pon 9. srp 2021, 10:59

Zajímavej test Rocketu se zapnutým/vypnutým AVX512 v x265 encodingu https://www.cnews.cz/test-intel-rocket- ... fektivita/

Výkon to zvedne o 10% a spotřebu o 30%. Ještěže tam to AVX512 dali

DOC_ZENITH · Příspěvek od **DOC_ZENITH** » pon 9. srp 2021, 11:44

Tak ono pokud jde o samotné 512-bit verkoty, tak Intel já má stále half-speed ne? Maj podporu ale moc velkej boost se čekat nedá. Ostatně s AVX512 je to tak obecně od začátku, nikdo to nechce, nikdy se to nevyplácelo (ok pomineme li ňákou u specifickou AI instrukci, bavíme se o samotnejch 512-bit vektorech), ale Intel si to hlava nehlava tlačí.

Něco jako když to Koduri komentoval "but our custommers love AVX512" ale už nedokázal odpovědět na "who?".

mr.qeg · Příspěvek od **mr.qeg** » pon 9. srp 2021, 14:35

OT: Daleko lepší by bylo, kdyby Intelu Keller vymyslel variabilní 2048 vektor, ala ARM SVE. Ještě by jim zbyly tranzistory na vícero ALU

Natural · Příspěvek od **Natural** » úte 10. srp 2021, 11:19

Baneshee píše:Zajímavej test Rocketu se zapnutým/vypnutým AVX512 v x265 encodingu https://www.cnews.cz/test-intel-rocket- ... fektivita/

Výkon to zvedne o 10% a spotřebu o 30%. Ještěže tam to AVX512 dali

Je tam krásně vidět, že 11900K a 11700K jsou horší procesory, jak 10900K s deseti jádry. Velmi bídná generace (snad kromě 11400F).

mr.qeg · Příspěvek od **mr.qeg** » úte 10. srp 2021, 11:56

Tak pokud někdo to má jen na hry a je mu ukradená spotřeba, posun vpřed tam je. Holt je to o prioritách.

Jan Olšan · Příspěvek od **Jan Olšan** » úte 10. srp 2021, 15:00

DOC_ZENITH píše:Tak ono pokud jde o samotné 512-bit verkoty, tak Intel já má stále half-speed ne? Maj podporu ale moc velkej boost se čekat nedá. Ostatně s AVX512 je to tak obecně od začátku, nikdo to nechce, nikdy se to nevyplácelo (ok pomineme li ňákou u specifickou AI instrukci, bavíme se o samotnejch 512-bit vektorech), ale Intel si to hlava nehlava tlačí.

Něco jako když to Koduri komentoval "but our custommers love AVX512" ale už nedokázal odpovědět na "who?".

Half-speed je to pokud vím jenom pro floating point operace (tj. FMA v HPC úlohách). Celočíslený operace zdá se i tyhle half-speed verze dokážou počítat s plným výkonem, takže by x265 a x264 mělo pořád profitovat cca stejně jako z full-speed implementace ve Skylake-X.

Ten nízkej nárůst výkonu je kvůli tomu, že se AVX-512 používá jen pro část výpočtů (v tom textu jsem se to snažil trošku přiblížit), proto se vůbec nedá čekat nárůst výkonu +100%, ale ani +50 %.

AVX-512 zrchluje jenom část funkcí, a to ještě jenom v ručně psaným assembleru, protože autovektorizace tam nefunguje. a x265 pořád cca 50 % času stráví v nevektorovém kódu, takže zrychlit se dá jenom půlka CPU času a tu kdybyste zrychlili 2×, tak se dostanete na 75 % původního CPU času, tj, zrychlení jenom o 33 %...

Ta spotřeba to celý kazí, to je jasné (i když podobně neefektivní poměr mezi výkonem navíc a spotřebou navíc je třeba i když člověk přetaktovává). Snad to bude na 10nm/7nm lepší.

jctrnacty · Příspěvek od **jctrnacty** » úte 10. srp 2021, 19:14

DOC_ZENITH píše:Tak ono pokud jde o samotné 512-bit verkoty, tak Intel já má stále half-speed ne? Maj podporu ale moc velkej boost se čekat nedá. Ostatně s AVX512 je to tak obecně od začátku, nikdo to nechce, nikdy se to nevyplácelo (ok pomineme li ňákou u specifickou AI instrukci, bavíme se o samotnejch 512-bit vektorech), ale Intel si to hlava nehlava tlačí.

Něco jako když to Koduri komentoval "but our custommers love AVX512" ale už nedokázal odpovědět na "who?".

POkud si dobre vzpominam, tak Linus Torvalds si pral at zhyne AVX krutou smrti.

https://www.zdnet.com/article/linus-tor ... ful-death/

Jan Olšan · Příspěvek od **Jan Olšan** » stř 11. srp 2021, 17:16

V tomhle se ale myslím Linus plete.

On jako obecně význam SIMD podceňuje, protože nedělá ani do numerických HPC výpočtů, ani do multimédií, kde je SIMD důležitý, ale jenom do operačního systému/jádra. Z pohledu vývojáře jádra logicky instrukce používané na vysokou propustnost výpočtů vypadají zbytečně, ale je to takovej profesně slepej omyl.

IIRC ho taky hodně štve ten problém se snížením frekvencí, ale jako to asi je věc, který je a bude, protože to může udělat nejen AVX-512, to je od počátku cena za používání turbo boostů...

Dolan · Příspěvek od **Dolan** » čtv 12. srp 2021, 11:20

On nespomína AVX ale špecificky AVX512, a myslím že jeden z dôvodov je, že tam je veľa rozšírení ktoré sú navzájom nekompatibilné a každý procesor má vpodstate svoju vlastnú ISA.... a je v tom bordel no.

Inak ani pri tých numerických a HPC výpočtoch to nieje ideálne. Best case pre to je linpack, čokoľvek zložitejšie (napríklad 2D matice a viac) už z toho až tak neprofituje. Problém je, že to vyžaduje veľa operácií (šírka vektora X FMA x hĺbka pipeline) a ideálnu dostupnosť dát (nedokáže to spracovať len prvú polovicu vektora v prípade, že druhá nieje dostupná) aby to bolo nejak prínosné.

Btw. Intel by už mal pripravovať AMX...

Ale tuto má podľa mňa lepšie riešenie Apple, ktorý má 4 128b porty, pretože to je oveľa flexibilnejšie. Funguje to v kompilátorom generovanom kóde (ekvivalent SSE) (...kde to má až neuveriteľný výkon

) a zároveň to dokáže rýchlo spracovať 512b, ak sa náhodou taký typ úlohy objaví (aj keď prakticky to tam ide cez iné akcelerátory). Dokonca aj AMD tam má určitú flexibilitu.

Jan Olšan · Příspěvek od **Jan Olšan** » ned 15. srp 2021, 18:13

Dolan píše:On nespomína AVX ale špecificky AVX512, a myslím že jeden z dôvodov je, že tam je veľa rozšírení ktoré sú navzájom nekompatibilné a každý procesor má vpodstate svoju vlastnú ISA.... a je v tom bordel no.

To se myslím přeceňuje.

Dolan píše:Inak ani pri tých numerických a HPC výpočtoch to nieje ideálne. Best case pre to je linpack, čokoľvek zložitejšie (napríklad 2D matice a viac) už z toho až tak neprofituje.

To by platilo spíš pro výpočty na GPU...

Dolan · Příspěvek od **Dolan** » pon 16. srp 2021, 18:06

No to nieje tak celkom môj názor. Podľa mňa sa trocha predceňujú aj ARM/NEON optimalizácie... no a aj tak sa tomu skoro každý vyhýba...

Do GPU som som veľmi nechcel ísť... pretože som vedel že z nejakého dôvodu máte opačný názor

Už z dôb Xeonov Phi, ktorým ste z nejakého dôvodu veľmi nadržiaval, a keď sa potom ukázalo ako katastrofálne failli tak ste to hodil na slabosť Atom jadra (nie celkového konceptu).

Pritom tie Xeony mali taký krásny teoretický výkon pri relatívne nízkej spotrebe. A to platí aj pre klasické Xeony. Ešte pred pár rokmi mali teoretický výkon porovnateľný s GPU. Čím to je že prakticky mali výkon mizerný a ľudia račej kupovali predražené P100?

Pretože v x86 musíte robiť všetko ručne a musí to byť hotové v čase kompilácie. Či už ten vektor, alebo multi-core, multi-socket... Všetko musí byť staticky dané pri kompilácii.

A to je problém všetkých úrovní paralelizácie v X86. Že sa to správa ako VLIW procesor...

S vínimkou out of order samozrejme, kde je okno ale príliš malé... Ak by chceli zachovať efektivitu schedulerov, tak by ich museli mať AVX512 procesory úmerne väčšie (pretože opakujem, problém vektorov je že ak jeden element chýba, tak musí čakať celý vektor)...

Jediná cesta ako zvýšiť výkon je čo najviac 128b ALU na samostatných OoO portoch. Toto je bez diskusie.

Inak všimnite si, že najmä výpočtové grafiky teoretický výkon až tak nezvyšujú, a praktický výkon aj tak podstatne rastie. To preto že Nvidia reálne rieši napríklad data-locality problémy. Možno by to bolo na zaujímavý článok, Nvidia totiž smeruje k tomu že sa celý GPU cluster bude správať ako jedno jadro (cache hierarchia, prístupy do pamätí, komunikácia GPU-GPU-CPU...)

Na druhej strane Intel náháňa len teoretický výkon a všetky optimalizácie hodia na sw. developerov... Preto im to nebude fungovať a AVX512 (v dnešnej podobe) bude mať čestné miesto veľa Itania.

mr.qeg · Příspěvek od **mr.qeg** » pon 16. srp 2021, 18:36

Itanium byl VLIW, jen tomu Intel zas říkal marketingově jinak myslím EPIC

Osobně si myslím, že Linus na AVX512 plive kvůli kombinaci všech výše zmíněných vlivů, ale nejdůležitější bude ta roztříštěnost. To je opravdu od Intelu WTF.

Co se týká přístupu raději 4/2x128/256bit vektorových ALU, než 1x512. Je to podle mě spíš o době, kdy to nasadit. Až se postupně bude více rozvíjet SW a bude obecně více SW umět využít 512b ALU, tak bude jistě lepší ta. Otázkou je, zda takový stav nastane ve světě obecného SW. 128SSE už teoreticky může být dostatečné a na zbytek stejně bude lepší ten akcelerátor, ať už GPU či nějaké FPGA přímo ušité na míru konkrétnímu algoritmu.

yuri.cs · Příspěvek od **yuri.cs** » pon 16. srp 2021, 22:39

Problem je zrejme i v tom, ze cim vic Intel zrychluje AVX512, tim vic jde o transistory a cas nasypany do veci, kterou realne vyuzije mizive procento aplikaci (krom implicitniho pouziti v memcpy, a podobne).

Tzn. lze uvazovat, ze usetrene transistory a vyzkum by sly investovat na "general purpose" ucely - nafouknout cache, zpresnit BPU, zvetsit OoO struktury, atd. Tim by se zrychlilo o 5% treba 98% aplikaci, namisto 300% zrychleni 2% aplikaci.

mr.qeg · Příspěvek od **mr.qeg** » úte 17. srp 2021, 09:56

Ano to máš pravdu. Možná to v mém postu tak nevyznělo, ale dokud bude umět AVX512 naplno využít více než 1-2% aplikací, tak bude vždy lepší mít 4x128ALU a 1 AVX512 instrukci s nějakou režií prohnat těmito 4 ALU, protože z nich budou profitovat i zbývající aplikace.

Krásná situace je s tím SSE, až do příchodu Core2, to všechny předchozí CPU zpracovávaly na víc průchodů, či pomocí vícero ALU. V roce 2006 už zřejmě majorita používala SSE2 díky vynucení v x86-64 a tak Core2 tímto přineslo brutální zrychlení.

Jan Olšan · Příspěvek od **Jan Olšan** » pát 20. srp 2021, 00:05

mr.qeg píše:Otázkou je, zda takový stav nastane ve světě obecného SW. 128SSE už teoreticky může být dostatečné a na zbytek stejně bude lepší ten akcelerátor, ať už GPU či nějaké FPGA přímo ušité na míru konkrétnímu algoritmu.

Linus má iirc názor že 128bitů není ještě sice úplně "dost pro každého", ale 256 bitů (AVX2) zase už nepřidá až tak moc, takže zůstat na 128bitech by nebyl úplně blbý nápad, tj. jako ARM s Neon před příchodem SVE.

Jinak ale instrukce SIMD v procesoru nemají stejné využití jako akcelerace na GPU, takže ač se to často říká, tak je chyba říkat si, že nejsou třeba, protože GPU. Některé aplikace GPU zastoupí, jiné ne.
Třeba x265 nebo x264 by se na GPU nedalo udělat. SIMD instrukce v procesoru je přístupná okamžitě s minimální latencí pro jakýkoli program běžící na CPU - nepotřebuje žádný ovladač nebo stack, takže různé výkoné rutiny se dají krásně zapracovat do programů a o tom je všechna ta optimalizace v assembleru. Zatímco když chcete něco offloadnout na GPU, tak se musí vyskočit z toho běžného vykonávání kódu na procesoru, zavolají se nějaké vrstvy OpenCL nebo Cuda, teď to snad kolikrát i jede přes kompilátor v GPU ovladači...
GPU je užitečné když mám velký kus kódu, který potřebuje ten výkon a běží na tom GPU poměrně dlouho, než se ten výsledek bude tahat zpátky do toho mateřského programu na CPU. Když chcete jenom optimalizovat nějaký menší prvek CPU programu, tak se to použít nedá, protože overhead je masivní.

mr.qeg píše:Co se týká přístupu raději 4/2x128/256bit vektorových ALU, než 1x512. Je to podle mě spíš o době, kdy to nasadit. Až se postupně bude více rozvíjet SW a bude obecně více SW umět využít 512b ALU, tak bude jistě lepší ta.

Ono je to o tom, že není výběr mezi 4x128bitů (SSE nebo lépe AVX2 ve 128bitové formě) a 1x512. Jako na jednu stranu je ta první možnost hrozně výhodná, protože zrychlí i všechen legacy kód bez modifikace, což je super. Jenže - když se SIMD operace provádějí rozsekané na víc 128bitových částí, tak pak zabírají místo navíc ve všech frontách, konzumují šířku v různých fázích vykonávání, a pak samozřejmě to znamená, že máte místo jednoho 512bitového portu a jednotku v procesoru čtyři paralelně a na to musí být navržené všechny ty fronty/buffery, schedulery a tak dál. A to je komplexita navíc, která není snadná a má svoje ceny.
V případě, že mám volbu mezi 4x128bitovou pipeline (ALU) a 1x512 tak je určitě lepší nápad to první, už jenom proto, že bych jinak měl mizerný výkon v SSE kódu (jenom jedna operace za cyklus).
Jenže architekti právě nechcou 1x512, oni by chtěli 2x512, 3x512 nebo líp 4x512 (i když 3-4x za cyklus by jádro třeba umělo zpracovat jenom sčítání, logické operace a tak, ne MUL nebo FMA).
No a to pak ta alternativa je 8x128bitová pipeline, 12x128bitová pipeline... a to už je rozhodně příliš velká komplexita a průser na realizování.
Takže v tomhle bodě je určitě lepší místo 8-12x 128 jít aspoň do AVX(2) a rozšířit vektor na 256 bitů, takže budu mít jenom 4-6 SIMD pipeline, což je mnohem snazší (i když 6 už je dost, to asi zatím nikdo nedělá, teda ne když se nepočítají load/store jednotky - výpočetní instrukce umí myslím i Zen 3 i Tiger Lake všechny maximálně 4x za cyklus).

4x256 bitů je podle mě nesporně užitečná věc, to stojí za to do procesoru dát. No ale právě potom když se má SIMD výkon rozšiřovat dál, tak logicky zase přichází ten problém přílišného počtu pipeline, takže 512bitové SIMD vektory jsou logická další cesta. Ice/Tiger/Rocket Lake pokud vím umějí některé ty 512bitocé instrukce s propustností 3x za cyklus a nevím jistě jestli některé ne i 4x, což by se nedalo tak rozumně udělat s AVX2, protože by muselo být 6-8 ALU pipeline, takže zase začíná být problém.

Ty porty/ALU pipeline jsou prostě drahé, takže je lepší zvýšit SIMD výpočetní výkon jedné pipky něž přidávat další.

Ten problém je samozřejmě jestli to consumer software pak může někde upotřebit a/nebo jestli budou mít programátoři vůli to dělat... v serveru/HPC tam je asi celkem jasné, že to nějaké využití má.

mr.qeg · Příspěvek od **mr.qeg** » pát 20. srp 2021, 08:05

Anebo AVX512 pro video, což je snad asi jediná oblast, kde to může dnes najít využití, nahradit vícero jádry

Ice/Tiger/Rocket Lake pokud vím umějí některé ty 512bitocé instrukce s propustností 3x za cyklus a nevím jistě jestli některé ne i 4x

A kterou tu podmožinu AVX512? Celou, nebo zase jen vybranou část. Opět jsme u toho, co Linus asi kritizuje.

Jinak není nutné vytrhávat z kontextu moje příspěvky a pak mi dlouze vysvětlovat, něco, co je mi jasné. Psal jsem tam: "s nějakou režií prohnat těmito 4 ALU".

Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti