Pokec na téma AVX a jednotlivých CPU architektur.

Cokoli kolem procesorů - výběr, technologie, informace, problémy a rady.

Moderátoři: flanker, Eddward, Baneshee, PKBO

DOC_ZENITH
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 08. kvě 2010
Bydliště: Praha

Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od DOC_ZENITH »

AVX se nám do běžného SW zatím jaksi moc nerozšířilo, ale vzhledem k tom uže se chystám prodat svou 24C opteron mašinu, tak jsem si řekl že než půjde vydoluji z ní co se dá, a že na ní spustim ňákej ten coin mining u těch altocoinů co běžej jen přes CPU.

Zde se začaly objevovat minery podporujícíé AVX. Ale naprosto u všech se jedná o specifická AVX. Je zde verze pro SSE3/4 třeba, a pak je zde verze pro SVX SB, AVX IB, AVX Haswell, atd, atd.

A Každá funguje trochu jinak. Vesměs jsou to kosmetické věci tzn oproti SSE jde výkon nahoru obvykle pod 10% (ok u haswellu je tot ak 15), protože operace jsou hodně závislé na přístupu do paměti, cache, a rychlosti AES jesdnotky, prostě ale, strašně mě zaráží ta rozsekanost.

Narozdsíl od SSE se AVX v tomnhle ohledu nejeví vůbec standardizovaně. Každej CPU potřebuje aby tam byl benefit executable psanej přímo pro něj kompilovanej pro jeho konkrétní implementaci AVX. Jinou má FX jinou maj intely i SB/IB se lišej kde jsem to nečekal.

Jak to teda s tim AVX vlastně je? Jsou ty instrukce vůbec standardizovaný a nebo se bude opakovat scénář SSE4 a SSE4A u Phenomů kterej byl s Inteláckym SSE4 nekomptaibilní?

Aby to nedopadlo jako u GPGU kde každá architektura GPU potřebuje defakto svůj odpíky psanej a pro ní optimalizovanej kód jinak je to nepoužitelně slow. Aby jsme tu ještě za 10 let neměli stále max SSE2/3 software protože vejš se nebude dát použít univerzální kód.

Já jsem bral AVX a FMA jako pevné standry, ale tyhle prográmky se kterejma jsem se setkával poslední tejden mě docela nahnaly hrůzu.
flanker
Moderátor
Moderátor
Uživatelský avatar
Registrován: 13. pro 2005
Bydliště: Brno
Kontaktovat uživatele:

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od flanker »

Mám dojem, že AVX podporuje i y-cruncher výpočet, x264 benchamrk od posledních verzí, možná Handbrake a netframework?

Chtělo by toho více každopádně. Prootže i díky tomu vázne potenciál moderních CPuček (cca od roku 2010/11)
ROG Power PC1:AMD Ryzen 7 5700X, Crosshair VII Hero, ROG Ryuo II 360, 512GB NVMe+500GB Samsung SSD, 2x 16GB GSkill TridentZ Neo RGB 3600 MHz, Dual RTX 2060,CM V750, Lian Li O11 Dynamic XL. PC2:AMD FX-8370, Silentium Fera, Asus 970 Pro Gaming/Aura, 240GB SSD HyperX 3K, R9-270X OC, 2x 4GB GSkill RipjawsX 2400 MHz, Corsair AX750, Bitfenix Pandora
DOC_ZENITH
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 08. kvě 2010
Bydliště: Praha

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od DOC_ZENITH »

Já ale nemluvim o rozšířenosti AVX, ale o tom že je tu SW s AVX pro různé CPU architektury, ala že je tu problém v tom že možná neni žádná "univerzální AVX".
flanker
Moderátor
Moderátor
Uživatelský avatar
Registrován: 13. pro 2005
Bydliště: Brno
Kontaktovat uživatele:

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od flanker »

dyť přece AVX je společná jak AMD, tak Intel, jen fungují komunikačně v CPU jinak, ale ta isntrukce je psaná stejně, ne?
ROG Power PC1:AMD Ryzen 7 5700X, Crosshair VII Hero, ROG Ryuo II 360, 512GB NVMe+500GB Samsung SSD, 2x 16GB GSkill TridentZ Neo RGB 3600 MHz, Dual RTX 2060,CM V750, Lian Li O11 Dynamic XL. PC2:AMD FX-8370, Silentium Fera, Asus 970 Pro Gaming/Aura, 240GB SSD HyperX 3K, R9-270X OC, 2x 4GB GSkill RipjawsX 2400 MHz, Corsair AX750, Bitfenix Pandora
del42sa
Pokročilý
Pokročilý
Uživatelský avatar
Registrován: 18. lis 2009
Bydliště: Omicron Persei 8

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od del42sa »

DOC_ZENITH píše:Já ale nemluvim o rozšířenosti AVX, ale o tom že je tu SW s AVX pro různé CPU architektury, ala že je tu problém v tom že možná neni žádná "univerzální AVX".
Ale AVX implementace je imho pevně daná, to není případ jako SSE s různými appendixy nebo různé mix specifikace (Viz AMD XOP, FMA4). Pokud by to bylo takto i u AVX, tak by muselo být něco jako AVXa AVXb nebo AVXx. Tohle se ale neděje. Rozdíl ve výkonu se samozřejmě dán odlišností jednotlivých architektur a rozdíly v cache hierarchii, nikoliv odlištnostmi v AVX samotném...

Obrázek

http://www.anandtech.com/show/2310
XOP is a revisioned subset of what was originally intended as SSE5. It was changed to be similar but not overlapping with AVX, parts that overlapped with AVX were removed or moved to separate standards such as FMA4 (floating-point vector multiply–accumulate) and CVT16 (Half-precision floating-point conversion implemented as F16C by Intel) .

All SSE5 instructions that were equivalent or similar to instructions in the AVX and FMA4 instruction sets announced by Intel have been changed to use the coding proposed by Intel. Integer instructions without equivalents in AVX were classified as the XOP extension. The XOP instructions have an opcode byte 8F (hexadecimal), but otherwise almost identical coding scheme as AVX with the 3-byte VEX prefix.
The SSE5 (short for Streaming SIMD Extensions version 5) was an instruction set extension proposed by AMD on 30 August 2007 as a supplement to the 128-bit SSE core instructions in the AMD64 architecture.
AMD's SSE5 extension bundle does not include the full set of Intel's SSE4 instructions, making it a competitor to SSE4 rather than a successor.
In May 2009, AMD published a revised specification for the planned future instructions. This revision changes the coding scheme to make it compatible with the AVX scheme, but with a differing prefix byte in order to avoid overlap between instructions introduced by AMD and instructions introduced by Intel.

The revised instruction set no longer carries the name SSE5, which has been criticized for being misleading, but most of the instructions in the new revision are functionally identical to the original SSE5 specification—only the way the instructions are coded differs. The planned additions to the AMD instruction set consists of three subsets:

XOP: Integer vector multiply–accumulate instructions, integer vector horizontal addition, integer vector compare, shift and rotate instructions, byte permutation and conditional move instructions, floating point fraction extraction.
FMA4: Floating-point vector multiply–accumulate.
F16C: Half-precision floating-point conversion.

These new instruction sets include support for future extensions for the vector size from 128 bits to 256 bits. It is unclear from these preliminary specifications whether the Bulldozer processor will support 256-bit vector registers (YMM registers).
"The more you buy, the more you save" AI everywhere - Nvidia CEO at Computex 2023 https://www.youtube.com/watch?v=FhlE3m1trM4
Vega Primitive Shader combines the functions of vertex and geometry shader and with the right knowledge you can discard game based primitives at an incredible rate" https://pcper.com/2017/01/amd-vega-gpu- ... tecture/2/

MSI MPG GUNGNIR 110R White | CPU AMD Ryzen 7 9700X Granite Ridge | DeepCool AK500 White | GPU Sapphire Pure RX 9070 XT 16GB | MB MSI MAG X670E GAMING PLUS WIFI | 32GB DDR5 Patriot Viper Elite 5 32GB KIT 6600MHz | system HDD SSD M.2 Kingston FURY Renegade NVMe 1TB | Seagate Baracuda HDD 1TB SATA III | data HDD WD RED 1TB SATA III | Quad HD VA monitor 27" MSI Optix G27CQ4 Free Sync 165 Hz 10bit HDR | zdroj Be quiet! SYSTEM POWER 9 CM700W 80 PLUS Bronze | Win 10-64 bit Pro
DOC_ZENITH
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 08. kvě 2010
Bydliště: Praha

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od DOC_ZENITH »

OK fajn, takže AVX je unvierzální a tyhle prográmky psané projednotlivé architektury jsou jen specifickej výplod s přímou optimalizací uarch, ok. Já jsem se prostě jen bál že jdeme směrem že se jednoho dne vyskytnou AVX programy které poběžej ok jen na určitý architektuře.
flanker
Moderátor
Moderátor
Uživatelský avatar
Registrován: 13. pro 2005
Bydliště: Brno
Kontaktovat uživatele:

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od flanker »

ROG Power PC1:AMD Ryzen 7 5700X, Crosshair VII Hero, ROG Ryuo II 360, 512GB NVMe+500GB Samsung SSD, 2x 16GB GSkill TridentZ Neo RGB 3600 MHz, Dual RTX 2060,CM V750, Lian Li O11 Dynamic XL. PC2:AMD FX-8370, Silentium Fera, Asus 970 Pro Gaming/Aura, 240GB SSD HyperX 3K, R9-270X OC, 2x 4GB GSkill RipjawsX 2400 MHz, Corsair AX750, Bitfenix Pandora
iOioo
Začátečník
Začátečník
Uživatelský avatar
Registrován: 26. led 2011
Kontaktovat uživatele:

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od iOioo »

čomu? GRID2 aj GRID Autosport je možné spustiť s AVX
Intel i5 3570K @ 4,2GHz | MSI Z77A-G43 | 16GB DDR3 Kingston | GTX 760 OC | Corsair TX650 V2 | Kingston SSDNow V +200 120GB + 1TB WD Black | Zalman Z11 Plus | Benq GW2320 + Dell P2414H | Razer Abyssus + Razer Kabuto + Ozone Strike Pro mx red
Intel i7 5775C @ 4,2GHz & NH-U9S | ASUS Z97M Plus | 32GB DDR3 Kingston | ASUS RTX 3070 | Seasonic M12II-520 | Crucial M500 120GB + Intel 535 480GB + 3TB WD RED | Fractal arc mini + 3xNF-F12 + 1x NF-A14 | Samsung C34F791 + BENQ XL2411P | ROCCAT® Kave XTD 5.1 + Asus Xonar DSX | Razer Mamba + Razer Destructor + Ozone Stike Pro mx red
flanker
Moderátor
Moderátor
Uživatelský avatar
Registrován: 13. pro 2005
Bydliště: Brno
Kontaktovat uživatele:

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od flanker »

jak se to projevuje např vytížením CPU, mění se nějak FPS?
ROG Power PC1:AMD Ryzen 7 5700X, Crosshair VII Hero, ROG Ryuo II 360, 512GB NVMe+500GB Samsung SSD, 2x 16GB GSkill TridentZ Neo RGB 3600 MHz, Dual RTX 2060,CM V750, Lian Li O11 Dynamic XL. PC2:AMD FX-8370, Silentium Fera, Asus 970 Pro Gaming/Aura, 240GB SSD HyperX 3K, R9-270X OC, 2x 4GB GSkill RipjawsX 2400 MHz, Corsair AX750, Bitfenix Pandora
AllowedCry
Mírně pokročilý
Mírně pokročilý
Registrován: 21. kvě 2011
Bydliště: Praha

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od AllowedCry »

No tak to by mě taky zajímalo :)
iOioo
Začátečník
Začátečník
Uživatelský avatar
Registrován: 26. led 2011
Kontaktovat uživatele:

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od iOioo »

nikdy som to netestoval :) ale GRID má vstavaný benchmark takže to nie je problém otestovať
E: rozdiel s AVX a bez robil u mňa 1fps :D
Intel i5 3570K @ 4,2GHz | MSI Z77A-G43 | 16GB DDR3 Kingston | GTX 760 OC | Corsair TX650 V2 | Kingston SSDNow V +200 120GB + 1TB WD Black | Zalman Z11 Plus | Benq GW2320 + Dell P2414H | Razer Abyssus + Razer Kabuto + Ozone Strike Pro mx red
Intel i7 5775C @ 4,2GHz & NH-U9S | ASUS Z97M Plus | 32GB DDR3 Kingston | ASUS RTX 3070 | Seasonic M12II-520 | Crucial M500 120GB + Intel 535 480GB + 3TB WD RED | Fractal arc mini + 3xNF-F12 + 1x NF-A14 | Samsung C34F791 + BENQ XL2411P | ROCCAT® Kave XTD 5.1 + Asus Xonar DSX | Razer Mamba + Razer Destructor + Ozone Stike Pro mx red
CageJ
Moderátor
Moderátor
Uživatelský avatar
Registrován: 31. bře 2011
Bydliště: Praha, Prešov
Kontaktovat uživatele:

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od CageJ »

+ su tam nejake extra efekty pokial pamatam pocitane cez CPU ale cez dedikovanu kartu nedostupne..
chce to este raz zmerat no :)
AMD RYZEN 2700X 4.2GHz@watercooled, 32GB DDR4 2,8GHz, AsRock B450 GAMING K4, RIOTORO GOLD 650W; ASUS DUAL RTX 2060; CoolerMaster ML500; AMD RYZEN 3600X, NOCTUA NH-D15, ASUS STRIX B450-F GAMING, SuperFlower GK550, 32GB CL14 G.SKILL 3200, FRACTAL DESIGN XL R4, ASUS STRIX RTX 3080 OC; APPLE MacBook AIR M1 iPhone 12 Pro 128GB
iOioo
Začátečník
Začátečník
Uživatelský avatar
Registrován: 26. led 2011
Kontaktovat uživatele:

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od iOioo »

Efekty tam možno sú, neviem nejako som to neštudoval.
Testoval som na medium a ultra, na ultra to vyšlo úplne rovnako, na medium bol rozdiel 1fps.
Hádam sa nájde niekto, kto to pretestuje :) nemám ja na takéto veci čas momentálne.
Intel i5 3570K @ 4,2GHz | MSI Z77A-G43 | 16GB DDR3 Kingston | GTX 760 OC | Corsair TX650 V2 | Kingston SSDNow V +200 120GB + 1TB WD Black | Zalman Z11 Plus | Benq GW2320 + Dell P2414H | Razer Abyssus + Razer Kabuto + Ozone Strike Pro mx red
Intel i7 5775C @ 4,2GHz & NH-U9S | ASUS Z97M Plus | 32GB DDR3 Kingston | ASUS RTX 3070 | Seasonic M12II-520 | Crucial M500 120GB + Intel 535 480GB + 3TB WD RED | Fractal arc mini + 3xNF-F12 + 1x NF-A14 | Samsung C34F791 + BENQ XL2411P | ROCCAT® Kave XTD 5.1 + Asus Xonar DSX | Razer Mamba + Razer Destructor + Ozone Stike Pro mx red
Eddward
Moderátor
Moderátor
Uživatelský avatar
Registrován: 16. pro 2009
Bydliště: SVK - Košice

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od Eddward »

flanker píše:btw...?

http://steamcommunity.com/app/44350/dis ... 640817016/

nějak tomu nevěřím...
comu presne neveris ?
toto je stara znama vec :D to som uz vytiahol asi aj na tomto fore pred rokom alebo kedy ked vysiel GRID 2...
tie hry (GRID2/Autosport) bezia aj pod procesom grid2_avx.exe... ved koniec koncov Intel si dal aj svoje logo a znelku pri uvode hry, takze ma v tom prsty...
tie sede plozky sa mi nepodarilo rozbehat, paradoxne ide vraj o AVX ficury ale nestaci na to AVX (Intel) procesor, ale treba tiez bezat na Intel iGPU podla vsetkeho, co teda kus nechapem, ale budis...
nikdy som tie moznosti neskusal a momentalne ani neodskusam lebo nemam HDMI kabel a doska DVI nema...
Intel Core i7 8700K @ 4.8Ghz + Noctua NH-D15 | 16GB DDR4 3200Mhz CL15 Corsair | MSI Z370 GAMING PRO CARBON | MSI GeForce RTX 2080 GAMING X TRIO 2.1/15.5Ghz
Crucial MX500 2TB | Samsung 970 EVO Plus 500GB NVMe | Seasonic Prime Ti Ultra 750W | W11 x64 Pro | Fractal Define R4 Black + 3x NF-A14 | DELL U2515H 1440p

Phone: Samsung Galaxy S22 Ultra 5G
Time Spy: 11 610
iOioo
Začátečník
Začátečník
Uživatelský avatar
Registrován: 26. led 2011
Kontaktovat uživatele:

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od iOioo »

to niekedy vyskúšam :)
Intel i5 3570K @ 4,2GHz | MSI Z77A-G43 | 16GB DDR3 Kingston | GTX 760 OC | Corsair TX650 V2 | Kingston SSDNow V +200 120GB + 1TB WD Black | Zalman Z11 Plus | Benq GW2320 + Dell P2414H | Razer Abyssus + Razer Kabuto + Ozone Strike Pro mx red
Intel i7 5775C @ 4,2GHz & NH-U9S | ASUS Z97M Plus | 32GB DDR3 Kingston | ASUS RTX 3070 | Seasonic M12II-520 | Crucial M500 120GB + Intel 535 480GB + 3TB WD RED | Fractal arc mini + 3xNF-F12 + 1x NF-A14 | Samsung C34F791 + BENQ XL2411P | ROCCAT® Kave XTD 5.1 + Asus Xonar DSX | Razer Mamba + Razer Destructor + Ozone Stike Pro mx red
CageJ
Moderátor
Moderátor
Uživatelský avatar
Registrován: 31. bře 2011
Bydliště: Praha, Prešov
Kontaktovat uživatele:

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od CageJ »

s tym modom to ide, co je v komentaroch, ale nie som si isty, ci to aj realne funguje..
AMD RYZEN 2700X 4.2GHz@watercooled, 32GB DDR4 2,8GHz, AsRock B450 GAMING K4, RIOTORO GOLD 650W; ASUS DUAL RTX 2060; CoolerMaster ML500; AMD RYZEN 3600X, NOCTUA NH-D15, ASUS STRIX B450-F GAMING, SuperFlower GK550, 32GB CL14 G.SKILL 3200, FRACTAL DESIGN XL R4, ASUS STRIX RTX 3080 OC; APPLE MacBook AIR M1 iPhone 12 Pro 128GB
Eddward
Moderátor
Moderátor
Uživatelský avatar
Registrován: 16. pro 2009
Bydliště: SVK - Košice

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od Eddward »

Smoke Shadows, Advanced Blending
OFF, OFF
Total frames: 12 620 frames
Average FPS: 86.90
Min FPS: 65.90
Max FPS: 103.10

ON, ON
Total frames: 12 083 frames
Average FPS: 83.17
Min FPS: 65.11
Max FPS: 100.40

Ostatne vsetko na MAX + 4xMSAA 1920x1080.
Teoreticky to asi funguje, kedze je nizsie FPS a teda je to narocnejsie. Mozno aj chyba merania, hoci priemerne FPS je skoro 4FPS dole, co je dost a tolko zrobi aj vylepseny driver na grafiku pre hru...cize chyba skor nie. Viackrat sa mi to ale merat nechce.
No otazka je asi ci sa daju tie efekty nejako solidne odpozorovat ze tam su, lebo na prvy pohlad ziadny rozdiel. Co sa tyka zataze CPU tiez ziadne vyrazne vykyvy.
Intel Core i7 8700K @ 4.8Ghz + Noctua NH-D15 | 16GB DDR4 3200Mhz CL15 Corsair | MSI Z370 GAMING PRO CARBON | MSI GeForce RTX 2080 GAMING X TRIO 2.1/15.5Ghz
Crucial MX500 2TB | Samsung 970 EVO Plus 500GB NVMe | Seasonic Prime Ti Ultra 750W | W11 x64 Pro | Fractal Define R4 Black + 3x NF-A14 | DELL U2515H 1440p

Phone: Samsung Galaxy S22 Ultra 5G
Time Spy: 11 610
Krteq
Čestný člen
Čestný člen
Registrován: 22. dub 2005
Bydliště: Brno

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od Krteq »

A zkoušel jsi to v benchmarku nebo v tom attract módu? V tom attract modu by se to mělo projevit víc.
Eddward
Moderátor
Moderátor
Uživatelský avatar
Registrován: 16. pro 2009
Bydliště: SVK - Košice

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od Eddward »

klasicky benchmark... no este skusim ten attact mode ze co to spravi
edit:
hah no neviem, ten mod nerobi ziadne vyhodnotenie a ja teraz nemam prostriedky robit vlastnu min/max/average fps... ani obrazovo nejako nevidim rozdiely, ale mozno sa zle pozeram, chcelo by to tip na co sa sustredit... tie tiene dymu by tam mali byt nejake ale aj bez tej zapnutej funkcie tam nieco je, takze co ja viem
Intel Core i7 8700K @ 4.8Ghz + Noctua NH-D15 | 16GB DDR4 3200Mhz CL15 Corsair | MSI Z370 GAMING PRO CARBON | MSI GeForce RTX 2080 GAMING X TRIO 2.1/15.5Ghz
Crucial MX500 2TB | Samsung 970 EVO Plus 500GB NVMe | Seasonic Prime Ti Ultra 750W | W11 x64 Pro | Fractal Define R4 Black + 3x NF-A14 | DELL U2515H 1440p

Phone: Samsung Galaxy S22 Ultra 5G
Time Spy: 11 610
CageJ
Moderátor
Moderátor
Uživatelský avatar
Registrován: 31. bře 2011
Bydliště: Praha, Prešov
Kontaktovat uživatele:

Re: Pokec na téma AVX a jednotlivých CPU architektur.

Příspěvek od CageJ »

https://software.intel.com/en-us/articl ... case-study

len akurat vypadava web :D
este vcera som si to hodil do zaloziek
AMD RYZEN 2700X 4.2GHz@watercooled, 32GB DDR4 2,8GHz, AsRock B450 GAMING K4, RIOTORO GOLD 650W; ASUS DUAL RTX 2060; CoolerMaster ML500; AMD RYZEN 3600X, NOCTUA NH-D15, ASUS STRIX B450-F GAMING, SuperFlower GK550, 32GB CL14 G.SKILL 3200, FRACTAL DESIGN XL R4, ASUS STRIX RTX 3080 OC; APPLE MacBook AIR M1 iPhone 12 Pro 128GB
Odpovědět

Zpět na „Procesory“