Stránka 6 z 335
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: ned 14. bře 2010, 09:34
od flanker
Zajímavá myšlenka, ačkoliv tomu do těchto detailů nerozumím, z povrchní omnáčky se přikláním ke kombinaci případu 1) a 2)
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: ned 14. bře 2010, 11:09
od yuri.cs
dersdenboy na blogu
v minulosti mluvil o "Cluster-based Multi-threading" a vyhrabal i par patentu pro beh 1 vlakna na 2 "clusterech".
//Vic sdilenych casti v jednom modulu by snad mohlo mluvit pro bod
3), kvuli celkove jednodussi logice.
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: ned 14. bře 2010, 12:32
od richie08
ad 8 IPC pro jedno vlákno - Podle mne je to overkill. Nějak si nedokážu představit jak by šlo efektivně využít 24 výpočetních jednotek (8 ALUs, 8 load/store jednotek, 8 FPU) v jednom vlákně. Podle mne je největší problém efektivita: už u současné K10 se 3IPC se málokdy využijí všechny 3 jednotky. Podle všeho jsou 4 aritmeticko-logické jednotky více než dostatečné, ne tak 8. Že nebudou dvě skupiny ALUs vzájemně spolupracovat bych usuzoval ze dvou schedulerů na tom schématu.
ad 8 FPU: tady bych si dokázal představit sdílení, protože s novými AVX instrukcemi a SSE5 se opět zvednou požadavky na výkon FPU. Ale hlavní důvod je, že FPU je pro vektorové zpracování dat kde se jedna instrukce provádí na množinu dat - zde není problém všechny jednotky efektivně využít.
Nedivil bych se kdyby byl K11 modul schopen zpracovat i více vláken na jádro (4 na modul)

Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: ned 14. bře 2010, 13:27
od ttxman
richie08 píše:ad 8 IPC pro jedno vlákno - Podle mne je to overkill. Nějak si nedokážu představit jak by šlo efektivně využít 24 výpočetních jednotek (8 ALUs, 8 load/store jednotek, 8 FPU) v jednom vlákně.
Ty FPU jsou jenom podle toho obrázku jenom 2. Sice by mohli zvládat 8 single precision výpočtů, ale pochybuju že nezávysle, spíš jako MMI packed typy.
Já to psal hlavně kvůli tomu, že to vypadá jako hrozně zajímavá možnost. Sdílená fetch a decode sekce prostě ukazuje, že se jedná o něco víc než jenom klasické 2 jádro.
richie08 píše:
Podle mne je největší problém efektivita: už u současné K10 se 3IPC se málokdy využijí všechny 3 jednotky
richie08 píše:
Nedivil bych se kdyby byl K11 modul schopen zpracovat i více vláken na jádro (4 na modul)
Efektivita vytížení pravděpodobně velmi klesne: kdyby další 4 jednotky znamenali jenom +20% výkonu tak když přidáš podporu něčeho jako hyperthreading povede to k lepšímu využití volných jednotek protože je bude moct používat další vlákno. A pokud nějakým způsobem dokážeš zrychlit provádění jednoho vlákna bude to mít v reálném použití velmi příjemné důsledky, jelikož většina algoritmů stejně nejde efektivně paralelizovat.
richie08 píše:
Že nebudou dvě skupiny ALUs vzájemně spolupracovat bych usuzoval ze dvou schedulerů na tom schématu.
Podívej se na K8/K10 tam ma vlastní malej sheduler každá ALU i FPU, takže z toho se nedá usuzovat asi nic. Pro nespolupráci spíš mluví oddělená L1 Data cache. Jenže zase je tam to "D"ata takže Instruction cache bude sdílená? To by tomu zase nahrávalo.
To schema je tak zjednodušené, že je těžké něco odhadovat
richie08 píše:
ad 8 FPU: tady bych si dokázal představit sdílení, protože s novými AVX instrukcemi a SSE5 se opět zvednou požadavky na výkon FPU. Ale hlavní důvod je, že FPU je pro vektorové zpracování dat kde se jedna instrukce provádí na množinu dat - zde není problém všechny jednotky efektivně využít.
Jak tak koukám po netu tak už dnešní phenomy mají 128bit FPU jednotky. Nejdůležitější asi bude ten FMAC. Na sčítání nasobení stojí většina zpracování signálů a pokud to Buldozer dokáže rychleji a přesněji určitě to někde bude vidět (video).
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: úte 16. bře 2010, 20:18
od richie08
Pokud si mám tipnout něco o architektuře K11:
- 2 oddělené ALU části na jeden modul, každá se 4 pipeline
- 2 sdílené FPU části na jeden modul
- schopnost zpracovat 4 vlákna současně
- prodloužená pipeline o cca 50% (pro ALU 16-18 stage)
Zajímavá diskuse o K11 je zde:
AMD zone.
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: úte 16. bře 2010, 20:36
od flanker
že by opravdový problém pro Intel po letech?
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: úte 16. bře 2010, 22:06
od THANATOS
Spracovanie 4 vlakien na modul by bolo velmi zaujimave, bolo by to asi ako hyperthreading a AMD viac HW varianta dokopy. Predlzenie pipeline tiez zjednodusi obvod a ak maju dostatocne premyslene predikcne algoritmi, nebude hrozit ani pokles vykonu. Na pretaktovanie som zvedavy, ked si zoberiem, ze aj k10 nemala az take zle taktovanie pri pohlade kolko stupnovu malo pipeline, vidim to celkom dobre pre Bulldozer. Len nech zapracuju na spotrebe aj pre chipset a to poriadne . Nevie sa, ci sa nepresunu niektore dalsie casti z chipsetu na procesor?
to flanker: No neviem, len aby sme sa potom neprekvapili Intelom alebo dalsim odkladom od AMD.
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: úte 16. bře 2010, 23:05
od flanker
tahnatos: Intel sleduju také a nic zázračného enchystá, SB je zcela 100% slabší než Gulftown...sice pokrokovější, ale je to odnož vyššího mainstremu. Navíc Bulldozer odložen není, již funkční vzorky jsou a při troše štěstí se možná ještě tento rok i ke mně dostane

Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: úte 16. bře 2010, 23:14
od richie08
Tak jsem to fórum na AMDzone trochu prošel a zde je lehký výtah:
- spekulace o malé L0 cache (zrychlení výpočtů mezi vlákny, které sdílejí data)
- spekulace o zápisu výsledků z FPU přímo do L2 cache
- na 99% nebudou ALUs v jednom modulu sdílené
- ALUs budou mít nový design, tedy ne jako u K8/K10 3ALUs + 3LSU -> 4ALU+4LSU, spekuluje se o 4xhybridních ALU/LSU
- leak dat s většími latencemi -> což by mohlo znamenat nižší výkon (IPC) na jádro nebo o vysokých taktech
- a asi nejdůležitější je upozornění od zaměstnance AMD, že ačkoli celkový výkon bude mnohem vyšší než u současné K10, tak výkon v jedno-vláknových aplikacích nemusí být vyšší. Tedy pravděpodobně vyšší bude, ale na SandyBridge mít nebude a ani to není cíl

Cílem prý není zvyšovat IPC, ale spíš zaměření na více jader kde lze dosáhnout lepší efektivity (výkon/watt, výkon/trazistor).
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: stř 17. bře 2010, 07:16
od THANATOS
to richie08: Na AMDzone som aj ja zavytal a musim s tebou suhlasit. Len mi nie je jasny ten vykon v jedno-vlaknovych aplikaciach. Cakal som podstatny narast v nich oproti K10, som trochu sklamamy, nebolo povodne 4IPC na jedno ALU? Brutalny vykon som cakal v multi-vlaknach ale budu pravdepodobne brzdene programami, ved staci sa pozriet na 6-jadro od Intelu. No uvidime co sa z toho vykluje.
to flanker: Ak to budes mat tento rok doma tak ti gratulujem. Jediny problem je v tom, ze ceny budu dost mastne (+300 eur) a na mainstream si este pockame.
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: stř 17. bře 2010, 07:55
od flanker
je to první generace Bulldozeru...věřím, že tento projekt má šanci na úspěch, jen ten výkon...Proč by jinak Bulldozer i na prezentacích (např na live konferenci z listopadu, kterou jsem sledoval přes stream) miříl přímo na highend, kdyby neměl odpovídající výkon?
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: stř 17. bře 2010, 10:07
od richie08
Zdá se že není prioritou vysoký výkon na jedno vlákno. K11 je architektura pro nadcházející dekádu a v AMD se spoléhají na rostoucí umění programátorů využívat více vláken. Dle mého to je také částečně dáno omezením architekturou x86 kdy více než 4 IPC není zkrátka efektivní. Vemte si Itanium, navrženo pro 6 IPC, kvůli tomu používá VLIW, ale i tak nejde o žádného drobečka. A k čemu to Itaniu je, když Opterony běží na vyšší frekvenci, mají více jader a celkový výkon je vyšší? Pokud aplikace dokáží efektivně využít více jader pak co je lepší? Drtič Intelu na všech frontách K11 patrně nebude, ale nevěšel bych hlavu. Celkový výkon leží hlavně na FPU a ta má být zcela nová (díky SSE5, ty vyžadují pro efektivní běh úpravu celé architektury a Intel s tím může mít problém). Navíc bude sdílená.
Zajímavostí jsou spekulace o FPU na SandyBridge. Mají být také nového designu, snad prý dokonce double pumped - neboli běžící na dvojnásobné frekvenci - návrat k P4?

Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: stř 17. bře 2010, 11:06
od ttxman
richie08 píše:Zdá se že není prioritou vysoký výkon na jedno vlákno. K11 je architektura pro nadcházející dekádu a v AMD se spoléhají na rostoucí umění programátorů využívat více vláken.
Já bych to spíš bral z druhé strany.
Paralelní programování není žádná legrace, jenže při výkonu dnešních CPU i na úrovni 1 vlákna většinou není vůbec potřeba o nějakém využívání více než jednoho vlákna ani přemýšlet. A bulldozer na tom určitě nebude hůř než dnešní generace. Takže výkon na 1 vlákno bude na 100% dostačující.
Nejvyužívanější úlohy pro více vláken jsou fyzikální simulace, zpracování obrazu a zvuku a ty v paralelním zpracování většinou škálují ještě dobře i při několika desítkách vláken. Potom tu jsou úlohy, které sice pracují na 1 vlákně, ale pouští se jich klidně stovky najednou, třeba takový web server. Poslední dobou bych řekl, že právně tyto použití se objevují pořád ve větší míře takže zaměření na efektivní stavbu více vláknového CPU(menší plocha, menší spotřeba) vypadá jako dobrá cesta i bez nutnosti "spoléhání na rostoucí umění programátorů".
Navíc s jednodušším jádrem je tu i šance vyšších frekvencí při rozumné spotřebě, takže by ani ten výkon na jedno vlákno nemusel degradovat.
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: stř 17. bře 2010, 17:03
od richie08
ad více vláknové programování - Nelze říci, že je to jednoduché nebo složité. Může to být obojí. Každý kdo má také zkušenosti s více vláknovým programováním mi dá za pravdu, že pokud daný algoritmus nevyžaduje složité techniky (synchronizaci při zápisu dat atd.), pak takový kód není o moc složitější než běžný jedno vláknový a zvládl by ho s trochou nadsázky i žák střední školy. Je pouze otázkou času kdy tvorbu více vláknových aplikací bude umět většina programátorů. Trend je jasný. Stejné to bylo i s OOP.
Rozlišoval bych segmenty trhu, které mají velmi rozdílné požadavky, jinak si budeme vše demagogicky stále dokola vyvracet:
1) segment HPC - To je doména vysokých IPC, tedy hlavně zde se prodávají Itania. Důvod je jednoduchý: FEA a CFD výpočty jdou řešit více vláknově jen pomocí dělením do domén. Bohužel to sebou nese nepříjemnosti: výsledek není identický pro různý počet vláken. Navíc mohou nastat problémy s konvergencí a hlavně výměna dat mezi doménami působí režie rostoucí s počtem domén. Z tohoto důvodu mi třeba CFD výpočet na více než 8-mi jádrech už nepřinášel žádné zrychlení a jen jsem plýtval zbytečně strojovým časem. Zde bude úspěch K11 otázkou, protože Intel bude mít asi náskok v IPC. Nicméně výkon FPU by měl být vysoký a věřím, že díky tomu sehraje i zde velmi vyrovnanou partii.
2) segment serverů - virtuální servery, webhosting, databáze atd. Zde by K11 měla zazářit nejvíc, hlavně výkonem/wat/tranzistor.
3) segment enthusiast desktop - Tito uživatelé, mezi něž se rovněž počítám, asi budou nejvíc zklamaní z výkonu, protože se nebude jednat o novou K7 která by deklasovala Intel ve všech směrech. Bohužel.
4) zbytek - do kanclu a na takové to běžné domácí hraní K11 bude 100% stačit. Navíc to v míň modulech bude úsporné a levné.
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: stř 17. bře 2010, 17:20
od THANATOS
To si nemyslel nahodou K8.
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: stř 17. bře 2010, 20:11
od flanker
jsem na to opravdu zvědav...každopádně performance má být dle JF vyšší než u Magny Cours, to by nebylo vůbec špatné! Ovšem servery a desktop je trochu jiná stránka. Proč by však na listopadové konferenci mluvili tak optimistick o high-endu?

Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: stř 17. bře 2010, 23:05
od richie08
Víme jak nám Ruiz servíroval Barcelonu jako killera... dopadlo to tak, že až Shangai srovnal krok. Jinak high-end to určitě bude, protože Thuban překoná jen díky většímu počtu jader. Ono 4 moduly / 8 jader / 16 vláken by mělo stačit na překonání nativního 6 jádra. Měla by být vyšší frekvence a IPC by také mělo vzrůst. Jestli jsem tomu dobře porozuměl, tak všechny současné CPU by měla K11 překonat téměř ve všech ohledech. Jenom se neví jestli to bude stačit na SandyBridge, který má přinést prý největší změny v architektuře od doby Core2.
Tipne si někdo L3 cache?

můj odhad je 16MB
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: čtv 18. bře 2010, 07:45
od flanker
já tu L3 vidím konzervativněji, alespoň v první generaci na 32nm...spíš 10-12 MB. Sandy Bridge by měla být sice změna, ale nakonec nic extra zásadního...Již existující vzroky jsou slabší než Gulftown (dle slov nějakého čínského uživatele), navíc i v roadmpatě Intelu se procesory řazené dle výkonosti pohybují pod i7 Bloomfield.
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: čtv 18. bře 2010, 08:14
od THANATOS
Mozno tie nase pochybnosti nebudu na mieste, predsa len ten post od flankera o vykone Bulldozera oproti doterajsim 4 a 6 jadram vyzera zaujimavo, uz len vediet v akych aplikaciach je ten rozdiel.
to flanker: vedel by si dat link k tej citacii ohladne vykonu bulldozera, vdaka.
Re: Procesory AMD K11 "Bulldozer&Bobcat"- info, testy, spekulace
Napsal: čtv 18. bře 2010, 10:58
od flanker
doma se po tom zkusím podívat...něco málo dnes a včera psal i jeden uživatel na xtremesystems v xtremenews/info o thubanech