Jinak b bylo zajimavy, kdyby G300 melo 512bit sbernici, s tema GDDR5 to by byl vykon...to bych pak veril ze by to melo trebas 2xvykon G200, ale co jsem zahledl, bude jen 256bit...
nVidia GF100 - spekulační thread
Moderátoři: Walker1134, Wilik
- sam_217
- Mírně pokročilý

- Registrován: 16. bře 2008
- Bydliště: Subprostor
- Kontaktovat uživatele:
Re: nVidia G300 - spekulační thread
O AMD vim ze to tak dela
ale u GPU sem si nebyl jisty, a vubec ze se to pouziva vsude...
Jinak b bylo zajimavy, kdyby G300 melo 512bit sbernici, s tema GDDR5 to by byl vykon...to bych pak veril ze by to melo trebas 2xvykon G200, ale co jsem zahledl, bude jen 256bit...
Jinak b bylo zajimavy, kdyby G300 melo 512bit sbernici, s tema GDDR5 to by byl vykon...to bych pak veril ze by to melo trebas 2xvykon G200, ale co jsem zahledl, bude jen 256bit...
PC1: AMD Ryzen 5800X3D@default Noctua NH-D15S // X570 AORUS MASTER (rev 1.0) // 64GB Patriot Viper Steel 3600MHz@CL18-22-22-42 // 9070XT Pulse // MSI Optix MAG274QRF-QD - 1mrtvý quantum dot pixel!!! // Samsung PM961 (1TB NVMe), Crucial M4 256GB, Micron enterprise SSD1920GB, Crucial MX500 2TB... // LianLi O11 XL // SSR-850FX
PC2: Lenovo Legion 5 17ACH6H - Ryzen 7 5800H / 16GB / RTX 3070 mobile 130W TDP
PC2: Lenovo Legion 5 17ACH6H - Ryzen 7 5800H / 16GB / RTX 3070 mobile 130W TDP
- Herkis
- Redaktor PCT

-
- Registrován: 14. pro 2007
- Bydliště: Jablonecké Paseky
Re: nVidia G300 - spekulační thread
Self-repair technologie (STAR od Virage Logic Corp) se u Radeonů používá jen na paměť na čipu (GPU) ne na SPs.
- beardie
- Středně pokročilý

- Registrován: 10. srp 2005
Re: nVidia G300 - spekulační thread
a RSX je tam naco?Nakel píše:z toho jedno pracuje jako grafické akcelerátor
sam_217: iba sirka zbernice a pamate vykon nerobia
Herkis: u radeonov su redundantne SP
¿ʇı ʇ,usı 'ƃuıʎouuɐ ʎʇʇǝɹd sı uʍop ǝpısdn ƃuıpɐǝɹ
- Nakel
- Nováček

-
- Registrován: 07. črc 2009
Re: nVidia G300 - spekulační thread
Re: beardie
Tak tam sem se spletl,promin.
Jinak ohledně těch pamětí.HD 4850 klasicky s DDR3 256 bit pam. sběrnice určitě všichni znají,ale HD 4850 s DDR5 a 256 bit pam. sběrnicí od Gainwardu když ještě dělal ATi se dala rovnat téměř k HD 4870.Z toho vyplívá že když jsou dnešní nejvýkonnější G200 na 512 bitech a použili by GDDR5 paměti výkon by byl opravdu "brutální",ovšem dá se čekat že jak zelení tak červení dají do svých nových karet to,co jim tam chybělo ted,tzn to co měl jejich konkurent a musím říct,že jak nerozumím těm grafickým procesorům,tak se těším na řešení pamětí a zároveň sem zvědav na řešení pamětí obou firem
.
Tak tam sem se spletl,promin.
Jinak ohledně těch pamětí.HD 4850 klasicky s DDR3 256 bit pam. sběrnice určitě všichni znají,ale HD 4850 s DDR5 a 256 bit pam. sběrnicí od Gainwardu když ještě dělal ATi se dala rovnat téměř k HD 4870.Z toho vyplívá že když jsou dnešní nejvýkonnější G200 na 512 bitech a použili by GDDR5 paměti výkon by byl opravdu "brutální",ovšem dá se čekat že jak zelení tak červení dají do svých nových karet to,co jim tam chybělo ted,tzn to co měl jejich konkurent a musím říct,že jak nerozumím těm grafickým procesorům,tak se těším na řešení pamětí a zároveň sem zvědav na řešení pamětí obou firem
- Herkis
- Redaktor PCT

-
- Registrován: 14. pro 2007
- Bydliště: Jablonecké Paseky
Re: nVidia G300 - spekulační thread
beardie: SPs jsou redundantní, ale to neznamená, že jsou self test and repair, na to jsou asi příliš složité (na testování) a jejich málo (oproti paměťovým buňkám), aby to mělo smysl.
P.S. Reagoval jsem na Krteqa - součástí self repair (samoopravujících se) obvodů je i zabudovaná testovací část a redundantní část. Příklad který uváděl, jsou pouze redundantní obvody, které se zapojí v případě potřeby po testech čipu - externím zařízením.
P.S. Reagoval jsem na Krteqa - součástí self repair (samoopravujících se) obvodů je i zabudovaná testovací část a redundantní část. Příklad který uváděl, jsou pouze redundantní obvody, které se zapojí v případě potřeby po testech čipu - externím zařízením.
- no-X
- Středně pokročilý

- Registrován: 24. úno 2004
- Bydliště: Č.Budějovice
Re: nVidia G300 - spekulační thread
Herkis: Máš nějaké zmatené informace, přečti si rozhovor o architektuře RV7xx...
Nejlepší moderátor ve výslužbě
- Herkis
- Redaktor PCT

-
- Registrován: 14. pro 2007
- Bydliště: Jablonecké Paseky
Re: nVidia G300 - spekulační thread
no-x: buď konkrétní a přidej odkaz.
- Krteq
- Středně pokročilý

-
- Registrován: 22. dub 2005
- Bydliště: Brno
Re: nVidia G300 - spekulační thread
AnandTech - The RV770 Story: Documenting ATI's Road to Success (Re-evaluating Strategy, Creating the RV770 in 2005)ATI asserted that a very large GPU, without the use of repair structures or harvesting (two techniques I’ll describe in a bit) may only have a 30% yield. That means for every 100 GPUs produced on a single wafer, only 30% of them would be fully functional and could be sold as advertised. Manufacturing these complex circuits is particularly expensive, those fab plants easily cost a couple of billion dollars to build and thus having most of your wafer go to waste isn’t really a good way of running a business.
Thankfully there are ways to improve that crappy 30% yield to a value north of 90%. The first is a technique generally known as repairability. The idea behind repairability is simple: build redundancy into your design. If you have a unit with 10 shader processors, actually build 11 but use one as a spare should there be a defect in any of the remaining processors....
Jinak tímhle bych asi diskuzi o použité "self-repair" technice v RV770 ukončil. Tohle je thread o G300.
- Herkis
- Redaktor PCT

-
- Registrován: 14. pro 2007
- Bydliště: Jablonecké Paseky
Re: nVidia G300 - spekulační thread
Krteq:Jsem pro, už kvůli tomu, že mezi "repair structures" a "self repair" je docela podstatný rozdíl. V článku na který odkazuješ není o self repair technologii ani slovo. Pokud tě to ale zajímá, přidávám odkaz, kde tuto technologii AMD používá: Viragelogic
no-x: self repair je samoopravující se. Pokud v autě vozíš rezervu (redundance) neznamená to, že se kolo v případě defektu samo opraví.
Nezaměňuj termín self-repairability (schopnost) za termín self repair, který si sám výše použil.
no-x: self repair je samoopravující se. Pokud v autě vozíš rezervu (redundance) neznamená to, že se kolo v případě defektu samo opraví.
Nezaměňuj termín self-repairability (schopnost) za termín self repair, který si sám výše použil.
Naposledy upravil(a) Herkis dne stř 8. črc 2009, 06:17, celkem upraveno 2 x.
- no-X
- Středně pokročilý

- Registrován: 24. úno 2004
- Bydliště: Č.Budějovice
Re: nVidia G300 - spekulační thread
Herkis: Za prvé se pokoušíš slovíčkařit a za druhé zaměňuješ self-testing za self-repairability. Nikdo tu netvrdil, že SPs podporujou self-testing, o tom jsi mluvil jen ty sám.
Nefunkční SPs se mohou nahradit redundantními SPs, čemuž se říká repairability nebo self-repairability (pokud jde o zdůraznění samotného faktu, že čip pro opravu používá pouze vlastní jednotky, které už v něm samém jsou fyzicky obsažené). Samotný pojem repairability je totiž o dost obecnější a může znamenat i opravu použitím dalšího čipu, což se praktikovalo už před desítkami let u CPU (procesor + koprocesor, dva stejné čipy jen každý s jinou vadnou/neaktivní částí, které se dohromady chovaly jako jeden plnohodnotný).
Nefunkční SPs se mohou nahradit redundantními SPs, čemuž se říká repairability nebo self-repairability (pokud jde o zdůraznění samotného faktu, že čip pro opravu používá pouze vlastní jednotky, které už v něm samém jsou fyzicky obsažené). Samotný pojem repairability je totiž o dost obecnější a může znamenat i opravu použitím dalšího čipu, což se praktikovalo už před desítkami let u CPU (procesor + koprocesor, dva stejné čipy jen každý s jinou vadnou/neaktivní částí, které se dohromady chovaly jako jeden plnohodnotný).
Nejlepší moderátor ve výslužbě
- vendo007
- Začátečník

- Registrován: 12. pro 2007
Re: nVidia G300 - spekulační thread
nie.Nakel píše:Jinak ohledně těch pamětí.HD 4850 klasicky s DDR3 256 bit pam. sběrnice určitě všichni znají,ale HD 4850 s DDR5 a 256 bit pam. sběrnicí od Gainwardu když ještě dělal ATi se dala rovnat téměř k HD 4870.Z toho vyplívá že když jsou dnešní nejvýkonnější G200 na 512 bitech a použili by GDDR5 paměti výkon by byl opravdu "brutální"
priepustnost pamati sice ovplyvnuje vykon, ale neplati formula cim vacsia priepustnost = tym vacsi vykon
uz dnes karty niesu limitovane priepustnostou (a ak ano tak len v malo pripadoch) preto je zvysovanie priepustnosti dalej neefektivne
4850 ako priklad nedavaj lebo ta s ddr3 je limitovana pamatami, kedze 4870 je to iste jadro jak 4850 len ine pamati a hned vidis ten skok vo vykone, lenze nataktuj pamati na 4870 na vacsiu hodnotu a uz nebudes vidiet taky vyrazny skok
"Real power can't be given. It must be taken."
- no-X
- Středně pokročilý

- Registrován: 24. úno 2004
- Bydliště: Č.Budějovice
Re: nVidia G300 - spekulační thread
Přesně tak. Nejde jen o sběrnici, ale čip ji musí mít čím vytížit a umět efektivně vytížit. Pokud budeš z Prahy do Brna vozit trabantem balíky slámy, tak jich za den odvozíš stejný množství ať pojedeš po dvouproudý, nebo dvacetiproudý dálnici 
Sběrnici obvykle nejvíce využívají ROPs a cache. Když pomineme, že záleží na množství ROPs, jejich schopnostech, kompresních algoritmech a dalších hlediscích, je tu stále prostý fakt, že v současné době nikdo neví, jestli G300 a RV8x0 vůbec budou mít ROPs. ATi i nVidia už mají nějakou dobu patentované technologie, které souvisejí s emulací funkčnosti ROPs přes unifikované jádro. Nikdo neví, jestli se to bude týkat už této generace, nebo až příští, ale bude velký zásah do architektury právě v oblasti, která nejvíce ovlivňuje vytížení sběrnice - takže se čip pak může chovat zcela jinak...
Stačí se podívat na HD2900 - emulovala MSAA resolve, který jinak provádějí právě ROPs a za následek to mělo velmi nízkou závislost výkonu na sběrnici, protože limitem přestala být propustnost, ale právě onen emulovaný resolve pass a přesun MSAA (Z/Color) dat do unifikovaného jádra a zpět.
Stačí si srovnat HD2900PRO a HD4670. Datová propustnost HD2900PRO je oproti HD4670 trojnásobná, ale výkon je stejný...
Sběrnici obvykle nejvíce využívají ROPs a cache. Když pomineme, že záleží na množství ROPs, jejich schopnostech, kompresních algoritmech a dalších hlediscích, je tu stále prostý fakt, že v současné době nikdo neví, jestli G300 a RV8x0 vůbec budou mít ROPs. ATi i nVidia už mají nějakou dobu patentované technologie, které souvisejí s emulací funkčnosti ROPs přes unifikované jádro. Nikdo neví, jestli se to bude týkat už této generace, nebo až příští, ale bude velký zásah do architektury právě v oblasti, která nejvíce ovlivňuje vytížení sběrnice - takže se čip pak může chovat zcela jinak...
Stačí se podívat na HD2900 - emulovala MSAA resolve, který jinak provádějí právě ROPs a za následek to mělo velmi nízkou závislost výkonu na sběrnici, protože limitem přestala být propustnost, ale právě onen emulovaný resolve pass a přesun MSAA (Z/Color) dat do unifikovaného jádra a zpět.
Stačí si srovnat HD2900PRO a HD4670. Datová propustnost HD2900PRO je oproti HD4670 trojnásobná, ale výkon je stejný...
Nejlepší moderátor ve výslužbě
- Sobo
- Středně pokročilý

- Registrován: 28. črc 2007
- Bydliště: Bolatice
Re: nVidia G300 - spekulační thread
Proč vůbec vzniká takový nátlak na fyzické odstranění ROPs z jádra? Měl jsem za to, že jejich emulace je pomalejší, než kdyby v jádře byly přítomny. Taky to asi sníží výpočetní potenciál SPs, ikdyž 512 SPs na 1700Mhz by možná byl trochu overkill. Jedinný důvod, proč se ROPs zbavit a emulovat jejich funkci přes SPs by mohla být úspora místa v jádře, nebo by SPs byly hodně naddimenzované a po emulaci už by to bylo tak akorát...
Ad srovnání: lepší by možná bylo porovnávat HD 2900Pro 512bit s HD 2900Pro 256bit. Mimo sběrnici naprosto identické karty, rozdíl ve výkonu 0,00nic.
Ad srovnání: lepší by možná bylo porovnávat HD 2900Pro 512bit s HD 2900Pro 256bit. Mimo sběrnici naprosto identické karty, rozdíl ve výkonu 0,00nic.
So, Lone Star, now you see that the Evil will always triumph, because Good is dumb! - Lord Dark Helmet @ Spaceballs
- beardie
- Středně pokročilý

- Registrován: 10. srp 2005
Re: nVidia G300 - spekulační thread
presne takto nejak si to predstavujemSobo píše:emulovat jejich funkci přes SPs by mohla být úspora místa v jádře a SPs by byly hodně naddimenzované a po emulaci už by to bylo tak akorát...
¿ʇı ʇ,usı 'ƃuıʎouuɐ ʎʇʇǝɹd sı uʍop ǝpısdn ƃuıpɐǝɹ
- no-X
- Středně pokročilý

- Registrován: 24. úno 2004
- Bydliště: Č.Budějovice
Re: nVidia G300 - spekulační thread
Nebo takSobo píše:Ad srovnání: lepší by možná bylo porovnávat HD 2900Pro 512bit s HD 2900Pro 256bit. Mimo sběrnici naprosto identické karty, rozdíl ve výkonu 0,00nic.
ROPs v současné době vykonávají některé funkce, které provádějí i SPs, takže jde o duplicitu. V některých případech by imho výkon SPs mohl být mnohem větší, v některých trochu nižší... Ale jde hlavně o to, že texturovací jednotky a ROPs jsou obrovské funkční bloky, které konzumují výraznou část jádra.
S texturovacími jednotkami se toho až zas tolik udělat nedá - emulovat filtraci textur by bylo neefektivní (filtrace textur je při emulaci 3D renderingu na CPU vůbec to nejnáročnější; pamětníci si určitě vybaví SW akcelerované hry z 90. let, které tahaly za oči právě těmi nefiltrovanými /při pohybu zrnícími/ texturami), texture addressing ALUs - alespoň v současné podobě - by bylo velmi obtížné a časově náročné navrhovat a optimalizovat ručně, aby mohly běžet na dvojnásobné frekvenci jako současné SPs nVidie a konzumovat tak jen polovinu místa (což byl důvod, proč je nVidia při návrhu G80 vyhodila ze shader core - NV40/G70 totiž pro texture addressing používala pixel shader ALU, G80/GT200 je kvůli zmíněným problémům má opět vydělené mimo unifikované jádro). nVidia sice nějaké 4 roky pracuje na nové architektuře, takže by se na to mohla zaměřit, ale imho je ho zatím zbytečné.
Takže zbývají ROPs. Jsou velké, některé funkce jsou duplicitní a jejich emulace by nebyla tak náročná, jako v případě texturovacích jednotek. Je pravda, že při emulovaném MSAA resolve na R600 byl problém s propady výkonu. Nedávno jsem si ty rozdíly srovnával s R580 a RV770 a je to poměrně zajímavé - propady jsou největší u nejnižšího počtu vzorků. Tím myslím, že propad při FSAA 2x je oproti R580 a RV770 velký, zatímco propad při FSAA 8x je oproti RV770 poměrně nízký. Zřejmě jde o to, že určitá fáze toho zpracování je stejně náročná bez ohledu na počet vzorků. To by imho ale mohlo jít vychytat po stránce HW návrhu - přecijen, i když R600 byla pro emulovaný resolve částečně optimalizovaná, neměl být využíván primárně.
Druhá věc je, že pár týdnů po vydání RV770 vyšly ovladače, které o desítky procent snížily propady výkonu při edge-detect režimu (při kterém se též používá emulovaný resolve). Bohužel to tehdy nikdo pořádně neotestoval, takže víme starou belu, jestli to pomohlo i R6xx, nebo ne, jen že to na RV770 výrazně zvedlo výkon. Věřím, že pokud by emulovaný resolve měl být využívaný primárně (nebo výhradně), určitě by na tom ještě zapracovali.
A poslední věc je, že je vhodnější tohle posuzovat nikoli z hlediska propadu výkonu při jedné konkrétní operaci, ale z hlediska průměrného výkonu na 1 tranzistor (případně na jednotku plochy, pokud jde o stejný výrobní proces). Je pravděpodobné, že některé procesy budou přes shader core zpracované výrazně rychleji, takže jiné, i když budou pomalejší, nezpůsobí v průměru takový propad, aby tahle cesta byla méně výhodná. Navíc tím, že vyhodíme ROPs, můžeme uvolněný prostor využít pro další SPs, případně i TMUs, čímž se celkový výkon zvedne.
Ještě mě napadají dva důvody pro tenhle přístup a imho půjde o dva nejpodstatnější:
1. odstranění limitů - jedna hra může být limitovaná výkonem ALUs a ROPs mohou zahálet, druhá hra může být limitovaná výkonem ROPs a ALUs budou zahálet. V praxi to znamená, že část čipu není využitá. Pokud budou oba typy operací prováděné stejnou výpočetní jednotkou, uzpůsobí se de facto čip na 100% požadavkům hry a bude fungovat efektivněji. To je stejné jako u unifikace shaderů...
2. čipy jsou stále větší a komplexnější a stejně tak i samotné jednotky v nich... jejich návrh je tedy čím dál náročnější a pokud se nějakým způsobem nebude zjednodušovat, budou intervaly mezi vydáváním nových produktů čím dál delší... takže vynechání ROPs (po vynechání VS) může být dalším krokem, jak zvyšující nároky kompenzovat... když v čipu nebudou ROPs, nebude je třeba navrhovat (ony teda budou nahrazeny imho jen po stránce aritmetické části, nějaká silně zjednodušená fixní část napojená na řadič tam zbyde, ale o to teď nejde)...
Je jen otázka času, kdy se oběma výrobcům bude zdát výhodné na tenhle systém přejít.
Nejlepší moderátor ve výslužbě
- richie08
- Začátečník

- Registrován: 15. říj 2006
Re: nVidia G300 - spekulační thread
Také by se nemělo zapomínat na GP/GPU negrafické výpočty - více ALUs je v tomto případě více výkonu. Vypadá to, že to má jen samé výhody: odstranění bottlenecku, díky větší unifikaci větší celková efektivita renderu a tedy i výkon, jednodušší návrh čipu. Jediný otazník u mne visí nad efektivitou emulace přes ALUs (vzhledem k počtu tranzistorů). Není o tomhle nějaké info?
- no-X
- Středně pokročilý

- Registrován: 24. úno 2004
- Bydliště: Č.Budějovice
Re: nVidia G300 - spekulační thread
Bohužel nic konkrétního nevím a ani není obecně známo... Na B3D fóru byly odkazy na nějaké patenty, ale z toho člověk nicmoc nevyčte a ohledně efektivity vůbec nic.
Myslím si, že po výpočetní stránce bude efektivita dobrá, ale asi bude třeba řešit hlavně různé latence, které jsou u fixní jednoúčelové jednotky asi nižší, přizpůsobit tomu compiler, cache...
Myslím si, že po výpočetní stránce bude efektivita dobrá, ale asi bude třeba řešit hlavně různé latence, které jsou u fixní jednoúčelové jednotky asi nižší, přizpůsobit tomu compiler, cache...
Nejlepší moderátor ve výslužbě
- barco
- Středně pokročilý

- Registrován: 22. čer 2006
- Bydliště: Európska únia
Re: nVidia G300 - spekulační thread
V nadpise je síce uvedené, že ide o spekulační thread, ale to neznamená, že sa tu bude preberať ATi apod., dodržujte aspoň trocha medze nV G300 témy, vďaka. 
.
- no-X
- Středně pokročilý

- Registrován: 24. úno 2004
- Bydliště: Č.Budějovice
Re: nVidia G300 - spekulační thread
Možnost absence ROPs je týká jak G300, tak R800. A stejně tak je HD2900 nejlepší názorný příklad toho, jaký (minimální) vliv může mít sběrnice na výkon i jaký vliv může mít na výkon emulace některých funkcí ROPs. Jelikož jde o spekulační thread, je třeba na něčem ony spekulace stavět. I kdybych se rozkrájel, tak prostě takovéhle příklady v portfoliu nVidie nenajdu, protože tam prostě nejsou... Bylo by podle mě poněkud blbé vynechat zajímavé spekulace jen proto, že se v nich objevuje slůvko "ATi", na které je třeba někdo alergický...
Nejlepší moderátor ve výslužbě
- beardie
- Středně pokročilý

- Registrován: 10. srp 2005
Re: nVidia G300 - spekulační thread
http://pctuning.tyden.cz/component/cont ... -par-tydnuOBR píše:DX11 karta s 2GB pamětí GDDR5 a 480ti SP procesory,by se zřejmě měla jmenovat GeForce GTX 300. Jádro bude vyrobené na 40nm a stále půjde pouze o vylepšené G80 (G200), ovšem některé části se dočkali výraznějšího omlazení. Když jsem se ptal, zdali bude přítomen NV/IO čip, tak prý ano ve své nové verzi, což mne velmi překvapilo. Čekal jsem integraci NV/IO funkcí do GPU, no uvidíme. Výkon karty ve hrách se předokládá někde kolem výkonu přetaktované GeForce GTX 295
preco mam taky pocit, ze som to uz raz niekde videl?
¿ʇı ʇ,usı 'ƃuıʎouuɐ ʎʇʇǝɹd sı uʍop ǝpısdn ƃuıpɐǝɹ