nVidia GF100 - spekulační thread

Grafické karty s libovolným GPU firmy nVidia (např. Riva, GeForce).

Moderátoři: Walker1134, Wilik

Zamčeno

Jaký bude podle Vás průměrný výkon karet s GF100 v plných recenzích?

Anketa končí za úte 2. bře 2010, 16:43

přibližně 10% nad Radeonem HD 5870 (± 2%)
49
23%
přibližně 20% nad Radeonem HD 5870 (± 2%)
41
20%
přibližně 30% nad Radeonem HD 5870 (± 2%)
43
21%
přibližně 40% nad Radeonem HD 5870 (± 2%)
17
8%
přibližně na úrovni Radeonu HD 5970 (± 2%)
28
13%
porazí Radeon HD 5970 přibližně o 10% (± 2%)
13
6%
porazí Radeon HD 5970 o víc jak 10%
18
9%
 
Celkem hlasů: 209
sam_217
Mírně pokročilý
Mírně pokročilý
Uživatelský avatar
Registrován: 16. bře 2008
Bydliště: Subprostor
Kontaktovat uživatele:

Re: nVidia G300 - spekulační thread

Příspěvek od sam_217 »

O AMD vim ze to tak dela :D ale u GPU sem si nebyl jisty, a vubec ze se to pouziva vsude...
Jinak b bylo zajimavy, kdyby G300 melo 512bit sbernici, s tema GDDR5 to by byl vykon...to bych pak veril ze by to melo trebas 2xvykon G200, ale co jsem zahledl, bude jen 256bit...
PC1: AMD Ryzen 5800X3D@default Noctua NH-D15S // X570 AORUS MASTER (rev 1.0) // 64GB Patriot Viper Steel 3600MHz@CL18-22-22-42 // 9070XT Pulse // MSI Optix MAG274QRF-QD - 1mrtvý quantum dot pixel!!! // Samsung PM961 (1TB NVMe), Crucial M4 256GB, Micron enterprise SSD1920GB, Crucial MX500 2TB... // LianLi O11 XL // SSR-850FX

PC2: Lenovo Legion 5 17ACH6H - Ryzen 7 5800H / 16GB / RTX 3070 mobile 130W TDP
Herkis
Redaktor PCT
Redaktor PCT
Registrován: 14. pro 2007
Bydliště: Jablonecké Paseky

Re: nVidia G300 - spekulační thread

Příspěvek od Herkis »

Self-repair technologie (STAR od Virage Logic Corp) se u Radeonů používá jen na paměť na čipu (GPU) ne na SPs.
beardie
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 10. srp 2005

Re: nVidia G300 - spekulační thread

Příspěvek od beardie »

Nakel píše:z toho jedno pracuje jako grafické akcelerátor
a RSX je tam naco? :)

sam_217: iba sirka zbernice a pamate vykon nerobia

Herkis: u radeonov su redundantne SP
¿ʇı ʇ,usı 'ƃuıʎouuɐ ʎʇʇǝɹd sı uʍop ǝpısdn ƃuıpɐǝɹ
Nakel
Nováček
Nováček
Registrován: 07. črc 2009

Re: nVidia G300 - spekulační thread

Příspěvek od Nakel »

Re: beardie

Tak tam sem se spletl,promin.
Jinak ohledně těch pamětí.HD 4850 klasicky s DDR3 256 bit pam. sběrnice určitě všichni znají,ale HD 4850 s DDR5 a 256 bit pam. sběrnicí od Gainwardu když ještě dělal ATi se dala rovnat téměř k HD 4870.Z toho vyplívá že když jsou dnešní nejvýkonnější G200 na 512 bitech a použili by GDDR5 paměti výkon by byl opravdu "brutální",ovšem dá se čekat že jak zelení tak červení dají do svých nových karet to,co jim tam chybělo ted,tzn to co měl jejich konkurent a musím říct,že jak nerozumím těm grafickým procesorům,tak se těším na řešení pamětí a zároveň sem zvědav na řešení pamětí obou firem :).
Herkis
Redaktor PCT
Redaktor PCT
Registrován: 14. pro 2007
Bydliště: Jablonecké Paseky

Re: nVidia G300 - spekulační thread

Příspěvek od Herkis »

beardie: SPs jsou redundantní, ale to neznamená, že jsou self test and repair, na to jsou asi příliš složité (na testování) a jejich málo (oproti paměťovým buňkám), aby to mělo smysl.

P.S. Reagoval jsem na Krteqa - součástí self repair (samoopravujících se) obvodů je i zabudovaná testovací část a redundantní část. Příklad který uváděl, jsou pouze redundantní obvody, které se zapojí v případě potřeby po testech čipu - externím zařízením.
no-X
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 24. úno 2004
Bydliště: Č.Budějovice

Re: nVidia G300 - spekulační thread

Příspěvek od no-X »

Herkis: Máš nějaké zmatené informace, přečti si rozhovor o architektuře RV7xx...
Nejlepší moderátor ve výslužbě
Herkis
Redaktor PCT
Redaktor PCT
Registrován: 14. pro 2007
Bydliště: Jablonecké Paseky

Re: nVidia G300 - spekulační thread

Příspěvek od Herkis »

no-x: buď konkrétní a přidej odkaz.
Krteq
Středně pokročilý
Středně pokročilý
Registrován: 22. dub 2005
Bydliště: Brno

Re: nVidia G300 - spekulační thread

Příspěvek od Krteq »

ATI asserted that a very large GPU, without the use of repair structures or harvesting (two techniques I’ll describe in a bit) may only have a 30% yield. That means for every 100 GPUs produced on a single wafer, only 30% of them would be fully functional and could be sold as advertised. Manufacturing these complex circuits is particularly expensive, those fab plants easily cost a couple of billion dollars to build and thus having most of your wafer go to waste isn’t really a good way of running a business.

Thankfully there are ways to improve that crappy 30% yield to a value north of 90%. The first is a technique generally known as repairability. The idea behind repairability is simple: build redundancy into your design. If you have a unit with 10 shader processors, actually build 11 but use one as a spare should there be a defect in any of the remaining processors....
AnandTech - The RV770 Story: Documenting ATI's Road to Success (Re-evaluating Strategy, Creating the RV770 in 2005)


Jinak tímhle bych asi diskuzi o použité "self-repair" technice v RV770 ukončil. Tohle je thread o G300.
Herkis
Redaktor PCT
Redaktor PCT
Registrován: 14. pro 2007
Bydliště: Jablonecké Paseky

Re: nVidia G300 - spekulační thread

Příspěvek od Herkis »

Krteq:Jsem pro, už kvůli tomu, že mezi "repair structures" a "self repair" je docela podstatný rozdíl. V článku na který odkazuješ není o self repair technologii ani slovo. Pokud tě to ale zajímá, přidávám odkaz, kde tuto technologii AMD používá: Viragelogic

no-x: self repair je samoopravující se. Pokud v autě vozíš rezervu (redundance) neznamená to, že se kolo v případě defektu samo opraví.
Nezaměňuj termín self-repairability (schopnost) za termín self repair, který si sám výše použil.
Naposledy upravil(a) Herkis dne stř 8. črc 2009, 06:17, celkem upraveno 2 x.
no-X
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 24. úno 2004
Bydliště: Č.Budějovice

Re: nVidia G300 - spekulační thread

Příspěvek od no-X »

Herkis: Za prvé se pokoušíš slovíčkařit a za druhé zaměňuješ self-testing za self-repairability. Nikdo tu netvrdil, že SPs podporujou self-testing, o tom jsi mluvil jen ty sám.

Nefunkční SPs se mohou nahradit redundantními SPs, čemuž se říká repairability nebo self-repairability (pokud jde o zdůraznění samotného faktu, že čip pro opravu používá pouze vlastní jednotky, které už v něm samém jsou fyzicky obsažené). Samotný pojem repairability je totiž o dost obecnější a může znamenat i opravu použitím dalšího čipu, což se praktikovalo už před desítkami let u CPU (procesor + koprocesor, dva stejné čipy jen každý s jinou vadnou/neaktivní částí, které se dohromady chovaly jako jeden plnohodnotný).
Nejlepší moderátor ve výslužbě
vendo007
Začátečník
Začátečník
Uživatelský avatar
Registrován: 12. pro 2007

Re: nVidia G300 - spekulační thread

Příspěvek od vendo007 »

Nakel píše:Jinak ohledně těch pamětí.HD 4850 klasicky s DDR3 256 bit pam. sběrnice určitě všichni znají,ale HD 4850 s DDR5 a 256 bit pam. sběrnicí od Gainwardu když ještě dělal ATi se dala rovnat téměř k HD 4870.Z toho vyplívá že když jsou dnešní nejvýkonnější G200 na 512 bitech a použili by GDDR5 paměti výkon by byl opravdu "brutální"
nie.
priepustnost pamati sice ovplyvnuje vykon, ale neplati formula cim vacsia priepustnost = tym vacsi vykon
uz dnes karty niesu limitovane priepustnostou (a ak ano tak len v malo pripadoch) preto je zvysovanie priepustnosti dalej neefektivne
4850 ako priklad nedavaj lebo ta s ddr3 je limitovana pamatami, kedze 4870 je to iste jadro jak 4850 len ine pamati a hned vidis ten skok vo vykone, lenze nataktuj pamati na 4870 na vacsiu hodnotu a uz nebudes vidiet taky vyrazny skok :wink:
"Real power can't be given. It must be taken."
no-X
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 24. úno 2004
Bydliště: Č.Budějovice

Re: nVidia G300 - spekulační thread

Příspěvek od no-X »

Přesně tak. Nejde jen o sběrnici, ale čip ji musí mít čím vytížit a umět efektivně vytížit. Pokud budeš z Prahy do Brna vozit trabantem balíky slámy, tak jich za den odvozíš stejný množství ať pojedeš po dvouproudý, nebo dvacetiproudý dálnici :-)

Sběrnici obvykle nejvíce využívají ROPs a cache. Když pomineme, že záleží na množství ROPs, jejich schopnostech, kompresních algoritmech a dalších hlediscích, je tu stále prostý fakt, že v současné době nikdo neví, jestli G300 a RV8x0 vůbec budou mít ROPs. ATi i nVidia už mají nějakou dobu patentované technologie, které souvisejí s emulací funkčnosti ROPs přes unifikované jádro. Nikdo neví, jestli se to bude týkat už této generace, nebo až příští, ale bude velký zásah do architektury právě v oblasti, která nejvíce ovlivňuje vytížení sběrnice - takže se čip pak může chovat zcela jinak...

Stačí se podívat na HD2900 - emulovala MSAA resolve, který jinak provádějí právě ROPs a za následek to mělo velmi nízkou závislost výkonu na sběrnici, protože limitem přestala být propustnost, ale právě onen emulovaný resolve pass a přesun MSAA (Z/Color) dat do unifikovaného jádra a zpět.

Stačí si srovnat HD2900PRO a HD4670. Datová propustnost HD2900PRO je oproti HD4670 trojnásobná, ale výkon je stejný...
Nejlepší moderátor ve výslužbě
Sobo
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 28. črc 2007
Bydliště: Bolatice

Re: nVidia G300 - spekulační thread

Příspěvek od Sobo »

Proč vůbec vzniká takový nátlak na fyzické odstranění ROPs z jádra? Měl jsem za to, že jejich emulace je pomalejší, než kdyby v jádře byly přítomny. Taky to asi sníží výpočetní potenciál SPs, ikdyž 512 SPs na 1700Mhz by možná byl trochu overkill. Jedinný důvod, proč se ROPs zbavit a emulovat jejich funkci přes SPs by mohla být úspora místa v jádře, nebo by SPs byly hodně naddimenzované a po emulaci už by to bylo tak akorát...

Ad srovnání: lepší by možná bylo porovnávat HD 2900Pro 512bit s HD 2900Pro 256bit. Mimo sběrnici naprosto identické karty, rozdíl ve výkonu 0,00nic.
So, Lone Star, now you see that the Evil will always triumph, because Good is dumb! - Lord Dark Helmet @ Spaceballs
beardie
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 10. srp 2005

Re: nVidia G300 - spekulační thread

Příspěvek od beardie »

Sobo píše:emulovat jejich funkci přes SPs by mohla být úspora místa v jádře a SPs by byly hodně naddimenzované a po emulaci už by to bylo tak akorát...
presne takto nejak si to predstavujem
¿ʇı ʇ,usı 'ƃuıʎouuɐ ʎʇʇǝɹd sı uʍop ǝpısdn ƃuıpɐǝɹ
no-X
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 24. úno 2004
Bydliště: Č.Budějovice

Re: nVidia G300 - spekulační thread

Příspěvek od no-X »

Sobo píše:Ad srovnání: lepší by možná bylo porovnávat HD 2900Pro 512bit s HD 2900Pro 256bit. Mimo sběrnici naprosto identické karty, rozdíl ve výkonu 0,00nic.
Nebo tak :-) Já jsem tam chtěl zahrnout vliv odlišných ROPs, ale v podstatě je to jedno...

ROPs v současné době vykonávají některé funkce, které provádějí i SPs, takže jde o duplicitu. V některých případech by imho výkon SPs mohl být mnohem větší, v některých trochu nižší... Ale jde hlavně o to, že texturovací jednotky a ROPs jsou obrovské funkční bloky, které konzumují výraznou část jádra.

S texturovacími jednotkami se toho až zas tolik udělat nedá - emulovat filtraci textur by bylo neefektivní (filtrace textur je při emulaci 3D renderingu na CPU vůbec to nejnáročnější; pamětníci si určitě vybaví SW akcelerované hry z 90. let, které tahaly za oči právě těmi nefiltrovanými /při pohybu zrnícími/ texturami), texture addressing ALUs - alespoň v současné podobě - by bylo velmi obtížné a časově náročné navrhovat a optimalizovat ručně, aby mohly běžet na dvojnásobné frekvenci jako současné SPs nVidie a konzumovat tak jen polovinu místa (což byl důvod, proč je nVidia při návrhu G80 vyhodila ze shader core - NV40/G70 totiž pro texture addressing používala pixel shader ALU, G80/GT200 je kvůli zmíněným problémům má opět vydělené mimo unifikované jádro). nVidia sice nějaké 4 roky pracuje na nové architektuře, takže by se na to mohla zaměřit, ale imho je ho zatím zbytečné.

Takže zbývají ROPs. Jsou velké, některé funkce jsou duplicitní a jejich emulace by nebyla tak náročná, jako v případě texturovacích jednotek. Je pravda, že při emulovaném MSAA resolve na R600 byl problém s propady výkonu. Nedávno jsem si ty rozdíly srovnával s R580 a RV770 a je to poměrně zajímavé - propady jsou největší u nejnižšího počtu vzorků. Tím myslím, že propad při FSAA 2x je oproti R580 a RV770 velký, zatímco propad při FSAA 8x je oproti RV770 poměrně nízký. Zřejmě jde o to, že určitá fáze toho zpracování je stejně náročná bez ohledu na počet vzorků. To by imho ale mohlo jít vychytat po stránce HW návrhu - přecijen, i když R600 byla pro emulovaný resolve částečně optimalizovaná, neměl být využíván primárně.

Druhá věc je, že pár týdnů po vydání RV770 vyšly ovladače, které o desítky procent snížily propady výkonu při edge-detect režimu (při kterém se též používá emulovaný resolve). Bohužel to tehdy nikdo pořádně neotestoval, takže víme starou belu, jestli to pomohlo i R6xx, nebo ne, jen že to na RV770 výrazně zvedlo výkon. Věřím, že pokud by emulovaný resolve měl být využívaný primárně (nebo výhradně), určitě by na tom ještě zapracovali.

A poslední věc je, že je vhodnější tohle posuzovat nikoli z hlediska propadu výkonu při jedné konkrétní operaci, ale z hlediska průměrného výkonu na 1 tranzistor (případně na jednotku plochy, pokud jde o stejný výrobní proces). Je pravděpodobné, že některé procesy budou přes shader core zpracované výrazně rychleji, takže jiné, i když budou pomalejší, nezpůsobí v průměru takový propad, aby tahle cesta byla méně výhodná. Navíc tím, že vyhodíme ROPs, můžeme uvolněný prostor využít pro další SPs, případně i TMUs, čímž se celkový výkon zvedne.

Ještě mě napadají dva důvody pro tenhle přístup a imho půjde o dva nejpodstatnější:

1. odstranění limitů - jedna hra může být limitovaná výkonem ALUs a ROPs mohou zahálet, druhá hra může být limitovaná výkonem ROPs a ALUs budou zahálet. V praxi to znamená, že část čipu není využitá. Pokud budou oba typy operací prováděné stejnou výpočetní jednotkou, uzpůsobí se de facto čip na 100% požadavkům hry a bude fungovat efektivněji. To je stejné jako u unifikace shaderů...

2. čipy jsou stále větší a komplexnější a stejně tak i samotné jednotky v nich... jejich návrh je tedy čím dál náročnější a pokud se nějakým způsobem nebude zjednodušovat, budou intervaly mezi vydáváním nových produktů čím dál delší... takže vynechání ROPs (po vynechání VS) může být dalším krokem, jak zvyšující nároky kompenzovat... když v čipu nebudou ROPs, nebude je třeba navrhovat (ony teda budou nahrazeny imho jen po stránce aritmetické části, nějaká silně zjednodušená fixní část napojená na řadič tam zbyde, ale o to teď nejde)...

Je jen otázka času, kdy se oběma výrobcům bude zdát výhodné na tenhle systém přejít.
Nejlepší moderátor ve výslužbě
richie08
Začátečník
Začátečník
Uživatelský avatar
Registrován: 15. říj 2006

Re: nVidia G300 - spekulační thread

Příspěvek od richie08 »

Také by se nemělo zapomínat na GP/GPU negrafické výpočty - více ALUs je v tomto případě více výkonu. Vypadá to, že to má jen samé výhody: odstranění bottlenecku, díky větší unifikaci větší celková efektivita renderu a tedy i výkon, jednodušší návrh čipu. Jediný otazník u mne visí nad efektivitou emulace přes ALUs (vzhledem k počtu tranzistorů). Není o tomhle nějaké info?
no-X
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 24. úno 2004
Bydliště: Č.Budějovice

Re: nVidia G300 - spekulační thread

Příspěvek od no-X »

Bohužel nic konkrétního nevím a ani není obecně známo... Na B3D fóru byly odkazy na nějaké patenty, ale z toho člověk nicmoc nevyčte a ohledně efektivity vůbec nic.

Myslím si, že po výpočetní stránce bude efektivita dobrá, ale asi bude třeba řešit hlavně různé latence, které jsou u fixní jednoúčelové jednotky asi nižší, přizpůsobit tomu compiler, cache...
Nejlepší moderátor ve výslužbě
barco
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 22. čer 2006
Bydliště: Európska únia

Re: nVidia G300 - spekulační thread

Příspěvek od barco »

V nadpise je síce uvedené, že ide o spekulační thread, ale to neznamená, že sa tu bude preberať ATi apod., dodržujte aspoň trocha medze nV G300 témy, vďaka. :-)
.
no-X
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 24. úno 2004
Bydliště: Č.Budějovice

Re: nVidia G300 - spekulační thread

Příspěvek od no-X »

Možnost absence ROPs je týká jak G300, tak R800. A stejně tak je HD2900 nejlepší názorný příklad toho, jaký (minimální) vliv může mít sběrnice na výkon i jaký vliv může mít na výkon emulace některých funkcí ROPs. Jelikož jde o spekulační thread, je třeba na něčem ony spekulace stavět. I kdybych se rozkrájel, tak prostě takovéhle příklady v portfoliu nVidie nenajdu, protože tam prostě nejsou... Bylo by podle mě poněkud blbé vynechat zajímavé spekulace jen proto, že se v nich objevuje slůvko "ATi", na které je třeba někdo alergický...
Nejlepší moderátor ve výslužbě
beardie
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 10. srp 2005

Re: nVidia G300 - spekulační thread

Příspěvek od beardie »

OBR píše:DX11 karta s 2GB pamětí GDDR5 a 480ti SP procesory,by se zřejmě měla jmenovat GeForce GTX 300. Jádro bude vyrobené na 40nm a stále půjde pouze o vylepšené G80 (G200), ovšem některé části se dočkali výraznějšího omlazení. Když jsem se ptal, zdali bude přítomen NV/IO čip, tak prý ano ve své nové verzi, což mne velmi překvapilo. Čekal jsem integraci NV/IO funkcí do GPU, no uvidíme. Výkon karty ve hrách se předokládá někde kolem výkonu přetaktované GeForce GTX 295
http://pctuning.tyden.cz/component/cont ... -par-tydnu

preco mam taky pocit, ze som to uz raz niekde videl?
¿ʇı ʇ,usı 'ƃuıʎouuɐ ʎʇʇǝɹd sı uʍop ǝpısdn ƃuıpɐǝɹ
Zamčeno

Zpět na „NVIDIA grafické karty“