Stránka 5 z 137

Re: NVIDIA Kepler - informace, spekulace

Napsal: úte 3. led 2012, 16:09
od DOC_ZENITH
Shader nemusí bejt unifikovanej aby dokázal provádět výpočty typu GPGPU. První verze ATI stream se oběvily pro Radeon X1800.

Ostatně, osobně jsem dodnes nepochopil přínos těch unifikovanejch shaderů, vzhledem k tomu že vertex shader se nikdy nezačal moc používat, nebylo by rozumnější prostě na něj vyčlenit pár tranzistorů a jednotek někde bokem, než dělat každej shader unifikovanej a tím podrejvat jeho efektivitu? Staré GPU co měly neunifikované shadery, hlavně u ATI měli lepší reálnej výkon na tranzistor.

Krteq- Jde o to co jsem nassal ohledně výkonu a efektivity, v tomhle ohledu OpenCL bohužel nesjednoducje prakticky nic, a kvůli tomu tu vlastně mělo být. Je totiž fuk jestli je SW psanej pro cuda only nebo OpenCL když mi to na ATInách pojede buďto vůbec nebo mizerně slow že CPU bude rychlejší, oboje varianty jsou ve finále stejně useless.

Re: NVIDIA Kepler - informace, spekulace

Napsal: úte 3. led 2012, 16:09
od del42sa
webwalker píše: PS: Tím "Tighten integration of GPU and CPU" imho není míněna Tegra.
a prozradíš nám co ?

Re: NVIDIA Kepler - informace, spekulace

Napsal: úte 3. led 2012, 17:38
od no-X
DOC_ZENITH píše:Ostatně, osobně jsem dodnes nepochopil přínos těch unifikovanejch shaderů, vzhledem k tomu že vertex shader se nikdy nezačal moc používat, nebylo by rozumnější prostě na něj vyčlenit pár tranzistorů a jednotek někde bokem…
Takže bychom dnes měli pár výpočetních jednotek pro vertex shading, pár výpočeních jednotek pro geometry shading, pár výpočetních jednotek pro domain shading, pár výpočetních jednotek pro hull shading, pár pro compute shading a pro pixel shading už by zbylo taky jen pár výpočetních jednotek. Ve výsledku by to bylo pomalé ve všem :)
DOC_ZENITH píše:Staré GPU co měly neunifikované shadery, hlavně u ATI měli lepší reálnej výkon na tranzistor.
Jo?

Obrázek Obrázek

X1950XTX / R580: 384 milionů tranzistorů
HD 4890 / RV790: 950 milionů tranzistorů

To je 2,47× více tranzistorů, ale 2,78× víc výkonu. Unifikovaná RV790 má tedy lepší poměr výkon / tranzistor než neunifikovaná R580. Konkrétně R580 dá 82 FPS na 1 miliardu tranzistorů, zatímco RV790 dá 92 FPS na 1 miliardu tranzistorů.

Re: NVIDIA Kepler - informace, spekulace

Napsal: úte 3. led 2012, 17:56
od Baneshee
Ale HD4890 ma jadro na 850MHz, zatimco X1950XTX jen na 650MHz. Kdyby se takty srovnaly, tak je v pomeru vykon/tranzistor hnedka X1950 lepsi

Re: NVIDIA Kepler - informace, spekulace

Napsal: úte 3. led 2012, 18:14
od marek p
Je to jen můj dojem,nebo se ve vlákně věnovaném nV grafikám se řeší ATI(AMD) a naopak?

Re: NVIDIA Kepler - informace, spekulace

Napsal: úte 3. led 2012, 18:16
od Alfajk
marek p píše:Je to jen můj dojem,nebo se ve vlákně věnovaném nV grafikám se řeší ATI(AMD) a naopak?
je to jen tvuj dojem :)

...kazdopadne ten prvni obrazek s grafem je zase fake, a ty fotky to zase videj moc ruzove(nebo spis zelene?) pochybuju ze v roce 2014 bude 4-5 nasobnej vypocetni vykon

Re: NVIDIA Kepler - informace, spekulace

Napsal: úte 3. led 2012, 18:20
od webwalker
DOC_ZENITH: No já sice nevím zda-li a jak jsou non-unifikované shadery pro gpgpu programovatelné, ale protože nejsou unifikované mají zřejmě rozdílné výpočetní schopnosti i jejich přesnost bude také rozdílná. Tudíž je nebude možné programově využít univerzálně tak jako unifikované.
del42sa píše:
webwalker píše: PS: Tím "Tighten integration of GPU and CPU" imho není míněna Tegra.
a prozradíš nám co ?
Neprozradím, protože o tom kulové vím :)
Umím si ale představit, že by nVidia mohla udělat takové antiAPU. Tedy namísto přestěhování gpu k cpu (APU), by mohli nastěhovat arm cpu k jejich gpu. Na takovémto gpu by pak mohli provádět nejen paralelní úlohy, ale také sériové (na tom armu). Ale to jsou vše jen mé fantazie :) EDIT: Projekt Denver

Alfajk: Pozor, tam není uveden výkon, ale výkon v DP na Watt :sad:

Re: NVIDIA Kepler - informace, spekulace

Napsal: úte 3. led 2012, 18:50
od havli
no-X píše: Jo?

Obrázek Obrázek

X1950XTX / R580: 384 milionů tranzistorů
HD 4890 / RV790: 950 milionů tranzistorů

To je 2,47× více tranzistorů, ale 2,78× víc výkonu. Unifikovaná RV790 má tedy lepší poměr výkon / tranzistor než neunifikovaná R580. Konkrétně R580 dá 82 FPS na 1 miliardu tranzistorů, zatímco RV790 dá 92 FPS na 1 miliardu tranzistorů.
A co takhle:

R600.... 700M (2900XT)
R580.... 384M (x1950XTX)

R600 ma 1,8x vic tranzistoru, ale jen 1,46x vetsi vykon (1600x1200 no AA)
http://www.computerbase.de/artikel/graf ... ancerating

A ani s odstupem casu a v novejsich hrach se rozdil moc nezvetsil. V mem testu vychazi 2900XT = 1,6x X1900XTX oproti 1,55x na CB.

http://havli-vga.ic.cz/benchmark-3-20.php

Re: NVIDIA Kepler - informace, spekulace

Napsal: úte 3. led 2012, 18:51
od Krteq
DOC_ZENITH píše:Shader nemusí bejt unifikovanej aby dokázal provádět výpočty typu GPGPU. První verze ATI stream se oběvily pro Radeon X1800.
Nojo, ale to bylo bez jedný úrovně (vrstvy) a programovalo se takřka přímo pro HW, od toho taky pojmenování "Close to Metal". S dnešním CAL už to má pramálo společného.
DOC_ZENITH píše:Krteq- Jde o to co jsem nassal ohledně výkonu a efektivity, v tomhle ohledu OpenCL bohužel nesjednoducje prakticky nic, a kvůli tomu tu vlastně mělo být. Je totiž fuk jestli je SW psanej pro cuda only nebo OpenCL když mi to na ATInách pojede buďto vůbec nebo mizerně slow že CPU bude rychlejší, oboje varianty jsou ve finále stejně useless.
No nevím, ale testy OpenCL co jsem viděl mluví o opaku. Třeba výpočty fraktálů běžely už na HD 4850 přes OpenCL (CAL) lépe než s OpenCL implementací (CUDA) u 9800 GT. Je jasný, že výkonově se mohou určitá řešení lišit podle architektury a zaměření, ale ber to tak, že OpenCL jako standard je tu s námi zatím jen pár let.

Re: NVIDIA Kepler - informace, spekulace

Napsal: stř 4. led 2012, 10:48
od del42sa
další info :

Obrázek

Obrázek

http://translate.google.cz/translate?hl ... ompleta%2F

EDIT: vzhledem k možnému zrušení hot-clock se spekuluje o tom, že by shadery (cuda cores) mohly být až o 50% menší i když mi ten počet přijde přitažený za vlasy :roll:

Re: NVIDIA Kepler - informace, spekulace

Napsal: stř 4. led 2012, 11:27
od flanker
těžko říci, ty takty se mi zdají až moc vysoké

Re: NVIDIA Kepler - informace, spekulace

Napsal: stř 4. led 2012, 11:38
od del42sa
vysoké ? na 28nm výrobní proces je to v pohodě. Vysoké jsou ty takty, které leaknul Sapphire u svých atomic edicí :oops: navíc má Kepler podle té tabulky pořád málo TMU :?:

Re: NVIDIA Kepler - informace, spekulace

Napsal: stř 4. led 2012, 12:01
od DOC_ZENITH
Pokud ano bude to jeho Achylovou patou, hlavně v hodně vysokejch rozlišeních protože už Fermi v 2560x1600 ztrácí více jak třeba v 1920x1200, protože jí tam dochází fillrate. Taky mi nesedne počet Rops. Proč má mít GK104 32 rops a GK100 64rops, když zbytek čipu neodpovídá, počet TMU ani shaderů ani propustnost paměti nevzrostli natolik aby nakrmili takovej počet rops.

No-X ten názor s neunifikovanými shadery jsem nevyjářil tím aby jsi jej kontroval čipem co ATI co měl možná nejlepší poměr výkon vs tranzistor z celé jejich unifikované řady(vychytal tunu bugů a nepřinášel nové technologie, u takovejch jde vždy výkon nahoru), kde by asi byla R5xx architektura kdyby jí další 4 roky rozvíjely a nehodili jí do koše po jedné 90nm generaci a nenahradili jí problémovou a hůře škálující R600) Unifikovanej shader byl prosazovanej jako věc sjednocující pixel a vertex shadery, vlzheldem k tomu že jsi pak vysypal z rukávu pár pojmů co nevim přesně co dělaj (domain shader a hull shader třeba), tak těžko mohu dále kontrovat, jen si myslím že vzhledem k tomu že naše hry jsou stále DX9.0C enginy jen s ňákou tou třešničkou (občas) nahoře aby se jako neřeklo, tak se tyhle věci stejně vůbec nepoužívaj, a čip co by se na to prostě vysral a investoval všechny tranzistory na výkon, by na tom dnes stále byl v herní praxi mnohem lépe než šílenosti typu Fermi a Cayman ( třeba ). Ve výsledku tu totiž stále máme nároky a bottleneck ve fillrate a výkonu pixel shaderů v provádění SM3.0 operací, nic víc. Ten zbytek od doby uvedení DX10 se prakticky doteď nepoužívá a začne tipuji, teprve až to bude další generace konzolí umět. Taková R5xx generace ve své době neměla žádnou slabou stránku. Měla kvalitní AF, kvalitní TRAA, solidní AA, podával brilatní výkon jak ve starších titulech tak moderních hrách, s postupem času a příchodem modernějších enginů a driverů se navíc její odstup od konkurence stával doslova propastnym, ve všem co uměla byla rychlá, uměla HDR s AA jako první čip. A nezapomínej na ty patetické časy prvních dvou DX10 generací kdy krom high endu produkty byly naprosto out of place, kdy HD2600 či 3600 řady se snažili postavit na místo kde předtím v té ceně stála x1950pro/gt, které jim jemně řečeno ve výkonu nakopávala pr*** a nebýt toho že se přestala vyrábět a ATIpřestala dělat drivery pro tyto karty, ještě by tam dlouho byla.

Karty na takovémto principu tu měly mít své místo a ty měly být tahákem pro hry. Teď co, máme tu GPU co jsou jakž takž dobré na hry a uměj ňáké ty výpočty ale furt nic moc a musí se jim furt psát SW přímo na HW a jsou použitelné jen na některé typy operací..... brr. Situace že by na trhu byla jedna GPU generace tlačící čistě reálnej herní výkon, a pro výpočty by byly jiné čipy s úplně jinými jednotkami pro to optimalizované, které by ani neměly výstupy či TMU či Rops, atd.... oba produkty by ve svých segmentech obstály více a nabízely lepší výkon celkově a lepší výkon/watt.

Re: NVIDIA Kepler - informace, spekulace

Napsal: stř 4. led 2012, 12:24
od del42sa
DOC_ZENITH píše:Pokud ano bude to jeho Achylovou patou, hlavně v hodně vysokejch rozlišeních protože už Fermi v 2560x1600 ztrácí více jak třeba v 1920x1200, protože jí tam dochází fillrate. Taky mi nesedne počet Rops. Proč má mít GK104 32 rops a GK100 64rops, když zbytek čipu neodpovídá, počet TMU ani shaderů ani propustnost paměti nevzrostli natolik aby nakrmili takovej počet rops.
možná proto, že u Fermi pořád jsou ROPs svázané napevno s paměťovou sběrnicí ...

Re: NVIDIA Kepler - informace, spekulace

Napsal: stř 4. led 2012, 12:31
od DOC_ZENITH
No, od GK104 se před uvedením tohoto slajdu očekávala 384-bit sběrnice. Sorry ale tenhle čip, pokud na trhu nebude GK100, se nestane úspěchem. Marketingově a asi i výkonem ho naprosto zastíní Tahiti. Ten čip s 256-bit sběrnicí + 32 Rops + 64TMU prostě nemůže konkurovat, srovnejte si to s tim jakou prostupnost a kolik TMU čili hrubej fillrate má Tahiti.... Bude někde mezi Radeony 7900 a 7800 v nejlepším případě a to ještě ne v 2560x1600. Nízkej počet TMU i užší sběrnice tu kartu odsuzuje k větším propadům výkonu s roustoucím rozlišením, ještě více než se tak děje u Fermi. A vítěz je ten co má nejlepší GPU, a u GK100 se očekává opožděnej launch, takže by high end zas půl roku patřil samotné ATI. Že by NV udělala takovou botu znova se mi nechce věřit.

Re: NVIDIA Kepler - informace, spekulace

Napsal: stř 4. led 2012, 12:33
od ArgCZ
del42sa píše: navíc má Kepler podle té tabulky pořád málo TMU :?:
to mě praštilo do očí jako první a pak to že nV vždy dávala přednost možnosti větší sběrnice/pomalejší paměti, než naopak k dosažení cílové propustnosti

má někdo nějaký odhad jaký počet CC by odpovídal po zrušení hot-clock dnešní Fermi aby měl stejný výkon? Asi blbá otázka co... :D

DOC_ZENITH: neházej flintu do žita, ty specifikace kulhaj na obě nohy... výmysl

Re: NVIDIA Kepler - informace, spekulace

Napsal: stř 4. led 2012, 12:36
od del42sa
ArgCZ píše:
má někdo nějaký odhad jaký počet CC by odpovídal po zrušení hot-clock dnešní Fermi aby měl stejný výkon? Asi blbá otázka co... :D
Dvojnásobek ? 8) viz "prorocký" dodatek od Acheho http://pctforum.tyden.cz/viewtopic.php? ... 1#p8192231
DOC_ZENITH píše:No, od GK104 se před uvedením tohoto slajdu očekávala 384-bit sběrnice. Sorry ale tenhle čip, pokud na trhu nebude GK100, se nestane úspěchem. Marketingově a asi i výkonem ho naprosto zastíní Tahiti. Ten čip s 256-bit sběrnicí + 32 Rops + 64TMU prostě nemůže
jasně, na druhou stranu GK104 je pořád spíše typem nahrazujícím Geforce 560 Ti nikoliv highendem Nvidie, takže mu zřejmě 256-bit sběrnice dostačuje (tzn. není namířen proti HD7970).
Naproti tomu Tahiti je (navzdory letité praxi ATi/AMD v uvádění těch nejvyšších karet coby duálních monster) spíše highendem než střední třídou. Pokud má tento čip (GK104) nahradit GeForce 560Ti, svoje poslání určitě splní, nakonec AMD také počet ROPs nezvyšovalo...... Jako nástupce GeForce 580 má být přece duální karta na bázi GK104, alespoň dle té poslední roadmapy.

Jinak ty specifikace GK 104 ve srovnání s GF114: 16SM bloků = dvojnásobek, 16 teselátorů =dvojnásobek, fekvence Jádra = cca 20% nárust, počet shaderů (cuda cores) = 50% nárust (poměr původních s hot-clock/ nových x počet), TMU = stejný počet, ROPs = stejný počet, cache = dvojnásobek, frekvence pamětí = 45% nahoru

to je slušný základ ne ?

Re: NVIDIA Kepler - informace, spekulace

Napsal: stř 4. led 2012, 14:46
od no-X
Časová osa ("growth drivers") je hodně stará, snad dokonce z podzimu. Jinak ty takty mi nepřijdou vysoký, viz vyjádření TSMC... původně se dokonce říkalo, že by Keplery mohly běžet skoro na 1300 MHz.
havli píše:A co takhle:
R600.... 700M (2900XT)
R600 je rozbitej, takže z toho vyplývá jen tolik, že rozbitej unifikovanej čip může být méně efektivní než funkční neunifikovanej. Což je imho stejně přínosný jako srovnání zánovního trabandu se zadřeným porsche :-)

Re: NVIDIA Kepler - informace, spekulace

Napsal: stř 4. led 2012, 14:57
od havli
Proto jsem taky uvazoval vykon bez AA. :) Nebo je v R600 rozbitych vic veci, nez AA?

Re: NVIDIA Kepler - informace, spekulace

Napsal: stř 4. led 2012, 20:19
od del42sa
ja jsem take toho nazoru,ze cokoliv unifikovaneho musi mit zakonite horsi pomer efektivity uz jen z principu. Navic ty cipy ktere mezi sebou srovnavate podle me srovnavat takto nelze,protoze musite vzit v potaz i jine faktory nez jen unifikovane shadery.Tech faktoru ktere ovlivnuji vyslednou efektivitu je totiz mnohem vice imho...