expLorer: podívej se na to takhle... současný generace a půlgenerace nebyly z hlediska výkonu nijakým významným skokem - důvody:
1. X850XT -> X1800XT ~ +50% výkonu
- prostor, který dala 90nm výroba, využila ATi především pro implementaci jednotek, které samy o sobě jako takové nepřidávají výkon (dispatchery), ale přinášejí mnoho vedlejších výhod (osamostatnění texturovací jednotky, která pak funguje mnohem efektivněji, a může nabídnout lepší režimy AF s nižším propadem výkonu; možnost zvyšovat počet PS procesorů bez změny architektury; efektivní dynamic branching tzn. efektivní implementace SM3.0; řada výhod pro GPGPU; přesunutí určité části zátěže ovladače z CPU na GPU atp.). Co se týkalo přímého zvýšení výkonu, tak to byl ring-bus a mírné zvýšení taktů jádra. Tzn. prostor pro navýšení plochy jádra nebyl primárně využit pro výkon.
2. X1800XT -> X1900XTX ~ +20-25% výkonu
- tentokrát ATi využila možnosti dispatcherů a jen zvýšila počet pixel shader procesorů - výsledné navýšení výkonu v průměru přesně odpovídá navýšení plochy jádra, což je z technologického hlediska velký úspěch, protože frekvence pamětí se prakticky nehnuly
3. X1900XTX -> X1950XTX ~ +10-15% výkonu
- rychlejší paměti (i když na úkor latencí) GDDR4, které jsou podle všeho na těchto "nízkých" frekvencích dobře dostupné a ani nejsou drahé. Nárůst výkonu je poloviční oproti nárůstu frekvence, což ale odpovídá tomu, že frekvence jádra zůstala beze změny a latence pamětí vzrostly.
-----------------------------
1. GeForce 6800Ultra -> GeForce 7800GTX ~ +50% výkonu
- nVidia šla jinou cestou a protože už měla hotový SM3.0 kompatibilní čip, tak veškerou plochu jádra, kterou nabídl 110nm proces, využila pro výkon, tedy ADD instrukce pro primární ALU (zjednodušeně řečeno pixel shading +33% výkonu na pipeline) a +50% pixel pipelines. Frekvence zůstala, paměti v podstatě taky, takže nVidia využila výkonného jádra pro kompenzaci pomalých pamětí. Pomalé paměti jsou levné. Levné paměti = levná karta.
2. GeForce 7800GTX -> GeForce 7900GTX ~ +50% výkonu
- tady šlo v podstatě o využití 90nm procesu pro dosažení vyšších frekvencí + rychlejší paměti + vyšší kapacita paměti, tedy kombinace všech možných prostředků pro dosažení vyššího výkonu, krom úpravy samotného čipu.
3. GeForce 7900GTX -> GeForce 7950GX2 ~ +35% výkonu
- obdobný krok jako v předchozím případě, jen s tím rozdílem, že pro zvýšení čipu navýšením jeho frekvencích už není prostor, takže výkon byl navýšen počtem čipů. Kvůli chlazení byla snížena jejich pracovní frekvence a kvůli ceně použity pomalejší paměti.
-----------------
Všechny tyhle kroky ale byly něčím limitovány - první krok v případě ATi plochou čipu, v případě nVidie existencí "úsporné" SM3.0 architektury navrhnuté původně pro malý 130nm čip, což znamená, že nV musela vycházet z existující architektury a jen ji ladit pro výkon (+pipelines), ATi musela prostor věnovat obvodům pro SM3.0 a hrubý výkon nechat. Pak už šlo v obou případech o zrychlování pamětí podle jejich dostupnosti a v případě nVidie využití 90nm pro vyšší frekvence, v případě ATi využití možnosti architektury čipu pro zvýšení počtu PS procesorů.
Takže v souhrnu to znamená, že s každou (půl)generací bylo měněno jen něco, protože na výraznější změny nebyl prostor (nedostupné rychlejší paměti, nebo omezení architekturou čipu, nebo velikost čipu, která už neumožňovala zvýšení počtu výpočetních jednotek.
Jenže, stačí se podívat na předchozí generaci:
R9800XT -> X800XT-PE
GF5950U -> 6800U
a máme nárůsty výkonu více než dvojnásobné (ATi: malý čip, nízké frekvence, novější výrobní proces umožnil dosažení výrazně vyšších taktů a dal mnoho prostoru, který byl využit čistě pro výpočetní jednotky = výkon, prostor pro frekvenci pamětí; nVidia: kompletně nová architektura navržená přímo pro konkrétní požadavky tehdejších her, nV přímo nevycházela z ničeho "staršího", takže čip nebyl ničím bržděn - tím myslím např. architekturu vhodnou pro potřeby starších aplikací, která by byla v novějších hrách méně efektivní.
A teď tu mámě něco podobného:
1. nVidia má novou architekturu navrženou přesně pro aktuální hry
2. širší sběrnice
3. spousta prostoru na jádře (90nm G71 byla malá), který podle mě bude využit, tak, aby na dosažení kompatibility se SM4.0 padlo minimum tranzistorů a maximum místa bylo využito pro výpočetní jednotky, které přímo přinášejí výkon
4. možnost využití GDDR4, pokud bude třeba
Takže výkonový skok (2x) se klidně opakovat může
---
za případné nesmysly a překlepy se předem omlouvám, nemám už čas to po sobě číst