ABOX - Unified Memory Architecture versus PCI

AMIGA REVIEW obsah časopisu online!

Domov

Software

Hry

Obaly

Download

ABOX - Unified Memory Architecture versus PCI

Petr Krenželok

Jinými slovy „Proč vyvíjet něco nového, když si to již můžete dávno koupit?“

Od doby zveřejnění základních specifikací počítačového systému ABOX a zákaznického čipu CAIPIRINHA, diskutovala veřejnost mnohokrát jejich smysl či nesmyslnost. Většina r těchto diskusních témat se týkala toho, proč by měla být použita UMA, a zdali lepší řešení nepředstavuje použití standardních a všestranně dostupných komponent.
Jednou ze skutečností, jež je často vytýkaná konceptu CAIPIRINHA spolu s UMA architekturou, je propustnost paměti, používané pro jisté systémové funkce, přístup procesoru a video výstupy. Kritici této technologie však extrémně jednoduchými příklady chtějí demonstrovat případné nevýhody tohoto řešení, jako například: „1600x 1200 bodů ve 24 bitové hloubce násobené 75 Hz představuje 432 MB/s stálého zatížení, navíc zde máme druhý video výstup, propočty velkého množství textur pro 3D scény, vícekanálové audio, a mnohem více, což vše má přímý vliv na snižování výkonu CPU.“ S touto argumentací se někteří uživatelé rozhodli podpořit spíše koncept s oddělenými sběrnicemi a grafikou na bázi PCI nebo AGP (viz dále). Jiné argumenty se snaží přesvědčit počítačovou veřejnost o lepší ochraně budoucích investic v podobě levnějších modulárních řešení, či snazší rozšiřitelnosti sběrnic. V následujících bodech se budeme snažit komentovat zmíněná tvrzení, přestože tato zanechávají na našich tvářích letmý úsměv...
1. Standardní architektura s pamětí a grafikou založenou například na bázi PCI, má mnohem menší propustnost, než námi plánovaný systém. Rozdělením paměti zde vzniká potřeba přenášet data z hlavni paměti do paměti grafické karty. A nyní tři příklady:
- Procesor v PC propočítává animovanou 3D scénu. Proto musí přečíst desítky tisíc hodnot souřadnic pro každou obrazovku, provést náročné propočty a zapsat data zpět do hlavní paměti. Poté musí být data z hlavní paměti opět odečtena, aby mohlo proběhnout jejich setřídění a následné odeslání 3D grafické kartě, to vše samozřejmě skrze PCI sběrnici. Protože 3D scény bývají dosti komplexní a grafická karta má většinou k dispozici pouze 2 až 4 MB RAM, nahrání nových textur musí být přeneseno do paměti pro tyto textury určené, kde 3D čip grafické karty vypočítá polygony. Jiným možným řešením je samozřejmě možnost používat velmi jednoduché scény s texturami tak malými, aby se vešly do 1 MB paměti, rezervované přímo na grafické kartě. Opravdové „High-end“ řešení, nemyslíte?
- Video digitizér zapisuje data svých obrázků snímaných v reálném čase do hlavní paměti PC, protože tam se počítá s jejich editací. Abychom tato data mohli zobrazit v podobě animovaného okna. musí být znovu nakopírována do paměti grafické karty, tj. 25 krát za sekundu přibližně 1 MB dat, což je jinými slovy rovno polovině možné propustnosti mnoha PCI systémů. Jaká smůla, že další polovina je již využita video digitizérem.
- Obrazovku s rozlišením 4000 x 4000 hodů (= 48 MB) zobrazíme na grafické kartě s rozlišením 1280 x 1024 bodů a pokusíme se jí různě posouvat (panning). Samozřejmě že je to možné provést se standardní architekturou PC, pomineme-li však fakt, že PCI sběrnice je zcela přetížena, protože procesor je příliš zaměstnán přenosem potřebných dat z hlavní paměti. A nakonec - na fakt, že je datová sběrnice zcela přetížena, můžeme s klidem zapomenout, protože i kdyby nebyla, procesor by stejně nemohl využít její propustnost k samotným výpočtům, jelikož je zaměstnán samotným přenosem dat.
Výčet podobných příkladů by samozřejmě mohl pokračovat dál, tu však není zapotřebí. UMA architektura má jasné výhody, zvláště co se týče přenosu dat, který se zde stává zbytečným, protože všechna data jsou již na svém místě, v jednotné paměti, kam mají všechny funkční jednotky systému zajištěný přístup. Při kombinaci UMA/DLRP mohou být obrazovková data, uložená na libovolném místě v paměti, zobrazena na libovolném místě obrazovky, aniž by vznikla jakákoliv potřeba využití propustnosti a CPU k jejich nakopírováni do „videopaměti“. Stejný přístup zpracování dat se týká například i 3D souřadnic, textur, dat pro audio, apod. Na závěr k tomuto bodu můžeme dodat snad už jen následující: Vzhledem k dnešním, ale i budoucím standardním řešením nenabízí dobře implementovaná UMA architektura pouze větní propustnost paměťových sběrnic, ale rovněž silně redukuje potřebu na využití této propustnosti, čími samozřejmě poskytuje větší výkon a více systémových zdrojů pro High-end aplikace.
2. Jednoduché propočty propustnosti počítají s konvenčním designem grafických karet, kdy data obrázku musí být uložena na jednom místě Jednoho souvislého bloku paměti. Proto je množství dat a hloubka barev vždy ve svém maximu, což je koncept, který nedává žádný smysl. Pokročilá technologie jednotky DLRP čipu CAIPIRINHA nabízí zcela odlišný koncept, kde zobrazená obrazovka nemusí být nutně v paměti ve výše uvedeném formátu. U DLRP je vzhledem k možnosti volby hloubky barev průtok dat mnohem menší. Jednoduchý DLRP příkaz může dát například povel 100 bodům na jednom řádku obrazovky v příslušné barvě k jejich zobracení. V systému, kde můžete mít 24-bitová okna jakéhokoliv tvaru a velikostí (což je umožněno pouze díky přítomnosti čipu CAIPIRINHA), záleží jen na uživateli, zdali si k zobrazení obrázku pozadí pracovní plochy zvolí 24-hitovou hloubku, kde samozřejmě dojde k využití zdrojů paměti a propustnosti, nebo si zvolí pozadí s omezenou hloubkou barev, čímž naopak šetří systémové zdroje. Zobrazení řádku o velikostí 1600 bodů by mohlo, hrubě přeneseno do lidské řeči, vypadat jako následující sekvence DLRP.

{
Zobraz 312 bodů RGBA 128,128,256,0
;Toto je pozadí
Zobraz 10 bodů pomocí 1 Bajtu počínaje adresou v cache $xxxxxxxx
;Zde dojde k zobrazení jednoho řádku pomocí posuvné lišty z cache
Zobraz 700 bodů RGBA pomocí 4 Bajtů počínaje adresou $yyyyyyyy
;700 bodů 24 bitového obrázku
Zobraz 350 bodů použitím l Bajtu od adresy $zzzzzzzz
;Zde se jedná o okno v popředí obrázku, např. ovládací panel s paletou 256 barev
Zobraz 312 hodů RGBA 128,128,256,0
;Dokončení pozadí k pravému okraji obrazovky
}

Na tomto příkladu vidíme, že použitím DLRP potřebujeme k zobrazení daného řádku 3150 bajtů plus několik instrukcí z hlavní paměti, zatímco u „tradičního“ 24 hitového, 1600 bodů dlouhého řádku to bude 64000 bajtů. Při zobrazeni celé obrazovky se tedy jedná o redukci propustnosti ze 432 MB/s na 213 MB/s. Jak jsme názorně předvedli na tomto příkladu, jež je vlastně součástí každodenních aplikací, inteligentním programováním a konfigurací v kombinaci s UMA a DLRP dosáhneme lepšího využití systémových zdrojů. A toto je, jak sami věříme, preferovaný koncept v dnešním světě marnivých GUI systémů, které často svými nároky kladou požadavky na vývoj nových generací procesorů.
3. Mnoho kritiků ABOXu nebo UMA architektury čipu CAIPIRINHA apeluje na High-end požadavky v oblasti grafiky a celkového výkonu systému. Přestože nevědí nic o konceptu tohoto čipu, očekávají zde různá omezení, a pak jej srovnávají s výkonností současných grafických karet, postavených na bázi standardních komponent. Velmi rádi pro srovnání používají příklad komplexního 3D zobrazení, s použitím nejvyšších rozlišení a občerstvovacích frekvencí. Pominete-li cenu těchto standardů, nezbývá než dodat, že zapomínají na několik důležitých skutečností:
- Dnešní PCI grafické karty již nevyhovují požadavkům na multimedia a 3D aplikace, navíc tolik vychvalované PCI sběrnice jsou již u konce se svou propustností. To samozřejmě až tak moc nevadí, protože průmysl již má v rukou řešení v podobě AGP s téměř 400 MB/s pro skutečně rychlé 3D aplikace. S tímto řešením však vzniká požadavek na nové grafické karty. Ale nejen to, samozřejmé budete potřebovat nový motherboard s podporou pro AGP. Bude skutečně zajímavé, když definicí marketingových strategií během jednoho či dvou let dojdeme k hranicím AGP kdo se odváži propagovat novou a výkonnější generaci softwaru, která pak bude mít nepředvídatelné požadavky na novou generaci hardwaru.
- Současné 3D grafické karty dostupné za přijatelnou cenu, jsou zřídkakdy schopné znázornit větší rozlišení než 1280 x 1024 bodů v 24 bitové hloubce (včetně nových karet na bázi EDORAM). K dosažení lepších výsledků si musíte zakoupit High-end grafickou kartu s VRAM nebo WRAM. Toto jsou jediné karty, které se mohou alespoň mírně přirovnat k systému ABOXu, navíc pouze co se rozlišení týče, ale rozhodně ne ve vztahu k ostatním vlastnostem.
- Mnoho grafických karet osazených čipy předních světových výrobců již nabízí rychlou 3D grafiku, ovšem pouze použitím nižších rozlišení a omezené hloubky barev. Jinými slovy: mnoho 3D enginů nevyužívá nejvyšší rozlišení, které jim čipy poskytují, ale většinou pouze 800 x 600 bodů v 16 bitové hloubce. Některé 3D enginy dokonce vůbec neumí využít 24 bitovou hloubku. CAIPIRINHA může jednoduše pokrýt tato rozlišení při 150 Hz občerstvovací frekvenci, přičemž dojde pouze k méně než 15% využití propustnosti. Ve skutečnosti to ještě pořád nemá co do činěni s REAL 3D grafikou (totéž se týká elegantně vypadajících konzoli), pro tu ještě většina dnešních systémů není dostatečně vybavená.
- Pro realističtější pohled na věc byste měli brát na vědomí omezení současných systémů. Často zmiňovaný teoretický vrchol výkonnosti standardních systémů je daleko vzdálenější realitě, než design čipu CAIPIRINHA od své maximální teoretické výkonnosti.
Znovu musíme připomenout, že dokonce i průmysl považuje PCI sběrnice za zastaralé. Tyto budou postupně nahrazovány technologií AGP ať už v PowerPC či x86 systémech, s urychlovacím faktorem 3. Ale to ještě pořád nepřekoná hranice a ani se nepřiblíží výkonnosti rychlé UMA architektury nebo CAIPIRINHY.
4. Jedním z argumentů proti UMA architektuře bylo tvrzení, že procesor by mohl mít omezený přístup k paměti. Při rychlosti sběrnice 50 MHz násobené 8 bajty (64-bitová sběrnice) je odhadovaná propustnost 400 MB/s. U systému s CAIPIRINHOU, kde může být procesorová sběrnice taktovaná na 100 MHz (je pravdou, že zatím PowerPC procesory tuto výkonnost nenabízí), můžeme dokonce propustnost odhadnout na 800 MB/s. Při porovnání s odhadovanou propustností samotné UMA paměti, jež bylo stanovena na 1600 MB/s, je jasné, že v praxi této výkonnosti nemůžeme nikdy dosáhnout. Tento fakt se ale bohužel týká i propustností 400 MB/s a 800 MB/s, protože i doposud nejrychlejší PowerPC procesory nemohou u příslušných aplikací zvládnout tak velký průtok dat. U ABOXu bude samozřejmě procesor od většiny přenosových prací osvobozen, protože ty za něj bude provádět CAIPIRINHA.
Dříve než bychom se měli pouštět do srovnávání řadičů PC systémů s UMA architekturou čipu CAIPIRINHA a odvolávat se na výsledky testů různých nezávislých časopisů, měli bychom si uvědomit, že dokonce u nejrychlejších Pentií a Pentií Pro je aktuální přístup do hlavní paměti menší než 100 MB/s. A dokonce i standardní řadič Motorola MPC 106 (kombinace paměti, cache a řadiče PCI sběrnice) s 60 ns pamětí RAM a 64bitovou datovou sběrnicí nepřesahuje maximum 133 MB/s (což je rovno výkonnosti nulového čekacího stavu řadiče RAM, taktovaného na 16 MHz), a v praxi bude samozřejmě daleko pomalejší. I kdyby PowerPC procesory díky velkému zatížení systému mohly od CAIPIRINHY přijímat data rychlostí pouze 200-300 MB/s, stále ještě tento systém po všech stránkách překoná všechny dnešní standardní koncepty, včetně těch, které budou k dispozici v roce 1997.
5. Dalším argumentem proti vysoké integraci, kterou vyžaduje koncept čipu CAIPIRINHA, je možnost jeho rozšíření. Lidé velmi rádi kritizují fakt, že řadič (včetně grafiky a zvuku)je integrován přímo do motherboardu, a není proto zaměnitelný skrze standardní sběrnicový systém. Toto řešení není zatím bohužel možné, protože v současné době neexistuje sběrnicový systém, který by nám poskytl dostatečnou výkonnost. Kromě toho zde existuje fakt, že CAIPIRINHA, která by měla být dokončena ještě v roce 1997, bude schopna využívat všechny dostupné technologie až na hranici jejich možností, jako například 100 MHz SDRAM paměti, které jsou k dispozici již téměř dva roky, ale teprve nyní se začínají používat, nebo 100 MHz sběrnice CPU, jež žádný procesor v současné době nevyužije na plný výkon. Díky svému designu bude CAIPIRINHA poskytovat léta maximální možnou výkonnost. Toto rozhodně nemůžeme očekávat od mnoha současných modulárních systémů. Pokud si dnes někdo například zakoupí PCI grafickou kartu, investuje do rychle stárnoucí technologie, přičemž nesmíme zapomínat na skutečnost, že PCI bude nahrazeno novou generací AGP technologie. Uvědomte si, že budete muset vymanit grafickou kartu a motherboard včetně všech řadičů. Přesto tato nová generace motherboardů s AGP pouze posouvá hranici výkonnosti ze 132 MB/s na přibližně 400 MB/s, přičemž se bude stále potýkat s omezeními v podobě rozšiřitelnosti. Jiné koncepty, kde je procesor spolu s cache a RAM umístěn na samostatné kartě, stojí při upgradu uživatele ještě více, protože většinou musí počítat s koupí nového procesoru, cache a systémového řadiče, včetně nových konektorů pro cache a paměť. Smysl těchto doplatků je více než diskutabilní, protože pokud budete chtít například zvýšit výkon svého systému přechodem na dokonalejší technologii cache a paměti (SDRAM), budete muset stejně vyměnit celé cache a paměťové moduly. Jak vidíte. ještě stále není zdaleka jasné, do jaké míry budou modulární systémy v budoucnosti dostačující a moderní...
Sestaveno s pomocí materiálů Phase5.

Vytlačiť článok

Pozn.: články boli naskenované ako text a preto obsahujú aj zopár chýb. Taktiež neručíme za zdrojové kódy (Asm, C, Arexx, AmigaGuide, Html) a odkazy na web. Dúfame, že napriek tomu vám táto databáza dobre poslúži.

Žiadna časť nesmie byť reprodukovaná alebo inak šírená bez písomného povolenia vydavatela © ATLANTIDA Publishing