RLS lattice koprocesor Zdeněk Pohl
Předchozí výsledky – IP core Logaritmická Aritmetika Implementace IP core Rozvrh Demo 19 % 30 % 52 % Virtex4 SX35
Cíle Odhadování řádu a zapomínání Vytvořit koprocesor Dynamická rekonfigurace
Odhadování řádu a zapomínání Hypotézy: řád modelu, zapomínání h1 = (řád 2, zap. 0.98), h2 = (řád 3, .99) Výsledek p(h1| Data), p(h2| Data) Pro každou hypotézu jeden RLS filtr Výhoda: Struktura RLS Lattice Order Update Order Update Order Update Order Update Input Řád 1 Řád 2 Řád 3 Řád 4
LNS aritmetika Číslo v LNS Odmocnina Obecná mocnina Podíl mocnin LNS19 8 bit, 10 bit LNS32 S 8 bit, 23 bit
Výpočet pravděpodobností Aktualizace pravděpodobností Normalizace a zapomínání RLS Lattice 0.98 RLS Lattice 0.99 p1 p2 Normalizace a zapomínání
Implementace koprocesoru EDK System Generator 89 % z Virtex4 SX35
Konfigurovatelnost Paralelní režim Pipeline režim Odhadování hypotéz Vysoký výkon RLS Lattice RLS Lattice
Dynamická rekonfigurace (1)
Dynamická rekonfigurace (2) Microblaze 1x SW Lattice Lattice 1 Lattice 2 Lattice 3 Lattice 4 ALU 2x A/S 4xMUL 4xDIV Lattice 1 Mem Lattice 2 Mem Lattice 3 Mem Lattice 4 Mem Lattice1 Mem float2log FSL0 Redirect Call Operace Čas / Řád Konverze 411 μs Reorganizace 3.9 μs Microblaze 1x SW Lattice Lattice 1 Lattice 2 Lattice 3 Lattice 4 ALU 2x A/S 4xMUL 4xDIV Lattice 1 Mem Lattice 2 Mem Lattice 3 Mem Lattice 4 Mem Lattice1 Mem FSL0 Redirect Activate All Pipeline split state
Dynamická rekonfigurace (3)
Závěr Vytvořen konfigurovatelný koprocesor Odhadováním řádu a zapomínání Podpora vnitřní reorganizace Max. Výkon 82 MFLOP což je 20x více než SW řešení na 4x větších hodinách