Po rozważeniu wszystkich tendencji jedno stało się jasne: istniejące architektury były najwyraźniej niewystarczające, aby sprostać przyszłym wymogom. Potrzeba nam było nowej architektury o elastyczności wystarczającej, aby mogła ona podejmować wyzwania dnia dzisiejszego i jutrzejszego.
Oto niektóre spośród kluczowych zadań projektowych X-Fi:
- optymalny stosunek ceny układu do jego wydajności : zgodnie z tradycją firmy Creative należało jak zwykle dostarczyć naszym klientom produkt najwyższej wartości. Wiadomo było, że aby upchnąć potrzebne elementy w jednym procesorze i przy odpowiednim progu cenowym, będziemy musieli skorzystać z najnowszych narzędzi i osiągnięć technologii VLSI (Very Large-Scale Integration),
- dynamiczny skok wydajności w sektorze podstawowym: Jeśli chodzi o naszych podstawowych użytkowników - graczy - wiedzieliśmy, że ci wciąż łakną czystej wydajności, i że wszelka poprawa odbioru ramek na sekundę będzie stanowiła klucz do sukcesu. Aby jednak przyciągnąć więcej użytkowników spoza owej grupy podstawowej, musieliśmy znaleźć sposoby aby zaoferować pokaźne i oczekiwane korzyści w przypadku bardziej ogólnych zastosowań audio,
- elastyczna architektura: Już wcześniej na kilku frontach doświadczyliśmy wpływu radykalnych zmian w architekturach pecetów i systemów operacyjnych, więc potrzebne nam było rozwiązanie, które mogłoby zapobiec ich ujemnym wpływom. Poza tym w miarę pojawiania się nowych kategorii produktów - jak np. gry konsolowe - wiedzieliśmy, że musimy mieć gotowe rozwiązanie dla owych pozapecetowych zastosowań. I wreszcie musieliśmy zaoferować produkt zapewniający najlepsze doznania niezależnie od zastosowania - w przeciwieństwie do obowiązującego dziś w świecie dźwięku modelu, wedle którego oferuje się rewelacyjne możliwości w zastosowaniach podstawowych, plus drugorzędną wydajność w pozostałych zastosowaniach,
- optymalizacja sprzętowo-programowa: X-Fi to nie tylko rozwiązanie sprzętowe. W końcu przecież sprzęt będzie musiał być komunikować się z systemem operacyjnym, w którym mieszka. To jest zadanie systemu sterowników i oprogramowania wyższego poziomu, a wydajność całego systemu zależy od tego, jak będziemy potrafili zoptymalizować komunikację pomiędzy naszymi własnymi sterownikami a sprzętem. Jest to warunek konieczny dla wyciągnięcia jak największej wydajności z danego systemu operacyjnego (oraz dla obejścia wszelkich wad systemu operacyjnego lub architektury komputera),
- elastyczne kierowanie sygnału: szeroka gama aplikacji, które mają być obsługiwane, ma różne wymagania, a zatem i różne topologie sygnału. Dzięki elastycznemu kierowaniu sygnału możemy realizować grafy o dowolnej złożoności i wychodzić naprzeciw potrzebom aplikacji znanych nam już dziś oraz nieznanych aplikacji jutra,
- mocny cyfrowy procesor sygnałowy (DSP): Nie wystarczy już jakikolwiek stary procesor DSP. W ramach naszej analizy zastosowań dźwiękowych określiliśmy najczęstsze operacje typowo dźwiękowe. Poprzez wbudowanie tych operacji w listę rozkazów procesora DSP, możemy uzyskać wyższą wydajność niż w przypadku procesorów ogólnego zastosowania. Poza tym dzięki naturze konstrukcyjnej procesora DSP, możemy utrzymywać warunki szczytowej wartości obciążenia przez dłuższy czas niż w przypadku konstrukcji procesora ogólnego, co ostatecznie daje wyższą przepustowość i skuteczną moc obliczeniową (MIPS lub FLOPS),
- obsługa sprzętowa dźwięku pozycyjnego: Podobnie jak naturalne sceny wizualne, otaczające nas naturalne środowisko dźwiękowe składa się ze zbioru obiektów, które albo emitują, albo odbijają dźwięki w złożony sposób. I tak jak modelowanie i rendering złożonych scenerii wizualnych, również realizacja wiarygodnych scenerii dźwiękowych wymaga modelowania nie tylko źródeł dźwięku, ale również złożonych relacji wzajemnych pomiędzy obiektami w otoczeniu słuchowym. Wiele czynników, jak np. przeszkody i zamknięcia, odgrywa zasadniczą rolę w uzyskiwaniu odczucia zanurzenia. W grach każde źródło wymaga niezależnego, ciągłego i dynamicznego przetwarzania, aby odpowiednio reagowało na każdy ruch gracza i obiektów wokół niego,
- zaawansowana konstrukcja przetworników częstotliwości próbkowania (SRC): Przetworniki SRC (Sample Rate Converters) wykorzystuje się na kilka sposobów do neutralizowania problemów związanych z systemem operacyjnym oraz z PCI, jak również w celu wykorzystania wyższej jakości przetworników cyfrowo-analogowych (DAC). W aktualnym modelu dźwiękowym przetworniki SRC postrzegane są jako zło konieczne, którego należy unikać gdzie się da. Wraz z nową architekturą X-Fi chcieliśmy zaoferować proces przetwarzania SRC tak wydajny i precyzyjny, żeby był on niewykrywalny, stając się tym samym elementem koniecznym, którego użytkownicy będą się domagać, zamiast go unikać,
- inteligentny dostęp bezpośredni do pamięci (DMA): równoważy problemy związane z systemem operacyjnym oraz z PCI,
- zaawansowane filtry: Zaawansowane filtry do obsługi wysoce złożonych modeli pogłosu oraz efektów przestrzennych. W ten sposób mogliśmy zaoferować najbogatsze, najbardziej realistyczne środowiska dźwiękowe w historii i to za pomocą dowolnego sprzętu odtwarzającego, począwszy od głośników 7.1, a na słuchawkach skończywszy.