Xilinx KCU116: Kustannustehokas 100 gbps:n verkko- ja tallennusalusta FPGA-kehitykseen
2021-07-27
Kintex® UltraScale+™ ‑perhettä pidetään hinnan, suorituskyvyn ja kannalta parhaana FPGA-laitteena. Tämä Xilinx®-tuoteperhe perustuu 16 nm:n TSMC FinFET -teknologiaan. Laitteessa yhdistyvät uusi UltraRAM ja uusi yhteyksien optimointiteknologia (SmartConnect). Se onkin kustannustehokkain ratkaisu sovelluksiin, joissa tarvitaan laadukkaita ja suorituskykyisiä lähetin-vastaanottimia 100 gbps:n yhteyksiin. Tuoteperhe on suunniteltu erityisesti verkko- ja tallennussovelluksin, kuten verkkopakettien käsittelyyn ja langattomaan MIMO-teknologiaan, 100 gbps:n langattomiin verkkoihin, teollisuuden ja datakeskusten verkkojen nopeuttamiseen sekä tallennuksen kiihdytykseen NVMe SSD ‑tekniikalla (solid-state drive, puolijohdetallennus). Tässä artikkelissa esitellään Xilinxin KCU116-arviointialustaa käyttävät toteutukset 100 gbps:n TCP Offload Engine ‑verkkoyhteyksille ja NVMe SSD -levyille. Näissä käytetään Design Gatewayn TOE100G-IP ‑ydintä, joka on tarkoitettu CPU-ratkaisuihin 12 gt/s:n TCP-tiedonsiirtonopeudella 100 GbE:n rajapinnan kautta, sekä NVMeG4-IP-ydintä, jolla saavutettava nopeus voi olla peräti noin 4 Gt/s per SSD.
Kintex® UltraScale+ KCU116 ‑arviointisarjan esittely
KCU116 on ihanteellinen ratkaisu tärkeimpien Kintex UltraScale+ ‑ominaisuuksien ja etenkin 28 gbps:n lähetin-vastaanottimen suorituskyvyn arviointiin. Sarja soveltuu hyvin XCKU5P-2FFVB676E FPGA ‑laitteeseen perustuvaan nopeaan prototyyppitestaukseen.
Kortilla on 1 Gt 32-bittistä DDR4-2666-muistia, FMC-laajennusportit 1 x M.2 NVMe SSD -levylle sekä PCIe Gen4 x8 ‑kaistat enintään 2 x M.2 NVMe SSD ‑rajapinnalle. 16 x 28 gbps:n GTY-lähetin-vastaanottimista on saatavana sekä PCIe Gen4- että 100 GbE ‑rajapintatoteutus ja ne tarjoavat lukuisia oheislaiterajapintoja sekä FPGA-logiikan käyttäjän räätälöimien ratkaisujen toteuttamiseen.
Kuva 1: KCU116-arviointisarja. (Kuvan lähde: Xilinx Inc.)
KCU116 tarjoaa yhdessä Design Gatewayn IP-ydinten kanssa käytettynä kaiken, mitä tarvitaan nykyaikaisten 100 gbps:n verkko- ja tallennusratkaisujen kehittämiseen tarvitsematta MPSoC-tukea.
100 gbps:n verkko- ja tallennusratkaisujen toteutus
Kuva 2: KCU116:n avulla toteutettava 100 gbps:n verkko- ja tallennusratkaisu. (Kuvan lähde: Design Gateway)
Vaikka Kintex UltraScale+ ‑laitteissa ei hyödynnetä MPSoC-teknologiaa, toisin kuin Zynq UltraScale+ ‑laitteissa, verkkotoiminnot ja NVMe-tallennusprotokollan käsittely voidaan Design Gatewayn IP Cores ‑ratkaisujen ansiosta toteuttaa ilman suorittimia ja käyttöjärjestelmää:
- TOE100G-IP: 100 GbE:n täydellinen TCP-protokollapino ja IP-ydin tarvitsematta CPU:ta
- NVMeG4-IP: Itsenäinen NVMe-isäntäohjain, jossa on sisäänrakennettu PCIe Gen4 Soft IP
Sekä laitetta TOE100G-IP että laitetta NVMeG4-IP voi käyttää ilman CPU:ta/käyttöjärjestelmää/ajuria. Molemmilla IP:illä voidaan toteuttaa ohjauksen ja datapolkujen käyttölogiikka pelkällä laitteistologiikalla tai Microblazen Bare metal ‑käyttöjärjestelmällä. Näin laadukkaita sovelluksia ja algoritmeja voidaan kehittää nopeammin ja helpommin ilman monimutkaisia verkko- ja NVMe-protokollia. Tämä tarjoaa uusia mahdollisuuksia kehittyneille järjestelmätason sovelluksille, kuten anturien datankeräykselle, kortilla tapahtuvalle laskennalle sekä AI-pohjaisille reunalaskentalaitteille.
Design Gatewayn TOE100G-IP UltraScale+-laitteelle
Kuva 3: TOE100G-IP-järjestelmät. (Kuvan lähde: Design Gateway)
TOE100G-IP-ytimen laitteistologiikalla toteutettava TCP/IP-pino käyttää Xilinxin 100 Gt:n Ethernet-alijärjestelmää alemman kerroksen laitteistona. TOE100G-IP:n käyttöliittymä koostuu ohjaussignaalien rekisterirajapinnasta ja datasignaalien FIFO-rajapinnasta. TOE100G-IP on suunniteltu yhdistettäväksi 100 Gt:n Ethernet-alijärjestelmään, joka yhdistetään käyttöliittymään käyttäen 512 bitin AXI4-ST-rajapintaa. Xilinxin toimittama Ethernet-alijärjestelmä tarjoaa EMAC-, PCS- ja PMA-toiminnot. 100 Gt:n Ethernet-alijärjestelmän käyttöliittymän kellotaajuus on 322,265625 MHz.
TOE100G-IP:n ominaisuudet
- Täydellinen TCP/IP-pinototeutus.
- Yksi TOE100G-IP tukee yhtä istuntoa (usean istunnon tuki voidaan toteuttaa käyttämällä useita TOE100G-IP-laitteita).
- Tukee sekä asiakas- että palvelintilaa (passiivinen/aktiivinen avaus ja sulku).
- Tukee Jumbo Framea.
- FIFO-vakiorajapintana toteutettu yksinkertainen datarajapinta.
- Yhden portin RAM-rajapintana toteutettu yksinkertainen ohjausrajapinta.
XCKU5P-2FFVB676E FPGA ‑laitteen FPGA-resurssien käyttö on esitetty seuraavassa taulukossa 1.
|
Taulukko 1: Kintex Ultrascale+ ‑laitteen esimerkkitoteutuksen tiedot
Katso lisätietoja TOE100G-IP:n teknisistä tiedoista, jotka voi ladata Design Gatewayn verkkosivustolta.
Design Gatewayn NVMe PCIe Gen4 ‑isäntäohjain GTY-lähetin-vastaanottimille
Kintex UltraScale+ ‑laite käyttää GTY-lähetin-vastaanotinta, joka tukee PCIe Gen4 ‑rajapintaa, mutta siinä ei ole PCIe Gen4 ‑integroitua lohkoa eikä ARM-prosessoria.
Design Gateway on ratkaissut tämän ongelman kehittämällä NVMe-isäntäohjaimena käytettävän itsenäisen NVMeG4-IP-ytimen, jossa PCIe soft IP ja PCIe-siltalogiikka on integroitu samaan ytimeen. NVMe PCIe Gen4 SSD ‑käytön salliminen yksinkertaistaa käyttöliittymää ja antaa mahdollisuuden suunnitella helppokäyttöisiä vakiotoimintoja tuntematta NVMe-protokollaa.
Kuva 4: NVMeG4-IP:n lohkokaavio. (Kuvan lähde: Design Gateway)
NVMeG4-IP:n ominaisuudet
- Toteuttaa sovelluskerroksen, transaktiokerroksen, datalinkkikerroksen ja joitakin fyysisen kerroksen osia, joiden avulla NVMe SSD:tä voidaan käyttää ilman CPU:ta ja ulkoista DDR-muistia.
- Toimii 4-kaistaiseksi PCIe Gen4:ksi konfiguroidun Xilinx PCIe PHY IP:n kanssa (256-bittinen väylärajapinta).
- Sisältää 256 kt:n RAM-datapuskurin.
- Tukee kuutta komentoa: tunnistus, sammutus, kirjoitus, lukuRead, SMART ja puskurin kirjoitus (haluttaessa tuki myös muille komennoille).
- Käyttäjän kellotaajuuden on oltava vähintään sama kuin PCIe-kellon (Gen4:ssä 250 MHz).
XCKU5P-2FFVB676E FPGA ‑laitteen FPGA-resurssien käyttö on esitetty seuraavassa taulukossa 2.
|
Taulukko 2: Kintex Ultrascale+ ‑laitteen esimerkkitoteutuksen tiedot.
Katso lisätietoja NVMeG4-IP:n teknisistä tiedoista, jotka voi ladata Design Gatewayn verkkosivustolta.
Esimerkki: TOE100G-IP:n toteutus ja suorituskykytulokset KCU116-arviontialustalla
Kuvassa 5 näyttää yleiskuvan KCU116-pohjaisesta referenssisuunnitelmasta, joka esittelee TOE100G-IP-toteutetuksen. Demojärjestelmään kuuluvat Microblazen Bare-metal OS, käyttölogiikka ja Xilinxin 100 Gt:n Ethernet-alijärjestelmä.
Kuva 5: TOE100G-IP-esimerkkijärjestelmän lohkokaavio. (Kuvan lähde: Design Gateway)
Esimerkkijärjestelmällä arvioidaan TOE100G-IP:n toimintaa sekä asiakas- että palvelintilassa. Testauslogiikka sallii testidatan lähettämisen ja vastaanottamisen käyttöliittymän korkeimman datansiirtonopeuden testaamiseksi. KCU116-alustalla toteutettavaan 100 GbE ‑rajapintaan tarvitaan neljä SFP+-lähetin-vastaanotinta (25GBASE-R) sekä kuitukaapelit, ks. kuva 6.
Kuva 6: KCU116-arviointialustalla toteutettu TOE100G-IP-demoympäristö. (Kuvan lähde: Design Gateway)
Kuvassa 7 on esitetty esimerkkitestin tulokset, joissa 100G:tä verrataan muihin vaihtoehtoihin (1G/10G/25G/40G).
Kuva 7: KCU116-alustalla toteutetun TOE100G-IP:n suorituskyky verrattuna muihin vaihtoehtoihin (1G/10G/25G/40G). (Kuvan lähde: Design Gateway)
Testituloksista käy ilmi, että TOE100G-IP:n TCP-tiedonsiirrossa saavuttama nopeus on noin 12 Gt/s.
Esimerkki: NVMeG4-IP:n toteutus ja suorituskykytulokset KCU116-arviointialustalla
Kuvassa 8 on esitetty KCU116-arviointialustalla toteutettu 1CH NVMeG4-IP:n käyttöä esittelevä referenssisuunnitelma. Tallennuskykyä voidaan parantaa toteuttamalla useita NVMeG4-IP-ilmentymiä, jos FPGA-resurssit ovat käytettävissä käyttäjän räätälöimässä ratkaisussa.
Katso lisätietoja NVMeG4-IP-referenssisuunnitelmasta Design Gateway verkkosivustolta löytyvästä NVMeG4-IP-referenssisuunnitelmasta.
Kuva 8: NVMeG4-IP-referenssisuunnitelman yleiskatsaus. (Kuvan lähde: Design Gateway)
Demojärjestelmä on suunniteltu kirjoittamaan ja tarkistamaan dataa KCU116-alustalla toteutetulla NVMe SSD:llä. Käyttäjä ohjaa testiä sarjakonsolin kautta. Jos KCU116-alustalla halutaan toteuttaa NVMe SSD ‑rajapinta, tarvitaan kuvassa 9 esitetty AB18-PCIeX16-sovitinlevy.
Kuva 9: KCU116-arviointialustalla toteutettu NVMeG4-IP-demoympäristö. (Kuvan lähde: Design Gateway)
Kuvassa 10 on esitetty tulokset esimerkkitestistä, jossa KCU116-alustalla toteutetussa demojärjestelmässä käytetään 512 Gt:n Samsung 970 Pro -levyä.
Kuva 10: KCU116-alustalla toteutetun NVMe SSD:n luku- ja kirjoitusnopeudet käytettäessä Samsung 970 PRO S -levyä. (Kuvan lähde: Design Gateway)
Yhteenveto
Sekä TOE100G-IP- että NVMeG4-IP-ydin tarjoavat ratkaisun hyödyntää KCU116-alustalla 100 gbps:n yhteysnopeutta sekä verkkotoimintojen että NVMe-tallennussovelluksen toteuttamisessa. Yksi TOE100G-IP voi siirtää 100 GbE ‑yhteyden ylitse noin 12 Gt dataa TCP-siirtona. NVMeG4-IP:n avulla voidaan toteuttaa NVMe PCIe Gen4:n kanssa erittäin suorituskykyinen tallennusratkaisu, noin 4 Gt/s per SSD. Useamman NVMeG4-IP-ilmentymän avulla voidaan rakentaa RAID0-ohjain ja kasvattaa tallennuskyky vastaamaan 100 GbE:n siirtonopeutta.
KCU116-arviointialustan ja Design Gatewayn IP-pohjaisten verkko- ja tallennusratkaisujen avulla voidaan saavuttaa mahdollisimman hyvä suorituskyky mahdollisimman pienellä FPGA-resurssien käytöllä ja toteuttaa erittäin kustannustehokas Xilinx® Kintex UltraScale+® ‑laitteeseen perustuva ratkaisu tai tuote.
Lisätietoa laitteista TOE100G-IP ja NVMeG4-IP on saatavana Design Gatewayn verkkosivustolta löytyvistä teknisistä tiedoista, referenssisuunnitelmista ja demoympäristöistä:
Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.