Xilinx KCU116: Kustannustehokas 100 gbps:n verkko- ja tallennusalusta FPGA-kehitykseen

Kirjoittaja Thanaporn Sangpaithoon

Kintex® UltraScale+™ ‑perhettä pidetään hinnan, suorituskyvyn ja kannalta parhaana FPGA-laitteena. Tämä Xilinx®-tuoteperhe perustuu 16 nm:n TSMC FinFET -teknologiaan. Laitteessa yhdistyvät uusi UltraRAM ja uusi yhteyksien optimointiteknologia (SmartConnect). Se onkin kustannustehokkain ratkaisu sovelluksiin, joissa tarvitaan laadukkaita ja suorituskykyisiä lähetin-vastaanottimia 100 gbps:n yhteyksiin. Tuoteperhe on suunniteltu erityisesti verkko- ja tallennussovelluksin, kuten verkkopakettien käsittelyyn ja langattomaan MIMO-teknologiaan, 100 gbps:n langattomiin verkkoihin, teollisuuden ja datakeskusten verkkojen nopeuttamiseen sekä tallennuksen kiihdytykseen NVMe SSD ‑tekniikalla (solid-state drive, puolijohdetallennus). Tässä artikkelissa esitellään Xilinxin KCU116-arviointialustaa käyttävät toteutukset 100 gbps:n TCP Offload Engine ‑verkkoyhteyksille ja NVMe SSD -levyille. Näissä käytetään Design Gatewayn TOE100G-IP ‑ydintä, joka on tarkoitettu CPU-ratkaisuihin 12 gt/s:n TCP-tiedonsiirtonopeudella 100 GbE:n rajapinnan kautta, sekä NVMeG4-IP-ydintä, jolla saavutettava nopeus voi olla peräti noin 4 Gt/s per SSD.

Kintex® UltraScale+ KCU116 ‑arviointisarjan esittely

KCU116 on ihanteellinen ratkaisu tärkeimpien Kintex UltraScale+ ‑ominaisuuksien ja etenkin 28 gbps:n lähetin-vastaanottimen suorituskyvyn arviointiin. Sarja soveltuu hyvin XCKU5P-2FFVB676E FPGA ‑laitteeseen perustuvaan nopeaan prototyyppitestaukseen.

Kortilla on 1 Gt 32-bittistä DDR4-2666-muistia, FMC-laajennusportit 1 x M.2 NVMe SSD -levylle sekä PCIe Gen4 x8 ‑kaistat enintään 2 x M.2 NVMe SSD ‑rajapinnalle. 16 x 28 gbps:n GTY-lähetin-vastaanottimista on saatavana sekä PCIe Gen4- että 100 GbE ‑rajapintatoteutus ja ne tarjoavat lukuisia oheislaiterajapintoja sekä FPGA-logiikan käyttäjän räätälöimien ratkaisujen toteuttamiseen.

Kuva: Xilinx KCU116 ‑arviointisarja (suurenna napsauttamalla)Kuva 1: KCU116-arviointisarja. (Kuvan lähde: Xilinx Inc.)

KCU116 tarjoaa yhdessä Design Gatewayn IP-ydinten kanssa käytettynä kaiken, mitä tarvitaan nykyaikaisten 100 gbps:n verkko- ja tallennusratkaisujen kehittämiseen tarvitsematta MPSoC-tukea.

100 gbps:n verkko- ja tallennusratkaisujen toteutus

Kaavio: KCU116:n avulla toteutettava 100 gbps:n verkko- ja tallennusratkaisuKuva 2: KCU116:n avulla toteutettava 100 gbps:n verkko- ja tallennusratkaisu. (Kuvan lähde: Design Gateway)

Vaikka Kintex UltraScale+ ‑laitteissa ei hyödynnetä MPSoC-teknologiaa, toisin kuin Zynq UltraScale+ ‑laitteissa, verkkotoiminnot ja NVMe-tallennusprotokollan käsittely voidaan Design Gatewayn IP Cores ‑ratkaisujen ansiosta toteuttaa ilman suorittimia ja käyttöjärjestelmää:

  1. TOE100G-IP: 100 GbE:n täydellinen TCP-protokollapino ja IP-ydin tarvitsematta CPU:ta
  2. NVMeG4-IP: Itsenäinen NVMe-isäntäohjain, jossa on sisäänrakennettu PCIe Gen4 Soft IP

Sekä laitetta TOE100G-IP että laitetta NVMeG4-IP voi käyttää ilman CPU:ta/käyttöjärjestelmää/ajuria. Molemmilla IP:illä voidaan toteuttaa ohjauksen ja datapolkujen käyttölogiikka pelkällä laitteistologiikalla tai Microblazen Bare metal ‑käyttöjärjestelmällä. Näin laadukkaita sovelluksia ja algoritmeja voidaan kehittää nopeammin ja helpommin ilman monimutkaisia verkko- ja NVMe-protokollia. Tämä tarjoaa uusia mahdollisuuksia kehittyneille järjestelmätason sovelluksille, kuten anturien datankeräykselle, kortilla tapahtuvalle laskennalle sekä AI-pohjaisille reunalaskentalaitteille.

Design Gatewayn TOE100G-IP UltraScale+-laitteelle

Kuva: TOE100G-IP-järjestelmätKuva 3: TOE100G-IP-järjestelmät. (Kuvan lähde: Design Gateway)

TOE100G-IP-ytimen laitteistologiikalla toteutettava TCP/IP-pino käyttää Xilinxin 100 Gt:n Ethernet-alijärjestelmää alemman kerroksen laitteistona. TOE100G-IP:n käyttöliittymä koostuu ohjaussignaalien rekisterirajapinnasta ja datasignaalien FIFO-rajapinnasta. TOE100G-IP on suunniteltu yhdistettäväksi 100 Gt:n Ethernet-alijärjestelmään, joka yhdistetään käyttöliittymään käyttäen 512 bitin AXI4-ST-rajapintaa. Xilinxin toimittama Ethernet-alijärjestelmä tarjoaa EMAC-, PCS- ja PMA-toiminnot. 100 Gt:n Ethernet-alijärjestelmän käyttöliittymän kellotaajuus on 322,265625 MHz.

TOE100G-IP:n ominaisuudet

  • Täydellinen TCP/IP-pinototeutus.
  • Yksi TOE100G-IP tukee yhtä istuntoa (usean istunnon tuki voidaan toteuttaa käyttämällä useita TOE100G-IP-laitteita).
  • Tukee sekä asiakas- että palvelintilaa (passiivinen/aktiivinen avaus ja sulku).
  • Tukee Jumbo Framea.
  • FIFO-vakiorajapintana toteutettu yksinkertainen datarajapinta.
  • Yhden portin RAM-rajapintana toteutettu yksinkertainen ohjausrajapinta.

XCKU5P-2FFVB676E FPGA ‑laitteen FPGA-resurssien käyttö on esitetty seuraavassa taulukossa 1.

Perhe Esimerkkilaite Fmax (MHz) CLB-rek. CLB-LUT CLB IOB BRAMTile URAM GTY Suunnittelutyökalut
Kintex-Ultrascale+ XCKU5P-FFVB676-2E 350 12883 17535 3208 - 53 - 4 Vivado2019.1

Taulukko 1: Kintex Ultrascale+ ‑laitteen esimerkkitoteutuksen tiedot

Katso lisätietoja TOE100G-IP:n teknisistä tiedoista, jotka voi ladata Design Gatewayn verkkosivustolta.

Design Gatewayn NVMe PCIe Gen4 ‑isäntäohjain GTY-lähetin-vastaanottimille

Kintex UltraScale+ ‑laite käyttää GTY-lähetin-vastaanotinta, joka tukee PCIe Gen4 ‑rajapintaa, mutta siinä ei ole PCIe Gen4 ‑integroitua lohkoa eikä ARM-prosessoria.

Design Gateway on ratkaissut tämän ongelman kehittämällä NVMe-isäntäohjaimena käytettävän itsenäisen NVMeG4-IP-ytimen, jossa PCIe soft IP ja PCIe-siltalogiikka on integroitu samaan ytimeen. NVMe PCIe Gen4 SSD ‑käytön salliminen yksinkertaistaa käyttöliittymää ja antaa mahdollisuuden suunnitella helppokäyttöisiä vakiotoimintoja tuntematta NVMe-protokollaa.

Kuva: NVMeG4-IP:n lohkokaavioKuva 4: NVMeG4-IP:n lohkokaavio. (Kuvan lähde: Design Gateway)

NVMeG4-IP:n ominaisuudet

  • Toteuttaa sovelluskerroksen, transaktiokerroksen, datalinkkikerroksen ja joitakin fyysisen kerroksen osia, joiden avulla NVMe SSD:tä voidaan käyttää ilman CPU:ta ja ulkoista DDR-muistia.
  • Toimii 4-kaistaiseksi PCIe Gen4:ksi konfiguroidun Xilinx PCIe PHY IP:n kanssa (256-bittinen väylärajapinta).
  • Sisältää 256 kt:n RAM-datapuskurin.
  • Tukee kuutta komentoa: tunnistus, sammutus, kirjoitus, lukuRead, SMART ja puskurin kirjoitus (haluttaessa tuki myös muille komennoille).
  • Käyttäjän kellotaajuuden on oltava vähintään sama kuin PCIe-kellon (Gen4:ssä 250 MHz).

XCKU5P-2FFVB676E FPGA ‑laitteen FPGA-resurssien käyttö on esitetty seuraavassa taulukossa 2.

Perhe Esimerkkilaite Fmax (MHz) CLB-rek. CLB-LUT CLB IOB BRAMTile URAM GTY Suunnittelutyökalut
Kintex-Ultrascale+ XCKU5P-FFVB676-2E 300 19214 21960 4382 - 12 8 4 Vivado2019.1

Taulukko 2: Kintex Ultrascale+ ‑laitteen esimerkkitoteutuksen tiedot.

Katso lisätietoja NVMeG4-IP:n teknisistä tiedoista, jotka voi ladata Design Gatewayn verkkosivustolta.

Esimerkki: TOE100G-IP:n toteutus ja suorituskykytulokset KCU116-arviontialustalla

Kuvassa 5 näyttää yleiskuvan KCU116-pohjaisesta referenssisuunnitelmasta, joka esittelee TOE100G-IP-toteutetuksen. Demojärjestelmään kuuluvat Microblazen Bare-metal OS, käyttölogiikka ja Xilinxin 100 Gt:n Ethernet-alijärjestelmä.

Kuva: TOE100G-IP-esimerkkijärjestelmän lohkokaavioKuva 5: TOE100G-IP-esimerkkijärjestelmän lohkokaavio. (Kuvan lähde: Design Gateway)

Esimerkkijärjestelmällä arvioidaan TOE100G-IP:n toimintaa sekä asiakas- että palvelintilassa. Testauslogiikka sallii testidatan lähettämisen ja vastaanottamisen käyttöliittymän korkeimman datansiirtonopeuden testaamiseksi.  KCU116-alustalla toteutettavaan 100 GbE ‑rajapintaan tarvitaan neljä SFP+-lähetin-vastaanotinta (25GBASE-R) sekä kuitukaapelit, ks. kuva 6.

Kuva: KCU116-arviointialustalla toteutettu TOE100G-IP-demoympäristöKuva 6: KCU116-arviointialustalla toteutettu TOE100G-IP-demoympäristö. (Kuvan lähde: Design Gateway)

Kuvassa 7 on esitetty esimerkkitestin tulokset, joissa 100G:tä verrataan muihin vaihtoehtoihin (1G/10G/25G/40G).

Kaavio: KCU116-alustalla toteutetun TOE100G-IP:n suorituskyky verrattuna muihin vaihtoehtoihin (1G/10G/25G/40G)Kuva 7: KCU116-alustalla toteutetun TOE100G-IP:n suorituskyky verrattuna muihin vaihtoehtoihin (1G/10G/25G/40G). (Kuvan lähde: Design Gateway)

Testituloksista käy ilmi, että TOE100G-IP:n TCP-tiedonsiirrossa saavuttama nopeus on noin 12 Gt/s.

Esimerkki: NVMeG4-IP:n toteutus ja suorituskykytulokset KCU116-arviointialustalla

Kuvassa 8 on esitetty KCU116-arviointialustalla toteutettu 1CH NVMeG4-IP:n käyttöä esittelevä referenssisuunnitelma. Tallennuskykyä voidaan parantaa toteuttamalla useita NVMeG4-IP-ilmentymiä, jos FPGA-resurssit ovat käytettävissä käyttäjän räätälöimässä ratkaisussa.

Katso lisätietoja NVMeG4-IP-referenssisuunnitelmasta Design Gateway verkkosivustolta löytyvästä NVMeG4-IP-referenssisuunnitelmasta.

Kaavio: NVMeG4-IP-referenssisuunnitelman yleiskatsausKuva 8: NVMeG4-IP-referenssisuunnitelman yleiskatsaus. (Kuvan lähde: Design Gateway)

Demojärjestelmä on suunniteltu kirjoittamaan ja tarkistamaan dataa KCU116-alustalla toteutetulla NVMe SSD:llä. Käyttäjä ohjaa testiä sarjakonsolin kautta. Jos KCU116-alustalla halutaan toteuttaa NVMe SSD ‑rajapinta, tarvitaan kuvassa 9 esitetty AB18-PCIeX16-sovitinlevy.

Kuva: KCU116-arviointialustalla toteutettu NVMeG4-IP-demoympäristö (suurenna napsauttamalla)Kuva 9: KCU116-arviointialustalla toteutettu NVMeG4-IP-demoympäristö. (Kuvan lähde: Design Gateway)

Kuvassa 10 on esitetty tulokset esimerkkitestistä, jossa KCU116-alustalla toteutetussa demojärjestelmässä käytetään 512 Gt:n Samsung 970 Pro -levyä.

Kaavio: KCU116-alustalla toteutetun NVMe SSD:n luku- ja kirjoitusnopeudet käytettäessä Samsung 970 PRO S -levyäKuva 10: KCU116-alustalla toteutetun NVMe SSD:n luku- ja kirjoitusnopeudet käytettäessä Samsung 970 PRO S -levyä. (Kuvan lähde: Design Gateway)

Yhteenveto

Sekä TOE100G-IP- että NVMeG4-IP-ydin tarjoavat ratkaisun hyödyntää KCU116-alustalla 100 gbps:n yhteysnopeutta sekä verkkotoimintojen että NVMe-tallennussovelluksen toteuttamisessa. Yksi TOE100G-IP voi siirtää 100 GbE ‑yhteyden ylitse noin 12 Gt dataa TCP-siirtona. NVMeG4-IP:n avulla voidaan toteuttaa NVMe PCIe Gen4:n kanssa erittäin suorituskykyinen tallennusratkaisu, noin 4 Gt/s per SSD. Useamman NVMeG4-IP-ilmentymän avulla voidaan rakentaa RAID0-ohjain ja kasvattaa tallennuskyky vastaamaan 100 GbE:n siirtonopeutta.

KCU116-arviointialustan ja Design Gatewayn IP-pohjaisten verkko- ja tallennusratkaisujen avulla voidaan saavuttaa mahdollisimman hyvä suorituskyky mahdollisimman pienellä FPGA-resurssien käytöllä ja toteuttaa erittäin kustannustehokas Xilinx® Kintex UltraScale+® ‑laitteeseen perustuva ratkaisu tai tuote.

Lisätietoa laitteista TOE100G-IP ja NVMeG4-IP on saatavana Design Gatewayn verkkosivustolta löytyvistä teknisistä tiedoista, referenssisuunnitelmista ja demoympäristöistä:

https://dgway.com/TOE100G-IP_X_E.html

https://dgway.com/NVMeG4-IP_X_E.html

Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.

Tietoja kirjoittajasta

Image of Thanaporn Sangpaithoon

Thanaporn Sangpaithoon

Thanaporn Sangpaithoon has been working at Design Gateway Co., Ltd. since 2001. He has been involved in FPGA design projects and successfully developed Serial ATA IP Core on Xilinx Virtex-4 in 2006. Now he is General Manager, responsible for sales and business development.