Data is de driver van NASCAR en F1, en NoSQL staat op paal

Klik voor meer informatie over auteur Daniel Foulkes Leon.

Snelheid en kracht stimuleren de acceptatie van NoSQL-technologieën in de motorsport. Als het gaat om racen en snelheid, zijn de doelstellingen van de Formule 1- en NASCAR-teams hetzelfde. Winnen. En dat doen ze door de snelste auto te hebben, de meest bekwame coureurs aan te trekken en de beste strategische en competitieve beslissingen te nemen, zowel voor als tijdens de race. Betreed het tijdperk van gigantische datavolumes die exponentieel groeien: van een overvloed aan sensoren in de auto’s, de uniformen van de chauffeurs, baanscanners, videofeeds, weerberichten, noem maar op. Databasetechnologieën en hun beheer zijn nu factoren die niet alleen van invloed kunnen zijn op de beslissingen die op het circuit plaatsvinden, maar ze zijn ook de sleutel tot het veiligstellen van die podiumplaats.

Formule 1 en NASCAR halen duidelijke voordelen uit gegevensanalyse en -verwerking, maar hun implementaties en benaderingen verschillen sterk van elkaar. Binnen de Formule 1 zijn de telemetriegegevens van het team bedrijfseigen en streng bewaakt. NASCAR daarentegen maakt telemetriegegevens van alle voertuigen en teams in realtime beschikbaar voor fans, teams en OEM’s (Original Equipment Manufacturers, Ford, Chevy en Toyota voor NASCAR). Maar zowel de Formule 1 als NASCAR delen één belangrijk element: de snelle acceptatie van NoSQL-technologieën.

Afbeeldingsbron: Williams Racing onder licentie van Daniel Foulkes Leon
Afgebeeld: George Russel in auto nummer 63 tijdens een pitstop in 2020

Augusto Cardoso is de hoofdingenieur bij SportMedia Technologies (SMT), de partner van NASCAR die alle racegegevens verzamelt, verwerkt en naar verschillende doelgroepen verzendt. Cardoso gaf aan dat het tempo van hun adoptie toeneemt in meerdere sporten:

‘We hebben eerst geadopteerd MongoDB in de Motorsports-groep, die ongeveer drie jaar geleden begon. Het verving een SQL-database. We breiden ons gebruik van MongoDB uit in andere sporten zoals hockey en honkbal. Elke sport heeft zijn eigen vereisten, en MongoDB biedt grote flexibiliteit. “

Phillip Thomason, hoofdingenieur bij het Britse Formule 1-raceteam en constructeur voor Williams Racing, identificeert twee grote voordelen van het gebruik van NoSQL-technologieën: het doorbreken van de muren tussen voorheen geïsoleerde opslagplaatsen en het mogelijk maken van samenwerking tussen meerdere teams. NoSQL helpt bij het oplossen van bepaalde problemen die normaal gesproken optreden als silo’s goed zijn ingegraven. Thomason beschrijft hoe het was voordat ze NoSQL-technologieën gingen gebruiken: “Deze zoekopdrachten waren traag, handmatig en vaak praktisch onmogelijk. NoSQL heeft gebruikers toegang gegeven tot het potentieel van alle gegevens en verbeterde communicatie tussen afdelingen. “

Afbeeldingsbron: SMT onder licentie van Daniel Foulkes Leon
Afgebeeld: Kevin Harvick in auto nummer 04 tijdens een pitstop in 2020

In deze datarijke omgeving heeft het omarmen van de verscheidenheid en diversiteit van data door middel van een “juiste tool voor de job” -filosofie de NoSQL-technologieën in staat gesteld om de kracht en snelheid te bieden die deze teams nodig hebben.

Dit is geen sinecure, aangezien Formule 1-teams minstens 3 TB aan gegevens per race genereren en alleen al door NASCAR in één weekend meer dan 100 miljoen datapunten worden gecreëerd.

Gegevens worden van de auto’s naar de basisstations over het circuit verzonden en tools moeten dit snel verwerken, zowel voor analyse door de teams als voor het koppelen van video-animaties voor uitzendingen.

“In het geval van NASCAR moeten de gegevens in realtime klaar zijn voor meerdere doelgroepen”, zegt Cardoso en vervolgt:

“In Motorsports hebben we een aantal unieke toepassingen waarbij we een productietruck hebben die wekelijks naar elke locatie rijdt. We bieden services voor at-track-gebruikers, waaronder teams, autofabrikanten (OEM’s) en tv-omroepen. De uitdaging is dat we data moeten laten repliceren in zowel de truck als in de cloud. Klanten gebruiken de data zowel rechtstreeks vanuit onze truck als vanuit de cloud. Bij een internetprobleem kan de tv-uitzending niet stoppen. Onze lokale infrastructuur kan onafhankelijk werken, maar het merendeel van de prestatieanalyses en Data Science-gebruikers maakt verbinding met de cloud. “

Dataprestaties met een hoog octaangehalte zijn een essentieel onderdeel van het bedrijf, maar het mag niet ten koste gaan van de bruikbaarheid. Cardoso voegt eraan toe, “sinds we zijn verhuisd naar MongoDB, met een ‘in the truck’ en cloud aanwezigheid, hebben we geen enkel databasegerelateerd probleem gehad.”

Binnen de F1 proberen teams actief een concurrentievoordeel te behalen ten opzichte van elkaar, en het gebruik en de combinatie van verschillende technologieën is daarop geen uitzondering.

“F1-teams zijn verplicht om veel van de vereiste software ‘in-house’ te ontwikkelen, omdat deze simpelweg niet beschikbaar is op de markt”, legt Thomason uit, verder:

“Omdat we een relatief klein team zijn, wordt de technologiekeuze vaak gedreven door bestaande vaardigheden binnen het team. Vaak is er onvoldoende tijd (of middelen) om aanvullende vaardigheden te werven. We vertrouwen op zeer bekwame teamleden die allemaal aan de ‘full-stack’ werken en hun dagelijkse taken omvatten onderzoek naar nieuwe technologie. “

Binnen Williams is het proces van het samenbrengen van gestructureerde en ongestructureerde gegevens een belangrijk concurrentiegebied en een gebied waarop niet veel anders openbaar kan worden gemaakt.

“Dankzij NoSQL hebben gebruikers toegang tot het potentieel van alle gegevens en is de communicatie tussen afdelingen ook verbeterd.” Phillip Thomason, Williams Racing

Naarmate databasetechnologieën vooruitgaan in potentieel en kansen, nemen ook methoden toe. Motorsport is geen uitzondering in hoe de push voor DevOps-processen de weg wijzen naar Continuous Integration-Continuous Development (CI-CD). Over DevOps-processen voegde Thomason dat toe voor Williams in F1:

“We worden altijd geconfronteerd met uitdagingen op het gebied van tijd en middelen en streven ernaar de efficiëntie in alle gebieden van het bedrijf te verbeteren. Tools zoals Docker hebben ons in staat gesteld om het traditionele softwareontwikkelingsteam naar de DevOps-arena te verplaatsen en hebben geholpen om de grens tussen IT- en softwareafdelingen beter te definiëren. We hadden altijd een zeer snel software-updatemechanisme (release op basis van race-to-race), maar DevOps heeft ons zeker meer flexibiliteit gegeven. “

Telemetriegegevens zijn niet het enige type gegevens dat tijdens een race kan worden verzameld; andere bronnen kunnen ook een enorme impact hebben op de teams en hun bonussen. Een voorbeeld hiervan is Pit Stops. Sinds het verbod op tanken halverwege de race in de Formule 1, bevinden hun pitstops zich nu consequent in de grens van minder dan drie seconden, waarbij Williams de snelste pitstop behaalde in 2016. De drang naar kortere pitstops is ook te zien binnen NASCAR, waar teams kunnen de pitstop-tijden van alle auto’s tijdens de race volgen en volgen. Dit heeft ertoe geleid dat teams speciale bonussen aan hun teams toekennen, uitsluitend gebaseerd op de gegevens die door SMT zijn verzameld.

Afbeeldingsbron: NASCAR
Afgebeeld: een voorbeeld van een Pit Stop-rapport binnen de NASCAR Team Analytics-app ontwikkeld door SMT

NASCAR en SMT verwerken hun gegevens volledig via MongoDB en microservices. Cardoso gaf zelfs aan dat ze geen enkele productiefout hadden gehad sinds ze ze geïmplementeerd hadden:

“De microservices zijn zoveel sneller. Ik heb al een trechter met scripts en alles wat er is … Dus wat betreft de CI-CD is het veel gemakkelijker voor mij om deze dingen uit te rollen … en ik kan het gewoon toevoegen en bewerken. “

Over de acceptatie van gegevens voegde Thomason toe:

“De F1 is altijd datagestuurd geweest, en aangezien het bestuursorgaan ons beperkte wat we kunnen doen met testen (beperkte banden, computationele vloeistofdynamica, windtunnel- en baanproeven), had dit geleid tot een efficiëntiewinst rond de technologie om de maximaal profiteren van het hardlopen dat we mogen. De uitbreiding van telemetriegegevens werd daarom aangestuurd door de teams die op zoek waren naar een concurrentievoordeel. ”

Terwijl de twee sporten veel waarde hechten aan data en beide duidelijke vruchten plukken van de analyse, is hun aanpak heel anders. Voor de Formule 1 beschrijft Thomason het als een zeer waardevolle en begeerde bron:

“Gezien de geschiedenis van de F1, zouden teams op alle openbaar vrijgegeven gegevens springen om de prestaties van hun concurrenten te analyseren en zouden er aanzienlijke investeringen in middelen nodig zijn om teams competitief te houden.”

NASCAR is daarentegen opvallend anders. “Dat is één ding dat NASCAR deed”, voegde Cardoso eraan toe, “iedereen kan de gegevens van iedereen zien. Dus dat is heel belangrijk. En dat was allemaal NASCAR-beleid! Daarvoor beveel ik ze aan omdat dat het toegankelijker maakt. ”

Dit heeft geleid tot een heel andere benadering van de gegevens en hoe het concurrentievermogen eromheen is opgebouwd. Cardoso maakt deel uit van een team dat een applicatie heeft ontwikkeld die rechtstreeks door NASCAR, de teams en zijn OEM’s wordt gebruikt en waarmee het brandstofverbruik en de schatting van elke auto in realtime kan worden berekend. De applicatie wordt onmiddellijk uitgevoerd. Toen hij de snelheid van de resultaten liet zien, voegde Cardoso eraan toe: “Ik weet niet of je kunt begrijpen hoe snel dit was. Deze samenvoeging bestaat uit 28 fasen. ” Niet alleen kan een achterliggend team in realtime zien of de auto’s aan de leiding voldoende brandstof hebben om de race uit te rijden, maar ook fans en concurrenten kunnen meedenken naarmate de race vordert.

Afbeeldingsbron: NASCAR
Afgebeeld: voorbeeld van brandstofstatistieken binnen een datatoepassing die SMT heeft ontwikkeld voor NASCAR

Formule 1 en NASCAR behandelen telemetriegegevens misschien anders, maar beide willen dat hun gegevens zo snel mogelijk worden overgedragen. Gegevensoverdrachtssnelheden zijn het algemene knelpunt voor zowel F1 als NASCAR, omdat verbindingsproblemen kunnen optreden als gevolg van netwerkfouten of basisstations die tijdens regen langs de baan overstromen. Toch hebben ze al indrukwekkende latentiesnelheden bereikt. Binnen NASCAR is SMT in staat om de gegevens van het circuit naar hun on-prem truck, naar de cloud en naar hun gebruikers zelfs sneller te verwerken dan de algemene uitzendvertraging. Cardoso zei:

“Dus om je een idee te geven: als je op de baan bent, is de latentie van de data die we versturen ongeveer 5 tot 6 milliseconden. Het is echt snel. De gegevenslatentie wanneer het in de cloud komt, komt dichter bij 100 milliseconden. En die grote kloof, die in feite van de vrachtwagen naar het datacenter gaat, de snelste die ik kan krijgen, dat is ongeveer 60 milliseconden aan latentie. “

De drang naar hogere datasnelheden wordt ook gedeeld door Williams, zoals Thomason aangaf:

“De drive is om de verwerking zo dicht mogelijk bij de race te brengen om de latentie in de gegevensverwerking / streamverrijkingssuite te verminderen. Een tiende van een seconde die hier wordt bespaard, heeft een echt voordeel op het gebied van raceprestaties. “

Snelheid, kracht en veelzijdigheid zijn de vereisten van elk element van de motorsport, van aerodynamica tot bandenkwaliteit en telemetriestromen. Databasetechnologieën en architectuurmodellen zijn geen uitzondering. NoSQL is nu een ander betrouwbaar element om die volgende fractie van een seconde te helpen winnen.