Analytics operationeel maken met DataOps en ModelOps

Klik voor meer informatie over co-auteur Prashanth Southekal.

Klik voor meer informatie over co-auteur Harde Vardhan.

Als je de hype in de markt wilt scheiden van de realiteit waarmee organisaties worden geconfronteerd bij het operationaliseren van analyses, zul je een gat opmerken. In 2019 meldde Gartner dat meer dan 80 procent van de analyse-initiatieven geen zakelijke waarde opleverden, en volgens McKinsey & Company had minder dan 20 procent van de bedrijven analyses op schaal bereikt. [1]

In dit artikel willen we benadrukken hoe een organisatie dat kan vermijd misstappen in hun analytische reis en ervoor zorgen dat hun analyse-initiatieven bedrijfswaarde opleveren. Hoe kunnen ze analyses op schaal gebruiken om resultaten te verbeteren en voorkomen dat ze deel uitmaken van de 72 procent wiens AI-initiatieven zich in het laboratorium bevinden en niet in productie? [2]

Om AI- en analyse-initiatieven op te schalen en deze technologieën in operationele processen in te bedden, moeten organisaties naar onze mening kijken naar de volledige levenscyclus van analyses en mogelijkheden identificeren om aspecten van hun modelleerproces te automatiseren. Betreed de praktijken van DevOps en de toepassing ervan binnen analytische modellering (DataOps, ModelOps en DecisionOps).

Figuur 1: Analytische levenscyclus
Afbeeldingsbron: SAS Institute Inc.

Om een ​​level-set te bereiken, brengt DevOps ontwikkeling (Dev) en IT-bewerkingen (Ops) samen in een reeks organisatorische praktijken die bedoeld zijn om de levenscyclus van applicatie-ontwikkeling te verkorten en tegelijkertijd te resulteren in verbeterde kwaliteit, minder risico / downtime en een grotere set functies. Evenzo richten DataOps, ModelOps en DecisionOps zich op praktijken die bedoeld zijn om de gegevens gereed te maken, de modelontwikkeling van laboratorium tot productie te versnellen en beslissingskaders te implementeren die gebruikmaken van de onderstaande modellen. Het doel is om ontwikkelings-, prototyping-, test- en implementatiecycli te verminderen en ervoor te zorgen dat kwaliteitsresultaten en resultaten tijdig kunnen worden bereikt.

De toepassing van deze praktijken binnen de analytische levenscyclus kan op de volgende drie manieren profiteren:

1. Breek organisatorische silo’s:
Deze praktijken zijn gericht op samenwerking tussen zakelijke belanghebbenden, data-ingenieurs, datawetenschappers, IT-operaties en applicatieontwikkelingsteams. De continue feedbacklus helpt ervoor te zorgen dat de bedrijfsresultaten centraal blijven staan ​​tijdens het ontwerp- en ontwikkelingsproces en dat alle belanghebbenden dezelfde doelen nastreven, waardoor de kans op succes wordt vergroot.

2. Strategisch verkregen gegevens:
Meer dan 80 procent van het analytische werk is het gereedmaken van de gegevens voor analytische verwerking. DataOps vermindert deze inspanning met een geautomatiseerde, procesgeoriënteerde methodologie die de gehele levenscyclus van gegevens omvat, zodat u tijdig toegang kunt bieden tot gegevens van hoge kwaliteit uit verschillende bronnen, terwijl u de vereisten voor rentmeesterschap en governance handhaaft.

3. Geschaalde analytische responsiviteit:
De ingebouwde automatisering in DataOps, ModelOps en DecisionOps stelt de organisatie in staat snel te reageren op een achteruitgang in modelprestaties, waardoor analytische inzichten in meer processen kunnen worden ingebed, waardoor oplossingen worden geschaald en de analytische mogelijkheden worden gedemocratiseerd.

Dus, hoe kunnen organisaties de curve verkorten en bedrijfswaarde realiseren die aan deze praktijken is gekoppeld? Onze ervaring leert dat er drie sleutels zijn voor het toepassen van DevOps-praktijken in uw analytische levenscyclus:

  • Breng een CI / CD-pijplijn (Continuous Improvement / Continuous Delivery) tot stand die het modelversiebeheer, de scores, uitdager- / kampioenstoernooien, implementatie en testen automatiseert. Dit zorgt ervoor dat wijzigingen in de modellogica snel kunnen worden getest, eenvoudig kunnen worden geïmplementeerd en indien nodig zonder aanzienlijke overhead kunnen worden teruggedraaid.
  • Breng een proces tot stand om modellen in productie te monitoren, en zorg ervoor dat een datapijplijn automatisch zowel de modeltraining als de validatieprocessen voedt. Samen met passende waarschuwingen kan dit het automatisch schakelen van modellen in productie mogelijk maken of een menselijke tussenkomst activeren als de prestaties van het model onder de aanvaardbare zakelijke drempels vallen.
  • Gebruik A / B-testen (of Canarische implementaties) om alternatieve what-if-scenario’s te testen om ervoor te zorgen dat de zakelijke aannames achter geautomatiseerde beslissingen nog steeds geldig zijn.

Om analytische initiatieven succesvol te laten zijn, moeten organisaties zichzelf transformeren door holistisch te kijken naar de business case, cultuur, processen, gegevens en technologieën waarmee ze efficiënter meer geïntegreerde geavanceerde analyseoplossingen kunnen ontwikkelen en implementeren. Een goed gedefinieerde ModelOps-DataOps-benadering stelt een organisatie in staat om een ​​iteratief, snel, leerzaam en agile proces te hebben dat tijdig toegang biedt tot inzichten, wat resulteert in betere, beter geïnformeerde beslissingen.

Voor aanvullende informatie kunt u lezen hoe u het meeste uit uw AI-investering kunt halen operationaliseren van analyses.

Referenties

[1] Southekal, Prashanth, Praktische tips voor Analytics, Techniek, 2020
[2] Leone, Mike, “ESG-briefing: voorspellingen van kunstmatige intelligentie en analyse voor 2020, ”2019st

follow:
admin

admin

Related Posts

Een korte geschiedenis van gegevensbeheer

Datamanagement is de organisatie van gegevens, de stappen die worden gebruikt om efficiëntie te bereiken en informatie uit die gegevens

Datakans klopt! Moet je antwoorden?

Klik voor meer informatie over auteur Kartik Patel. Als zakenmensen krijgen we vaak te maken met wat misschien een geweldige

Een korte geschiedenis van gegevensbeheer

Datamanagement is de organisatie van gegevens, de stappen die worden gebruikt om efficiëntie te bereiken en informatie uit die gegevens

Datakans klopt! Moet je antwoorden?

Klik voor meer informatie over auteur Kartik Patel. Als zakenmensen krijgen we vaak te maken met wat misschien een geweldige