Terwijl Microsoft, AWS, Google Cloud en IBM hun generatieve AI-aanbod al hebben uitgebracht, heeft rivaal Oracle tot nu toe grotendeels stil gehouden over zijn eigen strategie. In plaats van overhaast een concurrerend aanbod te lanceren, bereidt het bedrijf stilletjes een aanpak op drie niveaus voor.
“Onze tier-strategie lijkt op een cake met drie lagen en elk van deze lagen richt zich op verschillende zakelijke klanten, afhankelijk van hun behoeften”, zegt Karan Batta, vice-president van Oracle Cloud Infrastructure (OCI).
Het eerste niveau bestaat volgens Batta uit de OCI Supercluster-service en is gericht op ondernemingen, zoals Cohere of Hugging Face, die werken aan de ontwikkeling van grote taalmodellen om hun klanten verder te ondersteunen.
OCI’s Supercluster omvat OCI Compute Bare Metal, dat een ultralow-latency remote direct access memory (RDMA) biedt via een Converged Ethernet (RoCE)-cluster op basis van netwerktechnologie, en een keuze uit high-performance computing-opslagopties.
De AI-supercomputing-service kan volgens Oracle duizenden OCI Compute Bare Metal-instanties ondersteunen met tienduizenden Nvidia A100 GPU’s voor het verwerken van massaal parallelle applicaties.
De service wordt ook geleverd met de basismodellen van Nvidia, zoals BioNeMo en Nvidia Picasso, samen met AI-training en bestuurskaders.
Rivaliserende cloudserviceproviders zoals Microsoft en Google werken ook samen met Nvidia om te profiteren van de DGX Cloud – een service die is gebaseerd op de technologie die OpenAI’s ChatGPT aandrijft.
AWS daarentegen biedt Amazon Elastic Compute Cloud (Amazon EC2) P5-instances, mogelijk gemaakt door NVIDIA H100 Tensor Core GPU’s, voor training van grote taalmodellen en het ontwikkelen van generatieve AI-applicaties.
Nieuwe generatieve AI-service is in de maak
Het tweede niveau van Oracle richt zich op ondernemingen die generatieve AI-mogelijkheden willen ontwikkelen op basis van hun eigen gegevens voor hun eigen verbruik, zei Batta, eraan toevoegend dat Oracle werkte aan het leveren van een nieuwe generatieve AI-service voor zijn OCI-klanten.
Hoewel de service nog geen formele naam heeft gekregen en het meeste ervan zich nog in de planningsfase bevindt, kwam de formele indicatie dat het bedrijf een dergelijke service plant in juni, kort nadat Oracle zijn investering in de Canadese startup Cohere aankondigde, die fundamentele modellen zal leveren als onderdeel van de nieuwe dienst.
De fundamentele structuur of het concept van de geplande generatieve AI-dienst lijkt echter sterk te lijken op concurrerende aanbiedingen van rivaliserende openbare cloudserviceproviders: een pakket tools aanbieden, waaronder basismodellen, snelle engineeringtools en governancekaders, waarmee ondernemingen kunnen trainen hun gegevens op.
Om bedrijven te helpen hun eigen generatieve AI-applicaties of assistenten te ontwikkelen, zal de nieuwe service verbinding maken met alle bedrijfsgegevensbronnen via connectoren en een kennisgrafiek creëren om deze door LLM-inbeddingen te laten lopen voor semantisch begrip voordat deze door grote taalmodellen wordt geleid om AI te genereren antwoorden, zei Batta.
“Wanneer een zakelijke gebruiker iets in natuurlijke taal opvraagt, voert de generatieve AI-assistent of -prompt een vectorzoekopdracht uit en worden de resultaten van de vectorzoekopdracht opgeslagen op een bedrijfsserver of -locatie voordat een API-aanroep wordt gedaan naar het grote taalmodel voor het genereren van antwoorden. ‘ voegde Batta eraan toe, waarmee hij het gegevensprivacy-aspect van de geplande dienst onderstreepte.
Hoewel nog niet bevestigd, zei Batta dat de nieuwe basismodellen op basis van industriesectoren zoals gezondheid en openbare veiligheid in de toekomst aan de dienst kunnen worden toegevoegd.
Andere generatieve AI-serviceaanbiedingen volgen?
Terwijl rivaliserende aanbiedingen van AWS, Google Cloud, Microsoft en IBM hebben uiteengezet hoe elk van de services gaat werken, zijn de meeste van deze services momenteel in preview.
AWS biedt basismodellen via zijn op generatieve AI gebaseerde service genaamd Amazon Bedrock, terwijl Microsoft API’s voor GPT-modellen aanbiedt via zijn Azure OpenAI-service.
Ook IBM en Google Cloud bieden fundamentele modellen als onderdeel van respectievelijk hun Watsonx- en Vertex AI-services.
IBM en Google Cloud bieden ook low-code platforms aan in de vorm van Tuning Studio en Generative AI Studio om ondernemingen te helpen bij het verfijnen van modellen.
Oracle moet daarentegen nog configureren hoe het bedrijven zal helpen toegang te krijgen tot gegevens en tools voor het afstemmen van modellen als onderdeel van de geplande service.
Maar volgens Batta neigt Oracle meer naar “programmatische toegang” in de eerste plaats voor technische gebruikers, zoals data-engineers en wetenschappers, in plaats van een low-code of geen code-ervaring te bieden aan niet-technische gebruikers “recht uit de poort”.
Dit betekent dat de generatieve AI-service van Oracle waarschijnlijk een prompt-tool in een SQL-query-editor zal bevatten, zei Batta, eraan toevoegend dat het bedrijf de elementen van de service zou kunnen veranderen voordat het tegen het einde van het jaar wordt gelanceerd.
Oracle is ook van plan de service uit te breiden naar bedrijven die hun data en applicaties in hun eigen datacenters hebben staan.
Generatieve AI-ondersteuning voor Fusion Cloud-apps, NetSuite
Oracle is van plan om generatieve AI-mogelijkheden toe te voegen aan zijn volledige portfolio van Fusion Cloud-applicaties en NetSuite-aanbiedingen door de basismodellen van Cohere in te bedden in het SaaS-aanbod, aldus het bedrijf.
Metadata van deze applicaties zullen worden gecombineerd met fundamentele modellen om generatieve AI-assistenten binnen deze applicaties aan te bieden om de productiviteit van werknemers te verhogen, zei Batta, waarbij hij de geplande assistent vergeleek met Microsofts Clippy.
De metadata van deze applicaties zullen het taalmodel helpen trends te identificeren en patronen te begrijpen in een bepaald SaaS-aanbod, voegde Batta eraan toe.
Vorige maand voegde het bedrijf vergelijkbare generatieve AI-mogelijkheden toe aan zijn Fusion Cloud Human Capital Management (HCM)-suite. Deze mogelijkheden omvatten geassisteerde creatie, suggesties en samenvattingen.
Terwijl assisted authoring HR-managers zal helpen om gemakkelijk functiebeschrijvingen en andere HR-gerelateerde inhoud te schrijven met behulp van een korte prompt, wordt verwacht dat de samenvattingsfunctie HR-managers zal helpen met taken zoals analyse van de prestaties van werknemers, aldus het bedrijf.
Aan de andere kant wordt van Suggesties als functie verwacht dat ze aanbevelingen doen voor verschillende taken, zoals het geven van enquêtevragen, enz., voegde het eraan toe.
Ook op de markt voor SaaS-applicaties heeft Oracle te maken met hevige concurrentie van onder meer AWS, Salesforce, ServiceNow en Microsoft.
Vorige week lanceerde AWS een nieuwe service, genaamd AppFabric, die tot doel heeft een uniforme generatieve AI-ervaring te bieden voor meerdere SaaS-applicaties.
Ook Salesforce gaf in juni een voorproefje van zijn gebundelde generatieve AI-aanbod, genaamd AI Cloud. Evenzo heeft ServiceNow vorige maand ook zijn generatieve AI-assistent verbeterd.
Oracle zal naar verwachting ook generatieve AI-mogelijkheden toevoegen aan zijn databaseportfolio, aldus Batta.
Datawarehouse- en data lakehouse-platforms zoals Snowflake en Databricks hebben ook hun eigen generatieve AI-mogelijkheden geïntroduceerd in de vorm van Snowpark Container Services en de Lakehouse AI-toolbox.