Home ❯ Blog ❯ Gli otto tratti essenziali dell'apprendimento automatico self-service

Gli otto tratti essenziali dell'apprendimento automatico self-service

Da Janet Jaiswal

Pubblicato il 13 dicembre 2018

5 minuti di lettura

I processi e i software self-service eliminano la complessità inutile negli ambienti professionali. Prendono ciò che è lento e complicato e lo rendono veloce e semplice. In contesti self-service, un maggior numero di persone risolve i problemi da solo, anziché affidarsi ad altri. La produttività aumenta e si crea maggior valore aziendale.

Attualmente, il ciclo di vita dell'apprendimento automatico (ML) - la costruzione, l'addestramento e la distribuzione di un modello di apprendimento automatico - soffre di una mancanza di self-service. Di conseguenza, molte organizzazioni sono bloccate da progetti di ML incerti, molti dei quali non vedono mai la luce.

L'apprendimento automatico ha bisogno di una trasformazione in self-service. Ecco gli otto tratti essenziali di una soluzione di apprendimento automatico self-service.

1. Il ML self-service consente di creare pipeline di integrazione una sola volta e di riutilizzarle.

Nell'apprendimento automatico, i data engineer e i data scientist ricreano ripetutamente le stesse (o simili) applicazioni e pipeline di integrazione dei dati. Ad esempio, se vogliono aggiungere dati al loro set di dati di addestramento, devono completare molte delle stesse attività di preparazione dei dati eseguite durante la compilazione dei dati di addestramento iniziali. Con l'apprendimento automatico self-service, se si crea una pipeline di integrazione durante la fase di preparazione dei dati, è possibile riutilizzarla per una serie di scopi, tra cui l'addestramento continuo del modello.

2. L'ML self-service sostituisce il codice con un'interfaccia visiva drag-and-drop, ove possibile.

Quando creano dataset di formazione, i data engineer e i data scientist dedicano molto tempo alla conversione di colonne categoriche in numeriche, alla pulizia dei valori mancanti, all'estrazione di componenti da oggetti datetime, al campionamento e al rimescolamento dei dati e ad altre funzioni preparatorie. E lo fanno in gran parte attraverso un'intensa attività di codifica in Python, Java o un altro linguaggio di programmazione. Una soluzione self-service consente di eseguire queste operazioni di routine puntando e facendo clic (trascinando e rilasciando). In questo modo si risparmia tempo che può essere dirottato verso le parti più strategiche dei progetti di apprendimento automatico.

3. Il ML self-service alleggerisce il carico di lavoro di IT e DevOps

Gli scienziati dei dati e gli ingegneri dell'apprendimento automatico dipendono spesso dall'IT per fornire i dati grezzi per l'addestramento dei loro modelli. Si affidano anche a DevOps per mettere in produzione il modello finale. I colli di bottiglia si formano inevitabilmente poiché l'IT e i DevOps bilanciano queste richieste di scienza dei dati con un grande elenco di altre priorità. Il ML self-service limita la quantità di lavoro pesante che i professionisti dell'IT e di DevOps devono svolgere, consentendo tra l'altro agli scienziati dei dati di reperire i propri dati di origine ed eliminando i passaggi aggiuntivi dal processo di distribuzione. Questo stimola la collaborazione tra IT, DevOps, ingegneri dei dati, specialisti dell'integrazione e data scientist.

4. Il ML self-service facilita gli aspetti strategici del ML che richiedono pensiero critico e capacità di programmazione.

I data scientist passano dal 53 all'80% del loro tempo a raccogliere, organizzare e pulire i dati. Dovrebbero invece sfruttare la loro abilità tecnica per risolvere problemi complessi, rispondere a domande difficili e ottenere risultati di business con l'apprendimento automatico. Il ML self-service automatizza le attività di routine a basso valore in modo da liberare tempo, energia e risorse per attività ad alto impatto.

5. Il ML self-service elimina la fase di traduzione del modello

Una volta che un modello è stato sottoposto a una formazione e a test rigorosi ed è finalmente pronto per essere messo in produzione, i DevOps devono metterlo in produzione. Per farlo, in genere devono tradurre il modello in un linguaggio di programmazione diverso, in parte per sincronizzarlo con l'infrastruttura tecnologica dell'organizzazione. Inoltre, devono avviare i server. Il ML self-service consente di distribuire il modello come API non appena è pronto, senza dover configurare server web e scrivere codice.

6. Il ML self-service semplifica l'addestramento continuo e il reimpiego del modello.

Se volete che il vostro modello continui a migliorare la sua precisione di previsione e ad adattarsi alle tendenze in evoluzione, dovete addestrarlo continuamente con dati aggiuntivi. In un ambiente convenzionale, ciò significa che dovete ripetere gli stessi passaggi, pesanti in termini di codice e di tempo, per acquisire i dati, aggiornare il dataset di addestramento, chiedere a DevOps di distribuire nuovamente il modello e così via. L'apprendimento automatico self-service riduce drasticamente la quantità di lavoro da ripetere per addestrare continuamente il modello. Permette di utilizzare le pipeline di integrazione costruite in precedenza per acquisire nuovi dati grezzi, prepararli, addestrare e convalidare il modello e rendere operativo il modello nuovo e migliorato.

7. Il ML self-service riduce il time-to-value delle vostre iniziative di machine learning

Le insidie degli approcci tradizionali all'apprendimento automatico prolungano il tempo necessario alle aziende per vedere i ritorni dei loro progetti di ML. In alcuni casi, le loro iniziative di ML si sgretolano completamente. Il ML self-service, eliminando il lavoro ripetuto, la codifica eccessiva e i colli di bottiglia, produce risultati positivi più rapidamente. Inoltre, consente alle organizzazioni di lanciare un numero maggiore di modelli ad alte prestazioni rispetto a quanto farebbero altrimenti.

8. Il ML self-service esiste in un'unica piattaforma

Quando le funzionalità self-service sono suddivise tra diversi programmi software, perdono proprio le qualità che giustificano la loro denominazione "self-service". Infatti, se si salta continuamente da un'applicazione "self-service" all'altra, si ostacola la produttività e si commettono errori. L'apprendimento automatico self-service è contenuto in un'unica soluzione intelligente. In questo modo, chi è impegnato nello sviluppo e nella produzione di ML può integrare applicazioni e dati, addestrare e convalidare modelli e distribuirli utilizzando un'unica piattaforma completa.

SnapLogic Data Science: L'apprendimento automatico self-service diventa realtà

SnapLogic Data Science, un'estensione di SnapLogic Intelligent Integration Platform (IIP), trasforma la teoria dell'apprendimento automatico self-service in realtà. Incarnando gli otto tratti essenziali dell'apprendimento automatico self-service, SnapLogic Data Science rende possibile l'apprendimento automatico per le organizzazioni di tutte le dimensioni. Aumenta in modo significativo la produttività dei data engineer e dei data scientist, accelerando così i progetti di ML. La creazione di modelli di apprendimento automatico è appena diventata molto più semplice.

Per saperne di più sul perché l'approccio self-service all'apprendimento automatico stia diventando un imperativo strategico, leggete il nostro ebook "L'alba dell'apprendimento automatico self-service: Correggere i difetti dello sviluppo ML tradizionale".

Janet Jaiswal

Ex vicepresidente del marketing di prodotto di SnapLogic

Categoria: SnapLogic

Argomenti: Piattaforma di integrazione intelligente Apprendimento automatico SnapLogic Data Science

Gli otto tratti essenziali dell'apprendimento automatico self-service

Blog correlati

Come ottenere il massimo dall'apprendimento automatico investendo in persone e tecnologia

L'apprendimento automatico ha un problema di integrazione dei dati: la necessità di un self-service

Integrazione di ecosistemi aziendali completi attraverso il self-service