Amazon SageMaker Data Wrangler offre agli sviluppatori il modo più semplice e veloce per preparare i dati per l’apprendimento automatico
Amazon SageMaker Feature Store offre un archivio dati appositamente creato per l’archiviazione, l’aggiornamento, il recupero e la condivisione di funzionalità di apprendimento automatico
Amazon SageMaker Pipelines offre agli sviluppatori il primo servizio di integrazione continua e distribuzione continua (CI / CD) progettato appositamente e di facile utilizzo per l’apprendimento automatico
Amazon SageMaker Clarify offre agli sviluppatori una maggiore visibilità sui dati di formazione in modo che possano limitare i pregiudizi nei modelli di apprendimento automatico e spiegare le previsioni
Profilazione profonda per Amazon SageMaker Debugger monitora le prestazioni del training di machine learning per aiutare gli sviluppatori a addestrare i modelli più velocemente
Formazione distribuita su Amazon SageMaker offre nuove funzionalità in grado di addestrare modelli di grandi dimensioni fino a due volte più velocemente di quanto sarebbe altrimenti possibile con i processori di machine learning di oggi
Amazon SageMaker Edge Manager offre il monitoraggio e la gestione del modello di apprendimento automatico per i dispositivi periferici per garantire che i modelli distribuiti in produzione funzionino correttamente
Amazon SageMaker JumpStart fornisce un portale per sviluppatori per modelli pre-addestrati e flussi di lavoro predefiniti
SEATTLE- (BUSINESS WIRE) – : Invent,Amazon Web Services, Inc. (AWS), un file Amazon.com, Inc. azienda (NASDAQ: AMZN), ha annunciato nove nuove funzionalità per il suo servizio di machine learning leader del settore, AmazonSageMaker, rendendo ancora più semplice per gli sviluppatori automatizzare e ridimensionare tutti i passaggi del flusso di lavoro di machine learning end-to-end. Gli annunci di oggi riuniscono nuove potenti funzionalità come una preparazione più rapida dei dati, un repository appositamente creato per i dati preparati, l’automazione del flusso di lavoro, una maggiore trasparenza nei dati di addestramento per mitigare i pregiudizi e spiegare le previsioni, capacità di formazione distribuite per addestrare modelli di grandi dimensioni fino a due volte più velocemente e monitoraggio del modello su dispositivi periferici.
L’apprendimento automatico sta diventando sempre più diffuso, ma si sta ancora evolvendo a un ritmo rapido. Con tutta l’attenzione che il machine learning ha ricevuto, sembra che dovrebbe essere semplice creare modelli di machine learning, ma non lo è. Per creare un modello, gli sviluppatori devono iniziare con il processo altamente manuale di preparazione dei dati. Quindi devono visualizzarlo nei notebook, scegliere l’algoritmo giusto, impostare il framework, addestrare il modello, mettere a punto milioni di possibili parametri, distribuire il modello e monitorarne le prestazioni. Questo processo deve essere ripetuto continuamente per garantire che il modello funzioni come previsto nel tempo. In passato, questo processo metteva l’apprendimento automatico fuori dalla portata di tutti tranne che degli sviluppatori più esperti. Però,Amazon SageMaker lo ha cambiato. AmazonSageMaker è un servizio completamente gestito che elimina le sfide da ogni fase del processo di apprendimento automatico, rendendo radicalmente più facile e veloce per sviluppatori e data scientist di tutti i giorni creare, addestrare e distribuire modelli di apprendimento automatico. Decine di migliaia di clienti utilizzanoAmazon SageMaker per accelerare le loro implementazioni di machine learning, tra cui 3M, ADP, AstraZeneca, Avis, Bayer, Bundesliga, Capital One, Cerner, Chick-fil-A, Convoy, Domino’s Pizza, Fidelity Investments, GE Healthcare, Georgia-Pacifico, Hearst, iFood, iHeartMedia, JPMorgan Chase, Intuit, Lenovo, Lyft, National Football League, Nerdwallet, T-Mobile, Thomson Reuters e Vanguard.
Gli annunci di oggi si basano sulle oltre 50 novità Amazon Funzionalità di SageMaker che AWS ha fornito lo scorso anno per rendere ancora più semplice per sviluppatori e data scientist preparare, costruire, addestrare, distribuire e gestire modelli di machine learning, tra cui:
- Amazon Preparazione automatica dei dati di SageMaker Data Wrangler: AmazonSageMaker Data Wrangler offre il modo più semplice e veloce per preparare i dati per l’apprendimento automatico. La preparazione dei dati per l’apprendimento automatico è un processo difficile. Questa difficoltà deriva dal fatto che gli attributi dei dati (noti come funzionalità) utilizzati per addestrare un modello di apprendimento automatico spesso provengono da fonti diverse ed esistono in vari formati. Ciò significa che gli sviluppatori devono dedicare molto tempo all’estrazione e alla normalizzazione di questi dati in modo che sia sempre facile da usare con l’apprendimento automatico. I clienti potrebbero anche voler combinare funzionalità in funzionalità composite per fornire al modello di machine learning input più utili. Ad esempio, un cliente potrebbe voler creare una funzionalità che descriva un gruppo di clienti che spendono in modo prolifico in modo che possano essere offerti premi del programma fedeltà combinando funzionalità per articoli acquistati in precedenza, importo speso, e la frequenza degli acquisti. Il lavoro associato alla trasformazione dei dati in funzionalità è chiamato ingegneria delle funzionalità e richiede molto tempo agli sviluppatori quando creano modelli di machine learning.AmazonSageMaker Data Wrangler semplifica radicalmente il processo di preparazione dei dati e ingegnerizzazione delle caratteristiche. ConAmazon SageMaker Data Wrangler, i clienti possono scegliere i dati desiderati dai loro vari archivi dati e importarli con un solo clic. AmazonSageMaker Data Wrangler contiene oltre 300 trasformatori di dati incorporati che possono aiutare i clienti a normalizzare, trasformare e combinare le funzionalità senza dover scrivere alcun codice, gestendo al contempo tutta l’infrastruttura di elaborazione sotto il cofano. I clienti possono visualizzare in anteprima e controllare rapidamente che queste trasformazioni siano ciò che era previsto visualizzandole inSageMaker Studio(il primo ambiente di sviluppo integrato end-to-end per l’apprendimento automatico). Una volta che le funzionalità sono state progettate,Amazon SageMaker Data Wrangler li salverà per il riutilizzo in Amazon SageMaker Feature Store.
- Amazon SageMaker Feature Store archiviazione e gestione delle funzionalità: Amazon SageMaker Feature Storefornisce un nuovo repository che semplifica l’archiviazione, l’aggiornamento, il recupero e la condivisione di funzionalità di machine learning per l’addestramento e l’inferenza. Oggi i clienti possono salvare le proprie funzionalità inAmazon Simple Storage Service (S3). This works well for a simple set of features that are mapped to a single model, but most features are not mapped to only one model. Most features are used repeatedly by multiple models and multiple developers and data scientists, and as new features are created, developers also want to be able to reuse them repeatedly. This leads to multiple S3 objects to manage, which can quickly become difficult to manage. Developers and data scientists try to solve this by using spreadsheets, paper notes, and emails. Sometimes they even try to build a custom application to keep track of the features, but this is a lot of work and error-prone. Further, developers and data scientists need the same features not only to train multiple models with all of the data available and where this activity can happen over hours, but also to use during inference when the predictions need to be returned in milliseconds and often use just a subset of the data in relevant features. For example, a developer might want to create a model that predicts the next best song in a playlist. To do this, developers would train the model on thousands of songs and then provide the model the last three songs played during inference to predict the next song. Training and inference are very different uses cases. During training, the models can access the features offline and in batch, but for inference, the model needs only a subset of the features in near real-time. Since machine learning models have a single source of features that need to be consistent, these different access patterns make it challenging to keep the features consistent and up to date. Amazon SageMaker Feature Storerisolve questo problema fornendo un archivio di funzionalità appositamente costruito in cui gli sviluppatori possono accedere e condividere funzionalità che rendono molto più facile nominare, organizzare, trovare e condividere set di funzionalità tra team di sviluppatori e data scientist. DaAmazon SageMaker Feature Store risiede in Amazon SageMaker Studio, vicino a dove vengono eseguiti i modelli di machine learning, fornisce una latenza di millisecondi a una cifra per l’inferenza. Amazon SageMaker Feature Storerende semplice e facile organizzare e aggiornare grandi lotti di funzionalità per l’addestramento e istanze più piccole di esse per inferenza. In questo modo, esiste una vista coerente delle funzionalità da utilizzare per i modelli di apprendimento automatico e diventa notevolmente più semplice generare modelli che producono previsioni estremamente accurate.
- Amazon Gestione e automazione del flusso di lavoro di SageMaker Pipelines :AmazonSageMaker Pipelines è il primo servizio di integrazione continua e distribuzione continua (CI / CD) progettato appositamente e di facile utilizzo per l’apprendimento automatico. Come i clienti possono vedere con l’ingegneria delle funzionalità, l’apprendimento automatico comprende più passaggi che possono trarre vantaggio dall’orchestrazione e dall’automazione. Ciò non è dissimile dalla programmazione tradizionale, in cui i clienti dispongono di strumenti come CI / CD per aiutarli a sviluppare e distribuire le applicazioni più rapidamente. Tuttavia, con l’apprendimento automatico, gli strumenti CI / CD vengono utilizzati raramente perché non esistono o perché sono difficili da impostare, configurare e gestire. ConAmazonSageMaker Pipelines, gli sviluppatori possono definire ogni passaggio di un flusso di lavoro di machine learning end-to-end. Questi flussi di lavoro includono i passaggi di caricamento dei dati, le trasformazioni daAmazon SageMaker Data Wrangler, funzionalità memorizzate in Amazon SageMaker Feature Store, configurazione dell’addestramento e impostazione dell’algoritmo, passaggi di debug e passaggi di ottimizzazione. ConAmazon SageMaker Pipelines, gli sviluppatori possono facilmente rieseguire un flusso di lavoro end-to-end da Amazon SageMaker Studio, utilizzando le stesse impostazioni per ottenere ogni volta lo stesso identico modello, oppure possono rieseguire il flusso di lavoro a intervalli regolari con nuovi dati per aggiornare un modello. Amazon SageMaker Pipelines registra ogni passaggio Amazon Esperimenti SageMaker (un file AmazonCapacità di SageMaker che organizza e tiene traccia degli esperimenti di machine learning e delle versioni del modello) ogni volta che viene eseguito un flusso di lavoro. Ciò aiuta gli sviluppatori a visualizzare e confrontare le iterazioni del modello di apprendimento automatico, i parametri di addestramento e i risultati. ConAmazon SageMaker Pipelines, i flussi di lavoro possono essere condivisi e riutilizzati tra i team, per ricreare un modello o per fungere da punto di partenza per apportare miglioramenti attraverso nuove funzionalità, algoritmi o ottimizzazioni.
- AmazonSageMaker Chiarire il rilevamento e la spiegabilità dei bias:AmazonSageMaker Clarify fornisce il rilevamento dei pregiudizi nel flusso di lavoro di apprendimento automatico, consentendo agli sviluppatori di creare maggiore equità e trasparenza nei loro modelli di apprendimento automatico. Una volta che gli sviluppatori hanno preparato i dati per l’addestramento e l’inferenza, devono cercare di garantire che i dati siano privi di pregiudizi statistici e che le previsioni del modello siano trasparenti, in modo che possano spiegare in che modo le caratteristiche del modello stanno contribuendo alle previsioni. Oggi, gli sviluppatori a volte cercano di utilizzare strumenti open source per rilevare errori statistici nei loro dati, ma questi strumenti richiedono molto lavoro manuale e codifica e sono generalmente soggetti a errori. ConAmazon SageMaker Chiarire, gli sviluppatori possono ora rilevare più facilmente i pregiudizi statistici nell’intero flusso di lavoro di apprendimento automatico e fornire spiegazioni per le previsioni che stanno facendo i loro modelli di apprendimento automatico. Amazon SageMaker Clarify si integra con AmazonSageMaker Data Wrangler in cui esegue una serie di algoritmi sulle funzionalità per identificare i bias durante la preparazione dei dati con visualizzazioni che includono una descrizione delle origini e la gravità dei possibili bias. In questo modo, gli sviluppatori possono adottare misure per la mitigazione.Amazon SageMaker Clarify si integra anche con AmazonEsperimenti SageMaker per semplificare il controllo dei modelli addestrati per la distorsione statistica. Descrive inoltre in dettaglio come ogni caratteristica inserita nel modello influisce sulle previsioni. Infine,Amazon SageMaker Clarify si integra con Amazon SageMaker Model Monitor (un file Amazon Capacità di SageMaker che monitora continuamente la qualità dei modelli di apprendimento automatico in produzione) per avvisare gli sviluppatori se l’importanza delle caratteristiche del modello cambia e fa sì che il comportamento del modello cambi.
- Profilazione profonda per AmazonSageMaker Debugger model training profiler: Deep Profiling perAmazonSageMaker Debugger ora consente agli sviluppatori di addestrare i loro modelli più velocemente monitorando automaticamente l’utilizzo delle risorse di sistema e fornendo avvisi per i colli di bottiglia della formazione. Oggi, gli sviluppatori non hanno un modo standard per monitorare l’utilizzo del sistema (ad esempio GPU, CPU, throughput di rete e I / O di memoria) per identificare e risolvere i colli di bottiglia nei loro lavori di formazione. Di conseguenza, gli sviluppatori non possono addestrare i modelli nel modo più rapido ed economico possibile.Amazon SageMaker Debugger risolve questo problema con le nuove funzionalità di Deep Profiling, che forniscono agli sviluppatori la possibilità di profilare visivamente e monitorare l’utilizzo delle risorse di sistema in Amazon SageMaker Studio. Ciò semplifica l’individuazione delle cause dei problemi e riduce i tempi e i costi di addestramento dei modelli di machine learning. Con queste nuove funzionalità,Amazon SageMaker Debugger espande il suo ambito per monitorare l’utilizzo delle risorse di sistema, inviare avvisi sui problemi durante la formazione in Amazon SageMaker Studio o tramite AWS CloudWatch e correlare l’utilizzo a diverse fasi del lavoro di formazione o un momento specifico durante la formazione (ad esempio 28 minuti dopo l’inizio del lavoro di formazione). Amazon SageMaker Debugger può anche attivare azioni basate su avvisi (ad esempio interrompere un lavoro di formazione quando vengono rilevate irregolarità nell’utilizzo della GPU). AmazonDeep Profiling di SageMaker Debugger funziona su tutti i framework (PyTorch, Apache MXNet e TensorFlow) e raccoglie automaticamente le metriche di sistema e di addestramento necessarie senza richiedere modifiche al codice negli script di addestramento. Ciò consente agli sviluppatori di visualizzare come sono state utilizzate le risorse di sistema durante la formazione inAmazon SageMaker Studio.
- Formazione distribuita su AmazonSageMaker accelera i tempi di formazione: Nuova formazione distribuitaAmazonSageMaker consente di addestrare modelli di deep learning ampi e complessi fino a due volte più velocemente degli approcci attuali. Oggi, casi d’uso avanzati di machine learning, come l’elaborazione del linguaggio naturale per assistenti intelligenti, il rilevamento e la classificazione di oggetti per veicoli autonomi e la classificazione delle immagini per la moderazione dei contenuti su larga scala, richiedono set di dati sempre più grandi e più memoria GPU (graphics processing unit) per l’addestramento . Tuttavia, alcuni di questi modelli sono troppo grandi per entrare nella memoria fornita da una singola GPU. I clienti possono tentare di suddividere i modelli su più GPU, ma trovare il modo migliore per suddividere il modello e modificare il codice di formazione può spesso richiedere settimane di noiose sperimentazioni. Per superare queste sfide, la formazione distribuita suAmazonSageMaker offre due funzionalità di formazione distribuite che consentono agli sviluppatori di addestrare modelli di grandi dimensioni fino a due volte più velocemente senza costi aggiuntivi. Formazione distribuita conAmazonIl motore di parallelismo dei dati di SageMaker scala i lavori di addestramento da una GPU a centinaia o migliaia suddividendo automaticamente i dati su più GPU, migliorando i tempi di addestramento fino al 40%. La riduzione del tempo di formazione è possibile perchéAmazonIl motore di parallelismo dei dati di SageMaker gestisce le GPU per una sincronizzazione ottimale utilizzando algoritmi appositamente progettati per utilizzare completamente l’infrastruttura AWS con un’efficienza di scalabilità quasi lineare. Formazione distribuita conAmazonIl motore Model Parallelism di SageMaker può dividere in modo efficiente modelli grandi e complessi con miliardi di parametri su più GPU, profilando e identificando automaticamente il modo migliore per partizionare i modelli. Lo fanno utilizzando algoritmi di partizionamento del grafico per bilanciare in modo ottimale il calcolo e ridurre al minimo la comunicazione tra le GPU, con conseguenti modifiche minime al codice e meno errori causati dai vincoli di memoria della GPU.
- AmazonGestione del modello SageMaker Edge Manager per dispositivi edge:AmazonSageMaker Edge Manager consente agli sviluppatori di ottimizzare, proteggere, monitorare e mantenere i modelli di machine learning distribuiti su flotte di dispositivi edge. Oggi i clienti usanoAmazonSageMaker Neo per creare modelli ottimizzati per dispositivi periferici che funzionano fino a due volte più velocemente, con meno di un decimo dell’impronta di memoria e nessuna perdita di precisione. Tuttavia, dopo la distribuzione sui dispositivi edge, i clienti devono ancora gestire e monitorare i modelli per garantire che continuino a funzionare con elevata precisione.Amazon SageMaker Edge Manager ottimizza i modelli per essere eseguiti più velocemente sui dispositivi di destinazione e fornisce la gestione dei modelli per i dispositivi edge, in modo che i clienti possano preparare, eseguire, monitorare e aggiornare i modelli di machine learning distribuiti su flotte di dispositivi sull’edge. Amazon SageMaker Edge Manager offre ai clienti la possibilità di firmare crittograficamente i loro modelli, caricare i dati di previsione dai loro dispositivi su Amazon SageMaker per il monitoraggio e l’analisi e visualizza un dashboard che tiene traccia e riporta visivamente il funzionamento dei modelli distribuiti all’interno del Amazon Console SageMaker. Amazon SageMaker Edge Manager estende le funzionalità che in precedenza erano disponibili solo nel cloud campionando i dati dai dispositivi edge e inviandoli a Amazon SageMaker Model Monitor per l’analisi, in modo che gli sviluppatori possano migliorare continuamente la qualità del modello riqualificandoli quando la loro precisione diminuisce nel tempo.
- Amazon SageMaker JumpStart consente il viaggio del machine learning: AmazonSageMaker JumpStart fornisce agli sviluppatori un’interfaccia facile da usare e ricercabile per trovare le migliori soluzioni, algoritmi e notebook di esempio. Oggi, alcuni clienti che non hanno esperienza con il machine learning hanno difficoltà a iniziare con le distribuzioni di machine learning, mentre gli sviluppatori più avanzati trovano difficile adottare il machine learning per tutti i loro casi d’uso. Con il lancio di oggi diAmazonSageMaker JumpStart, i clienti possono ora trovare rapidamente informazioni rilevanti specifiche per i loro casi d’uso di machine learning. Gli sviluppatori che non conoscono l’apprendimento automatico potranno scegliere tra diverse soluzioni complete di apprendimento automatico end-to-end (ad es. Rilevamento delle frodi, previsione del tasso di abbandono dei clienti o previsione) e distribuirle direttamente nel loroAmazon SageMaker Studioambienti. Inoltre, gli utenti esperti potranno scegliere tra più di cento modelli di machine learning per iniziare rapidamente a creare e addestrare modelli.
“Centinaia di migliaia di sviluppatori e data scientist di tutti i giorni hanno utilizzato il nostro servizio di machine learning leader del settore, AmazonSageMaker, per rimuovere gli ostacoli alla creazione, formazione e distribuzione di modelli di machine learning personalizzati. Una delle parti migliori di avere un servizio così ampiamente adottato come SageMaker è che riceviamo molti suggerimenti dai clienti che alimentano il nostro prossimo set di risultati “, ha affermatoSwami Sivasubramanian, Vicepresidente, Amazon Apprendimento automatico, Amazon Web Services, Inc. “Oggi annunciamo una serie di strumenti per Amazon SageMaker che rende molto più semplice per gli sviluppatori creare pipeline di machine learning end-to-end per preparare, costruire, addestrare, spiegare, ispezionare, monitorare, eseguire il debug ed eseguire modelli di machine learning personalizzati con maggiore visibilità, spiegabilità e automazione su larga scala. “
Con operazioni aziendali in 70 paesi e vendite in 200, 3M sta creando la tecnologia e i prodotti che promuovono ogni azienda, migliorano ogni casa e migliorano la vita di tutti i giorni. “Il successo di 3M si basa sui nostri ricercatori imprenditoriali e sulla nostra costante attenzione alla scienza. Un modo in cui abbiamo migliorato la scienza dei nostri prodotti è l’adozione dell’apprendimento automatico su AWS “, ha affermatoDavid Frazee, Direttore tecnico presso 3M Laboratorio di ricerca sui sistemi aziendali. “Utilizzando l’apprendimento automatico, 3M sta migliorando prodotti collaudati, come la carta vetrata, e promuovendo l’innovazione in molti altri spazi, compresa la sanità. Mentre prevediamo di estendere l’apprendimento automatico a più aree di 3M, vediamo la quantità di dati e modelli crescere rapidamente, raddoppiando ogni anno. Siamo entusiasti del nuovoAmazon Le funzionalità di SageMaker perché ci aiuteranno a scalare. Amazon SageMaker Data Wrangler rende molto più facile preparare i dati per l’addestramento del modello e Amazon SageMaker Feature Storeeliminerà la necessità di creare ripetutamente le stesse caratteristiche del modello. Infine,AmazonSageMaker Pipelines ci aiuterà ad automatizzare la preparazione dei dati, la creazione di modelli e la distribuzione dei modelli in un flusso di lavoro end-to-end in modo da poter accelerare il time to market per i nostri modelli. I nostri ricercatori non vedono l’ora di trarre vantaggio dalla nuova velocità della scienza alla 3M “.
Deloitte sta aiutando a trasformare le organizzazioni in tutto il mondo. L’organizzazione evolve continuamente il modo in cui funziona e il modo in cui guarda alle sfide del mercato in modo da poter continuare a fornire risultati misurabili e sostenibili per i suoi clienti e le comunità. “Amazon SageMaker Data Wrangler ci consente di iniziare a lavorare per soddisfare le nostre esigenze di preparazione dei dati con una ricca raccolta di strumenti di trasformazione che accelerano il processo di preparazione dei dati di apprendimento automatico necessario per portare nuovi prodotti sul mercato”, ha affermatoFrank Farrall, Preside, Ecosistemi AIe Platforms Leader presso Deloitte. “A loro volta, i nostri clienti traggono vantaggio dalla velocità con cui scaliamo le implementazioni, consentendoci di fornire risultati misurabili e sostenibili che soddisfano le esigenze dei nostri clienti in pochi giorni anziché in mesi”.
Una filiale di Koch Industriesdal 2004 INVISTA immette sul mercato gli ingredienti proprietari per il nylon 6,6 e marchi riconosciuti tra cui STAINMASTER, CORDURA e ANTRON. È uno dei più grandi produttori integrati al mondo di intermedi chimici, polimeri e fibre. “In INVISTA, siamo guidati dalla trasformazione e cerchiamo di sviluppare prodotti e tecnologie a vantaggio dei clienti di tutto il mondo”, ha affermatoCaleb Wilkinson, Lead Data Scientist presso INVISTA. “Consideriamo l’apprendimento automatico un modo per migliorare l’esperienza del cliente, ma con set di dati che si estendono su centinaia di milioni di righe, avevamo bisogno di una soluzione che ci aiutasse a preparare i dati e sviluppare, distribuire e gestire modelli di apprendimento automatico su larga scala. Per accelerare questi processi, abbiamo lavorato con il team AWS su diverse nuove funzionalità. ConAmazonSageMaker Data Wrangler, ora possiamo selezionare, pulire, esplorare e comprendere in modo interattivo i nostri dati in modo efficace, consentendo al nostro team di data science di creare pipeline di ingegneria delle funzionalità in grado di scalare facilmente a set di dati che si estendono su centinaia di milioni di righe. Possiamo anche automatizzare e gestire facilmente i flussi di lavoro di machine learning su larga scala conAmazonSageMaker Pipelines, così possiamo facilmente unire i singoli passaggi del flusso di lavoro di machine learning. Insieme aAmazon SageMaker Data Wrangler e Amazon SageMaker Pipelines, possiamo rendere operativi i nostri flussi di lavoro di machine learning più velocemente “.
Snowflake Data Cloud abbatte le barriere che hanno impedito alle organizzazioni di tutte le dimensioni di liberare il vero valore dai propri dati. “Una delle maggiori sfide che i nostri clienti aziendali devono affrontare è la preparazione dei dati per i progetti di machine learning”, ha affermatoChristian Kleinerman, SVP of Product at Snowflake. “Siamo entusiastiAmazonSageMaker Data Wrangler, che rende più facile per le organizzazioni aggregare e preparare i dati per l’apprendimento automatico. Con l’aggiunta di Snowflake come origine dati inAmazon SageMaker Data Wrangler, i clienti congiunti saranno presto in grado di sfruttare le funzionalità della piattaforma integrata di Snowflake, insieme alla preparazione interattiva dei dati e alle capacità di apprendimento automatico di AmazonSageMaker. I clienti avranno la possibilità di passare dai dati grezzi ai modelli e agli approfondimenti di machine learning più rapidamente di quanto fosse possibile in precedenza “.
Fondato nel 2013 dai creatori originali di Apache Spark ™, Delta Lake e MLflow, Databricksriunisce ingegneria dei dati, scienza e analisi su una piattaforma aperta e unificata in modo che i team di dati possano collaborare e innovare più rapidamente. “In Databricks, ci impegniamo a riunire ingegneria dei dati, scienza e analisi in modo che i team di dati possano collaborare e innovare più rapidamente”, ha affermatoAdam Conway, SVP of Products presso Databricks. “Non vediamo l’ora di continuare la nostra partnership con AWS nel 2021, in particolare con la perfetta integrazione che i nostri clienti possono sperimentare con AWS suAmazonSageMaker Data Wrangler. Con questa partnership, i nostri clienti possono sfruttareDelta Lake con Amazon SageMaker per preparare solidi dati di formazione in modo che possano creare i modelli di machine learning più accurati. “
MongoDB Atlas è il servizio completamente gestito per MongoDB, il popolare database progettato per aiutare i team a creare, scalare e iterare rapidamente. “La nostra missione in MongoDB è liberare il genio che c’è in tutti, rendendo i dati incredibilmente facili da utilizzare. MongoDB Atlas esegue più di 1,5 milioni di cluster di database, alimentando applicazioni critiche per i nostri clienti; vogliamo che sia facile creare, addestrare e distribuire modelli di machine learning basati sui dati generati da tali applicazioni “, ha affermatoMark Porter, CTO presso MongoDB. “Siamo entusiasti che i nostri clienti ora dispongano di un modo più veloce e visivo per aggregare e preparare i dati per l’utilizzo del machine learningAmazonSageMaker Data Wrangler. A partire dal 2021, i nostri clienti saranno presto in grado di interrogare e analizzare i datiAmazon S3 e MongoDB Atlas all’interno Amazon SageMaker Data Wrangler, consentendo loro di ottenere più valore dai propri dati più velocemente “.
Intuit è una società di piattaforma finanziaria globale orientata alla missione e orgogliosa produttrice di TurboTax, QuickBooks e Mint. “Abbiamo scelto di creare la nuova piattaforma di machine learning di Intuit su AWS nel 2017, combinandoAmazon Le potenti capacità di SageMaker per lo sviluppo di modelli, la formazione e l’hosting con le capacità proprie di Intuit nell’orchestrazione e nell’ingegneria delle funzionalità “, ha affermato Mammad Zadeh, Vice President of Engineering, Data Platform di Intuit. “Di conseguenza, abbiamo ridotto drasticamente il ciclo di vita dello sviluppo del modello. Ciò che prima richiedeva sei mesi interi ora richiede meno di una settimana, permettendoci di spingere le capacità di intelligenza artificiale nei nostri prodotti TurboTax, QuickBooks e Mint a un ritmo notevolmente accelerato. Abbiamo lavorato a stretto contatto con AWS in vista del rilascio diAmazon SageMaker Feature Storee siamo entusiasti della prospettiva di un feature store completamente gestito in modo da non dover più mantenere più repository di funzionalità in tutta la nostra organizzazione. I nostri data scientist saranno in grado di utilizzare le funzionalità esistenti da un archivio centrale e guidare sia la standardizzazione che il riutilizzo delle funzionalità tra team e modelli “.
The Climate Corporation(Climate) è una consociata di Bayer e leader del settore nel portare l’innovazione digitale agli agricoltori di tutto il mondo aumentando la loro produttività utilizzando strumenti digitali. Climate si concentra sull’aiutare gli agricoltori a comprendere i loro campi in modi che non sono mai stati possibili prima e a trarre raccomandazioni efficaci dai dati agricoli. “In Climate, crediamo nel fornire agli agricoltori del mondo informazioni accurate per prendere decisioni basate sui dati e massimizzare il loro ritorno su ogni acro”, ha affermatoDaniel McCaffrey, Vice President, Data and Analytics at Climate. “Per raggiungere questo obiettivo, abbiamo investito in tecnologie come strumenti di apprendimento automatico per creare modelli utilizzando entità misurabili note come caratteristiche, come la resa per il campo di un coltivatore. ConAmazon SageMaker Feature Store, possiamo accelerare lo sviluppo di modelli di machine learning con un archivio di funzionalità centrale per accedere e riutilizzare facilmente le funzionalità di più team. Amazon SageMaker Feature Storesemplifica l’accesso alle funzionalità in tempo reale utilizzando il negozio online o esegue le funzionalità in base a una pianificazione utilizzando il negozio offline per diversi casi d’uso. ConAmazon SageMaker Feature Store, possiamo sviluppare modelli di machine learning più velocemente “.
DeNA è un fornitore leader di servizi mobili e online, inclusi giochi, e-commerce e distribuzione di contenuti di intrattenimento in Giappone. “In DeNA, la nostra missione è fornire impatto e deliziare i clienti utilizzando l’intelligenza artificiale e l’apprendimento automatico. Fornire servizi basati sul valore è il nostro obiettivo principale e vogliamo garantire che le nostre attività e i nostri servizi siano pronti a raggiungere tale obiettivo “, ha affermatoKenshin Yamada, Direttore generale, Sistemi di intelligenza artificialepresso DeNA. “Una delle nostre iniziative chiave è espandere le nostre capacità nell’intelligenza artificiale e nell’apprendimento automatico.AmazonSageMaker ci ha aiutato nel nostro percorso di implementazione del machine learning in molte delle nostre attività fornendo ampie capacità per addestrare e distribuire modelli accurati. Una delle aree su cui vogliamo concentrarci è la preparazione dei dati e la semplificazione per i nostri team di ingegneri. ConAmazonSageMaker Data Wrangler, crediamo di poter partire con una ricca raccolta di strumenti di trasformazione senza la necessità di scrivere codice aggiuntivo. Man mano che diventiamo più efficienti con la preparazione dei dati, vogliamo anche assicurarci che i nostri team nelle nostre diverse attività non ripetano o duplichino il lavoro nella creazione di funzionalità simili per le nostre applicazioni. Vorremmo scoprire e riutilizzare le funzionalità in tutta l’organizzazione eAmazon SageMaker Feature Store ci aiuta con un modo semplice ed efficiente per riutilizzare le funzionalità per diverse applicazioni. Amazon SageMaker Feature Storeci aiuta anche a mantenere le definizioni delle caratteristiche standard e ci aiuta con una metodologia coerente mentre addestriamo i modelli e li distribuiamo alla produzione. Con queste nuove funzionalità diAmazon SageMaker, possiamo addestrare e distribuire modelli di machine learning più velocemente, mantenendoci sul nostro percorso per deliziare i nostri clienti con i migliori servizi “.
iFood è un portale di consegna di cibo online e una delle più grandi società di consegna di cibo in America latinaoffrire servizi di qualità ai consumatori. “In iFood, ci sforziamo di soddisfare i nostri clienti attraverso i nostri servizi che utilizzano tecnologie come l’apprendimento automatico”, ha affermatoSandor Caetano, Chief Data Scientist presso iFood. “Abbiamo utilizzatoAmazonSageMaker per i nostri modelli di machine learning per creare applicazioni di alta qualità in tutta la nostra attività. La creazione di un flusso di lavoro completo e senza interruzioni per sviluppare, addestrare e distribuire modelli è stata una parte fondamentale del nostro viaggio verso l’apprendimento automatico su scala.Amazon SageMaker Pipelines ci aiuta a creare rapidamente più flussi di lavoro di machine learning automatizzati e scalabili e semplifica l’implementazione e la gestione dei nostri modelli in modo efficace. AmazonSageMaker Pipelines ci consente di essere più efficienti con il nostro ciclo di sviluppo. Continuiamo a sottolineare la nostra leadership nell’utilizzo dell’intelligenza artificiale e dell’apprendimento automatico per fornire un servizio clienti ed efficienza superiore con tutte queste nuove funzionalità diAmazon SageMaker. “
Da quando ha nominato AWS come fornitore di tecnologia ufficiale in Gennaio 2020, il DFL Deutsche Fußball Liga – organizzatore e marketing dei principali campionati di calcio tedeschi Bundesliga e Bundesliga 2 – e AWS hanno intrapreso un viaggio insieme per portare in vita per i fan e la TV analisi avanzate dello sport, tramite Bundesliga Match Facts powered by AWS emittenti di tutto il mondo. “Amazon SageMaker Clarify si integra perfettamente con il resto della piattaforma digitale Bundesliga Match Facts ed è una parte fondamentale della nostra strategia a lungo termine di standardizzazione dei nostri flussi di lavoro di machine learning suAmazon SageMaker “, ha detto Andreas Heyden, Vicepresidente esecutivo delle innovazioni digitali per Gruppo DFL. “Utilizzando le tecnologie innovative di AWS, come l’apprendimento automatico, per fornire informazioni più approfondite e fornire ai fan una migliore comprensione delle decisioni in una frazione di secondo prese in campo, Bundesliga Match Facts consente agli spettatori di ottenere informazioni più approfondite sulle decisioni chiave in ogni partita. “
CS DISCO è un provider SaaS che offre soluzioni per automatizzare e semplificare una varietà di attività legali, inclusa la discovery. “In CS DISCO abbiamo rivoluzionato il modo in cui le prove legali vengono riviste con la nostra piattaforma DISCO AI per ediscovery”, ha affermatoAlan Lockett, Principal Data Scientist presso CS DISCO. “Cerchiamo sempre di migliorare la velocità con cui si addestrano i nostri modelli avanzati di deep learning. Il nostro team ha lavorato con ilAmazon Il team di SageMaker di AWS e ritiene che tecnologie come la formazione distribuita e altre possano aiutare ad accelerare i nostri casi d’uso dell’IA “.
Turbine è una società di scoperta di farmaci basata sulla simulazione che fornisce terapie antitumorali mirate ai pazienti. “Usiamo l’apprendimento automatico per addestrare il nostro modello di cellula umana in silico, chiamato Simulated Cell ™, basato su un’architettura di rete proprietaria. Prevedendo accuratamente vari interventi a livello molecolare, Simulated Cell ™ ci aiuta a scoprire nuovi farmaci antitumorali e a trovare partner combinati per le terapie esistenti “, ha affermato Kristóf Szalay, CTO di Turbine. “L’addestramento della nostra simulazione è qualcosa su cui iteriamo continuamente, ma su una singola macchina ogni formazione richiede giorni, ostacolando la nostra capacità di iterare rapidamente nuove idee. Siamo molto entusiasti della formazione distribuita suAmazon SageMaker, che ci aspettiamo riduca i nostri tempi di addestramento del 90% e ci aiuti a concentrarci sul nostro compito principale: scrivere una base di codice migliore per l’addestramento del modello cellulare. Amazon SageMaker ci consente in definitiva di diventare più efficaci nella nostra missione principale: identificare e sviluppare nuovi farmaci contro il cancro per i pazienti “.
Latent Space è una startup focalizzata sulla costruzione del primo motore di gioco 3D completamente renderizzato con IA. “In Latent Space, stiamo costruendo un motore di gioco con rendering neurale in cui chiunque può creare alla velocità del pensiero. Spinti dai progressi nella modellazione del linguaggio, stiamo lavorando per incorporare la comprensione semantica sia del testo che delle immagini per determinare cosa generare “, ha affermato Sara Jane, cofondatrice e Chief Science Officer di Latent Space. “Il nostro obiettivo attuale è quello di utilizzare il recupero delle informazioni per aumentare la formazione su modelli su larga scala, per la quale disponiamo di sofisticate pipeline di machine learning. Questa configurazione rappresenta una sfida oltre all’addestramento distribuito poiché ci sono più origini dati e modelli da addestrare allo stesso tempo. Pertanto, stiamo sfruttando le nuove funzionalità di formazione distribuita inAmazon SageMaker per scalare in modo efficiente la formazione per modelli generativi di grandi dimensioni. “
Lenovo è il più grande produttore mondiale di personal computer. Lenovo progetta e produce dispositivi come laptop, tablet, smartphone e una varietà di dispositivi IoT intelligenti. “In Lenovo, siamo più di un fornitore di hardware e ci impegniamo ad essere un partner affidabile per trasformare l’esperienza dei clienti sui dispositivi e per raggiungere i loro obiettivi di business. Lenovo Device Intelligence è un ottimo esempio di come lo stiamo facendo con la potenza del machine learning, potenziato daAmazon SageMaker “, ha detto Igor Bergman, Vicepresidente Lenovo, Cloud e software di PC e dispositivi intelligenti. “Con Lenovo Device Intelligence, gli amministratori IT possono diagnosticare in modo proattivo i problemi del PC e aiutare a prevedere potenziali guasti del sistema prima che si verifichino, contribuendo a ridurre i tempi di inattività e aumentare la produttività dei dipendenti. IncorporandoAmazon SageMaker Neo, abbiamo già visto un sostanziale miglioramento nell’esecuzione dei nostri modelli predittivi su dispositivo: un segnale incoraggiante per il nuovo AmazonSageMaker Edge Manager che verrà aggiunto nelle prossime settimane. Il nuovoAmazonSageMaker Edge Manager aiuterà ad eliminare lo sforzo manuale richiesto per ottimizzare, monitorare e migliorare continuamente i modelli dopo la distribuzione. Con esso, ci aspettiamo che i nostri modelli funzioneranno più velocemente e consumeranno meno memoria rispetto ad altre piattaforme di machine learning comparabili. Man mano che estendiamo l’AI a nuove applicazioni nel portafoglio di servizi Lenovo, continueremo a richiedere una pipeline ad alte prestazioni flessibile e scalabile sia nel cloud che su milioni di dispositivi edge. Ecco perché abbiamo selezionatoAmazonPiattaforma SageMaker. Con le sue ricche funzionalità di flusso di lavoro edge-to-cloud e CI / CD, possiamo portare efficacemente i nostri modelli di machine learning su qualsiasi flusso di lavoro del dispositivo per una produttività molto più elevata “.
Basler AG è un produttore leader di fotocamere digitali e accessori di alta qualità per l’industria, la medicina, i trasporti e una varietà di altri mercati. “Basler AG fornisce soluzioni di visione artificiale intelligenti in una varietà di settori, comprese le applicazioni manifatturiere, mediche e al dettaglio. Siamo entusiasti di estendere la nostra offerta software con nuove funzionalità rese possibili daAmazon SageMaker Edge Manager “, ha affermato Mark Hebbel, Head of Software Solutions presso Basler. “Per garantire che le nostre soluzioni di machine learning siano efficienti e affidabili, abbiamo bisogno di uno strumento scalabile edge to cloud MLOps che ci consenta di monitorare, mantenere e migliorare continuamente i modelli di machine learning sui dispositivi edge.AmazonSageMaker Edge Manager ci consente di campionare automaticamente i dati all’edge, inviarli in modo sicuro al cloud e monitorare continuamente la qualità di ogni modello su ogni dispositivo dopo la distribuzione. Questo ci consente di monitorare, migliorare e aggiornare da remoto i modelli sui nostri dispositivi periferici in tutto il mondo e allo stesso tempo fa risparmiare tempo e costi a noi e ai nostri clienti “.
Missione Automatizzare le soluzioni software artigianali per conto dei propri clienti globali. “Siamo costantemente alla ricerca di nuove soluzioni in grado di fornire la migliore qualità software ai nostri clienti, ma come piccola organizzazione, non abbiamo la stessa capacità di specializzarci in silos come altre organizzazioni”, ha affermatoAlex Panait, CEO presso Mission Automate. “Amazon SageMaker JumpStart ora ci fornisce un modo per iniziare più rapidamente con l’apprendimento automatico, comprese nuove tecniche che possiamo utilizzare nei nostri flussi di lavoro per aumentare la nostra offerta di servizi e ridurre i costi. L’opzione di selezionare modelli e algoritmi di machine learning da zoo di modelli popolari ci consente di addestrare rapidamente modelli di machine learning personalizzati, il che aiuta i nostri clienti a raggiungere il mercato più velocemente. Grazie aAmazon SageMaker JumpStart, siamo in grado di lanciare soluzioni di machine learning in pochi giorni per soddisfare le esigenze di previsione del machine learning in modo più veloce e affidabile “.
MyCase offre un potente software di gestione della pratica legale che aiuta gli studi legali a funzionare in modo efficiente da qualsiasi luogo, fornire un’esperienza cliente eccezionale e monitorare facilmente le prestazioni dell’azienda. “Abbiamo diversi elementi aziendali e di prodotto che possono essere migliorati con l’apprendimento automatico”, ha affermatoGus Nguyen, Software Engineer presso MyCase. “Amazon SageMaker JumpStart ci consente di lanciare soluzioni end-to-end con un clic e accedere a una raccolta di notebook per aiutarci a comprendere più a fondo i clienti e utilizzare le previsioni per soddisfare meglio le loro esigenze. Grazie aAmazon SageMaker JumpStart, possiamo avere punti di partenza migliori, il che ci consente di implementare una soluzione di machine learning per i nostri casi d’uso in quattro o sei settimane invece di tre o quattro mesi “.
Altri articoli
Consorzio Grana Padano celebra la giornata dell’ANT Visite dermatologiche per i propri dipendenti
ITALTEKNO tra i Leader della Crescita 2025 secondo il Sole 24 Ore