Amazon DataZone è un servizio di gestione dei dati che rende più facile e veloce per i clienti catalogare, scoprire, condividere e gestire i dati archiviati su AWS, locali e fonti di terze parti. Con Amazon DataZone, ingegneri, data scientist, product manager, analisti e utenti aziendali possono accedere rapidamente ai dati di tutta l'organizzazione in modo da poterli scoprire, utilizzare e collaborare per ricavare informazioni basate sui dati. Gli amministratori e i proprietari dei dati che supervisionano gli asset di dati di un'organizzazione possono gestire e governare facilmente l'accesso ai dati. Amazon DataZone offre flussi di lavoro integrati per consentire ai consumatori di dati di richiedere l'accesso ai dati e ai proprietari dei dati di approvare l'accesso.
Amazon DataZone offre agli utenti un portale di gestione dei dati unificato per scoprire, accedere, preparare, analizzare e generare report sui dati in tutta l'organizzazione. Possono quindi collaborare più facilmente con i data engineer e gli amministratori IT per ottenere più rapidamente informazioni dai propri dati. Amazon DataZone aiuta gli utenti a utilizzare le risorse di dati presenti nel catalogo di dati aziendali dell’editor di query Amazon Redshift e Amazon Athena tramite un'applicazione basata sul Web. Ciò elimina la necessità di accedere alla Console di gestione AWS per gli utenti che preferiscono un'esperienza fuori dalla console. Per impostare, configurare o integrare in modo programmatico i processi esistenti, Amazon DataZone ha pubblicato delle API con linee guida su come utilizzarle.
Puoi utilizzare Amazon DataZone per gestire gli asset di dati dalle tabelle AWS Glue gestite da AWS Lake Formation e dalle tabelle Amazon Redshift. Inoltre, con i connettori AWS Glue e la relativa integrazione con Amazon AppFlow, è possibile catalogare risorse provenienti da varie fonti per aumentare la visibilità all'interno dell'organizzazione. Con la disponibilità generale, puoi configurare Amazon DataZone per catalogare gli asset personalizzati laddove hai la flessibilità di definire quale potrebbe essere tale risorsa.
I progetti Amazon DataZone sono raggruppamenti di utenti, asset di dati e strumenti di analisi basati su casi d'uso aziendale. Forniscono uno spazio collaborativo in cui gli utenti del progetto sono in grado di collaborare e scambiare dati e artefatti. I progetti sono protetti in modo che soltanto chi è esplicitamente aggiunto al progetto possa accedere ai dati e agli strumenti di analisi al suo interno.
Una volta implementato, il progetto crea ruoli AWS Identity and Access Management (IAM) in base alle funzionalità selezionate dal progetto (ad esempio, un data lake) che forniscono agli utenti l'accesso necessario per svolgere il proprio lavoro. I progetti forniscono anche l'isolamento del lavoro all'interno dello stesso account, nonché un limite di sicurezza (gruppo di sicurezza e ruoli IAM). Per lavorare con i dati all'interno dei progetti, puoi creare ambienti. Gli ambienti creano ruoli IAM in base agli strumenti e alle funzionalità (ad esempio, data lake) che forniscono agli utenti l'accesso necessario per svolgere il proprio lavoro.
Sì, il catalogo di dati aziendali di Amazon DataZone supporta un glossario aziendale. Un glossario aziendale è come un dizionario per un'organizzazione che elenca i termini commerciali con le relative definizioni per garantire che le stesse definizioni vengano utilizzate in tutta l'organizzazione durante la scoperta e l'analisi dei dati. Inoltre, il catalogo dei dati aziendali fornisce moduli di metadati per personalizzare, imporre o definire metadati aggiuntivi alle risorse affinché gli addetti ai dati possano apprendere e comprendere la risorsa prima di utilizzarla per le proprie analisi.
Amazon DataZone astrae il processo di condivisione dei dati tra produttori di dati e consumatori utilizzando costrutti di Lake Formation. Amazon DataZone automatizza l'adempimento dell'accesso ai dati agli asset sottostanti (gestiti da Amazon DataZone) in base alle policy applicate dagli editori di dati. L'adempimento viene eseguito senza la necessità di un amministratore o di spostare i dati.
Sì, abbiamo supporto per API, AWS CloudFormation, interfaccia a riga di comando AWS Command Line Interface (AWS CLI) e Kit di sviluppo per il cloud AWS (AWS CDK). Per maggiori informazioni sul supporto per le API, consulta la documentazione.