Funzionalità di Amazon Comprehend
Perché dovrei scegliere Amazon Comprehend?
Amazon Comprehend è un servizio di elaborazione del linguaggio naturale (NLP) che utilizza la tecnologia del machine learning (ML) per estrapolare approfondimenti dal testo. Amazon Comprehend fornisce servizi di riconoscimento di entità personalizzate, classificazione personalizzata, estrazione di frasi chiave, analisi del sentiment, riconoscimento delle entità e altre tipologie di API per permettere di integrare facilmente l'NLP nelle applicazioni. Dovrai semplicemente chiamare le API Amazon Comprehend nella tua applicazione e specificare la posizione del documento o del testo di origine. Le API restituiranno entità, frasi chiave, emozioni e lingua in formato JSON, che potrai usare nell'applicazione.
Riconoscimento personalizzato di entità
Il riconoscimento personalizzato di entità consente di personalizzare Amazon Comprehend per identificare termini specifici del dominio. Utilizzando AutoML, Amazon Comprehend apprende da un piccolo insieme di esempi (ad esempio, un elenco di numeri di policy, numeri di richieste o SSN), e poi addestra un modello privato e personalizzato per riconoscere questi termini, come i numeri di richiesta, in qualsiasi altro blocco di testo in PDF, testo semplice, o documenti Microsoft Word, senza aver bisogno del ML. Per ulteriori dettagli, consultare questa pagina della documentazione.
-
Esempio: In questo esempio una società di assicurazioni vorrebbe analizzare i documenti di testo per determinate entità delle aziende e i numeri di policy.
Testo di esempio: Ciao, mi chiamo Sam Ford e sto inviando una richiesta per un incidente d'auto. Il mio numero di polizza è 456-YQT.
Entità Categoria Conteggio Affidabilità 456-YQT Policy_ID 1 0.95
Classificazione personalizzata
L’API di classificazione personalizzata permette di creare con facilità modelli personalizzati di classificazione dei testi utilizzando etichette specifiche di ogni azienda e senza dover conoscere il ML. Per esempio, il dipartimento di assistenza clienti può utilizzare la classificazione personalizzata per suddividere automaticamente le richieste in entrata per tipo di problema, in base alla descrizione fornita dal cliente. Il modello personalizzato semplifica le attività di moderazione di commenti su un sito Web, valutazione del feedback dei clienti e di organizzazione dei documenti di gruppi di lavoro. Per ulteriori dettagli, consulta questa pagina della documentazione.
-
Esempio: desideri organizzare il feedback relativo all’assistenza clienti di una linea aerea. Ciascun elemento del feedback deve essere organizzato nella sezione Domande sull’account, Rimborsi dei biglietti e Reclami sui voli. Per addestrare il servizio, devi creare un file CSV contenente esempi di testo per ciascun problema e assegnare a ciascun esempio una delle tre etichette applicabili. Il servizio addestrerà automaticamente un modello personalizzato per tuo conto. Per utilizzare il tuo modello per analizzare tutte le chiamate del giorno successivo, invia al servizio ciascun file di testo; riceverai i risultati etichettati insieme a un punteggio di affidabilità delle etichette.
Testo Etichetta Punteggio di affidabilità Riga 0 Domanda sull’account 0,92 Riga 1 Rimborso biglietto 1 Riga 2 Lamentela sul volo 1 Riga 3 Lamentela sul volo 0,91 Doc5.csv Rimborso biglietto 1
Riconoscimento delle entità
L'API di riconoscimento delle entità restituisce le entità denominate ("persona", "luogo", "località" e così via), automaticamente classificate in base al testo fornito. Per ulteriori dettagli, consultare questa pagina della documentazione.
-
Esempio: In questo esempio osserviamo la descrizione di un’azienda. L'API identifica entità come organizzazione, data e luogo e restituisce un punteggio di affidabilità.
Testo di esempio: Amazon.com ha sede a Seattle, Washington, ed è stata fondata il 5 luglio 1994 da Jeff Bezos, per permettere ai clienti di acquistare qualsiasi articolo, dai libri ai frullatori. Seattle si trova a nord di Portland e a sud di Vancouver, British Columbia. Altre illustri aziende con sede a Seattle sono Starbucks e Boeing.
Entità Categoria Affidabilità Amazon.com, Inc.
Organizzazione 0,96 Seattle, WA Luogo 0,96 5 luglio 1994 Data 0,99 Jeff Bezos Persona 0,99 Seattle
Luogo 0,98 Portland
Luogo 0,99 Vancouver, British Columbia Luogo 0,97 Starbucks
Organizzazione 0,91 Boeing
Organizzazione 0,99
Analisi del sentiment
L'API di analisi del sentiment restituisce il sentiment complessivo di un testo (positivo, negativo, neutro o misto). Per ulteriori dettagli, consultare questa pagina della documentazione.
-
Esempio: In questo esempio un cliente pubblica il proprio feedback su un paio di scarpe. L'API identifica l'emozione espressa dal cliente insieme a un punteggio di affidabilità.
Testo di esempio: Ho ordinato un numero 38 e mi aspettavo che mi calzassero bene, ma si sono rivelate piuttosto un 39-40. La qualità è eccezionale. È un marrone più chiaro di quello nella fotografia, ma abbastanza simile. Sarebbero dieci volte migliori se fossero foderate con lana o cotone all'interno.
Emozione Punteggio Mista 0,89 Positiva 0,09 Negativa 0,01 Neutra 0,00
Sentiment mirato
Il sentiment mirato fornisce approfondimenti granulari identificando il sentiment (positivo, negativo, neutro o misto) rispetto alle entità all'interno del testo. Per ulteriori dettagli, consultare questa pagina della documentazione.
-
Esempio: in questo esempio, un ristorante sta controllando la recensione di un cliente per capire come migliorare la propria attività.
Testo di esempio: L’hamburger era buonissimo, ma il servizio era lento.
Testo Tipo di entità Punteggio di affidabilità dell’entità Emozione Punteggio I Persona 0,99 Neutra 0,99 Hamburger Altro 0,99 Positiva 0,99 Servizio Attributo 0,99 Negativa 0,99
Identificazione e redazione delle informazioni di identificazione personale (PII)
Utilizza le funzionalità ML di Amazon Comprehend per rilevare e redigere le informazioni di identificazione personale (PII) in e-mail dei clienti, ticket di assistenza, recensioni prodotti, social media e altri ancora. Non sono necessarie competenze in campo ML. Ad esempio, è possibile analizzare i ticket di assistenza e i file di caratteristiche del caso per rilevare le entità PII e revisionare il testo prima di indicizzare i documenti nella soluzione di ricerca. Dopodiché, le soluzioni di ricerca saranno dei documenti senza entità PII. Revisionare le entità PII ti consente di proteggere la privacy e soddisfare i requisiti legali e i la regolamentazione locali. Per ulteriori dettagli, consulta questa pagina della documentazione.
-
Esempio: In questo esempio, un cliente vuole revisionare le informazioni personali e finanziarie da un rendiconto bancario. L’API di revisione PII identifica e revisiona le PII con un punteggio di affidabilità.
Testo di esempio: Ciao John Smith. Il Suo conto numero 1111-0000-1111-0008 collegato alla carta di credito AnyCompany Financial Services LLC ha un pagamento minimo di 24,53 USD da saldare entro il 31 luglio. In base alle impostazioni di pagamento automatico, ritireremo il Suo pagamento alla data di scadenza dal suo conto bancario numero XXXXXX1111 con numero di routing XXXXX0000.
Entità
Tipo
Punteggio
John Smith
Nome
0.99+
1111-0000-111-0008
Numero carta di debito
0.99+
31 luglio
Data
0.99+
XXXXXX111
Numero conto bancario
0.99+
XXXXX0000
Numero routing bancario
0.99+
Rilevamento di contenuti inappropriati
Il rilevamento di contenuti inappropriati di Comprehend è una soluzione semplice basata sull'elaborazione del linguaggio naturale (NLP) per il rilevamento di contenuti inappropriati nei documenti testuali. Questa funzionalità è disponibile da subito per moderare le conversazioni peer-to-peer su piattaforme online e gli input/output dell'IA generativa. Per ulteriori dettagli, consultare questa pagina della documentazione.
Classificazione di sicurezza del prompt
Comprehend fornisce un classificatore binario pre-addestrato in grado di classificare il prompt di input come dannoso o innocuo. Questo può essere integrato per consentire agli LLM di rispondere solo a contenuti innocui. Per ulteriori dettagli, consultare questa pagina della documentazione
Estrazione di frasi chiave
L'API di estrazione di frasi chiave restituisce frasi chiave o argomenti di discussione insieme a un punteggio di affidabilità per specificare che si tratta effettivamente di una frase chiave. Per ulteriori dettagli, consultare questa pagina della documentazione.
-
Esempio: In questo esempio un cliente confronta una fotocamera DSLR con una fotocamera a sviluppo istantaneo. L'API estrae frasi chiave e restituisce un punteggio di attendibilità sui risultati.
Testo di esempio: Sono un fotografo appassionato e di solito scatto foto con la mia DSLR o la mia fotocamera a sviluppo istantaneo che mi porto sempre dietro per l'uso occasionale. Mentre nulla batte la mia DSLR quanto a potenza e praticità, la mia fotocamera a sviluppo istantaneo ha qualcosa di magico. Forse è il fatto di imprimere realmente su pellicola un'immagine o forse è la consapevolezza che ogni scatto è un oggetto fisico unico, qualcosa di speciale nel mondo di oggi, in cui spopolano Instagram e Facebook, strapieni di foto. Quello che so di sicuro è che sono fotocamere incredibilmente divertenti da usare e suscitano sempre l'entusiasmo di chiunque a una festa.
Frase chiave Affidabilità un fotografo appassionato 0,99
la mia DSLR 0,97 la mia fotocamera a sviluppo istantaneo 0,99
uso occasionale 0,99
potenza e praticità 0,94 realmente su pellicola 0,99 ogni scatto 0,92 un manufatto fisico unico 0,99
oggi 0,91 mondo 0,99
Instagram e Facebook 0,99
Rilevamento di eventi
Comprehend Events consente di estrarre la struttura di un evento da un documento, distillando pagine di testo in dati processati in modo semplice per il consumo da parte delle applicazioni IA o dello strumento di visualizzazione a grafo. Questa API consente di rispondere a domande del tipo chi-cosa-dove-quando su grandi insiemi di documenti, su vasta scala e senza esperienza pregressa in elaborazione del linguaggio naturale (NLP). Utilizza Comprehend Events per estrarre dettagli granulari su eventi della vita quotidiana ed entità associate espressi in testi non strutturati. Per ulteriori dettagli, consultare questa pagina della documentazione.
Rilevamento della lingua
L'API di rilevamento della lingua identifica automaticamente il testo scritto in oltre 100 lingue e restituisce la lingua dominante con un punteggio di affidabilità per specificare che si tratta della lingua dominante. Per ulteriori dettagli, consultare questa pagina della documentazione.
-
Esempio: In questo esempio l'API analizza il testo ed è in grado di identificare l'italiano come lingua dominante nel testo, restituendo un punteggio di affidabilità.
Testo di esempio: Amazon Elastic Compute Cloud (Amazon EC2) è un servizio Web che fornisce capacità di elaborazione sicura e scalabile nel cloud. È concepito per rendere più semplice il cloud computing su scala Web per gli sviluppatori.
Codice lingua ISO-639-1 Linguaggio Affidabilità it Italiano 1,0
Analisi della sintassi
L'API di sintassi di Amazon Comprehend permette ai clienti di analizzare i testi utilizzando tokenizzazione e categorie morfo-sintattiche, nonché di identificare i confini delle parole e le parti del discorso quali nomi e aggettivi. Per ulteriori dettagli, consultare questa pagina della documentazione.
-
Esempio: Supponiamo di dover analizzare un breve documento utilizzando l'API di sintassi di Comprehend. Questa API tokenizza il testo (ovvero definisce i confini delle parole) ed etichetta ciascuna parola con la categoria morfo-sintattica appropriata, ad esempio nome o verbo. Oltre a definire punto iniziale e finale di una parola per individuarla nel testo, offre anche una percentuale di affidabilità.
Testo di esempio: I love my fast, new Kindle Fire!
Testo Tag I Pronome Love Verbo
My Pronome Rapidità Aggettivo , Punteggiatura Novità Aggettivo Kindle Nome proprio Fire
Nome proprio ! Punteggiatura
Topic modeling
L'API di topic modeling identifica termini o argomenti rilevanti da una raccolta di documenti memorizzati in Amazon S3. Identifica gli argomenti più comuni nella raccolta e li organizza in gruppi, quindi associa ogni documento a un argomento. Per ulteriori dettagli, consulta questa pagina della documentazione.
-
Esempio: Se i documenti (Doc1.txt, Doc2.txt, Doc3.txt e Doc4.txt) sono archiviati in Amazon S3 e se ne indicano ad Amazon Comprehend le rispettive posizioni, il servizio analizza i documenti e restituisce due visualizzazioni:
1. Raggruppamento di parole chiave che corrispondono ad argomenti
Ogni gruppo di parole chiave viene associato a un gruppo di argomenti. Il peso si riferisce alla prevalenza della parola chiave all'interno del gruppo. Le parole chiave con peso vicino a 1 sono le più indicative del contesto del gruppo di argomenti.Gruppo di argomenti Parole chiave Peso 1 Amazon 0,87 1 Seattle 0,65 2 Festività 0,78 2 Shopping 0,67 Ogni gruppo di parole chiave viene associato a un gruppo di argomenti. Il peso si riferisce alla prevalenza della parola chiave all'interno del gruppo. Le parole chiave con peso vicino a 1 sono le più indicative del contesto del gruppo di argomenti.2. Raggruppamento di documenti per argomenti
Nome del documento Gruppo di argomenti Proporzione Doc1.txt 1 0,87 Doc2.txt 1 0,65 Doc3.txt 2 0,78 Doc4.txt 2 0,67 Ogni documento viene associato a un gruppo di argomenti in base alla proporzione delle parole chiave pesate del gruppo di argomenti presenti nel documento.
Supporto multilingue
Amazon Comprehend può eseguire l'analisi del testo in tedesco, inglese, spagnolo, italiano,
Testo in portoghese, francese, giapponese, coreano, hindi, arabo, cinese (semplificato) e cinese (tradizionale). Per costruire applicazioni in altre lingue, i clienti hanno a disposizione Amazon Translate per convertire il testo in una lingua supportata da Amazon Comprehend, per poi utilizzarlo per effettuare l’analisi del testo. Per maggiori informazioni sul supporto in lingua, consultare la pagina relativa alla documentazione.
Ulteriori informazioni sui prezzi di Amazon Comprehend