VoxML (Voice Markup Language)

VoxML (Voice Markup Language) è una tecnologia di Motorola per la creazione di un dialogo vocale con un sito Web in cui un utente può chiamare un sito Web per telefono e interagire con esso tramite il riconoscimento vocale e le risposte del sito Web. VoxML (TM) consente a uno sviluppatore di creare uno script della conversazione che un utente può avere con un programma applicativo eseguito da un server Web. L'utente che effettua la chiamata è connesso a un programma client chiamato a browser vocale. Il browser vocale a sua volta trasmette le richieste al server Web. Il markup definito in VoxML è coerente con Extensible Markup Language (XML), il linguaggio di definizione dei dati strategico per Internet. L'utilizzo di VoxML non deve essere più difficile che scrivere una pagina Web utilizzando l'Hypertext Markup Language (HTML).

Motorola fornisce VoxML come interfaccia aperta e i potenziali sviluppatori possono scaricare il kit di sviluppo dal sito Web di Motorola. Motorola ha già fornito la tecnologia ad alcuni dei primi sviluppatori di prodotti, tra cui The Weather Channel. Le applicazioni tipiche potrebbero includere la fornitura di informazioni meteorologiche, informazioni sui voli e risultati sportivi, nonché l'ordinazione di prodotti e servizi online.

Come l'utente utilizza VoxML

  1. L'utente identifica un sito Web che offre l'interazione telefonica. Ad esempio, alcuni siti di e-tailing potrebbero consentire agli utenti di ordinare dal sito Web per telefono invece che compilando un modulo.
  2. L'azienda con il sito Web pubblicherebbe un numero di telefono da chiamare per il proprio sito Web.
  3. L'utente chiamerebbe il numero su un normale telefono. (Inizialmente, cioè, la connessione telefonica tramite Internet stessa non è supportata.)
  4. L'utente si connetterà a un file browser vocale sul sito Web.
  5. Una volta connesso, l'utente ascolterebbe una voce registrata che lo invitava a interagire con il sito Web, ad esempio per effettuare un ordine o scegliere un'altra opzione.
  6. Quando l'utente rispondeva, le risposte selezionate potevano attivare richieste dal browser vocale a un'applicazione del server Web. Il server Web potrebbe anche inviare nuove pagine Web al computer dell'utente, ad esempio immagini di articoli di catalogo e conferme d'ordine.
  7. L'utente e l'applicazione VoxML avrebbero interagito fino al completamento della transazione. Quindi l'utente riaggancia, terminando la sessione.

Come lo sviluppatore sviluppa un'applicazione VoxML

  1. Per prima cosa, lo sviluppatore progetta e specifica l'applicazione, annotando i possibili dialoghi vocali che saranno possibili.
  2. Lavorando su un normale PC su cui è installato il software di sviluppo, lo sviluppatore utilizza VoxML, le istruzioni di dialogo dell'utente ei nomi dei file di risposta audio registrati per creare un file che definisce formalmente i dialoghi.
  3. Lo sviluppatore (o qualcun altro) registra ogni possibile richiesta vocale, creando un file vocale rispetto al quale è possibile confrontare le voci vocali degli utenti. Lo sviluppatore predispone eventuali risposte vocali predefinite, che potrebbero essere disponibili da un'altra applicazione.
  4. Lo sviluppatore ha il client vocale sul PC in modo che lo script VoxML possa essere testato.
  5. Dopo il test, tutti i file vengono inseriti nel server del sito Web.
  6. Lo sviluppatore modifica il sito Web per invitare gli utenti a richiedere l'applicazione vocale.
  7. Una volta che l'applicazione VoxML è stata configurata, gli utenti possono interagire con il sito Web tramite il mouse e la tastiera come al solito e anche, per gli scopi invitati, tramite un telefono.