"Alexa, che tempo fa domani ?"
Ecco, è entrato nelle case. Quello che non riuscì agli occhiali di Google, riesce ad Amazon con l'audio.
Noi gli parliamo, lui risponde. Come fa ?
Bisogna pensare prima di tutto che di soluzioni simili ce ne sono tante. Però Alexa, l'assistente virtuale contenuto nei dispositivi (smart speaker) di Amazon e di tutti i produttori che lo vogliano (questo è importante), funziona.
Funziona perchè dal 2010 ad oggi hanno testato tutti i fallimenti più comuni, riducendoli al minimo. E hanno sviluppato una piattaforma di sviluppo molto flessibile. Chi ne sa poco può provare a creare cose semplici da solo, perdendoci solo alcuni giorni; chi invece sviluppa per lavoro può produrre skill in tempi rapidi per il test.
Le skill sono le app che "funzionano" sulla piattaforma Amazon.
Interessante quindi l'integrazione con il mondo Amazon, tutto, riconoscimento incluso.
I dati sono tutti gestiti sui server Amazon, ovviamente le skill possono (o meno) trattatare anch'esse dati. Contrattualmente e ex privacy quindi abbiamo un rapporto multilaterale da regolare nel proporre le app.
Malfunzionamenti ?
Ce ne possono essere sotto mille punti di vista, questo è lo stato dell'arte, qualcosa che il legislatore dovrebbe ricordare e proteggere per consentire lo sviluppo.
In questi casi la clausola di recesso, qualora vi vengano addebitati degli importi ordinando qualcosa tramite Alexa, permette di fermare ogni acquisto.
Sotto il profilo sicurezza chiunque può avviare, parlando al dispositivo, un acquisto. Di questo sarà opportuno tenere presente, migliorando quindi il flusso che porta alla conclusione contrattuale.
La diffusione di Alexa negli smart speakers è superiore ai concorrenti, e funziona. Riconoscere l'audio mentre il dispositivo suona, non è proprio alla portata di tutti i concorrenti nel settore dei voice assistent.
Le skill, per molti versi, sono paragonabili ai chatbot e alla loro programmazione.
L'essere solo "audio" o "vocale" comporta però una diversità linguistica e comunicativa non indifferente, che richiede di non pensare ad una skill come ad altre soluzioni già viste.
La programmazione ruota su intent e Utterances: azioni e sinonimi (traduzione libera). Alcune azioni sono predefinite, comunque personalizzabili. Altre definibili dallo sviluppatore.
La percentuale di insuccesso (la skill non sa cosa fare) è un fattore importante che richiede una continua attività successiva, che va tuttavia progettata.
Pensare quindi ad una skill come ad uno strumento eccessivamente flessibile è il modo sbagliare di approcciarsi a questo mondo.
L'idea invece è quella di insegnare alla propria skill un compito alla volta. I filoni sono molteplici, ma tutti accomunati da una caratteristica: parlare ad un microfono è molto più rapido e appagante del leggere un terminale.