La capacità di una macchina di interpretare i pattern del linguaggio vocale umano naturale e tradurli in un formato leggibile dalla macchina. È noto anche come riconoscimento vocale automatico (Automatic Speech Recognition, ASR), riconoscimento vocale del computer e conversione dell’audio in testo (Speech To Test, STT). Esempio: la tecnologia alla base degli assistenti virtuali come Siri e Alexa, che permette a questi strumenti di comprendere i comandi vocali.