Synteza mowy (z angielskiego Text to Speech, w skrócie TTS) jest to proces przetwarzania tekstu, w którym zostaje on zamieniony na komunikaty głosowe. Synteza mowy wykorzystywana jest przez osoby niewidome lub słabowidzące na przykład w odczytywaniu treści na stronach internetowych, wiadomości tekstowych czy poczty elektronicznej. Sygnały głosowe mogą być generowane na dwa różne sposoby. Możliwe jest modelowanie sygnału przy użyciu nagrań mowy, jest to tak zwana metoda konkatenacyjna. Druga metoda nazywana jest alfoniczną i polega na generowaniu przez komputer mowy na podstawie dźwięków elementarnych zapisanych w pamięci maszyny. Przez długi czas wielkim wyzwaniem w syntezie było uzyskanie możliwie naturalnej płynności mowy. Obecnie procesy konwersji tekstu na mowę są na tyle rozwinięte, że ciężki rozróżnić prawdziwą mowę ludzką od tej, która jest wynikiem syntezy.