所以在他的构想里面文字转WAV音频