不过如果换一种想法就比较容易理解和接受了文字转WAV音频