恐怕有很多细节会错过文字转WAV音频