所以我只能是模拟一下文字转WAV音频