不过此时根据问话人的语气文字转WAV音频