我们只能按照原定计划去接应他们文字转WAV音频