并根据他们的指引文字转WAV音频