给出的最表面的指引文字转WAV音频