再加上正确的走位文字转WAV音频