准确的把握到高扬的位置时文字转WAV音频