既然可以确定位置文字转WAV音频