似乎是在辨认位置文字转WAV音频