都是自动的让出了位置文字转WAV音频