相信可以把小四所在的范围尽可能缩到最小文字转WAV音频