而且必须得靠近目标文字转WAV音频