仍然要口称一声文字转WAV音频