他们是准备在特定情况下文字转WAV音频