他们的情况就普通了文字转WAV音频