他们也就都采用了文字转WAV音频