原本他们都以文字转WAV音频