因为他们的渠道原本就是成熟的文字转WAV音频