他们几乎同时想到文字转WAV音频