但是很显然他们就是不太相信文字转WAV音频