刚开始阶段他们确实不会文字转WAV音频