他们更愿意看到真实的文字转WAV音频