只是因为它们经过分析认为文字转WAV音频