他们使用本体文字转WAV音频