然后直接穿透建筑文字转WAV音频