而是因为提前算好了轨迹文字转WAV音频