估计应该是后一种文字转WAV音频