估计也都会做出相似的选择文字转WAV音频