时间的长短很难认定文字转WAV音频