这样不仅分散了人流文字转WAV音频