他们会分段取样文字转WAV音频