但也很难实现包围文字转WAV音频