而且极难捕获文字转WAV音频