然后再根据气息文字转WAV音频