然后他就带着大家做出各种假设文字转WAV音频