这二人的目标都是他文字转WAV音频