可从他的行为来看文字转WAV音频