他们便只能根据声音来推测苏林的样子文字转WAV音频