但都是由身边人去执行文字转WAV音频