他主导的是方向和框架文字转WAV音频