实际上刚刚我们一直在研究这些视频文字转WAV音频