前面两次他的正确率连六成都不到文字转WAV音频