一种由于拍摄的时候机位摆放和后期剪切不当文字转WAV音频