只要能够确认深度便没有什么问题文字转WAV音频