只能尽量多的去拍摄各个角度文字转WAV音频