如果只是依据现场围观群众拍摄的照片来判定的话文字转WAV音频