那就要考虑任何可能性哪怕最微小的可能文字转WAV音频