也就是所谓的内修和外修文字转WAV音频