并且他们最多口头上支援文字转WAV音频