绝大多数都还在原地文字转WAV音频