问题是他们没有日本那样的地理条件文字转WAV音频