十人便是从各自的区域文字转WAV音频