虽然大部分的区域仍然是灰蒙蒙的文字转WAV音频