恐怕他们根本不会细想文字转WAV音频