IT之家 10 月 18 日新闻 ,微软微软旗下钻研团队克日宣告论文,陈说称详细钻研了大型语言模子 (LLM) 的微软“可信度”以及潜在毒性,特意关注 OpenAI 的陈说称 GPT-4 及其前代 GPT-3.5 。
钻研团队,微软GPT-4 尽管在尺度基准测试中比 GPT-3.5 愈加坚贞 ,陈说称但简略受到“越狱”揭示(绕过模子清静措施)影响 。微软GPT-4 可能会凭证这些“越狱”揭示,陈说称天生有害内容。微软
论文中夸张 GPT-4 更易受到恶意“越狱”零星或者用户揭示影响