科技媒体 testingcatalog 发透露了 AI 公司 Anthropic 正在研发的新模型 Claude Neptune 的相关信息。目前,这一新 AI 模型已进入内部安全测试阶段,预计将与 OpenAI 的 GPT-5及谷歌的 Gemini Ultra 展开竞争。

image.png

根据博文的介绍,Claude Neptune 的安全测试正在使用 Anthropic Workbench 平台进行。这一阶段主要进行红队演习,旨在评估模型抵御越狱攻击的能力。红队演习将于5月18日结束,测试的重点在于 constitutional classifiers 系统,这是该模型安全协议的核心,特别关注对越狱尝试的防范。初步测试结果显示,相较于以往的模型,Claude Neptune 在安全问题上的敏感性有所增强,表现出更强大的防护能力。

媒体推测,Anthropic 可能会在5月底或6月初正式发布 Claude Neptune。这一新模型的推出,不仅使其与 GPT-5和 Gemini Ultra 正面交锋,还预计将加强多模态和智能体功能,为市场带来新的竞争动力。

值得一提的是,Claude Neptune 在设计上对用户的安全和隐私问题给予了高度重视,进一步提升了 AI 系统在处理复杂任务时的安全性和稳定性。这表明 Anthropic 在 AI 领域的持续创新与发展,将助力公司在激烈的市场竞争中占据一席之地。

Claude Neptune 的发布值得期待,尤其是在人工智能领域日益增长的需求和挑战下。随着技术的不断进步,未来的 AI 模型将可能在多个领域实现更广泛的应用,提升人们的生活质量。

划重点:

🌟 新模型 Claude Neptune 正在进行内部安全测试,将与 GPT-5和 Gemini Ultra 竞争。  

🔐 重点测试内容包括抵御越狱攻击的能力及对安全问题的敏感性。  

📅 预计 Claude Neptune 将于5月底或6月初正式发布,带来新的市场挑战。