爱企猫02月24日消息:清华大学与瑞莱智慧联合团队推出大语言模型RealSafe-R1,该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,实现了安全性的显著提升。RealSafe-R1各尺寸模型及数据集将于一周后陆续开放下载。瑞莱智慧方面表示,RealSafe-R1系列大模型相比Deepseek-R1安全性大幅提升,优于国际上被认为安全性较好的闭源大模型Claude3.5、GPT-4o等,为Deepseek生态添砖加瓦。
研究团队提出了STAIR框架(SafeTy Alignment with Introspective Reasoning),采用三阶段的方法,系统性提升基础模型在复杂的安全对齐场景中表现。
关联信息:清华大学于-成立,法人是王希勤,注册资本184219万,行业是-,位于:北京市海淀区清华园
清华大学
本文地址:https://news.aiqimao.com/id/39018