商量SenseChat
由商汤科技开发的一款基于自研大模型的AI聊天助手
Skywork-Reward-V2 是昆仑万维团队在 2025 年 7 月发布的第二代开源奖励模型(Reward Model)系列,涵盖 8 款不同参数规模的模型,参数量从 6 亿到 80 亿不等,分别基于 Qwen3 和 LLaMA3 等主流预训练模型进行训练。这一系列模型在七大主流奖励模型评测基准(如 RewardBench v1/v2、PPE、RM‑Bench、JudgeBench 等)中全面领先,在“人类偏好对齐”“客观正确性”“安全性”等方面均表现出色。

本站知音库提供的Skywork-Reward-V2都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由知音库实际控制,在2025年11月4日 上午2:56收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,知音库不承担任何责任。