novita/openchat-7b

public

Published on 3/5/2025

openchat-7b

OpenChat-7B uses C-RLFT (Conditioned Reinforcement Learning Fine-Tuning) to enhance a 7B parameter base model. This innovative approach trains on mixed-quality data without requiring preference labels.

Models

openchat-7b

anthropic

chat

edit

apply