Comment utiliser Serverless RL
Effectuez le post-entraînement de modèles avec Serverless RL à l’aide du framework ART d’OpenPipe et de la Serverless Training API pour l’apprentissage par renforcement.
Utilisez Serverless RL via le framework ART d’OpenPipe et la Serverless Training API.
Pour commencer à utiliser Serverless RL, vous devez remplir les prérequis pour utiliser les outils W&B, puis suivre le démarrage rapide d’ART.
Pour obtenir des exemples de code et de flux de travail, voir le notebook Google Colab.