Serverless RL の使い方
OpenPipe の ART フレームワークと、強化学習向けの Serverless Training API を使用して、モデルをポストトレーニングします。
Serverless RL は、OpenPipe の ART フレームワーク と Serverless Training API を使用して利用できます。
Serverless RL の使用を開始するには、まず W&B ツールを使用するための 前提条件 を満たし、その後 ART の クイックスタート を完了してください。
コード例やワークフローについては、Google Colab ノートブック をご覧ください。