Serverless RL 사용하기
OpenPipe의 ART 프레임워크와 강화 학습용 Serverless Training API로 모델을 사후학습(Post-training)하세요.
OpenPipe의 ART 프레임워크와 Serverless Training API를 통해 Serverless RL을 사용할 수 있습니다.
Serverless RL을 시작하려면 먼저 W&B 도구를 사용하기 위한 사전 요구 사항을 충족한 다음, ART 퀵스타트를 진행해야 합니다.
코드 예시와 워크플로는 Google Colab notebook에서 확인하세요.