Serverless Training - Weights & Biases Documentation

Serverless Training을 사용하면 관리형 서버리스 인프라에서 LLM을 포스트 트레이닝하고 파인튜닝할 수 있습니다. W&B는 사용자를 위해 트레이닝 인프라(CoreWeave에서)를 프로비저닝하면서도 환경 설정은 원하는 대로 유연하게 구성할 수 있도록 합니다. 수십 개의 GPU까지 탄력적으로 자동 확장되는 관리형 트레이닝 클러스터에 즉시 액세스할 수 있습니다. Serverless Training은 현재 공개 프리뷰로 제공됩니다. Serverless Training은 서로 보완적인 두 가지 방법을 제공합니다:

Serverless RL: 강화 학습으로 모델을 포스트 트레이닝하여 여러 턴으로 이루어진 에이전트 작업을 수행할 때 새로운 동작을 학습하고, 신뢰성, 속도, 비용 효율을 개선합니다. Serverless RL은 RL 워크플로를 Inference 단계와 트레이닝 단계로 나누고 이를 여러 작업에 멀티플렉싱해 GPU 사용량을 높이고 트레이닝 시간과 비용을 줄입니다.
Serverless SFT: 선별된 데이터셋으로 지도 학습을 수행해 모델을 파인튜닝합니다. 증류, 출력 스타일과 형식 학습, 또는 RL을 적용하기 전에 모델을 워밍업하는 용도로 SFT를 사용하세요.

Serverless Training은 다음과 같은 작업에 적합합니다:

음성 에이전트
딥 리서치 어시스턴트
온프레미스 모델
콘텐츠 마케팅 분석 에이전트

Serverless Training은 특정 작업에 맞게 모델을 특화할 수 있도록 저랭크 어댑터(LoRA)를 트레이닝합니다. 이를 통해 실제 작업에서의 경험으로 원래 모델의 기능을 확장할 수 있습니다. W&B는 트레이닝한 LoRA를 계정에 아티팩트로 자동 저장합니다. 백업을 위해 로컬이나 서드파티에 저장할 수도 있습니다. 또한 Serverless Inference는 Serverless Training을 통해 트레이닝한 모델도 자동으로 호스팅합니다. 시작하려면 ART 퀵스타트 또는 Google Colab 노트북을 참조하세요.

왜 Serverless Training인가요?

Serverless Training은 사후학습(Post-training)에서 다음과 같은 이점을 제공합니다:

더 낮은 트레이닝 비용: 여러 사용자에게 공유 인프라를 멀티플렉싱하고, 각 작업마다 설정 과정을 생략하며, 실제로 트레이닝하지 않을 때는 GPU 비용을 0까지 낮출 수 있으므로 Serverless Training은 트레이닝 비용을 크게 줄여줍니다.
더 빠른 트레이닝 시간: 여러 GPU에 추론 요청을 분산하고, 필요할 때 즉시 트레이닝 인프라를 프로비저닝하므로 Serverless Training은 트레이닝 작업을 더 빠르게 실행하고 반복 주기를 단축할 수 있게 해줍니다.
자동 배포: Serverless Training은 트레이닝한 모든 체크포인트를 자동으로 배포하므로 호스팅 인프라를 수동으로 설정할 필요가 없습니다. 로컬, 스테이징 또는 프로덕션 환경에서 트레이닝된 모델에 즉시 액세스하고 테스트할 수 있습니다.

Serverless Training에서 W&B 서비스를 사용하는 방식

Serverless Training은 다음 W&B 컴포넌트를 조합해 작동합니다:

Inference: 모델을 실행하는 데 사용
Models: LoRA 어댑터 트레이닝 중 성능 메트릭을 추적하는 데 사용
Artifacts: LoRA 어댑터를 저장하고 버전을 관리하는 데 사용
Weave (선택): 트레이닝 루프의 각 단계에서 모델이 어떻게 응답하는지 관측성을 확보하는 데 사용

Serverless Training은 공개 프리뷰 상태입니다. 프리뷰 기간 동안 W&B는 Inference 사용량과 아티팩트 저장소에 대해서만 요금을 청구합니다. 프리뷰 기간 동안 어댑터 트레이닝에는 요금이 청구되지 않습니다.

​왜 Serverless Training인가요?

​Serverless Training에서 W&B 서비스를 사용하는 방식

왜 Serverless Training인가요?

Serverless Training에서 W&B 서비스를 사용하는 방식