Queue Config Templates 설정하기
Queue Config Templates를 사용하여 컴퓨팅 소비에 대한 가드레일을 관리하고 관리하세요. 메모리 소비, GPU, 런타임 기간과 같은 필드에 대해 기본값, 최소값 및 최대값을 설정할 수 있습니다. 설정 템플릿을 사용하여 큐를 구성하면, 팀의 멤버는 사용자가 정의한 특정 범위 내에서만 필드를 변경할 수 있습니다.큐 템플릿 구성하기
기존 큐에서 템플릿을 구성하거나 새 큐를 생성할 수 있습니다.- W&B Launch 앱으로 이동합니다.
- 템플릿을 추가하려는 큐 이름 옆의 View queue를 선택합니다.
- Config 탭을 선택합니다. 여기에서 큐가 생성된 시기, 큐 설정, 기존의 launch-time 재정의(overrides)와 같은 정보를 볼 수 있습니다.
- Queue config 섹션으로 이동합니다.
- 템플릿을 생성하려는 설정 키-값(key-values)을 식별합니다.
- 설정의 값을 템플릿 필드로 바꿉니다. 템플릿 필드는
{{variable-name}}형식을 취합니다. - Parse configuration 버튼을 클릭합니다. 설정을 파싱하면, W&B는 생성된 각 템플릿에 대해 큐 설정 아래에 자동으로 타일을 생성합니다.
- 생성된 각 타일에 대해, 먼저 큐 설정이 허용할 수 있는 데이터 타입(string, integer 또는 float)을 지정해야 합니다. 이를 위해 Type 드롭다운 메뉴에서 데이터 타입을 선택합니다.
- 데이터 타입에 따라 각 타일 내에 나타나는 필드를 완성합니다.
- Save config를 클릭합니다.
launch config
InstanceType에 대한 템플릿 필드를 추가하면 설정은 다음과 같이 바뀝니다.
launch config
aws-instance라는 라벨이 붙은 새 타일이 나타납니다.
거기서 Type 드롭다운의 데이터 타입으로 String을 선택합니다. 그러면 사용자가 선택할 수 있는 값을 지정할 수 있는 필드가 채워집니다. 예를 들어, 다음 이미지에서 팀의 관리자는 사용자가 선택할 수 있는 두 가지 AWS 인스턴스 유형(ml.m4.xlarge 및 ml.p3.xlarge)을 설정했습니다.

Launch 잡 동적 구성하기
큐 설정은 에이전트가 큐에서 잡을 꺼낼 때(dequeue) 평가되는 매크로를 사용하여 동적으로 구성할 수 있습니다. 다음 매크로를 설정할 수 있습니다.| 매크로 | 설명 |
|---|---|
${project_name} | Run 이 실행되는 Project 의 이름입니다. |
${entity_name} | Run 이 실행되는 Project 의 소유자입니다. |
${run_id} | 실행되는 Run 의 ID입니다. |
${run_name} | 실행 중인 Run 의 이름입니다. |
${image_uri} | 이 Run 을 위한 컨테이너 이미지의 URI입니다. |
앞의 표에 나열되지 않은 커스텀 매크로(예:
${MY_ENV_VAR})는 에이전트의 환경에서 가져온 환경 변수로 대체됩니다.가속기(GPU)에서 실행되는 이미지를 빌드하기 위해 Launch 에이전트 사용하기
가속기 환경에서 실행되는 이미지를 빌드하기 위해 Launch 를 사용하는 경우 가속기 베이스 이미지를 지정해야 할 수도 있습니다. 이 가속기 베이스 이미지는 다음 요구 사항을 충족해야 합니다.- Debian 호환성 (Launch Dockerfile은 python을 가져오기 위해 apt-get을 사용함)
- CPU 및 GPU 하드웨어 명령어 세트 호환성 (사용하려는 GPU에서 CUDA 버전이 지원되는지 확인하세요)
- 제공하는 가속기 버전과 ML 알고리즘에 설치된 패키지 간의 호환성
- 하드웨어 호환성 설정을 위해 추가 단계가 필요한 설치된 패키지
TensorFlow에서 GPU를 사용하는 방법
TensorFlow가 GPU를 올바르게 활용하는지 확인하세요. 이를 위해 큐 리소스 설정의builder.accelerator.base_image 키에 Docker 이미지와 이미지 태그를 지정합니다.
예를 들어, tensorflow/tensorflow:latest-gpu 베이스 이미지는 TensorFlow가 GPU를 올바르게 사용하도록 보장합니다. 이는 큐의 리소스 설정을 사용하여 구성할 수 있습니다.
다음 JSON 스니펫은 큐 설정에서 TensorFlow 베이스 이미지를 지정하는 방법을 보여줍니다.
Queue config