Linux 및 Windows용 Azure Data Science Virtual Machine이란?

DSVM(Data Science Virtual Machine)은 데이터 과학 수행을 위해 특별히 구축된 Azure 클라우드 플랫폼의 사용자 지정 VM 이미지입니다. 여기에는 고급 분석을 위한 인텔리전트 애플리케이션 빌드를 바로 수행할 수 있도록 다수의 유명한 데이터 과학 도구가 미리 설치 및 구성되어 있습니다.

DSVM은 다음에서 사용할 수 있습니다.

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

또한 대규모 분산 딥 러닝 워크로드에 최적화된 Azure Marketplace의 Ubuntu 20.04 이미지인 PyTorch용 Azure DSVM을 제공하게 되어 기쁘게 생각합니다. 설치 비용을 줄이고 가치 창출 시간을 가속화하기 위해 최신 PyTorch 버전으로 미리 설치되고 유효성이 검사됩니다. 다양한 최적화 기능(ONNX Runtime​, DeepSpeed​, MSCCL​, ORTMoE​, Fairscale​, Nvidia Apex)과 호환되는 최신 버전의 Ubuntu, Python, PyTorch, CUDA가 포함된 최신 스택과 함께 패키지로 제공됩니다.

Azure Machine Learning과 비교

DSVM은 데이터 과학용으로 사용자 지정된 VM 이미지이지만 Azure Machine Learning은 다음을 포함하는 엔드투엔드 플랫폼입니다.

  • 완전 관리형 컴퓨팅
    • 컴퓨팅 인스턴스
    • 분산 ML 작업용 컴퓨팅 클러스터
    • 실시간 점수 매기기를 위한 유추 클러스터
  • 데이터 저장소(예: Blob, ADLS Gen2, SQL DB)
  • 실험 추적
  • 모델 관리
  • Notebooks
  • 환경(conda 및 R 종속성 관리)
  • 레이블 지정
  • 파이프라인(엔드투엔드 데이터 과학 워크플로 자동화)

Azure Machine Learning 컴퓨팅 인스턴스와 비교

Azure Machine Learning 컴퓨팅 인스턴스는 완전히 구성되고 관리되는 VM 이미지이지만 DSVM은 관리되지 않는 VM입니다.

이들 간의 주요 차이점은 다음과 같습니다.

기능 데이터 과학
VM
Azure Machine Learning
컴퓨팅 인스턴스
완전 관리형
언어 지원 Python, R, Julia, SQL, C#,
Java, Node.js, F#
Python 및 R
운영 체제 Ubuntu
Windows
Ubuntu
미리 구성된 GPU 옵션
스케일 업 옵션
SSH 액세스
RDP 액세스 아니요
기본 제공
호스트된 Notebooks
아니요
(추가 구성 필요)
기본 제공 SSO 아님
(추가 구성 필요)
기본 제공 협업
사전 설치된 도구 Jupyter(lab), VS Code,
Visual Studio, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter(랩)

샘플 사용 사례

DSVM 고객을 위한 몇 가지 일반적인 사용 사례는 다음과 같습니다.

단기 실험 및 평가

DSVM을 사용하면, 특별히 게시된 샘플 및 연습 중 일부를 진행하여 새로운 데이터 과학 도구를 평가하거나 학습할 수 있습니다.

GPU를 사용한 딥 러닝

DSVM에서 학습 모델은 GPU(그래픽 처리 장치)를 기반으로 하는 하드웨어에서 딥 러닝 알고리즘을 사용할 수 있습니다. DSVM을 사용하면 Azure 플랫폼의 VM 확장 기능을 활용하여 필요에 따라 클라우드에서 GPU 기반 하드웨어를 사용할 수 있습니다. 큰 모델을 학습할 때 또는 동일한 OS 디스크를 유지하면서 고속 계산이 필요한 경우 GPU 기반 VM으로 전환할 수 있습니다. DSVM에서 N 시리즈 GPU 지원 가상 머신 SKU 중 하나를 선택할 수 있습니다. 참고 GPU 지원 가상 머신 SKU는 Azure 무료 계정에서 지원되지 않습니다.

DSVM의 Windows 버전에는 GPU 드라이버, 프레임워크 및 GPU 버전 딥 러닝 프레임워크가 미리 설치되어 있습니다. Linux 버전의 경우 Ubuntu DSVM에서 GPU에 대한 딥 러닝이 활성화됩니다.

GPU를 기반으로 하지 않는 Azure 가상 머신에 DSVM의 Ubuntu 또는 Windows 버전을 배포할 수도 있습니다. 이 경우 모든 딥 러닝 프레임워크는 CPU 모드로 대체됩니다.

사용 가능한 딥 러닝 및 AI 프레임워크에 대해 자세히 알아보세요.

데이터 과학 학습 및 교육

데이터 과학 수업을 가르치는 엔터프라이즈 트레이너 및 강사는 대개 가상 머신 이미지를 제공합니다. 이미지를 통해 학생에게 일관된 설정을 제공하여 샘플이 예상대로 작동하도록 할 수 있습니다.

DSVM은 지원 및 비호환 문제를 덜어주는 일관된 설정을 사용하여 주문형 환경을 생성합니다. 이러한 환경을 빈번하게 구축해야 하는 경우, 특히 짧은 수업의 경우, 실질적인 이점이 있습니다.

DSVM에는 무엇이 포함되나요?

여기에서 Windows 및 Linux DSVM의 전체 도구 목록을 참조하세요.

다음 단계

다음 문서에서 자세한 내용을 알아보세요.