CLOUDV는 고성능 GPU 서버를 무약정으로 제공하여, 장기 계약에 따른 위약금 부담 없이 최대 8way GPU를 최저가로 이용할 수 있습니다.
또한, 구매형 및 소유권 이전형 옵션을 통해 기존 데이터와 GPU 서버를 그대로 양도받아 운영할 수 있는 유연한 조건을 갖추고 있습니다.
대규모 데이터셋과 복잡한 AI 모델 학습에 필요한 방대한 메모리 대역폭을 확보로 안정적이고 신뢰성이 높은 딥러닝 및 고성능 컴퓨팅 작업을 지원합니다.
ECC(Error-Correcting Code) GDDR6 메모리는 데이터 무결성과 연산 중 발생할 수 있는 오류 최소화, 중요한 연구 및 개발 작업에서의 신뢰성을 더욱 높여줍니다.
직접 설계하고 자체 운영하는 데이터센터에서 고성능 GPU 컴퓨팅 환경을 제공합니다. IDC-SMILE 데이터센터의 전력 효율성과 냉각 시스템은 최적의 성능을
유지하면서도 운영 비용을 절감할 수 있도록 설계되었습니다. 24시간 365일 모니터링과 유지보수를 통해 항상 안정적이고 신뢰할 수 있는 서비스를 제공합니다.
Ollama, vLLM, KTransformers 등의 AI 프레임워크를 기반으로 대규모 언어 모델(LLM)을 실행할 수 있는 최적화된 사양을 제안합니다.
수억원 대 NVIDIA 최상급 Multi-GPU 시스템에서나 실행할 수 있었던 DeepSeek-R1 671B를 Ktransformers를 통해 가벼운 성능에서도 쉽게 구동할 수 있습니다.
[ LLM&GPU 바로가기 ]
※ 상품 이용 전 이용 조건 및 공통 사항을 반드시 확인하시기 바랍니다.
※ GPU, RAM, DISK는 선택한 서버 사양에 따라 확장 가능하오니 자세히 보기를 참고하시기 바랍니다.
※ GPU 서버 모든 사양 및 요금은 부품 수급 상황에 따라 변동 될 수 있습니다.
※ 상품 이용 전 이용 조건 및 공통 사항을 반드시 확인하시기 바랍니다.
※ GPU, RAM, DISK는 선택한 서버 사양에 따라 확장 가능하오니 자세히 보기를 참고하시기 바랍니다.
※ GPU 서버 모든 사양 및 요금은 부품 수급 상황에 따라 변동 될 수 있습니다.
※ 상품 이용 전 이용 조건 및 공통 사항을 반드시 확인하시기 바랍니다.
※ GPU, RAM, DISK는 선택한 서버 사양에 따라 확장 가능하오니 자세히 보기를 참고하시기 바랍니다.
※ GeForce 그래픽카드가 장착된 GPU 서버 사용시 반드시NVIDIA GeForce 소프트웨어 사용을 위한 라이선스 를 확인하시기 바랍니다.
※ GPU 서버 모든 사양 및 요금은 부품 수급 상황에 따라 변동 될 수 있습니다.
LLM 서버 성능은 사용 목적에 맞는 사양 설정에 따라 달라집니다. GPU는 병렬 연산, CPU는 모델 관리 및 데이터 처리, RAM은 대용량 처리, Storage는 데이터 저장 및 I/O 속도에 각각 기여합니다. LLM 모델의 규모, 목적, 예산에 맞춰 선택할 수 있습니다.
GPU는 LLM 처리에서 가장 중요한 요소 중 하나로, 대규모 병렬 연산을 수행합니다.
- GPU 메모리 용량 (VRAM): 대규모 언어 모델의 경우 모델 크기가 매우 크기 때문에 GPU의 VRAM 용량이 충분히 커야 합니다.
- FP16/FP32 연산 속도 : AI 작업에서 주로 사용되는 FP16(half-precision) 연산 속도가 높은 GPU를 선택해야 합니다.
- 다중 GPU 지원 여부 : 대형 모델은 기본적으로 멀티 GPU 구성이 필요합니다.
CPU는 전체 시스템의 제어와 데이터 전처리 및 모델 관리를 담당합니다.
- 코어 수: CPU 코어는 병렬 데이터 로딩 및 모델 스케줄링을 처리하므로 멀티코어 프로세서가 유리합니다.
- 클럭 속도 : 높은 클럭 속도는 빠른 데이터 준비와 모델 실행 속도를 지원합니다.
RAM은 모델 실행 및 데이터 처리 시 임시 데이터를 저장하는 역할을 합니다.
- 용량: RAM은 GPU 메모리의 한계를 보완하는 역할을 합니다. 따라서 충분한 RAM 용량이 중요합니다.
- 속도 (클럭) : RAM 클럭 속도가 빠를수록 데이터 처리 속도가 향상됩니다. DDR4 또는 최신 DDR5 메모리를 추천합니다.
- 메모리 확장성 : 서버의 RAM 슬롯 수를 확인하여 필요 용량을 계산할 수 있습니다.
Storage는 LLM 작업에서는 모델 저장 및 데이터 I/O 성능이 중요합니다.
- 속도: 고속 데이터 입출력을 위해 NVMe SSD를 추천합니다.
- 입출력 작업 수 : 대규모 데이터셋을 빠르게 불러오기 위해 IOPS(초당 입력/출력 작업 수)가 높은 SSD를 추천합니다.
- 용량 : 1~2TB 이상의 용량을 권장합니다.
지원 범위 | Ollama, vLLM(4GPU) | Ollama, vLLM(8GPU) | Ktransformers |
---|---|---|---|
GPU 슬롯 | 최대 4개 | 최대 8개 | 최대 1개 |
GPU 모델 | - AMD : w6800, 9700 - NVIDIA : 4000Ada, A6000, 6000Ada, PRO5000, PRO6000, 4090 blower |
- AMD : w6800, 9700 - NVIDIA : 4000Ada, A6000, 6000ada, PRO5000, PRO6000, 4090 blower |
- NVIDIA : 4000Ada, A6000, 6000Ada, PRO5000, PRO6000, 4090 blower, 5080, 5090 |
CPU | 1 x Xeon Silver 4314 (16C/32T) |
2 x Xeon Silver 4314 (32C/64T) |
2 x Xeon Silver 4510 (24C/48T) |
RAM | 8 x 16~64GB (DDR4) |
32 x 16~64GB (DDR4) |
16 x 64GB (DDR5) |
Storage | SSD, NVMe - 내부: 2 x PCIe3.0 x2, 1 x SATA3(2.5") - 외부: 8 x SATA3(2.5"/3.5") Hot-swap |
SSD, NVMe - 내부: 1 x PCIe3.0 x4 - 외부: 12 x SATA3(2.5"/3.5") Hot-swap |
SSD, NVMe - 내부: 2 x PCIe4.0 x2, 1 x SATA3(2.5") - 외부: 8 x SATA3(2.5"/3.5") Hot-swap |
LAN | - 4 x 2.5Gbps(RJ45, Ethernet 전용) - 1 x IPMI 전용(RJ45) - 최대 2port 10Gbps NIC 장착 가능 (3GPU 이하 시) |
- 2 x 1Gbps(RJ45, Ethernet 전용) - 1 x IPMI 전용(RJ45) - 최대 2port 10Gbps NIC 장착 가능 |
- 2 x 1Gbps(RJ45, Ethernet, 1x IPMI 공유) - 1 x IPMI 전용(RJ45) - 최대 2port 10Gbps NIC 장착 가능 |
Chassis | SMILE Barebone4U | Tyan GPU B7129F83AV8E4HR-N-HE | SMILE Barebone4U |
PSU | ATX [2000/2500]W Single | - 6000W(3+1 2,000W RPSU, 80+ Platinum) - 4800W(3+1 1,600W RPSU, 80+ Platinum) |
ATX 1200W Single |
※ 맞춤 서버는 상담 > 견적 > 납품 순으로 진행하며, 이 과정에서 서비스 이용까지 시간이 소요될 수 있습니다.
※ 스마일서브 IDC 외 설치 장소는 스마일서브 협력사를 통하여 납품을 제공하므로 출장비가 발생합니다.
※ 맞춤 서버는 견적 당시 기준으로 공급가가 결정되며, 견적 유효 기간 또는 공공 요금 인상 등의 이유로 변경 될 수 있습니다.
※ 표시된 정보는 실제 정보를 확인할 수 있는 상품 페이지의 내용과 상이할 수 있으며, 실제 서비스가 가능한 페이지의 정책을 우선으로 합니다.
※ 기타 이용에 관한 사항은 약관 및 SLA에서 확인하시기 바랍니다.
고객 소유의 GPU를 장착할 수 있는 베어본 서버 기반의 IDC 서비스를 제공합니다. 최대 8WAY까지 장착 가능하며 CPU, RAM, Storage 사양을 선택할 수 있습니다. 스마일서브가 직접 설계한 서버를 통해 안정적인 성능을 제공합니다.
GPU |
· 게이밍 - 최대 2GPU까지 가능 / 사이즈 350mmx150mmx65mm(길이x높이x두께, 커넥터 위치에 따라 상이) · 서버/데이터센터/전문가용 - 최대 8GPU까지 가능 (두께에 따라 상이) · 수냉 장착 불가 |
---|---|
CPU | Intel Xeon scalable 4314 [32Thread / 2.4GHz] |
RAM | DDR4 32GB PC4-21300 ECC/REG |
DISK | Datacenter SSD or NVMe M.2 |
Form Factor | SMILE 4U Barebone / 2000W(Single power) or Tyan GPU B7129F83AV8E4HR-N-HE / 6000W(3+1 2,000W RPSU, 80+ Platinum) |
※ 커스텀 GPU 서버 서비스는 스마일서브 담당자와의 상담과 견적을 통해서만 신청이 가능합니다.
※ 고객 소유의 GPU에 발생하는 장애나 파손에 대한 책임과 관리는 고객에게 있습니다.
※ 베어본 서버에 장착되는 GPU의 호환성은 스마일서브에서 보장하지 않습니다.
※ 베어본 서버의 A/S는 스마일서브의 규정을 따르며, GPU는 A/S 대상에서 제외됩니다.
※ 서비스 해지 등의 사유로 서버나 GPU 장치를 반출할 경우, 미납 요금은 전액 완납해야 합니다.
※ 고객이 소유한 GPU 장치의 사용에 필요한 라이선스는 고객이 직접 취득해야 합니다.
※ IDC 이용료(전기 요금 포함)는 GPU 모델의 최대 전력 소비량을 기준으로 책정됩니다.
제조사 | NVIDIA | AMD | |||||
---|---|---|---|---|---|---|---|
모델 | PRO6000 | PRO5000 | Tesla T4 | A6000 | 4000Ada | RX9060XT | W6800 |
아키텍쳐 | Blackwell | Blackwell | Turing | Ampere | Ada Lovelace | AMD RDNA™ 4 | AMD RDNA™ 2 |
GPU 메모리 | 96GB (GDDR7 ECC) |
48GB (GDDR7 ECC) |
16GB (GDDR6 ECC) |
48GB (GDDR6 ECC) |
20GB (GDDR6 ECC) |
16GB (GDDR6) |
32GB (GDDR6 ECC) |
GPU 메모리 대역폭 | 1,792 GB/s | 1,344 GB/s | 320 GB/S | 768 GB/S | 360 GB/S | 320 GB/s | 512 GB/S |
CUDA 코어 (스트림프로세서) |
24,064 | 14,080 | 2,560 | 10,752 | 6,144 | 2,048 | 3,840 |
FP32 성능 | 110 TFLOPS | 73.2 TFLOPS | 8.1 TFLOPS | 38.7 TFLOPS | 26.7 TFLOPS | 25.6 TFLOPs | 17.83 TFLOPS |
TDP | 300W | 300W | 70W | 300W | 130W | 160W | 250W |
이용 안내 |
|
---|---|
맞춤 서버 이용안내 |
|
제공 트래픽 |
※ 트래픽비용은 다운로드 트래픽(Out-bound) 사용량을 기준으로 하며, 해외트래픽은 전체 트래픽양에 포함됩니다. ※ IDC내 서비스간 발생하는 트래픽은 모두 비과금 처리되어 무료로 제공됩니다. (Non ELCAP Firewall Zone 제외). |
기타/주의사항 |
|
1. 서버로 접근하는 악의적인 접근과 불필요한 패킷유입 “ELCAP 방화벽”으로 차단하세요.(무료) | 자세히 보기 |
2. “서버 취약점 점검”으로 시스템의 취약점을 확인하고, 보완하여 보안사고를 예방하세요.(무료) | 자세히 보기 |
3. 가장 기본적이면서 중요한 “데이터 백업”은 랜섬웨어 피해 또는 유사시 복구를 위한 필수사항 입니다. | 자세히 보기 |
4. 보안서버 구축 의무화, 위반시 과태료 최대 3천만원! 지금 바로 “SSL 보안서버” 를 구축하세요. | 자세히 보기 |
5. 지속적으로 증가하는 웹공격 위협! “지능형 웹방화벽”으로 다양한 웹공격에 대비하세요. | 자세히 보기 |
6. 개인정보 유출시 과징금 최대 5억원! “DB 암호화”로 개인정보를 보호하고, 유출을 차단하세요. | 자세히 보기 |
Ollama와 vLLM을 활용한 LLM 설치 및 실행
TensorFlow, PyTorch 등 다양한 AI/딥러닝 프레임워크 설치
[ 기술 문의 : 1688-4879 ]
Docker 기본 탑재, Docker HUB 연결을 통한 Application 이미지 지원
GPU에서 수집한 다양한 메트릭을 시각적으로 편리하게 모니터링 할 수 있는 Grafana 소프트웨어 설치