상세 컨텐츠

본문 제목

NVIDIA 차세대 GPU 사양, 성능 유출 - 7936 CUDA, 48GB HBM2e VRAM

IT기기/PC Hardware News

by 컴 공 생 2020. 3. 5. 13:16

본문


NVIDIA 의 차세대 GPU 가 머지않아 공개될 것입니다. 코로나 바이러스의 영향으로 인해 GTC 가 온라인으로 진행되지만, 코로나가 엔비디아의 신제품 발표는 막지 못했습니다. 며칠 전에 "출시되지 않은 두 개의 GPU" 의 사양이 유출된 것을 보았습니다만, 오늘은 사양이 아닌 새로운 정보가 발견된 것으로 보입니다. 최신 GPU 는 8K 즉 8000개에 가까운 CUDA 를 가졌는데, 그야말로 괴물입니다.

 

엔비디아 차세대 GPU 성능, 사양 유출 - 최대 8K CUDA, 48GB HBM2e VRAM

코드네임 "Ampere" 로 알려진 엔비디아의 차세대 GPU 는 HPC, 클라우드 데이터센터 등에서 사용되는, NVIDIA 의 최신 테슬라 GPU 를 강화할 것입니다. 인디애나 대학교의 최고 정보 책임자(CIO) 에 따르면, 엔비디아 차세대 GPU는 기존 볼타 기반 GPU 보다 75% 정도 향상된 성능을 제공한다고 밝혔습니다.

GeekBench 에서 발견된 최신 GPU 의 사양에 관해서, 이전에 유출된 성능과 비교하였을 때의 차이점을 기반으로 어느 정도의 성능 향상이 이루어졌을지 살펴볼 수 있을 것입니다. 이 GPU 는 2019년 10월과 11월에 테스트를 거쳤는데, GeekBench 데이터베이스에서 숨겨져 있었고, 이것의 사양은 초기 샘플이었습니다. 따라서, 지금 이 GPU 는 상당히 큰 변화를 보여줄 것입니다.

 

NVIDIA 차세대 GPU 사양 및 성능 - #1

가장 먼저 언급해 볼 GPU는, 최근에 발견된 GPU입니다. 엔비디아 GPU 아키텍처에는 스트리밍 멀티프로세서당 64개의 CUDA 가 탑재되므로, 최근에 발견된 GPU의 총 SM 수는 124개인데, 계산해 보면 총 7936개의 CUDA 가 탑재되어 있습니다.

 

이것은 테슬라 V100 의 5120 CUDA 에 비해 약 55% 정도 증가한 것입니다. GPU의 최대 클럭은 1.1GHz 정도이며, 아직 최적화되지 않은 상태에서 약 17.5~18 TFLOPs 의 FP32 성능을 보여줍니다. VRAM 의 경우, HBM2e 32GB VRAM 을 제공하며, 4096-Bit BUS 인터페이스 및 1200MHz 의 클럭으로 작동합니다.

 

성능과 관련하여, 이 GPU는 GeekBench 5 CUDA (OpenCL) 벤치마크에서 222,377 점을 기록하였습니다. 벤치마크는 CUDA 8.0 을 사용하며, 테스트 당시에 이 GPU 는 완전히 최적화되지 않았을 가능성이 높습니다.

 

NVIDIA 차세대 GPU 사양 및 성능 - #2

두 번째 GPU 에는 118 SM, 7552 CUDA 가 탑재되었으며, CUDA 코어가 테슬라 V100 보다 약 47.5% 정도 증가한 것입니다. 또한, HBM2e 24GB VRAM 이 탑재되며, 3072-Bit BUS 인터페이스 및 1100MHz 의 클럭으로 작동합니다. 이 GPU 는 약 16.7 TFLOPs 의 이론적 성능을 제공합니다만, 클럭이 높아질 수 있다는 점을 상기해야 합니다.

이 특정 GPU 는 OpenCL 및 CUDA 컴퓨팅 벤치마크 모두에서 테스트되었습니다. OpenCL 벤치마크에서 이 GPU는 184,096 점을 기록하였으며, CUDA 벤치마크에서는 169,368 점을 기록하였습니다. 7936 CUDA 를 탑재한 GPU 와 7552 CUDA 를 탑재한 GPU 모두 CUDA 8.0 에서 벤치마크되었으며, 이것은 아직 GeekBench 5 벤치마크에서 완전히 최적화되지 않았음을 보여줍니다. 코어 수가 5% 정도 차이나지만, 성능 면에서는 큰 차이가 있는 것 같습니다.

NVIDIA 차세대 GPU 사양 및 성능 - #3

마지막으로, 6912개의 CUDA 를 탑재한 것이 있습니다. 이는 클럭이 1.01GHz 이며, 3개의 GPU 중 가장 낮은 클럭으로 작동한다고 보고되었습니다. 이 GPU 는 테슬라 V100 보다 약 35% 많은 CUDA 코어를 가지며, HBM2e VRAM 을 46.8GB 탑재한 것으로 보입니다.

 

이것은 GeekBench 벤치마크가 메모리를 잘못 인식한 것으로 보이며, 실제로는 48GB 의 VRAM 이 탑재되었을 수 있습니다. 이 GPU는 CUDA 벤치마크에서 141,654 기록하였으며, 추가적인 클럭 향상이 이루어진다면 이것보다 더 높은 점수를 기록할 것입니다.

 

NVIDIA 테슬라 제품군 비교:

비교적 사양 GPU 에 많은 VRAM 을 할당한 것을 볼 수 있는데, 이것은 두 가지를 의미할 수 있습니다. 우선, NVIDIA 는 특정 워크로드에 대해 더 많은 메모리를 탑재한 저가 GPU 를 갖거나, 혹은 서로 다른 메모리 구성을 가진다는 것입니다. 48GB HBM2e VRAM 은 이 특정 GPU SKU 에서 가장 많은 메모리를 탑재한 것일 수 있습니다.

 

또 다른 흥미로운 점은, 차세대 테슬라 제품군에는 다양한 GPU SKU 가 있으며, GPU 풀칩은 128 M, 즉 8192 개의 CUDA 를 탑재해야 한다는 것입니다.

마지막으로, 젠슨 황은 차세대 7nm GPU 출시 일정에 관한 질문을 받았지만, 출시 날짜를 공개하는 것은 아직 이르다고 대답하였습니다. 우리는 최근 NVIDIA CFO, Colette Kress 와의 인터뷰에서 "NVIDIA 가 7nm GPU 를 발표하여 모든 사람들을 놀라게 하고 싶지만, 그러기에는 아직 이르며, 적절한 타이밍을 기다리고 있다" 라는 이야기를 들은 적이 있습니다.

 

한편, AMD 는 8192 SP 를 가지며, 7nm GPU 를 기반으로 하는 "Arcturus GPU" 가 탑재된 "라데온 Instinct Mi100 HPC 가속기" 를 머지않아 발표할 것입니다. 그러나, 엔비디아는 과거에 입증된 것과 같이 향상된 노드 (16nm vs 12nm / 12nm vs 7nm) 를 기반으로 하는 경쟁사의 GPU 와 비교할 때, NVIDIA 과 라데온이 충분히 경쟁할 수 있을 정도로 아키텍처를 최적화 할 수 있습니다.

 

엔비디아가 차세대 GPU 와 완전히 새로운 AMD 프로세스 패리티(?)에 있다고 가정할 때, 우리는 실질적인 "괴물같은 성능" 의 GPU 를 볼 수 있습니다. 이것들은 NVIDIA의 차세대 GPU 에 대한 강력한 사양이며, 3월 22일에 개최되는 GTC 2020 온라인 기조 연설에서 NVIDIA 의 발표를 기대할 수 있습니다.

 

※ 본 글은 필자가 직접 작성한 것이 아닌, WCCFTech 의 원본을 해석한 것입니다.

※ 따라서, 번역에 오류가 있을 수 있고, 이 글의 모든 권리는 필자가 아닌 WCCFTech  있음을 알립니다.

※ 자료 출처: WCCFTech


 

ⓒCopyLight 2019. WCCFTech all rights reserved.

ⓒCopyLight 2019. WCCFTech all pictures cannot be copied without permission.

관련글 더보기

댓글 영역