'80억'에 AI 모델 개발한 中 '딥시크'…韓 반도체 업계 파장은
'쩐의 전쟁'으로 불렸던 AI 모델 개발…큰 변화 예고
[뉴스웍스=채윤정 기자] 중국 인공지능(AI) 스타트업인 '딥시크'가 저비용으로 AI 모델을 개발했다고 발표하면서, 고대역폭메모리(HBM)를 생산하고 있는 국내 반도체 업계에 큰 파장을 일으키고 있다.
딥시크는 557만6000달러(약 80억원)의 개발비로 빅테크 기업들의 AI 서비스에 대적할 수 있는 AI 모델인 '딥시크-V3'를 개발했다고 지난달 20일 밝혔다.
이에 '딥시크의 AI 개발이 업계에 큰 타격을 줄 것'이라는 우려가 제기되면서 31일 국내 반도체 업체의 주가도 큰 폭의 내림세를 보였다. 특히 딥시크의 저비용 AI 모델 개발로 AI 가속기 시장을 90% 이상 장악한 엔비디아의 독점적 지위도 변화가 있을 것이라는 관측이 나온다.
딥시크-V3 개발비는 페이스북 모회사 메타플랫폼이 AI 모델 '라마3′에 사용한 비용의 10분의 1 수준이어서 충격을 주고 있다. 딥시크는 V3를 훈련하는 데 엔비디아의 보급형 가속기인 'H800'을 2000여 개 사용했다고 설명했다. 엔비디아가 미 정부의 수출 규제를 피하고자 만든 중국 수출용 제품인 H800은 가격이 저렴하다. 성능도 낮아 미국 빅테크 기업들이 사용하는 엔비디아의 고성능 가속기 'H100'의 절반 수준인 것으로 평가된다.
국내 증시 휴장 기간 일어난 '딥시크 충격'은 31일 반도체 주를 강타하면서 SK하이닉스와 삼성전자 주가를 끌어 내렸다. 이날 SK하이닉스의 주가는 9.86% 하락한 19만9200원으로 장을 마감했다. 삼성전자 주가도 2.42% 하락한 5만2400원으로 내려섰다.
투자업계는 딥시크 충격이 반도체 업체 주가에 어떤 영향을 줄지 주목하고 있다. 일단 증권가는 딥시크의 등장으로 반도체 수요가 줄어들 것이란 우려는 맞지 않다며, 시장이 고사양과 저사양으로 양분될 것이라는 전망을 제기하고 있다.
◆저성능 가속기 이용한 AI 모델 개발…"믿을 수 없다"
무엇보다 딥시크 AI 모델의 등장은 엔비디아에 HBM을 거의 독점적으로 공급하는 SK하이닉스에 큰 영향을 미칠 것으로 보인다. 31일 증시에서도 SK하이닉스의 주가가 유독 많이 내려간 것은 이 같은 투자심리가 반영된 결과로 분석된다.
딥시크는 AI 모델 개발을 위해 저성능 가속기를 사용했다고 주장한 만큼, 고성능 가속기인 H100에 탑재되는 HBM3E 수요가 크게 줄어들 수 있다는 시각이다.
삼성전자도 엔비디아의 8단 HBM3E 퀄테스트를 통과, 제품 공급을 앞두고 있다. 또한 12단 HBM3E와 HBM4도 공급을 추진하고 있어 장기적인 악재가 될 수도 있다. 단, 엔비디아 공급 비중이 낮은 만큼, 주가에 미치는 영향은 SK하이닉스보다는 제한적일 것으로 관측된다.
딥시크는 자체 개발 추론형 AI 언어모델 'R1'과 AI 모델인 'V3'를 공개했는데, 전문가들은 딥시크의 AI가 AI 인프라 투자 향배를 바꿀 수 있는 ‘게임체인저’가 될 수 있을 것으로 보고 있다. 다시 말해 '쩐의 전쟁'으로 불렸던 AI 모델 개발에 큰 변화를 예고한 것이다.
딥시크는 R1 기반 서비스를 공개하고, 이 모델의 개발 논문으로 볼 수 있는 '기술보고서'를 공개했다. 이 보고서에 따른 딥시크의 R1은 AIME, MATH-500, SWE-벤치 등 IT 업체 주요 벤치마크 테스트 결과, 챗GPT의 GPT4-o1보다 같거나 더 나은 성능을 보이는 것으로 평가되고 있다.
하지만 IT 업계와 증권가, 학계에서는 딥시크가 저성능 칩을 사용해 AI를 개발했다는 주장을 100% 신뢰할 수 없다는 시각도 보인다.
AI 학습용 데이터 기업인 미국 스케일AI의 알렉산더 왕 최고경영자(CEO)는 “딥시크가 미국 수출 통제 때문에 밝히진 않았을 뿐, 엔비디아 H100을 5만개 넘게 보유하고 있다”고 주장했다.
일론 머스크 테슬라 CEO도 저렴한 칩을 이용해 개발했다는 딥시크의 주장에 의문을 제기했다. 머스크는 27일(현지시간) 엑스(옛 트위터)에서 "딥시크가 표면적으로 밝힌 것보다 엔비디아의 고성능 가속기인 H100을 대량 보유하고 있다"라는 글을 공유했다.
아트레이드매니지먼트의 최고투자책임자 개빈 베이커도 엑스에 딥시크의 발표 내용을 비판적으로 분석한 글을 올렸다.
그는 "개발 비용에는 '아키텍처, 알고리즘, 데이터에 대한 이전의 연구와 실험에 관련된 비용들'이 포함돼 있지 않다"며 "이것은 연구실에서 이미 수억 달러를 이전 연구에 지출했고 훨씬 더 큰 클러스터에 접근할 수 있다면 600만달러만으로 R1 퀄리티 모델을 훈련할 수 있다는 것을 의미한다. 딥시크는 분명히 H800보다 더 많은 것을 갖고 있다"고 평가했다. 이어 "엔비디아의 첨단 칩이 규제의 망을 피해 중국 AI 기업에 들어갔을 가능성이 있다"고 덧붙였다.
머스크는 베이커의 게시물에 '흥미로운 분석, 지금까지 본 것 중 최고'라는 글을 남기기도 했다.
투자회사인 캔터피츠제럴드 애널리스트들도 "딥시크가 자사의 컴퓨팅 용량을 실제보다 더 축소해서 밝혔을 수 있다"고 의문을 제기했다.
◆반도체 업계 영향은 '제한적'…딥시크 AI, 긍정적 평가도
이종환 상명대학교 시스템반도체공학과 교수는 "아직 딥시크의 AI 모델 개발에 대해 좀 더 봐야 한다. 진위 확인 후 얼마나 영향이 있을 것인지 분석해야 한다"고 전제했다. 이어 "단기적으로 시장에 영향을 주겠지만, 장기적인 영향은 제한적일 것"이라고 의견을 말했다.
이 교수는 "SK하이닉스·삼성전자도 저사양 HBM 메모리를 공급하고 있다. 물론 이 시장에 중국 업체들과 마이크론이 들어올 것이지만 크게 우려할 것은 아니다"라며 "알고리즘에 고사양 가속기를 사용하면 AI 모델 성능이 더 좋아지는 건 자명하다. 저사양 시장이 형성된다고 해서 고사양 시장이 축소되지는 않을 것"이라고 봤다.
반도체 업계에서도 딥시크가 저비용으로 AI를 개발했을지 확인할 수 없는 만큼, 조금 더 지켜봐야 한다는 입장이다.
업계 한 관계자는 "딥시크 발표가 나온 뒤 엔비디아 주가가 많이 빠지는 등 큰 영향이 있었지만, 진실 여부를 더 확인해야 할 것 같다"며 "무엇보다 숫자를 기반으로 판단해야 한다. 구체적인 숫자를 밝히지 않은 현 상황에서는 불확실이 크다"고 말했다.
딥시크가 가성비를 주장한 V3의 일부 요소가 이미 큰 개발비를 투입해 개발된 다른 AI 모델을 기반으로 했을 가능성도 제기되고 있다.
V3 기술보고서에 따르면 V3는 추론 능력을 R1 시리즈 모델에서 증류해 개발했다. '선생님 모델'인 R1의 핵심적인 생각 방식을 V3가 배운 구조인 만큼, R1에 이미 들어간 개발 비용 덕에 V3의 개발 비용이 줄었을 가능성이 크다는 것이다.
특히 딥시크는 V3 개발 비용을 훈련 단계에 한정해서만 공개했을 뿐, AI 모델 개발에 필수적인 데이터 취득·정제 비용은 물론 인건비도 고려하지 않았다. 때문에 실제 개발에는 훨씬 더 큰 비용을 사용했을 것이라는 추측도 제기된다.
하지만 딥시크의 AI 개발에는 긍정적 요인도 많다는 분석도 나온다. 그간 AI 모델을 개발하기 위해서는 고가의 고성능 가속기가 필수적이라고 봤는데, 저사양 가속기로도 같은 결과를 낼 수 있다면 AI 모델 개발에 '새로운 전기'가 마련될 수 있다는 것이다.
임지용 NH투자증권 연구원은 “딥시크 R1 발표로 미국의 AI 장기 호황이 가속하면 했지, 투자가 줄지는 않을 것”이라며 "AI 수퍼사이클 파동이 진폭을 키우겠지만, AI 코어 인프라 기업의 주가 우상향은 계속될 것"으로 내다봤다.
또한 "이번 발표는 엔비디아를 비롯해 ASIC 대장인 브로드컴, TSMC 등 코어 기업의 업계 내 독점적 경쟁력을 건드리는 이슈가 아니다”라며 “최근 급락은 시장의 오해와 과장된 보도에서 오는 매수 기회”라고 분석했다.
한종목 미래에셋증권 연구원은 “딥시크가 낸 논문은 증류된 모델에 강화학습을 적용하는 방식을 제안했다”며 “대형 모델을 훈련할 수 있는 자원이 없는 연구자나 기업도 소형 모델을 통해 고성능 AI 혜택을 누릴 수 있을 것이다. 이는 한국 기업에도 적용될 것"이라고 긍정적으로 평가했다.