기자명 박광하 기자
  • 입력 2025.11.25 11:51
AI 모델이 여러 차례 시도한 답안을 병렬로 취합해 가장 적합한 결과를 선택하는 '병렬 테스트타임 컴퓨트' 방식으로 산출된 성능 비교 결과. (자료제공=앤트로픽)
AI 모델이 여러 차례 시도한 답안을 병렬로 취합해 가장 적합한 결과를 선택하는 '병렬 테스트타임 컴퓨트' 방식으로 산출된 성능 비교 결과. (자료제공=앤트로픽)

[뉴스웍스=박광하 기자] 앤트로픽이 25일 차세대 AI 모델 '클로드 오퍼스(Claude Opus) 4.5'를 공개했다. 그러면서 해당 모델이 코딩·에이전트·컴퓨터 활용 분야에서 업계 최고 수준 성능을 달성했다고 자평했다.

앤트로픽은 오퍼스 4.5가 지능 및 효율성 강화를 통해 심층 연구는 물론 슬라이드, 스프레드시트 처리 등 실무형 작업에서도 향상된 성능을 제공한다고 강조했다. 실전 소프트웨어 엔지니어링 테스트에서도 업계 최고 수준의 성능을 입증했다고 덧붙였다.

앤트로픽은 오퍼스 4.5 출시와 함께 클로드 개발자 플랫폼과 클로드 코드, 소비자용 앱도 대규모로 업데이트했다. 장시간 구동되는 에이전트를 지원하는 신규 도구가 추가됐으며, 클로드를 엑셀·크롬·데스크톱 환경에서 활용하는 방식도 확장됐다. 클로드 앱에서는 긴 대화가 중간에 끊기지 않도록 문맥 관리 기능이 강화됐다.

오퍼스 4.5는 앤트로픽이 엔지니어 채용 과정에서 활용하는 고난도 실기시험에서 역대 어떤 인간 지원자보다 높은 점수를 기록했다. 제한 시간 2시간 안에 기술력과 판단력을 평가하는 시험으로, AI가 숙련된 엔지니어를 능가한 결과다. 앤트로픽은 이러한 변화를 추적하기 위해 사회적 영향 및 미래 경제 연구를 진행 중이며, 관련 분석 결과를 조만간 공개할 계획이다.

테스터들은 오퍼스 4.5가 애매한 상황에서도 스스로 판단해 적절한 선택지를 찾아내고, 복잡한 멀티 시스템 오류도 별다른 안내 없이 해결했다고 전했다. 불과 몇 주 전까지만 해도 앤트로픽의 다른 AI 모델 소네트 4.5로는 처리하기 어려웠던 작업들이 이제는 무리 없이 수행됐다.

이동재 뤼튼테크놀로지스 최고제품책임자(CPO)는 "클로드 오퍼스 4.5는 장문의 스토리텔링에서 탁월한 성능을 보여주며, 10~15페이지 분량의 챕터를 체계적이고 일관되게 생성한다"며 "이전에는 안정적으로 구현하기 어려웠던 활용 사례 개발까지 가능해졌다"고 밝혔다.

노션 AI 리드 엔지니어 사라 삭스는 "오퍼스 4.5는 사용자의 의도를 정확히 파악해 첫 시도에서 바로 공유 가능한 결과물을 만든다"며 "속도·효율성·비용 경쟁력까지 갖춰 처음으로 노션 에이전트에 도입했다"고 밝혔다.

앤트로픽은 오퍼스 4.5가 지금까지 선보인 모델 중 가장 견고하게 정렬된 모델이며, 업계 최고 수준의 안전성을 갖춘 프런티어 모델이라고 강조했다. 프롬프트 인젝션 공격에 대한 강인성을 크게 높였으며, 업계 프런티어 모델 중 가장 속기 어려운 수준에 도달했다고 강조했다.

앤트로픽 앱과 API, 주요 3대 클라우드 플랫폼에서 즉시 사용할 수 있다. 가격은 백만 토큰 기준 5~25달러(약 7300~3만6500원)로 책정됐다.

저작권자 © 뉴스웍스 무단전재 및 재배포 금지