AI 뉴스·새소식

GLM-5.2·Kimi K2.7, 중국 오픈소스 AI가 5분의 1 가격으로 따라잡았다 (+2026 프롬프트 팁)

레이블웹스 2026. 7. 3. 20:51

오퍼스·소넷 얘기만 하다 보면 놓치기 쉬운데, 요즘 중국 오픈소스 진영 움직임이 심상치 않습니다. 6월 한 달 사이에 즈푸(Zhipu)의 GLM-5.2와 문샷 AI(Moonshot AI)의 Kimi K2.7-Code가 나란히 나왔는데, 벤치마크 격차가 눈에 띄게 좁혀졌습니다. 정리해 봤습니다.


🇨🇳 GLM-5.2 — 오퍼스 4.8 턱밑까지, 가격은 5분의 1

즈푸 AI(Z.ai)는 6월 16일 GLM-5.2를 공개했습니다. 컨텍스트 창을 기존 20만 토큰에서 100만 토큰으로 늘렸고, 주요 에이전트 벤치마크에서 앤트로픽 오퍼스 4.8과 1%포인트 차이까지 따라붙었다는 평가가 나왔습니다. 그런데 비용은 오퍼스의 약 5분의 1 수준입니다.

더 눈에 띄는 건 배경입니다. 즈푸는 올해 1월 홍콩 증시에 상장하며 세계 최초로 기업공개(IPO)를 한 파운데이션 모델 회사가 됐고(공모가 기준 시가총액 약 71억 달러), GLM 시리즈는 엔비디아 칩 없이 화웨이 어센드(Ascend) 칩과 자체 프레임워크 마인드스포어(MindSpore)로 학습됐다고 밝혔습니다. API 가격은 입력 100만 토큰당 $1.00, 출력 100만 토큰당 $3.20 수준입니다.


🚀 Kimi K2.7-Code — 문샷 AI, 1년 새 다섯 번째 메이저 출시

문샷 AI는 6월 12일 Kimi K2.7-Code를 내놨습니다. 1조 파라미터 MoE(토큰당 320억 활성화) 구조를 기반으로 한 K2 시리즈의 최신판으로, 1년이 채 안 되는 기간에 다섯 번째 메이저 릴리스입니다.

직전 버전 K2.6 대비 추론에 쓰는 토큰 수를 30% 줄였다는 게 회사 측 설명입니다. K2.6에서 이미 25.6만 토큰(256K) 컨텍스트, 300개 서브 에이전트가 최대 4,000단계를 조율하는 "에이전트 스웜" 기능을 선보인 바 있어, 코딩 에이전트 용도로는 상당히 공격적인 포지셔닝입니다. 가중치는 허깅페이스에 Modified MIT 라이선스로 공개돼 있습니다.


💡 덤으로 — 2026년 프롬프트 잘 쓰는 법, 몇 가지만 추리면

모델이 계속 바뀌어도 프롬프트 기본기는 크게 안 변합니다. 최근 나온 가이드들을 종합해 보면 이 정도로 정리됩니다.

1. 역할 + 맥락 + 제약 + 출력 형식 네 가지를 프롬프트 앞부분에 명시하는 게 여전히 기본입니다. "너는 ~야" 역할 지정은 실제 작업과 관련 있을 때만 효과가 있습니다.
2. 예시(few-shot)를 1~2개만 넣어도 애매한 작업의 정확도가 눈에 띄게 올라갑니다.
3. 컨텍스트를 무작정 길게 넣지 마세요. 연구에 따르면 추론 성능은 3,000토큰 근처부터 떨어지기 시작하고, 대부분의 작업에서는 150~300단어 정도가 실질적인 최적 구간입니다.
4. 캐주얼하게 툭 던지는 프롬프트와, 프로덕션에 들어가는 "컨텍스트 엔지니어링"은 이제 다른 스킬로 취급하는 분위기입니다. 반복 실행되는 프롬프트라면 변수화·버전 관리까지 신경 쓰는 게 낫습니다.


👉 정리하면

오퍼스·소넷·페이블만 보고 있으면 중국 오픈소스 모델들이 벤치마크·가격 양쪽에서 빠르게 좁혀 오는 흐름을 놓치기 쉽습니다. 특히 GLM-5.2는 컨텍스트 창을 100만 토큰까지 늘리면서 가격 이점을 유지했다는 점이 실무에서 꽤 매력적인 조합입니다.

출처: CNBC — Zhipu closing in on top US models · LLM-Stats — GLM-5 launch · DevOps.com — Kimi K2.7-Code · Lakera — Prompt Engineering Guide 2026


관련 글: 클로드 소넷 5 출시 + 클로드 페이블 미국 정부 접근제한 해제

이 블로그는 AI 홈페이지 빌더 레이블웹스에서 운영합니다.