모델 한도 상향과 학습·API 가격 업데이트 #12
오늘의 레터
- Anthropic, Claude 사용 한도 상향·SpaceX 컴퓨트 계약
- Unsloth·NVIDIA, LLM 학습 가속 기법 공개
- DeepSeek, V4 Pro 가격 75% 할인 연장
Anthropic, Claude 사용 한도 상향·SpaceX 컴퓨트 계약

- Anthropic이 5월 6일 Claude 사용 한도 상향과 SpaceX 데이터센터 컴퓨트 계약을 발표함
- Claude Code의 5시간 기준 rate limit을 Pro·Max·Team·좌석형 Enterprise 플랜에서 2배로 늘림
- Pro와 Max 계정의 Claude Code 피크 시간대 한도 축소를 폐지하고, Claude Opus 모델 API rate limit도 크게 상향함
- SpaceX의 Colossus 1 데이터센터 전체 컴퓨트 용량을 쓰는 계약을 체결했고, 한 달 내 300메가와트 이상과 NVIDIA GPU 22만 개 초과 규모 용량에 접근한다고 밝힘
- 추가 용량은 Claude Pro와 Claude Max 구독자 처리 capacity 개선에 직접 반영되며, Anthropic은 AWS Trainium·Google TPU·NVIDIA GPU를 함께 사용 중이라고 설명함
- Anthropic은 Amazon과 최대 5기가와트 계약, Google·Broadcom과 5기가와트 계약, Microsoft·NVIDIA와 Azure 300억달러 규모 capacity 파트너십도 함께 언급함
원문: anthropic.com
참고: techzine.eu · business-standard.com · dqindia.com
Unsloth·NVIDIA, LLM 학습 가속 기법 공개

- Unsloth가 5월 6일 NVIDIA와 공동으로 LLM 학습 최적화 기법을 공개했고, 최신 업데이트 적용 시 추가로 약 25% 빠른 학습 속도를 제시함
- 이번 개선은 기존 Unsloth의 2~5배 학습 가속과 별도로 더해지는 최적화이며, RTX 노트북·데이터센터 GPU·DGX Spark에서 자동 활성화된다고 밝힘
- packed sequence 메타데이터를 레이어마다 다시 만들지 않고 캐시해 재사용하는 방식으로, Qwen3-14B QLoRA SFT 기준 배치당 14.3%, forward 구간 43.3%, backward 구간 5.8% 개선 수치를 제시함
- gradient checkpointing에서는 CPU 메모리에서 GPU로 activation을 다시 올리는 경로에 이중 버퍼를 적용해 복사 지연을 계산과 겹치게 했고, 해당 방식으로 8% 속도 개선을 설명함
- GPT-OSS 학습 경로에서는 MoE 라우팅 단계에 argsort와 bincount를 적용해 15% 더 빠른 학습 속도를 제시함
- 정확도 저하 없이 적용되는 최적화라는 점을 강조했고, 구현 세부는 xFormers·PyTorch 기반 attention 및 checkpointing 경로의 반복 오버헤드 축소에 초점을 둠
원문: unsloth.ai
참고: techflowpost.com
DeepSeek, V4 Pro 가격 75% 할인 연장
- DeepSeek가 API 가격표를 갱신하고 DeepSeek-V4-Pro 75% 할인 기간을 2026년 5월 31일 15:59 UTC까지 연장함
- V4-Pro 가격은 100만 입력 토큰 기준 캐시 히트 0.003625달러, 캐시 미스 0.435달러, 출력 0.87달러로 표기됨
- 정가 기준 V4-Pro 가격은 입력 캐시 히트 0.0145달러, 캐시 미스 1.74달러, 출력 3.48달러이며 현재 할인 가격을 함께 병기함
- DeepSeek-V4-Flash와 V4-Pro 모두 컨텍스트 길이 100만, 최대 출력 384K, JSON 출력과 툴 호출을 지원함
- OpenAI 형식 기본 URL은 https://api.deepseek.com, Anthropic 형식 기본 URL은 https://api.deepseek.com/anthropic 으로 제공됨
- deepseek-chat과 deepseek-reasoner는 향후 중단 예정이며 각각 V4-Flash의 non-thinking 모드와 thinking 모드 호환 이름으로 안내됨
- 전체 모델의 입력 캐시 히트 단가는 출시가의 10분의 1로 인하됐고 적용 시점은 2026년 4월 26일 12:15 UTC로 명시됨
- DeepSeek는 실제 사용량 기준 충전을 권장했고, 가격은 변동될 수 있어 최신 정보는 가격 페이지에서 다시 확인해야 함
조코레터는 개발자와 만드는 사람을 위해 AI, 소프트웨어, 제품 흐름을 한국어로 정리합니다.
#Anthropic #DeepSeek #Unsloth