모델 한도 상향과 학습·API 가격 업데이트 #12

2026년 5월 8일 — 4 min read

오늘의 레터

Anthropic이 5월 6일 Claude 사용 한도 상향과 SpaceX 데이터센터 컴퓨트 계약을 발표함
Claude Code의 5시간 기준 rate limit을 Pro·Max·Team·좌석형 Enterprise 플랜에서 2배로 늘림
Pro와 Max 계정의 Claude Code 피크 시간대 한도 축소를 폐지하고, Claude Opus 모델 API rate limit도 크게 상향함
SpaceX의 Colossus 1 데이터센터 전체 컴퓨트 용량을 쓰는 계약을 체결했고, 한 달 내 300메가와트 이상과 NVIDIA GPU 22만 개 초과 규모 용량에 접근한다고 밝힘
추가 용량은 Claude Pro와 Claude Max 구독자 처리 capacity 개선에 직접 반영되며, Anthropic은 AWS Trainium·Google TPU·NVIDIA GPU를 함께 사용 중이라고 설명함
Anthropic은 Amazon과 최대 5기가와트 계약, Google·Broadcom과 5기가와트 계약, Microsoft·NVIDIA와 Azure 300억달러 규모 capacity 파트너십도 함께 언급함

원문: anthropic.com
참고: techzine.eu · business-standard.com · dqindia.com

Unsloth가 5월 6일 NVIDIA와 공동으로 LLM 학습 최적화 기법을 공개했고, 최신 업데이트 적용 시 추가로 약 25% 빠른 학습 속도를 제시함
이번 개선은 기존 Unsloth의 2~5배 학습 가속과 별도로 더해지는 최적화이며, RTX 노트북·데이터센터 GPU·DGX Spark에서 자동 활성화된다고 밝힘
packed sequence 메타데이터를 레이어마다 다시 만들지 않고 캐시해 재사용하는 방식으로, Qwen3-14B QLoRA SFT 기준 배치당 14.3%, forward 구간 43.3%, backward 구간 5.8% 개선 수치를 제시함
gradient checkpointing에서는 CPU 메모리에서 GPU로 activation을 다시 올리는 경로에 이중 버퍼를 적용해 복사 지연을 계산과 겹치게 했고, 해당 방식으로 8% 속도 개선을 설명함
GPT-OSS 학습 경로에서는 MoE 라우팅 단계에 argsort와 bincount를 적용해 15% 더 빠른 학습 속도를 제시함
정확도 저하 없이 적용되는 최적화라는 점을 강조했고, 구현 세부는 xFormers·PyTorch 기반 attention 및 checkpointing 경로의 반복 오버헤드 축소에 초점을 둠

원문: unsloth.ai
참고: techflowpost.com

DeepSeek가 API 가격표를 갱신하고 DeepSeek-V4-Pro 75% 할인 기간을 2026년 5월 31일 15:59 UTC까지 연장함
V4-Pro 가격은 100만 입력 토큰 기준 캐시 히트 0.003625달러, 캐시 미스 0.435달러, 출력 0.87달러로 표기됨
정가 기준 V4-Pro 가격은 입력 캐시 히트 0.0145달러, 캐시 미스 1.74달러, 출력 3.48달러이며 현재 할인 가격을 함께 병기함
DeepSeek-V4-Flash와 V4-Pro 모두 컨텍스트 길이 100만, 최대 출력 384K, JSON 출력과 툴 호출을 지원함
OpenAI 형식 기본 URL은 https://api.deepseek.com, Anthropic 형식 기본 URL은 https://api.deepseek.com/anthropic 으로 제공됨
deepseek-chat과 deepseek-reasoner는 향후 중단 예정이며 각각 V4-Flash의 non-thinking 모드와 thinking 모드 호환 이름으로 안내됨
전체 모델의 입력 캐시 히트 단가는 출시가의 10분의 1로 인하됐고 적용 시점은 2026년 4월 26일 12:15 UTC로 명시됨
DeepSeek는 실제 사용량 기준 충전을 권장했고, 가격은 변동될 수 있어 최신 정보는 가격 페이지에서 다시 확인해야 함

원문: api-docs.deepseek.com

조코레터는 개발자와 만드는 사람을 위해 AI, 소프트웨어, 제품 흐름을 한국어로 정리합니다.

#Anthropic #DeepSeek #Unsloth