모델 한도 상향과 학습·API 가격 업데이트 #12

모델 한도 상향과 학습·API 가격 업데이트 #12

오늘의 레터

  1. Anthropic, Claude 사용 한도 상향·SpaceX 컴퓨트 계약
  2. Unsloth·NVIDIA, LLM 학습 가속 기법 공개
  3. DeepSeek, V4 Pro 가격 75% 할인 연장

Anthropic, Claude 사용 한도 상향·SpaceX 컴퓨트 계약

Anthropic, Claude 사용 한도 상향·SpaceX 컴퓨트 계약
  • Anthropic이 5월 6일 Claude 사용 한도 상향과 SpaceX 데이터센터 컴퓨트 계약을 발표함
  • Claude Code의 5시간 기준 rate limit을 Pro·Max·Team·좌석형 Enterprise 플랜에서 2배로 늘림
  • Pro와 Max 계정의 Claude Code 피크 시간대 한도 축소를 폐지하고, Claude Opus 모델 API rate limit도 크게 상향함
  • SpaceX의 Colossus 1 데이터센터 전체 컴퓨트 용량을 쓰는 계약을 체결했고, 한 달 내 300메가와트 이상과 NVIDIA GPU 22만 개 초과 규모 용량에 접근한다고 밝힘
  • 추가 용량은 Claude Pro와 Claude Max 구독자 처리 capacity 개선에 직접 반영되며, Anthropic은 AWS Trainium·Google TPU·NVIDIA GPU를 함께 사용 중이라고 설명함
  • Anthropic은 Amazon과 최대 5기가와트 계약, Google·Broadcom과 5기가와트 계약, Microsoft·NVIDIA와 Azure 300억달러 규모 capacity 파트너십도 함께 언급함

원문: anthropic.com
참고: techzine.eu · business-standard.com · dqindia.com


Unsloth·NVIDIA, LLM 학습 가속 기법 공개

Unsloth·NVIDIA, LLM 학습 가속 기법 공개
  • Unsloth가 5월 6일 NVIDIA와 공동으로 LLM 학습 최적화 기법을 공개했고, 최신 업데이트 적용 시 추가로 약 25% 빠른 학습 속도를 제시함
  • 이번 개선은 기존 Unsloth의 2~5배 학습 가속과 별도로 더해지는 최적화이며, RTX 노트북·데이터센터 GPU·DGX Spark에서 자동 활성화된다고 밝힘
  • packed sequence 메타데이터를 레이어마다 다시 만들지 않고 캐시해 재사용하는 방식으로, Qwen3-14B QLoRA SFT 기준 배치당 14.3%, forward 구간 43.3%, backward 구간 5.8% 개선 수치를 제시함
  • gradient checkpointing에서는 CPU 메모리에서 GPU로 activation을 다시 올리는 경로에 이중 버퍼를 적용해 복사 지연을 계산과 겹치게 했고, 해당 방식으로 8% 속도 개선을 설명함
  • GPT-OSS 학습 경로에서는 MoE 라우팅 단계에 argsort와 bincount를 적용해 15% 더 빠른 학습 속도를 제시함
  • 정확도 저하 없이 적용되는 최적화라는 점을 강조했고, 구현 세부는 xFormers·PyTorch 기반 attention 및 checkpointing 경로의 반복 오버헤드 축소에 초점을 둠

원문: unsloth.ai
참고: techflowpost.com


DeepSeek, V4 Pro 가격 75% 할인 연장

  • DeepSeek가 API 가격표를 갱신하고 DeepSeek-V4-Pro 75% 할인 기간을 2026년 5월 31일 15:59 UTC까지 연장함
  • V4-Pro 가격은 100만 입력 토큰 기준 캐시 히트 0.003625달러, 캐시 미스 0.435달러, 출력 0.87달러로 표기됨
  • 정가 기준 V4-Pro 가격은 입력 캐시 히트 0.0145달러, 캐시 미스 1.74달러, 출력 3.48달러이며 현재 할인 가격을 함께 병기함
  • DeepSeek-V4-Flash와 V4-Pro 모두 컨텍스트 길이 100만, 최대 출력 384K, JSON 출력과 툴 호출을 지원함
  • OpenAI 형식 기본 URL은 https://api.deepseek.com, Anthropic 형식 기본 URL은 https://api.deepseek.com/anthropic 으로 제공됨
  • deepseek-chat과 deepseek-reasoner는 향후 중단 예정이며 각각 V4-Flash의 non-thinking 모드와 thinking 모드 호환 이름으로 안내됨
  • 전체 모델의 입력 캐시 히트 단가는 출시가의 10분의 1로 인하됐고 적용 시점은 2026년 4월 26일 12:15 UTC로 명시됨
  • DeepSeek는 실제 사용량 기준 충전을 권장했고, 가격은 변동될 수 있어 최신 정보는 가격 페이지에서 다시 확인해야 함

원문: api-docs.deepseek.com


조코레터는 개발자와 만드는 사람을 위해 AI, 소프트웨어, 제품 흐름을 한국어로 정리합니다.

#Anthropic #DeepSeek #Unsloth

조코레터 구독하기

Read more