AI 모델 공개와 에이전트 코딩 지표 업데이트 #48

AI 모델 공개와 에이전트 코딩 지표 업데이트 #48

오늘의 레터

  1. Xiaomi MiMo, 1T 모델 카드 공개
  2. NVIDIA, 에이전트 코딩 벤치마크 선두 발표

Xiaomi MiMo, 1T 모델 카드 공개

Xiaomi MiMo, 1T 모델 카드 공개
  • Hugging Face에 MiMo-V2.5-Pro-FP4-DFlash 모델 페이지가 2026년 6월 8일 기준 게시됨
  • 시스템 프롬프트 구간에 MiMo-v2.5-pro가 1T 파라미터와 1M-token 컨텍스트 윈도우를 가진다고 명시됨
  • 개발 주체는 Xiaomi MiMo Team으로 표기되며, 관련 리포지터리 명칭은 XiaomiMiMo로 노출됨
  • 모델명에 FP4와 DFlash가 포함돼 관련 최적화 구성을 시사하는 배포물로 읽힘
  • 제공된 1차 본문은 모델 카드와 템플릿 문자열이 섞인 메타데이터 성격이 강해, 상세 성능 수치나 사용 조건은 본문에서 충분히 확인되지 않음

원문: huggingface.co
참고: mimo.xiaomi.com


NVIDIA, 에이전트 코딩 벤치마크 선두 발표

NVIDIA, 에이전트 코딩 벤치마크 선두 발표
  • NVIDIA가 6월 12일 기술 블로그에서 Artificial Analysis의 AA-AgentPerf 기준 자사 에이전트 코딩 추론 성능 결과를 공개함
  • AA-AgentPerf는 동시 실행 AI 에이전트 수를 측정하는 멀티벤더 공개 벤치마크로, GPU당 성능과 메가와트당 성능을 함께 비교하도록 설계됨
  • 측정 대상은 DeepSeek-V4-Pro 기반 에이전트 코딩 워크로드이며, 12개 이상 프로그래밍 언어와 공개 코드 저장소 이슈 해결 경로를 사전 기록한 궤적으로 구성됨
  • 요청 시퀀스 길이는 5K~131K, 평균 약 27K이며, CPU 측 툴 호출은 중앙값 1초 지연 분포로 시뮬레이션해 시스템별 동일 기준을 적용함
  • SLO 30 기준에서 NVIDIA는 GB300 NVL72가 메가와트당 동시 에이전트 6만1400개, GPU당 57.5개를 기록했고, H200은 각각 2600개와 1.4개로 제시함
  • NVIDIA는 GB300 NVL72가 H200 대비 최대 20배 높은 에이전트 수용 능력을 보였다고 설명했으며, SGLang·TensorRT LLM·vLLM과 WideEP·DeepEP·DeepGEMM·NVLink 최적화를 배경으로 제시함

원문: developer.nvidia.com
참고: blogs.nvidia.com

Sponsored · 조코헌트 · SnapView (자동)

🏆 조코헌트 TOP1 · 사진 선별과 비교 정리를 빠르게 끝내는 macOS 뷰어

SnapView 로고

맥에서 촬영본을 빠르게 훑고 고르려는 분들을 위한 이미지 뷰어입니다. 폴더와 ZIP을 바로 열고 사진과 동영상을 한 폴더에서 함께 탐색할 수 있습니다.

별점·Pick/Reject·컬러 라벨, Quick Check와 비교 모드, RAW+JPG 페어링까지 담아 선별과 정리를 한 번에 이어갑니다. 베타 피드백을 반영해 다듬었고 맥 앱스토어 사진 및 비디오 카테고리 상위권을 유지 중인 점도 신뢰를 더합니다.

“맥에서 마음에 드는 이미지 뷰어가 없어 직접 쓰려고 만들기 시작했습니다”

앱 살펴보기

조코레터는 개발자와 만드는 사람을 위해 AI, 소프트웨어, 제품 흐름을 한국어로 정리합니다.

#NVIDIA #Xiaomi

조코레터 구독하기

Read more