물리 AI 모델과 음성 더빙 도구 업데이트 #35
오늘의 레터
NVIDIA, Cosmos 3로 물리 AI 개발 경로 제시
- NVIDIA가 2026년 5월 31일 AI 클라우드 생태계 확장 발표에서 Cosmos 3를 물리 AI용 프런티어 월드 파운데이션 모델로 제시함
- CoreWeave는 Cosmos 3를 자사 NVIDIA AI Cloud 플랫폼에 연결해 합성 데이터 생성, 모델 파인튜닝, 로보틱스 데이터 플라이휠 가속에 사용한다고 밝힘
- CoreWeave는 Vera Rubin, Vera CPU, Spectrum-X Ethernet Photonics도 조기 도입해 에이전트형 AI·물리 AI·프런티어 모델 워크로드를 함께 지원한다고 설명함
- Nebius는 새 Physical AI Workbench에 Cosmos 3, Isaac Sim, Isaac GR00T를 묶어 에이전트가 조합 가능한 워크플로로 제공한다고 발표함
- 해당 워크벤치는 시뮬레이션과 합성 데이터에서 학습·평가까지 연결해 로보틱스와 자율 시스템 개발 속도 단축에 초점을 둠
- NVIDIA는 AI Clouds가 현재 6개 대륙으로 확대됐으며, 지역별·주권형 AI 인프라 수요에 맞춰 학습, 추론, 에이전트형 AI, 물리 AI 배치를 지원한다고 설명함
- CoreWeave는 장기적으로 million-GPU AI 팩토리를 겨냥한 네트워크 기반도 함께 구축 중이라고 밝힘
원문: blogs.nvidia.com
ElevenLabs, Dubbing v2 공개
- ElevenLabs가 2026년 5월 28일 AI 더빙 모델 `Dubbing v2`를 공개하고 ElevenCreative와 ElevenProductions에 적용함
- 원본 화자의 감정, 톤, 말속도, 전달 방식에 직접 조건을 걸어 90개 이상 언어로 더빙해도 원래 퍼포먼스를 최대한 유지하는 것이 핵심임
- 텍스트 전사 중심 더빙과 달리 원본 발화의 억양, 강조, 머뭇거림, 에너지까지 반영하도록 설계됨
- 동기화 인지 번역 시스템으로 언어별 문장 구조와 리듬을 조정하면서 시작, 정지, 페이싱을 자동 정렬해 수작업 보정을 줄임
- ElevenCreative에서는 영상 더빙을 원클릭으로 제공하고, YouTube 등 크리에이터 영상의 다국어 배포를 빠르게 처리할 수 있음
- ElevenProductions는 Dubbing v2에 사람 번역, 보이스 캐스팅, 오디오 믹싱을 결합한 전문 더빙 워크플로를 기업·스튜디오·방송사 대상으로 제공함
- 출시 후 7일간 무료 플랜 1분, Starter 플랜 15분, Creator+ 플랜 30분의 체험 사용량을 제공하며, API는 추후 제공 예정임
원문: elevenlabs.io
참고: gigazine.net
조코레터는 개발자와 만드는 사람을 위해 AI, 소프트웨어, 제품 흐름을 한국어로 정리합니다.
#ElevenLabs #NVIDIA