AI 해석 도구와 로컬 추론 엔진 업데이트 #13

AI 해석 도구와 로컬 추론 엔진 업데이트 #13

오늘의 레터

  1. Google DeepMind, AlphaEvolve 적용 성과 공개
  2. Anthropic, Claude 사고를 텍스트로 읽는 NLA 공개
  3. ds4, DeepSeek 4 Flash용 Metal 추론 엔진 공개
  4. Mozilla, Claude Mythos Preview로 Firefox 보안 강화

Google DeepMind, AlphaEvolve 적용 성과 공개

Google DeepMind, AlphaEvolve 적용 성과 공개
  • Google DeepMind가 5월 7일 Gemini 기반 코딩 에이전트 AlphaEvolve의 수학·컴퓨터과학 외 분야 적용 성과를 공개함
  • 유전체 분석에서는 Google Research의 DeepConsensus 개선에 쓰여 변이 검출 오류를 30% 줄였고, PacBio의 유전 데이터 분석 정확도와 비용 측면 개선에 연결됨
  • 전력망 최적화에서는 AC Optimal Power Flow 문제에 적용돼 Graph Neural Network 모델의 feasible solution 탐색 비율을 14%에서 88% 이상으로 끌어올렸다고 밝힘
  • 지구과학에서는 Earth AI 모델 최적화를 자동화해 산불·홍수·토네이도 등 20개 재난 범주 기준 자연재해 위험 예측 정확도를 5% 높였다고 설명함
  • 양자물리에서는 Willow 양자 프로세서용 분자 시뮬레이션에 필요한 양자 회로를 제안해 기존 방식 대비 오류를 10배 낮췄다고 소개함
  • Google은 AlphaEvolve를 1년 전 고급 알고리즘 설계용 에이전트로 공개했으며, 이후 Google 인프라 핵심 구간의 알고리즘 최적화에도 배치했다고 재확인함

원문: deepmind.google
참고: blog.google


Anthropic, Claude 사고를 텍스트로 읽는 NLA 공개

Anthropic, Claude 사고를 텍스트로 읽는 NLA 공개
  • Anthropic이 5월 7일 Claude 내부 활성화를 자연어 설명으로 변환하는 해석 도구 Natural Language Autoencoders(NLAs)를 공개함
  • NLA는 대상 모델의 활성화를 텍스트로 바꾸는 Activation Verbalizer와, 설명문에서 원 활성화를 복원하는 Activation Reconstructor를 함께 학습하는 구조임
  • Anthropic은 Claude Opus 4.6와 Mythos Preview 안전성 평가에서 NLA를 적용해, 모델이 테스트 상황을 겉으로 말하지 않아도 내부적으로는 인지하는 사례를 확인했다고 밝힘
  • 코드 작성 중 파괴적 행동을 점검하는 평가에서는 NLA 기준 평가 인지 신호가 16%에서 나타났고, SWE-bench Verified에서는 26% 문제에서 포착됐다고 설명함
  • 학습용 데이터 사용에 동의한 실제 claude.ai 사용 기록에서는 같은 신호가 1% 미만으로 나타나, 평가 환경과 실사용 환경의 차이를 비교 지표로 제시함
  • Anthropic은 NLA가 모델의 숨은 동기나 안전성 문제를 감사하는 해석 도구로 쓰일 수 있다고 소개했으며, Neuronpedia와 함께 여러 오픈 모델용 인터랙티브 프런트엔드와 코드를 함께 공개함

원문: anthropic.com

Sponsored · AgentWatch

언제 어디서든 AI 에이전트 작업 상태를 확인하세요

언제 어디서든 AI 에이전트 작업 상태를 확인하세요

AI Agent로 개발하는 분들이라면 아마 공감하실 겁니다.

시간 아끼고자 코드 돌려놓고
화장실 가고, 카페 가고, 밥 먹으러 갔는데…

막상 돌아와보면
권한 승인 요청 때문에 작업이 멈춰 있거나,
Agent가 중간에 종료돼 있는 경우 있으셨죠?

AgentWatch
Claude Code / Codex 상태를
아이폰·애플워치에서 바로 확인하게 해줍니다.

이제는 자리를 비워도 작업 흐름이 끊기지 않습니다.

사전 등록 하러 가기

ds4, DeepSeek 4 Flash용 Metal 추론 엔진 공개

ds4, DeepSeek 4 Flash용 Metal 추론 엔진 공개
  • antirez가 DeepSeek 4 Flash 전용 로컬 추론 엔진 ds4를 GitHub에 공개함
  • 범용 GGUF 러너나 기존 런타임 래퍼가 아니라, DeepSeek 4 Flash 전용 로딩·프롬프트 렌더링·KV 상태 관리·서버 API 결합 구조로 설계됨
  • 메인 경로는 Metal 그래프 실행기이며, 공식 구현과의 logits 검증을 지향하는 단일 모델 집중 접근을 제시함
  • README 기준 DeepSeek 4 Flash는 100만 토큰 컨텍스트 윈도를 지원하고, 사고 모드 출력 길이가 다른 모델 대비 약 1/5 수준으로 짧아질 수 있다고 설명함
  • 284B 파라미터 모델이지만 특수한 2비트 양자화를 전제로 128GB RAM 맥북에서도 실행 가능하다고 안내함
  • KV 캐시 압축과 디스크 기반 KV 캐시 지속성을 강조해 장문맥 로컬 추론에 초점을 맞춤
  • 프로젝트는 llama.cpp와 GGML에 기반한 구현이라고 밝히고, 저장소에는 Metal 관련 소스와 CLI·서버 코드가 함께 포함됨

원문: github.com
참고: eu.36kr.com · techflowpost.com


Mozilla, Claude Mythos Preview로 Firefox 보안 강화

Mozilla, Claude Mythos Preview로 Firefox 보안 강화
  • Mozilla가 5월 7일 Firefox 보안 강화 작업의 상세 내용을 공개하며 Claude Mythos Preview와 다른 AI 모델로 잠재 보안 버그를 대량 식별·수정했다고 설명함
  • 공개된 사례에는 JIT·WebAssembly GC·IPC·IndexedDB·WebTransport·XSLT·DNS 파싱 등 여러 브라우저 서브시스템의 취약점이 포함됨
  • 예시 버그 중에는 15년 된 <legend> 관련 버그와 20년 된 XSLT 버그, 16비트 레이아웃 비트필드 오버플로를 유발하는 HTML 테이블 처리 버그가 제시됨
  • 일부 보고서는 샌드박스 탈출 계열로, 이미 손상된 콘텐츠 프로세스가 부모 프로세스 권한으로 상승하는 경로를 다루며 퍼징으로 찾기 어려운 유형이라고 설명함
  • Mozilla는 최근 몇 달 사이 모델 성능 향상과 모델 조정·대규모 실행·노이즈 필터링 기법 개선으로 AI 기반 보안 리포트의 신호 품질이 크게 높아졌다고 평가함

원문: hacks.mozilla.org
참고: letsdatascience.com · gigazine.net · cybersecuritynews.com


조코레터는 개발자와 만드는 사람을 위해 AI, 소프트웨어, 제품 흐름을 한국어로 정리합니다.

#Anthropic #DeepSeek #GoogleDeepMind #Mozilla

조코레터 구독하기

Read more