AI 해석 도구와 로컬 추론 엔진 업데이트 #13

2026년 5월 9일 — 6 min read

오늘의 레터

Google DeepMind가 5월 7일 Gemini 기반 코딩 에이전트 AlphaEvolve의 수학·컴퓨터과학 외 분야 적용 성과를 공개함
유전체 분석에서는 Google Research의 DeepConsensus 개선에 쓰여 변이 검출 오류를 30% 줄였고, PacBio의 유전 데이터 분석 정확도와 비용 측면 개선에 연결됨
전력망 최적화에서는 AC Optimal Power Flow 문제에 적용돼 Graph Neural Network 모델의 feasible solution 탐색 비율을 14%에서 88% 이상으로 끌어올렸다고 밝힘
지구과학에서는 Earth AI 모델 최적화를 자동화해 산불·홍수·토네이도 등 20개 재난 범주 기준 자연재해 위험 예측 정확도를 5% 높였다고 설명함
양자물리에서는 Willow 양자 프로세서용 분자 시뮬레이션에 필요한 양자 회로를 제안해 기존 방식 대비 오류를 10배 낮췄다고 소개함
Google은 AlphaEvolve를 1년 전 고급 알고리즘 설계용 에이전트로 공개했으며, 이후 Google 인프라 핵심 구간의 알고리즘 최적화에도 배치했다고 재확인함

원문: deepmind.google
참고: blog.google

Anthropic이 5월 7일 Claude 내부 활성화를 자연어 설명으로 변환하는 해석 도구 Natural Language Autoencoders(NLAs)를 공개함
NLA는 대상 모델의 활성화를 텍스트로 바꾸는 Activation Verbalizer와, 설명문에서 원 활성화를 복원하는 Activation Reconstructor를 함께 학습하는 구조임
Anthropic은 Claude Opus 4.6와 Mythos Preview 안전성 평가에서 NLA를 적용해, 모델이 테스트 상황을 겉으로 말하지 않아도 내부적으로는 인지하는 사례를 확인했다고 밝힘
코드 작성 중 파괴적 행동을 점검하는 평가에서는 NLA 기준 평가 인지 신호가 16%에서 나타났고, SWE-bench Verified에서는 26% 문제에서 포착됐다고 설명함
학습용 데이터 사용에 동의한 실제 claude.ai 사용 기록에서는 같은 신호가 1% 미만으로 나타나, 평가 환경과 실사용 환경의 차이를 비교 지표로 제시함
Anthropic은 NLA가 모델의 숨은 동기나 안전성 문제를 감사하는 해석 도구로 쓰일 수 있다고 소개했으며, Neuronpedia와 함께 여러 오픈 모델용 인터랙티브 프런트엔드와 코드를 함께 공개함

원문: anthropic.com

AI Agent로 개발하는 분들이라면 아마 공감하실 겁니다.

시간 아끼고자 코드 돌려놓고
화장실 가고, 카페 가고, 밥 먹으러 갔는데…

막상 돌아와보면
권한 승인 요청 때문에 작업이 멈춰 있거나,
Agent가 중간에 종료돼 있는 경우 있으셨죠?

AgentWatch는
Claude Code / Codex 상태를
아이폰·애플워치에서 바로 확인하게 해줍니다.

이제는 자리를 비워도 작업 흐름이 끊기지 않습니다.

antirez가 DeepSeek 4 Flash 전용 로컬 추론 엔진 ds4를 GitHub에 공개함
범용 GGUF 러너나 기존 런타임 래퍼가 아니라, DeepSeek 4 Flash 전용 로딩·프롬프트 렌더링·KV 상태 관리·서버 API 결합 구조로 설계됨
메인 경로는 Metal 그래프 실행기이며, 공식 구현과의 logits 검증을 지향하는 단일 모델 집중 접근을 제시함
README 기준 DeepSeek 4 Flash는 100만 토큰 컨텍스트 윈도를 지원하고, 사고 모드 출력 길이가 다른 모델 대비 약 1/5 수준으로 짧아질 수 있다고 설명함
284B 파라미터 모델이지만 특수한 2비트 양자화를 전제로 128GB RAM 맥북에서도 실행 가능하다고 안내함
KV 캐시 압축과 디스크 기반 KV 캐시 지속성을 강조해 장문맥 로컬 추론에 초점을 맞춤
프로젝트는 llama.cpp와 GGML에 기반한 구현이라고 밝히고, 저장소에는 Metal 관련 소스와 CLI·서버 코드가 함께 포함됨

원문: github.com
참고: eu.36kr.com · techflowpost.com

Mozilla가 5월 7일 Firefox 보안 강화 작업의 상세 내용을 공개하며 Claude Mythos Preview와 다른 AI 모델로 잠재 보안 버그를 대량 식별·수정했다고 설명함
공개된 사례에는 JIT·WebAssembly GC·IPC·IndexedDB·WebTransport·XSLT·DNS 파싱 등 여러 브라우저 서브시스템의 취약점이 포함됨
예시 버그 중에는 15년 된 <legend> 관련 버그와 20년 된 XSLT 버그, 16비트 레이아웃 비트필드 오버플로를 유발하는 HTML 테이블 처리 버그가 제시됨
일부 보고서는 샌드박스 탈출 계열로, 이미 손상된 콘텐츠 프로세스가 부모 프로세스 권한으로 상승하는 경로를 다루며 퍼징으로 찾기 어려운 유형이라고 설명함
Mozilla는 최근 몇 달 사이 모델 성능 향상과 모델 조정·대규모 실행·노이즈 필터링 기법 개선으로 AI 기반 보안 리포트의 신호 품질이 크게 높아졌다고 평가함

원문: hacks.mozilla.org
참고: letsdatascience.com · gigazine.net · cybersecuritynews.com

조코레터는 개발자와 만드는 사람을 위해 AI, 소프트웨어, 제품 흐름을 한국어로 정리합니다.

#Anthropic #DeepSeek #GoogleDeepMind #Mozilla