AI 에이전트 메모리와 개발 도구 업데이트 #1
오늘의 레터
- OpenAI, GPT-5.5·GPT-5.5 Pro API 출시
- Stash, AI 에이전트용 오픈소스 메모리 계층 공개
- CC-Canary, Claude Code 회귀 징후 탐지 도구 공개
- VT Code, Rust TUI 코딩 에이전트 공개
- LamBench, 람다 계산 기반 AI 벤치마크 v1 공개
OpenAI, GPT-5.5·GPT-5.5 Pro API 출시
- OpenAI가 API changelog를 통해 gpt-5.5와 gpt-5.5-pro 출시를 공개함
- 공지 출처는 developers.openai.com의 공식 API 문서이며, Latest 영역에 GPT-5.5가 반영됨
- API 문서 내 Models·Pricing 경로에서도 GPT-5.5 관련 항목을 확인할 수 있음
- 이번 업데이트는 Chat Completions가 아니라 OpenAI API 문서 체계와 함께 안내된 개발자용 릴리스임
- 같은 changelog에는 2026-04-21의 gpt-image-2, 2026-04-15의 gpt-5.4-mini·gpt-5.4-nano 항목도 이어서 기록돼 있음
- Agents SDK·Tools·Pricing·Models 등 개발자 문서 탐색 구조 안에서 최신 모델 안내가 함께 제공됨
원문: developers.openai.com
참고: news.google.com
Stash, AI 에이전트용 오픈소스 메모리 계층 공개
- Stash는 AI 에이전트에 지속형 메모리 계층을 붙여 세션이 바뀌어도 이전 대화 맥락을 이어가는 오픈소스 프로젝트로 소개됨, 보도에 따르면
- Claude, GPT, 로컬 모델 등 모델 종류와 무관하게 연결 가능하다고 설명되며, PostgreSQL과 pgvector 기반 저장 구조를 제시
- 메모리는 episodes·facts·relationships·patterns·goals·failures·hypotheses 단계로 정리되고, 6단계 파이프라인과 28개 MCP 도구 구성을 내세움
- 네임스페이스 경로 체계로 사용자 정보, 프로젝트 지식, 에이전트 자기 정보 등을 분리 저장하는 방식
- 프로젝트 측 설명 기준으로 RAG와 달리 대화에서 사실을 축적하고 목표·실패·모순을 추적하는 구조를 강조
- ChatGPT·Claude.ai의 내장 메모리와 비교해 특정 플랫폼 종속 없이 동작하고, 데이터 소유권을 사용자 쪽에 둔다는 점을 차별점으로 제시
- 다만 공식 외부 검증 자료가 제한적이어서 성능 우위와 장기 추론 효과는 아직 유출 단계 주장에 가까움
원문: alash3al.github.io
참고: github.com
CC-Canary, Claude Code 회귀 징후 탐지 도구 공개
- GitHub 공개 저장소에 cc-canary와 cc-canary-html 2개 Agent Skill이 올라왔고, Claude Code 회귀 징후 탐지 도구로 소개됨, 보도에 따르면.
- ~/.claude/projects/ 아래 JSONL 세션 로그를 읽어 포렌식 마크다운 보고서 또는 다크 테마 HTML 대시보드를 생성하는 구조.
- 기본 분석 구간은 60d이며 7d·14d·30d·90d·180d 옵션을 지원한다고 README에 명시.
- 판정 단계는 HOLDING·SUSPECTED REGRESSION·CONFIRMED REGRESSION·INCONCLUSIVE 4종으로 제시.
- 지표는 비용, read:edit 비율, reasoning loops, tokens/turn, 모델 버전 간 비교, inflection date 탐지 등을 포함.
- 설치는 npx skills add delta-hq/cc-canary 방식이며, python3 3.8 이상이 필요하다고 적혀 있음.
- 저장소 설명 기준으로 네트워크, 계정, 텔레메트리, 백그라운드 데몬 없이 로컬 디스크의 기존 로그만 사용.
- 상태 표기는 0.x pre-alpha이며 출력 형식과 metric set이 바뀔 수 있다고 안내.
원문: github.com
VT Code, Rust TUI 코딩 에이전트 공개
- VT Code가 GitHub 저장소 형태로 공개됐고, Rust 기반 TUI 코딩 에이전트로 소개됨
- 저장소 헤더에는 LLM 네이티브 코드 이해와 강한 셸 안전성을 내세운다고 적혀 있음
- 캡처 시점 기준 GitHub 지표는 스타 528개, 포크 45개, 이슈 0개, PR 0개로 표시됨
- 커밋 수는 5,529건으로 보이고, src·tests·docs·system-prompts·rules 디렉터리가 함께 포함됨
- vscode-extension, zed-extension, homebrew, vtcode-lmstudio, vtcode-acp, vtcode-auth 같은 하위 구성도 확인됨
- .mcp.json, vtcode.toml.example, AGENTS.md가 포함돼 설정 파일과 외부 도구 연동 지향이 보도에 따르면 드러남
- 아직 저장소 공개 단계라 지원 모델 범위나 실제 멀티 프로바이더 동작 조건은 공식 문서 추가 확인 전 단계로 보임
원문: github.com
LamBench, 람다 계산 기반 AI 벤치마크 v1 공개
- LamBench라는 이름의 AI 벤치마크 v1이 공개된 것으로 보이며, 소개 페이지와 GitHub 저장소 링크가 함께 제시됨
- 아직 유출 단계에 가까운 정보만 확인돼 세부 설명은 제한적이며, 보도에 따르면 공식 문서 수준의 상세 스펙은 확인되지 않음
- 페이지에는 intelligence, speed, elegance, problems, matrix 다섯 항목이 노출돼 평가 축 또는 결과 분류 체계로 보임
- 이름 그대로 람다 계산을 전면에 둔 벤치마크로 읽히지만, 실제 측정 방식과 데이터셋 구성은 추가 공개가 필요함
- 모델 성능 순위표, 점수 산식, 비교 대상 모델 목록은 현재 확인되지 않아 정량 비교 자료로 쓰기엔 이른 상태
- 연구·평가 커뮤니티에서는 기존 수학·코딩 벤치마크와 다른 추상 계산 능력 측정 시도인지가 관전 포인트가 될 가능성
조코레터는 개발자와 만드는 사람을 위해 AI, 소프트웨어, 제품 흐름을 한국어로 정리합니다.
#LamBench #OpenAI #Stash #VTCode #delta-hq