경량 AI 모델 공개와 개발 인터페이스 변화 #18
오늘의 레터
Needle, Gemini 3.1 툴콜링 증류 2600만 모델 공개
- cactus-compute가 Gemini 3.1을 증류한 2600만 파라미터 함수 호출 모델 Needle을 GitHub에 공개함
- README 기준 Needle은 매우 작은 디바이스에서도 실행 가능하도록 설계됐고, Mac·PC 로컬 파인튜닝도 지원함
- 모델 구조는 Simple Attention Network 기반으로 소개됐고, 설정 값으로 d=512·8H/4KV·BPE=8192를 명시함
- 운영 수치는 Cactus 환경 기준 prefill 초당 6000토큰, decode 속도 1200으로 제시됨
- 가중치는 Cactus-Compute/needle 저장소에서 공개됐고, 데이터셋 생성 방식도 함께 오픈했다고 밝힘
원문: github.com
Google DeepMind AI 포인터 구상 공개
- Google DeepMind가 2026년 5월 12일 AI 시대용 마우스 포인터 구상을 공개함
- 기존 포인터는 반세기 넘게 큰 변화가 없었고, 앞으로는 화면 대상을 가리키는 기능만으로는 부족하다고 설명함
- 포인터가 무엇을 가리키는지뿐 아니라, 그 대상이 사용자에게 왜 중요한지도 이해하는 AI 기반 기능을 검토 중
- 목표는 별도 AI 창으로 콘텐츠를 옮기지 않고, 사용 중인 웹사이트·문서·워크플로 안에서 AI가 맥락을 바로 파악하는 상호작용임
- 예시로 건물 이미지를 가리킨 뒤 "길 안내 보여줘"라고 요청하면, 추가 설명 없이도 맥락을 이해하는 사용 흐름을 제시함
- 이번 글에서는 미래 사용자 인터페이스 설계 방향을 위한 4대 원칙을 소개하며, 더 자연스럽고 끊김 없는 AI 협업 방식을 제안함
원문: deepmind.google
참고: sources.news
조코레터는 개발자와 만드는 사람을 위해 AI, 소프트웨어, 제품 흐름을 한국어로 정리합니다.
#Cactus #GoogleDeepMind