경량 AI 모델 공개와 개발 인터페이스 변화 #18

경량 AI 모델 공개와 개발 인터페이스 변화 #18

오늘의 레터

  1. Needle, Gemini 3.1 툴콜링 증류 2600만 모델 공개
  2. Google DeepMind AI 포인터 구상 공개

Needle, Gemini 3.1 툴콜링 증류 2600만 모델 공개

Needle, Gemini 3.1 툴콜링 증류 2600만 모델 공개
  • cactus-compute가 Gemini 3.1을 증류한 2600만 파라미터 함수 호출 모델 Needle을 GitHub에 공개함
  • README 기준 Needle은 매우 작은 디바이스에서도 실행 가능하도록 설계됐고, Mac·PC 로컬 파인튜닝도 지원함
  • 모델 구조는 Simple Attention Network 기반으로 소개됐고, 설정 값으로 d=512·8H/4KV·BPE=8192를 명시함
  • 운영 수치는 Cactus 환경 기준 prefill 초당 6000토큰, decode 속도 1200으로 제시됨
  • 가중치는 Cactus-Compute/needle 저장소에서 공개됐고, 데이터셋 생성 방식도 함께 오픈했다고 밝힘

원문: github.com


Google DeepMind AI 포인터 구상 공개

  • Google DeepMind가 2026년 5월 12일 AI 시대용 마우스 포인터 구상을 공개함
  • 기존 포인터는 반세기 넘게 큰 변화가 없었고, 앞으로는 화면 대상을 가리키는 기능만으로는 부족하다고 설명함
  • 포인터가 무엇을 가리키는지뿐 아니라, 그 대상이 사용자에게 왜 중요한지도 이해하는 AI 기반 기능을 검토 중
  • 목표는 별도 AI 창으로 콘텐츠를 옮기지 않고, 사용 중인 웹사이트·문서·워크플로 안에서 AI가 맥락을 바로 파악하는 상호작용임
  • 예시로 건물 이미지를 가리킨 뒤 "길 안내 보여줘"라고 요청하면, 추가 설명 없이도 맥락을 이해하는 사용 흐름을 제시함
  • 이번 글에서는 미래 사용자 인터페이스 설계 방향을 위한 4대 원칙을 소개하며, 더 자연스럽고 끊김 없는 AI 협업 방식을 제안함

원문: deepmind.google
참고: sources.news


조코레터는 개발자와 만드는 사람을 위해 AI, 소프트웨어, 제품 흐름을 한국어로 정리합니다.

#Cactus #GoogleDeepMind

조코레터 구독하기

Read more