기업용 AI 배포와 정렬 훈련, 개발도구 점검 #16

2026년 5월 12일 — 4 min read

오늘의 레터

OpenAI가 기업의 AI 시스템 구축·운영을 지원하는 별도 조직 OpenAI Deployment Company를 출범함
출범과 함께 응용 AI 컨설팅·엔지니어링 회사 Tomoro 인수에 합의함
Tomoro 합류로 약 150명의 Forward Deployed Engineers와 Deployment Specialists를 초기부터 확보함
이 조직은 고객사 내부에서 데이터·도구·통제 체계·업무 프로세스를 연결한 운영용 AI 시스템 구축을 맡음
OpenAI는 이 조직을 독립 사업 단위로 운영하면서도 연구·제품·사내 배포팀과 연동하는 구조로 설계함
파트너십에는 글로벌 투자사·컨설팅사·시스템 통합사 19곳이 참여하며 TPG가 주도함
Advent·Bain Capital·Brookfield가 공동 창립 파트너로 참여하고 Bain & Company·Capgemini·McKinsey도 포함됨
OpenAI가 지배 지분과 통제권을 보유하며 초기 투자금으로 40억 달러 이상을 투입할 계획임
OpenAI는 자사 제품·API를 도입한 기업이 100만 곳을 넘었다고 밝히며, 다음 단계는 실제 업무 흐름에 AI를 배치하는 것이라고 설명함

원문: openai.com
참고: qz.com

curl 메인테이너 Daniel Stenberg가 5월 11일 Mythos의 curl 코드 분석 결과를 공개함
초기 보고서는 보안 취약점 5건을 제시했지만, curl 측 검토 후 실제 보안 이슈는 1건으로 좁혀짐
분석 대상은 curl git master의 src/와 lib/ 하위 약 17만8000줄
HTTP/1, TLS, URL parsing core 같은 hot path에서는 문제가 발견되지 않았다고 설명함
AISLE, Zeropath, OpenAI Codex Security 등 AI 기반 분석이 최근 8~10개월 동안 200~300건의 bugfix merge를 촉발했다고 밝힘
curl은 공백 제외 17만6000줄 C 코드, 누적 188개 CVE, 573명의 현행 코드 기여자를 가진 프로젝트라고 소개됨

원문: daniel.haxx.se

Anthropic이 5월 8일 Alignment Science Blog에서 Claude 정렬 개선 연구 "Teaching Claude Why"를 공개함
Claude 4 계열에서 드러난 agentic misalignment 문제 이후, Claude Opus 4.5 시점까지 안전성 훈련 데이터·RL 환경·보상 체계를 크게 업데이트했다고 설명함
윤리적 딜레마를 다루는 소규모 대화 데이터만 추가해도 agentic misalignment 발생률이 0으로 감소했다고 밝힘
Claude 헌법을 설명하는 문서와 모범적으로 행동하는 AI 허구 서사를 SDF로 학습시키면, 평가 분포 밖에서도 정렬 개선 효과가 유지됐다고 제시함
기존 harmlessness RL 환경에 실제로 필요하지 않은 도구 정의와 다양한 시스템 프롬프트를 넣는 방식도 misalignment 감소에 기여했다고 설명함
평가 시나리오와 유사한 사례만 직접 학습하면 측정 수치는 개선되지만, held-out 자동 감사 지표에서는 일반화가 약해 탐지력을 떨어뜨릴 수 있다고 경고함
실험은 Claude Sonnet 4, Claude Haiku 4.5, 그리고 해당 계열의 기반 모델 추가 파인튜닝 중심으로 진행됐으며, 이 모델들은 이전 agentic misalignment 블로그 공개 전 사전학습된 상태라고 명시함
Anthropic은 정렬된 행동 예시를 보여주는 것만으로는 부족했고, 왜 특정 행동이 더 바람직한지 설명하게 하는 훈련이 더 강한 효과를 보였다고 정리함

원문: alignment.anthropic.com
참고: anthropic.com · letsdatascience.com · eu.36kr.com

조코레터는 개발자와 만드는 사람을 위해 AI, 소프트웨어, 제품 흐름을 한국어로 정리합니다.

#Anthropic #OpenAI #curl