오늘의 한줄
오늘은 AI가 더 작고 빠르게 배포되는 흐름과, 동시에 기업 데이터·보안 인프라가 에이전트 시대에 맞춰 재설계되는 움직임이 두드러졌습니다. 모델 성능 경쟁만큼이나 신뢰성, 추론 검증, 개인정보 보호가 실제 도입의 핵심 조건으로 떠오르고 있습니다.
🤖Artificial Intelligence7
엔비디아·구글 클라우드, 에이전트형 AI와 피지컬 AI 확산 위해 협력 강화
엔비디아와 구글 클라우드는 10년 넘게 이어온 협력을 바탕으로, 라이브러리·프레임워크부터 엔터프라이즈 클라우드 서비스까지 아우르는 풀스택 AI 플랫폼을 함께 고도화하고 있습니다. 이번 협력은 에이전트형 AI뿐 아니라 로보틱스, 시뮬레이션, ‘physical AI’까지 실험 단계를 넘어 실제 운영 환경으로 옮기는 데 초점이 맞춰져 있습니다. 국내 기업에는 GPU 확보만으로는 부족하고, 클라우드·소프트웨어 스택·배포 자동화까지 묶인 생태계 선택이 더 중요해지고 있음을 보여줍니다.
Qwen3.6-27B, 27B 밀집형 모델로 플래그십급 코딩 성능 제시
알리바바의 Qwen3.6-27B는 270억 파라미터의 dense 모델이면서도 상위권 코딩 성능을 내세우며, 대형 모델 일변도의 흐름에 도전장을 던졌습니다. Hacker News에서 500개가 넘는 추천과 250개 이상의 댓글이 붙을 정도로 개발자 반응도 뜨거웠는데, 이는 ‘작지만 실전적인’ 코딩 모델 수요가 크다는 뜻입니다. 한국 개발팀 입장에선 API 비용과 지연시간을 줄이면서도 고급 코딩 보조를 확보할 수 있는 대안이 늘고 있다는 점이 반갑습니다.
Kimi 벤더 검증기: 추론 제공자 정확도 차이를 검증하는 오픈소스 도구
Kimi 벤더 검증기는 같은 오픈소스 모델이라도 인프라나 서빙 구현에 따라 결과가 달라지는 문제를 검증해, 모델 자체 한계와 엔지니어링 오류를 구분할 수 있게 돕습니다. 공식 API 기준으로 OCRBench 91.0, AIME2025 avg@32 98.4, MMMU Pro Vision 78점대 등 구체적인 성능 기준을 제시해 비교의 기준점도 제공합니다. 멀티벤더 추론 환경을 쓰는 국내 기업에선 비용 절감만 보고 제공자를 바꿨다가 품질 저하를 겪는 일을 줄여줄 수 있습니다.
AI가 ‘잘 모르겠습니다’라고 말하도록 가르치는 법
MIT 연구진은 추론 모델의 성능을 크게 해치지 않으면서도, 자신의 확신도를 더 정확하게 표현하도록 만드는 새로운 학습 방법을 제안했습니다. 핵심은 정답률 자체만 높이는 것이 아니라, 불확실할 때 ‘모른다’고 말할 수 있게 해 환각의 근본 원인 중 하나를 줄이는 데 있습니다. 의료·법률·금융처럼 잘못된 자신감이 치명적인 분야에 AI를 적용하려는 한국 기업에게 특히 중요한 진전입니다.
ChatGPT에 워크스페이스 에이전트 도입
OpenAI가 Codex 기반의 ‘workspace agents’를 ChatGPT에 도입해, 여러 업무 도구를 넘나드는 복잡한 워크플로를 클라우드에서 자동화할 수 있게 했습니다. 팀 단위 보안과 권한 체계를 유지한 채 반복 업무를 위임하는 방향이어서, 개인용 챗봇에서 조직용 작업자 플랫폼으로 무게중심이 이동하고 있다는 점이 눈에 띕니다. 국내 SaaS·협업툴 시장에도 ‘대화형 UI’보다 실제 업무 실행 능력이 더 중요한 경쟁 포인트가 될 가능성이 큽니다.
Google LiteRT-LM, 엣지 디바이스용 고성능 LLM 추론 프레임워크
구글의 LiteRT-LM은 Android, iOS, 웹, 데스크톱, Raspberry Pi 같은 IoT 환경까지 폭넓게 지원하는 프로덕션급 온디바이스 LLM 추론 엔진입니다. 최신 Gemma 4 지원과 함께 GPU·NPU 가속을 활용해 엣지에서도 대규모 언어 모델을 실용적으로 돌릴 수 있도록 설계됐습니다. 개인정보 보호와 지연시간, 네트워크 비용이 중요한 한국 모바일·임베디드 서비스에선 클라우드 의존도를 줄이는 현실적인 선택지가 될 수 있습니다.
미 국방부, 대부분 국가의 국방비를 웃도는 540억 달러 규모 드론 예산 추진
미 국방부가 드론에만 540억 달러를 투입하는 예산안을 추진하고 있는데, 이는 상당수 국가의 전체 국방예산보다 큰 규모입니다. 우크라이나의 전체 군사 예산에 맞먹는 수준이라는 점에서, 자율 시스템과 무인 전력이 이제 보조 전력이 아니라 군사 전략의 중심으로 이동하고 있음을 보여줍니다. 한국 방산·로보틱스 업계에도 AI 소프트웨어, 센서, 엣지 컴퓨팅 역량이 국가 경쟁력과 직접 연결되는 흐름으로 읽힙니다.
🏢Big Tech2
구글, ‘에이전트 시대’ 겨냥한 차세대 TPU 2종 공개
구글이 추론용과 학습용으로 역할을 분리한 차세대 TPU 2종을 공개하며, 에이전트형 AI 워크로드에 맞춘 인프라 전략을 분명히 했습니다. 단일 칩 성능 경쟁을 넘어, 학습과 서빙을 각각 최적화해 비용·지연시간·확장성을 세밀하게 조정하겠다는 접근입니다. 한국의 AI 서비스 기업들에도 모델 성능만이 아니라 inference economics가 경쟁력을 가르는 시대가 왔다는 신호로 읽힙니다.
질문하는 인간이 아니라 행동하는 에이전트를 위해, 구글이 데이터 스택을 다시 짰다
구글은 Cloud Next에서 ‘Agentic Data Cloud’를 공개하며, 사람이 정기 쿼리를 돌리던 기존 데이터 스택을 AI 에이전트가 실시간으로 행동하는 구조로 재설계하겠다고 밝혔습니다. 핵심 축은 쿼리 로그에서 비즈니스 의미를 추론하는 Knowledge Catalog, AWS S3의 Iceberg 테이블을 egress 비용 없이 조회하는 cross-cloud lakehouse, 그리고 VS Code·Claude Code·Gemini CLI에 연결되는 Data Agent Kit입니다. 데이터 엔지니어가 파이프라인 코드를 직접 짜는 시대에서, 원하는 결과를 선언하고 에이전트가 실행하는 시대로 넘어가고 있다는 점에서 한국 기업의 데이터 조직에도 시사점이 큽니다.
🛠️Developer Tools5
OpenAI, 기업 데이터의 개인정보를 기기에서 바로 제거하는 오픈소스 ‘프라이버시 필터’ 공개
OpenAI가 Hugging Face에 Apache 2.0 라이선스로 공개한 ‘Privacy Filter’는 15억 파라미터 규모의 온디바이스 모델로, 클라우드로 보내기 전에 기업 데이터에서 PII(개인식별정보)를 탐지·삭제합니다. 일반 노트북이나 웹브라우저에서도 실행할 수 있어, 학습 데이터셋 오염이나 추론 과정의 민감정보 노출을 줄이는 ‘privacy-by-design’ 도구로 주목됩니다. 국내 기업 입장에선 생성형 AI 도입 시 가장 큰 걸림돌인 개인정보 규제와 데이터 반출 우려를 완화할 수 있다는 점이 중요합니다.
마이크로소프트, macOS·Linux ASP.NET 위협에 긴급 보안 업데이트 배포
마이크로소프트가 macOS와 Linux 환경의 ASP.NET 관련 위협에 대응하기 위해 긴급 업데이트를 내놨습니다. 핵심은 인증이 실패할 때 보안 경계가 무너질 수 있다는 점으로, 크로스플랫폼 .NET 스택을 운영하는 조직이라면 즉시 패치 우선순위를 높여야 하는 사안입니다. 한국에서도 리눅스 기반 백엔드와 멀티클라우드 운영이 일반화된 만큼, ‘윈도우가 아니니 괜찮다’는 가정은 더 이상 통하지 않습니다.
Responses API에 WebSocket을 적용해 에이전트 워크플로를 더 빠르게 만드는 방법
OpenAI는 Codex 에이전트 루프를 사례로 들어, Responses API에 WebSocket과 연결 단위 캐싱을 적용해 API 오버헤드와 모델 지연시간을 줄이는 방식을 설명했습니다. 에이전트가 여러 번 도구를 호출하고 상태를 주고받는 구조에서는 단순한 모델 성능보다 세션 유지와 네트워크 효율이 체감 속도를 좌우한다는 점이 핵심입니다. 한국 팀이 에이전트 제품을 만들 때도 프롬프트 설계만이 아니라 실시간 연결 구조와 캐시 전략이 UX 경쟁력으로 직결됩니다.
빠른 동적 언어 인터프리터를 만드는 방법
이 글은 AST 직접 순회 방식의 인터프리터라도 값 표현, 인라인 캐시, 객체 모델, watchpoint 같은 기법과 반복적인 미세 최적화만으로 상당한 성능 향상이 가능하다고 설명합니다. 성능을 거의 고려하지 않은 Zef 베이스라인은 CPython 3.10보다 35배, Lua 5.4.7보다 80배, QuickJS-ng 0.14.0보다 23배 느렸지만, 21단계 최적화를 거치며 큰 폭으로 개선됐습니다. 언어 런타임이나 개발자 도구를 만드는 국내 엔지니어에게 ‘JIT가 없으면 느리다’는 통념을 다시 보게 하는 자료입니다.
Vercel 침해 사고, OAuth 공격이 플랫폼 환경 변수의 숨은 위험 드러내
이번 Vercel 침해는 Context.ai 직원이 Lumma Stealer에 감염되면서 시작됐고, 탈취된 Google Workspace OAuth 토큰이 Vercel 직원 계정과 내부 시스템 접근으로 이어졌습니다. 그 결과 일부 고객 프로젝트의 환경 변수가 노출됐는데, 이는 토큰·API 키·DB 비밀번호가 집중되는 ‘환경 변수’가 얼마나 강력한 공격 표면인지 다시 보여줍니다. 한국 스타트업과 플랫폼 운영팀도 OAuth 권한 관리, 내부 계정 보호, 비밀정보 저장 방식 전반을 재점검할 필요가 있습니다.