오늘의 한줄

오늘은 AI 에이전트가 실제 소프트웨어와 하드웨어를 어떻게 바꾸고 있는지가 핵심입니다. 한쪽에서는 코딩·보안·인프라가 에이전트 중심으로 재편되고, 다른 한쪽에서는 로보틱스·바이오·자율주행처럼 현실 세계 적용이 빠르게 구체화되고 있습니다.

🤖Artificial Intelligence4

Qwen3.6-35B-A3B, 에이전트형 코딩 성능 공개

Qwen3.6-35B-A3B는 총 350억 파라미터 중 약 30억만 활성화되는 희소 MoE 구조를 채택해, 비용 효율성과 성능을 동시에 노린 오픈소스 모델입니다. 이전 세대보다 에이전트형 코딩 능력이 크게 개선돼 Qwen3.5-27B나 Gemma4-31B 같은 대형 밀집형 모델과 경쟁 가능한 수준을 보여줍니다. 한국 개발자 입장에서는 더 적은 연산 자원으로도 실전형 코딩 에이전트를 구축할 수 있다는 점이 특히 중요합니다.

클로드 오푸스 4.7 공개

Anthropic은 실험적 성격의 Mythos와 별개로, 기존 주력 모델을 다듬은 Claude Opus 4.7을 선보였습니다. 최근 사이버 보안 분야에서 AI의 위험과 효용을 다룬 Project Glasswing를 공개한 직후 나온 업데이트라는 점에서, 성능 향상뿐 아니라 안전성과 배포 전략의 균형을 의식한 행보로 읽힙니다. 국내 기업 입장에서는 ‘더 강한 모델’ 자체보다, 어떤 기능을 제한적으로 공개하고 어떤 영역부터 상용화하는지가 더 중요한 판단 기준이 되고 있습니다.

AI 에이전트 스킬, 현실 성능은 벤치마크의 절반 이하

UC Santa Barbara, MIT CSAIL, MIT-IBM Watson AI Lab 연구팀은 오픈소스에서 수집한 3만4,198개의 스킬을 바탕으로 AI 에이전트의 실제 활용 능력을 평가했습니다. 그 결과, 벤치마크에서 보이는 성능이 현실 환경에서는 절반에도 못 미치는 경우가 많았고, 워크플로·API 사용법·모범 사례 같은 구조화된 지식을 실제로 연결해 쓰는 데 큰 격차가 드러났습니다. 한국 기업이 에이전트 도입을 검토할 때도 데모 점수보다 운영 환경에서의 재현성과 실패 비용을 먼저 따져야 한다는 메시지입니다.

오픈AI, 생물학 특화 LLM ‘GPT-Rosalind’ 제공 시작

OpenAI가 생물학 워크플로에 맞춰 학습한 특화 모델 GPT-Rosalind를 제한된 접근 방식으로 제공하기 시작했습니다. 범용 LLM 경쟁에서 한발 더 나아가, 특정 산업의 연구 절차와 데이터 흐름에 맞춘 도메인 모델 시장이 본격화되고 있음을 보여줍니다. 바이오·헬스케어 분야의 국내 연구자와 기업에게는, 앞으로 경쟁력이 단순 모델 크기보다 ‘업무 맥락에 얼마나 잘 맞느냐’로 이동할 가능성을 시사합니다.

🚀Startups1

피지컬 인텔리전스, 학습하지 않은 작업도 해내는 새 로봇 브레인 공개

로보틱스 스타트업 Physical Intelligence는 새 모델 π0.7을 공개하며, 이를 범용 로봇 브레인을 향한 초기지만 의미 있는 진전이라고 설명했습니다. 핵심은 사전에 명시적으로 가르치지 않은 작업도 추론을 통해 수행할 수 있다는 주장으로, 로봇이 고정된 스크립트에서 벗어나 일반화 능력을 갖추기 시작했다는 점입니다. 제조·물류 자동화에 관심 있는 국내 업계에는, 로봇 경쟁력이 하드웨어보다 모델의 범용성에서 갈릴 가능성을 보여주는 사례입니다.

🛠️Developer Tools9

세일즈포스, 전체 플랫폼을 AI 에이전트 인프라로 바꾸는 ‘헤드리스 360’ 공개

세일즈포스는 연례 TDX 개발자 컨퍼런스에서 자사 27년 역사상 가장 큰 아키텍처 전환이라며 ‘Headless 360’을 발표했습니다. 플랫폼의 거의 모든 기능을 API, MCP 도구, CLI 명령으로 노출하고, 개발자에게 즉시 활용 가능한 100개 이상의 새 도구와 스킬을 제공해 브라우저 없이도 AI 에이전트가 CRM 전체를 조작할 수 있게 했습니다. 이는 엔터프라이즈 소프트웨어가 이제 화면 중심 UI보다 ‘에이전트가 호출할 수 있는 시스템’으로 재정의되고 있음을 보여줍니다.

Android CLI, 어떤 에이전트와도 연동해 앱 개발 속도 3배 향상

새로 공개된 Android CLI는 터미널 기반 인터페이스로, Gemini·Antigravity·Claude Code·Codex 같은 다양한 AI 에이전트와 연동해 Android 앱 개발 속도를 최대 3배까지 끌어올리는 것을 목표로 합니다. Android Studio 바깥에서도 빌드와 자동화 작업을 수행할 수 있어, 개발 환경 자체가 IDE 중심에서 에이전트 중심으로 이동하고 있다는 신호로 볼 수 있습니다. 모바일 팀에게는 생산성 향상 도구이자, 향후 CI/CD와 코드 생성 워크플로를 다시 설계해야 한다는 의미이기도 합니다.

Thoughtworks 테크놀로지 레이더 34호 공개

Thoughtworks는 기술·도구·플랫폼·언어/프레임워크를 ‘도입 권장, 시험 사용, 평가, 주의’의 4단계로 정리한 Technology Radar Volume 34를 공개했습니다. 이번 호의 핵심 테마는 에이전트 시대의 기술 평가, 원칙은 유지하되 패턴은 재검토해야 한다는 점, 에이전트의 보안 문제, 그리고 코딩 에이전트 하네스였습니다. 단순한 유행 정리가 아니라, 생성형 AI 이후 조직이 어떤 기술을 실험하고 어디서 브레이크를 걸어야 하는지에 대한 실무 가이드라는 점에서 의미가 큽니다.

클라우드플레어, 에이전트를 위한 양방향 이메일 플랫폼 공개 베타 출시

Cloudflare는 이메일을 에이전트와 애플리케이션의 핵심 인터페이스로 보고, Email Sending과 Email Routing을 결합한 Email Service 공개 베타를 선보였습니다. 이를 통해 Cloudflare 환경 안에서 이메일 수신, 처리, 응답까지 하나의 흐름으로 구성할 수 있어, 단순 발송 도구가 아니라 자동화 실행 채널에 가까워졌습니다. 기업 입장에서는 가장 오래된 커뮤니케이션 수단인 이메일이 다시 ‘AI 업무 인터페이스’로 재해석되고 있다는 점이 흥미롭습니다.

pi-autoresearch, 카르파시의 ‘AI 자율 실험’ 아이디어를 범용화한 오픈소스

pi-autoresearch는 ‘아이디어를 시도하고, 측정하고, 개선되면 유지하고 아니면 버린다’는 자율 실험 루프를 범용화한 오픈소스 프로젝트입니다. 터미널 AI 코딩 에이전트 pi를 확장해 Karpathy가 제시한 AI 기반 반복 실험 아이디어를 실제 연구·개발 워크플로에 적용하려는 시도라는 점이 핵심입니다. 한국의 스타트업이나 연구팀에게는 단순 코드 생성보다, 가설 검증 자체를 자동화하는 방향으로 AI 활용이 이동하고 있다는 신호입니다.

Zerobox, OpenAI Codex 런타임 기반 경량 프로세스 샌드박스

Zerobox는 Codex의 샌드박스 런타임을 독립 도구로 분리해, 임의의 명령 실행에 파일·네트워크·자격증명 제어를 적용할 수 있게 만든 경량 크로스 플랫폼 격리 도구입니다. 기본 정책이 deny 중심이라 AI가 생성한 코드를 그대로 실행하더라도 파일 손상이나 데이터 유출 위험을 크게 줄일 수 있습니다. 에이전트가 실제 시스템 명령을 만지는 시대에는 성능 좋은 모델만큼이나 ‘어디까지 실행을 허용할 것인가’가 핵심 인프라가 됩니다.

모질라, 셀프호스팅 인프라에 초점을 맞춘 Thunderbolt AI 클라이언트 출시

Mozilla는 deepset의 Haystack을 기반으로, 셀프호스팅 인프라에 초점을 맞춘 Thunderbolt AI 클라이언트를 공개했습니다. 회사는 이를 ‘분산형 오픈소스 AI 생태계’로 가는 한 걸음으로 설명하며, 클라우드 종속 대신 조직이 직접 모델과 파이프라인을 통제할 수 있는 방향을 제시했습니다. 규제와 데이터 주권 이슈가 큰 한국 기업에는, AI 도입 전략이 곧 인프라 통제 전략이 된다는 점을 다시 보여주는 사례입니다.

클라우드플레어의 AI 플랫폼, 에이전트를 위한 추론 계층

Cloudflare는 다양한 모델과 제공자를 하나로 묶어 에이전트형 애플리케이션의 복잡성을 줄이는 ‘추론 계층’을 제시했습니다. AI Gateway와 Workers AI를 통해 70개 이상의 모델과 12개 이상의 제공자를 단일 API로 호출할 수 있게 하면서, 멀티모델 운영을 인프라 레벨에서 단순화하려는 접근입니다. 이는 앞으로 AI 플랫폼 경쟁이 개별 모델 성능보다 라우팅, 관측성, 비용 통제 같은 운영 계층으로 이동할 수 있음을 보여줍니다.

정말 데이터베이스가 필요할까

이 글은 모든 데이터베이스가 결국 파일 시스템 위의 구조화된 파일 집합이라는 점에서 출발해, 초기 단계 애플리케이션이라면 직접 파일을 관리하는 방식도 충분히 실용적일 수 있다고 주장합니다. Go, Bun, Rust로 동일한 서버를 구현해 파일 스캔·인메모리 맵·디스크 이진 탐색 방식의 성능을 비교하면서, 무조건 DB부터 도입하는 관성을 다시 보게 만듭니다. 한국 개발팀에도 ‘스택을 단순하게 유지하는 선택’이 때로는 확장성 못지않게 중요하다는 점을 상기시켜 줍니다.

🇰🇷Korea Tech3

Codex가 삼성 스마트 TV 해킹에 성공

이번 실험에서는 AI 모델 Codex가 실제 삼성 스마트 TV를 대상으로 브라우저 권한에서 루트 권한까지 이어지는 완전한 공격 체인을 수행했습니다. OpenAI와의 협력 아래 펌웨어 소스와 장치 접근권을 활용해 취약점을 자동 탐색하고 악용하는 과정을 검증했다는 점에서, AI가 보안 연구의 속도와 범위를 크게 넓히고 있음을 보여줍니다. 한국 제조·임베디드 업계에는 ‘AI로 개발 생산성을 높이는 시대’와 동시에 ‘AI가 공격도 자동화하는 시대’가 함께 왔다는 경고로 읽힙니다.

라이드플럭스, 국내 첫 자율주행 트럭 유상 화물운송 허가

라이드플럭스는 국토교통부로부터 국내 최초로 자율주행자동차 유상 화물운송 허가를 받아, 서울 송파 동남권물류단지와 충북 진천 물류센터를 잇는 112km 구간에서 상업 운송을 시작할 예정입니다. 회사는 앞서 11톤 화물을 적재한 25톤 대형 로보트럭으로 단 한 차례의 인간 개입 없이 완주한 영상을 공개했고, 이번 허가도 60일 이상의 사전 운행 등 검증 절차를 거쳐 받았습니다. 한국 자율주행 산업이 실증을 넘어 실제 매출이 발생하는 단계로 진입했다는 점에서 상징성이 큽니다.

파네시아, PCIe 6.4·CXL 3.2 퓨전 스위치 샘플 칩 공급

파네시아는 올해 하반기 PCIe 6.4와 CXL 3.2를 동시에 지원하는 퓨전 스위치 샘플 칩을 공급한다고 밝혔습니다. 이 칩은 PBR(Port-Based Routing)을 포함한 CXL 3.2 전체 기능을 구현해 GPU, PCIe 스위치, CXL CPU, 메모리 확장 장치, AI 가속기 등을 유연하게 연결할 수 있도록 설계됐습니다. AI 데이터센터에서 자원 공유와 메모리 확장이 곧 운영비 절감으로 이어지는 만큼, 한국 반도체·서버 업계에도 꽤 실질적인 의미가 있는 발표입니다.