release media memory providers codex

OpenClaw 4.5–4.11: 로브스터, 창작을 배우다 — 영상, 음악, 그리고 당신 대신 기억해주는 메모리

OpenClaws.io Team

OpenClaws.io Team

@openclaws

April 11, 2026

9 분 소요

OpenClaw 4.5–4.11: 로브스터, 창작을 배우다 — 영상, 음악, 그리고 당신 대신 기억해주는 메모리

6일. 세 번의 릴리스. 4.5, 4.7, 4.10, 4.11.

3.31–4.2가 공성전이었다면 — 로브스터가 자기 몸을 지키는 법을 배우던 시기 — 4.5부터 4.11까지는 갑옷을 입은 다음에 벌어지는 이야기다. 이제 뭔가를 만들기 시작한다. 뭔가를 기억하기 시작한다. 질문에 답하기만 하던 로브스터가 이제 영상을 찍고, 음악을 쓰고, 당신이 부탁하기 전에 필요한 맥락을 답장 안에 집어넣는다.

영상 생성이 퍼스트 클래스 툴이 되다

4.5 전까지 영상은 일종의 사이드 프로젝트였다. 플러그인을 통해 뭔가 엮을 수는 있었지만, 공용 툴 이름도 없었고, 프로바이더 레지스트리도, 폴백 체인도 없었다. 그게 바뀌었다.

video_generate가 이제 내장 툴이다. 에이전트는 image_generate를 부르는 것과 똑같은 방식으로 호출한다. 결과는 첨부 미디어로 돌아오고, 대화가 돌아가는 채널이 무엇이든 — 텔레그램이든, 디스코드든, 슬랙이든, iMessage든 — 그쪽으로 전달된다.

출시 시점의 번들 프로바이더는 xAI(grok-imagine-video), Alibaba Model Studio Wan, Runway. 4.10은 fal 프로바이더를 통해 Seedance 2.0을 추가했고, 길이·해상도·오디오·시드까지 모두 지원한다. 4.11은 URL 전용 에셋 전달, 레퍼런스 오디오 입력, 에셋별 역할 힌트, 그리고 adaptive 화면비를 추가했다 — 거대한 파일을 메모리에 들고 있지 않아도 프로바이더가 더 풍부한 모드를 노출할 수 있도록.

인증 기반 이미지·음악·영상 프로바이더 전반에 걸친 자동 폴백은 4.7에서 들어왔다. 전환 중에도 의도는 보존된다. 크기, 화면비, 해상도, 길이 힌트는 실패로 날려버리는 대신 가장 가까운 지원 옵션으로 재매핑된다. 한 프로바이더가 요청을 처리하지 못하면, 체인의 다음 프로바이더가 번역된 버전을 받아간다.

음악 생성도, 같은 패턴으로

같은 릴리스, 같은 패턴. music_generate도 내장 툴이고, Google Lyria와 MiniMax가 번들 프로바이더로 들어있다. 비동기 추적이 지원되고, 오디오가 완성되면 후속으로 전달된다. 프로바이더가 지원하지 않는 선택적 힌트 — 예를 들면 Lyria의 durationSeconds — 는 요청을 죽이는 대신 경고와 함께 무시된다.

전부 로컬에서 돌리고 싶다? 4.5에 번들된 ComfyUI 워크플로 플러그인이 image_generate, video_generate, 그리고 워크플로 기반의 music_generate를 로컬 ComfyUI와 Comfy Cloud 양쪽에 대해 커버한다. 프롬프트 삽입, 선택적 레퍼런스 이미지 업로드, 라이브 테스트, 출력 다운로드 — 한 바퀴가 전부 들어있다.

`openclaw infer`: 모든 추론을 하나의 CLI로

4.7에서 openclaw infer가 프로바이더 기반 추론 워크플로의 퍼스트 클래스 허브로 안착했다. 모델, 미디어, 웹, 임베딩 작업이 모두 같은 명령어 아래로 모인다. 트랜스크립션은 요청별로 promptlanguage 오버라이드를 지원한다. 웹 검색과 웹 페치는 에이전트 런타임이 실행할 때와 똑같이 동작한다.

챗 루프 바깥에서 추론을 돌리려고 일회용 스크립트를 이어붙여오던 사람이라면, 이게 그 대체물이다.

액티브 메모리: 로브스터가 스스로 기억하기 시작한다

이번 릴리스에서 사용자가 가장 확실하게 체감하게 될 한 가지.

4.10 전까지 메모리는 당신이 시켜야 움직이는 것이었다. "다크 모드 좋아한다는 거 기억해둬." "그 API 키 워크플로를 메모리에서 찾아봐." 로브스터는 해주지만, 당신이 "기억해두라"고 말하는 걸 스스로 기억해야 했다.

액티브 메모리는 그걸 뒤집는다. 선택적 플러그인이 매 턴의 메인 응답 직전에 전용 메모리 서브 에이전트를 돌린다. 서브 에이전트는 선호, 과거의 세부 정보, 관련 맥락을 자동으로 프롬프트에 끌어온다. 당신이 "기억하기"를 기억하지 않아도 된다.

얼마나 공격적으로 할지에 따라 메시지 스코프, 최근 스코프, 풀 컨텍스트 모드 중에서 고를 수 있다. /verbose로 무엇이 끌려오는지 실시간으로 들여다볼 수 있다. 튜닝이 필요하면 프롬프트와 thinking 오버라이드도 준비돼 있다. 특정 메모리 결정을 디버깅해야 할 때를 위해, 트랜스크립트 지속도 옵트인이 가능하다.

4.12가 그걸 더 조였다. mx-claw 같은 래퍼가 개입돼 있어도 리콜 실행은 해석된 채널 위에 머문다. 렉시컬 폴백 랭킹이 개선됐다. 액티브 메모리 결과는 시스템 프롬프트에 직접 들어가는 대신, 숨겨진 untrusted prompt-prefix 경로에 얹힌다 — 덕분에 게이트웨이 디버그 로그에서 모델이 정확히 무엇을 받았는지 그대로 볼 수 있다.

Codex에 전용 프로바이더가 생겼다

4.10이 Codex를 OpenAI 프로바이더 경로에서 떼어냈다. codex/gpt-<em class="italic text-slate-200"> 모델은 이제 플러그인 소유의 app-server 하네스를 통해 Codex가 관리하는 인증, 네이티브 스레드, 모델 발견, 컴팩션을 사용한다. openai/gpt-</em>는 표준 OpenAI 프로바이더에 남는다.

실전에서의 의미: Codex 구독이 당신의 OpenAI API 키를 밟지 않는다. 인증 프로파일이 분리된다. 모델 목록은 Codex 카탈로그에서 온다. 4.14는 gpt-5.4-pro에 대한 포워드 호환 지원을 뒤따라 넣었다 — 업스트림 카탈로그가 따라오기 전에 Codex 측 가격과 제한이 제대로 보이는 상태로.

LM Studio가 번들 프로바이더가 되다

4.12가 번들된 LM Studio 프로바이더를 내놓았다. 온보딩 플로우, 런타임 모델 발견, 스트림 프리로드, 메모리 검색 임베딩 — 퍼스트 클래스 경로가 전부 들어있다. LM Studio로 로컬 모델을 돌리고 있다면, 더 이상 범용 OpenAI 호환 엔드포인트로 설정해두고 능력 탐지가 제대로 되기를 기도할 필요가 없다.

언급할 가치가 있는 더 작은 것들

  • Arcee AI 프로바이더(4.7): Trinity 카탈로그, OpenRouter 지원, 온보딩 가이드.
  • Gemma 4 지원(4.7): 명시적인 thinking-off 시맨틱이 Gemma 호환 래퍼를 통과해도 보존된다.
  • Qwen, Fireworks AI, StepFun 번들(4.5) — 여기에 MiniMax TTS, Ollama Web Search, MiniMax Search 통합까지.
  • Amazon Bedrock(4.5): 추론 프로파일 발견과 요청 리전 자동 주입. AWS_BEARER_TOKEN_BEDROCK 를 export하지 않아도 IAM 인증이 자격증명 체인을 통해 동작한다.
  • 컴팩션 프로바이더 레지스트리(4.7): 플러그인이 내장 요약 파이프라인을 대체할 수 있다. 프로바이더가 실패하면 LLM 요약으로 폴백한다.
  • 컴팩션 체크포인트 영구 저장(4.7): 컴팩션 이전 상태를 검사하고 복구하기 위한 Sessions UI의 브랜치/복원 액션.

이번 사이클의 모양

세 가지 테마가 나란히 달린다:

  1. 1.만든다. 영상, 음악, 로컬 워크플로 러너. 질문에 답하기만 하던 로브스터가 이제 챗 바깥에 남는 결과물을 만든다.
  2. 2.기억한다. 액티브 메모리가 메모리를 "당신이 호출하는 것"에서 "스스로 호출하는 것"으로 바꿔놓았다.
  3. 3.경계가 깨끗해졌다. Codex는 자기 차선을 얻었다. LM Studio는 퍼스트 클래스가 됐다. 프로바이더 인증이 맥락을 넘어 흘러다니지 않는다.

이 중에 어떤 것도 "이게 간판이다"라고 한마디로 말할 수 있는 단일 기능은 아니다. 개별로 보면 점진적인 업그레이드의 연속이지만, 합쳐놓고 보면 로브스터의 손맛 자체가 바뀐다. 영상을 부탁하면 영상이 돌아온다. 선호를 한 번 지나가듯 말해두면 남아있다. Codex와 OpenAI GPT 사이를 오가도 인증이 충돌하지 않는다.

6일, 세 번의 릴리스, "할 수 있다"에서 "당신을 대신해 해준다"로 넘어간 로브스터 한 마리.

소식 받기

새 기능과 연동 소식을 알려드려요. 스팸 없음, 언제든 구독 취소 가능.