지난 주 Anthropic이 Claude Code 세션 40만 개를 분석한 리서치를 발표했다. 2025년 10월부터 2026년 4월까지, 약 23만 5천 명의 사용자가 남긴 기록이다. 결론을 한 줄로 요약하면 이렇다. 코딩을 잘하는 것보다 무엇을 만들지 아는 것이 더 중요하다.
나는 이 결론을 읽으면서 고개를 끄덕였다. 개발자가 아닌 내가 에이전트로 블로그를 만들고, 주식 백테스팅 도구를 만들고, 학습 자동화 파이프라인을 만들 수 있었던 건 코딩 실력 때문이 아니었다. 리서치라는 도메인이 있었기 때문이다. 내가 풀고 싶은 문제를 정확히 알고, 그 문게 맞는지 틀린지 판별할 수 있는 지식이 있으니 에이전트가 만든 결과물을 검증하고 방향을 잡을 수 있었다. 이게 핵심이다.
40만 세션이 말하는 분업
Anthropic의 분석에서 가장 흥미로운 발견은 분업의 구조다. 전형적인 세션에서 사용자는 계획 결정의 약 70%를 내리고, Claude는 실행 결정의 약 80%를 내린다. 무엇을 만들지는 인간이 정하고, 어떻게 만들지는 에이전트가 정한다. 사용자가 보내는 하나의 프롬프트당 Claude는 평균 10개의 액션을 수행한다. 때로는 100개가 넘는다. 파일을 읽고, 코드를 수정하고, 명령을 실행하고, 평균 2,400단어의 출력을 생성한다.
Anthropic은 사용자의 도메인 전문성을 다섯 단계로 분류했고, 각 단계별로 에이전트가 얼마나 일하는지 측정했다. 여기서 도메인 전문성이 차이를 만든다. 초보자 세션에서는 하나의 프롬프트당 Claude가 평균 5개의 액션과 약 600단어 출력을 만들어낸다. 전문가 세션에서는 12개 액션과 3,200단어 출력이 나온다. 같은 도구를 쓰는데 전문가에게서 두 배 이상의 작업이 나온다. 전문가가 더 정확한 지시를 주기 때문이다. 에이전트가 해야 할 일이 명확하면, 에이전트는 더 많은 것을 더 빠르게 해낸다.
Anthropic은 도메인 전문성을 다섯 단계로 분류했다. novice에서 expert까지. 각 단계에서 에이전트가 얼마나 일하는지, 세션이 성공하는지를 측정했다. 성공의 정의도 엄격하다. 단순히 "사용자가 만족했다"가 아니라 커밋, 풀 리퀘스트, 테스트 통과 같은 검증 가능한 증거가 있어야 verified success로 인정한다.
코딩 직업 vs 다른 직업 — 격차는 5포인트
가장 놀라운 데이터는 직업 간 성공률 비교다. 소프트웨어 관련 직업의 verified success rate는 약 30%. 비소프트웨어 직업은 약 26%. 격차는 4포인트다. 코드를 실제로 작성하는 세션만 비교해도 34% vs 29%로, 5포인트 차이밖에 나지 않는다. 느슨한 기준(partial success)으로 가면 89% vs 88%로 거의 차이가 사라진다.
관리 직군(management occupations)은 소프트웨어 엔지니어보다 verified success rate가 약간 더 높았다. 에이전트에게 지시를 내리는 데 관리 스킬이 전이되는 것으로 Anthropic은 추측한다. 중요한 건 이 격차가 7개월 동안 줄지도 늘지도 않았다는 점이다. 코딩 배경이 프로그래밍 성공에 미치는 영향은 점점 줄고 있다.
도메인을 알수록 에이전트가 더 많이 일한다
이 데이터를 읽으면서 내 경험을 대조해봤다. 나는 개발자가 아니다. 코드를 처음부터 끝까지 손수 쓸 수 없다. 하지만 리서치라는 도메인이 있다. 리서치 회사에서 일하면서 쌓은 데이터 분석, 워크플로우 설계, 자동화에 대한 지식이 있다. 이 지식 위에서 에이전트를 쓰니 내가 직접 코딩할 수 없는 것들 — 블로그 자동 배포, 주식 백테스팅 도구, Notion 연동 파이프라인 — 을 만들 수 있었다.
이게 Anthropic 리서치가 말하는 "persistent returns to expertise"다. 도메인 전문성은 에이전트 시대에도 사라지지 않는다. 오히려 에이전트가 도메인 전문가의 손에 들어가면 증폭된다. 일반 개발자가 바이브코딩을 한 결과보다, 이미 도메인이 있는 사람이 바이브코딩을 한 결과가 더 성과가 좋다. 왜냐하면 도메인 전문가는 에이전트가 만든 결과물이 맞는지 틀린지를 알 수 있기 때문이다. 검증 능력이 없으면 에이전트가 만든 코드를 그대로 받아들이게 되고, 그 코드가 실제로 문제를 해결하는지 확인할 방법이 없다.
내가 에이전트로 가장 효율적으로 성공한 케이스를 돌아보면 하나의 패턴이 있다. 배워서 내 도메인에 적용하는 것. 새로운 도구나 기술을 배울 때, 그것을 리서치 워크플로우에 어떻게 연결할지 먼저 생각한다. 도구 자체가 목적이 아니라 내 도메인 문제를 푸는 수단이다. 이 접근이 에이전트 시대에 가장 빠르고 효율적인 성공 경로다.
중요한 건 도메인 지식의 깊이가 에이전트의 정확도를 결정한다는 점이다. 에이전트를 몇 개 띄우느냐는 상관없다. 도메인을 깊이 아는 사람이 하나의 에이전트에게 정확한 지시를 내리는 것이, 도메인 없이 여러 에이전트를 동시에 돌리는 것보다 결과가 낫다. 에이전트의 수가 아니라 지시의 질이 결과를 결정한다. 그리고 지시의 질은 도메인 지식에서 나온다.
이건 코딩에만 해당하는 이야기가 아니다. Anthropic 데이터에서 주목할 부분은 세션의 13%가 코드가 아닌 작업 — 데이터 분석, 문서 작성, 프레젠테이션 — 이라는 점이다. 문서 편집이나 글 작성에서도 마찬가지다. LLM이 그냥 뱉어내는 출력과, 내 암묵지와 도메인 지식을 기반으로 에이전트에게 방향을 준 출력은 결과가 다르다. 글을 쓸 때도 내가 알아야 할 맥락, 독자, 톤앤매너를 정확히 에이전트에게 전달하면 훨씬 더 나은 결과가 나온다. 그 맥락을 모르면 에이전트는 평균적인 글을 쓴다. 맥락을 아는 사람은 에이전트에게 "이 부분은 이렇게 풀어라, 여기는 이 독자를 생각해라"라고 지시할 수 있다. 그 차이가 곧 성공률의 차이가 된다.
Anthropic 리포트에서 눈에 밟히는 구절이 있다. "Coding agents are not substituting for domain expertise — the more understanding a worker brings to an agent, the more quality work the agent is able to do." 에이전트는 도메인 전문성을 대체하는 게 아니라, 도메인 전문성을 증폭하는 도구다. 전문성이 없는 사람에게 에이전트는 600단어를 출력한다. 전문성이 있는 사람에게는 3,200단어를 출력한다. 같은 도구, 같은 모델, 다른 결과. 차이는 사람이 만든다.
Anthropic 리포트에서 눈에 밟히는 구절이 있다. "Coding agents are not substituting for domain expertise — the more understanding a worker brings to an agent, the more quality work the agent is able to do." 에이전트는 도메인 전문성을 대체하는 게 아니라, 도메인 전문성을 증폭하는 도구다. 전문성이 없는 사람에게 에이전트는 600단어를 출력한다. 전문성이 있는 사람에게는 3,200단어를 출력한다. 같은 도구, 같은 모델, 다른 결과. 차이는 사람이 만든다.
Coding agents are not substituting for domain expertise—the more understanding a worker brings to an agent, the more quality work the agent is able to do.