posts
리서치 메모, AI·자동화 실험, 1인 기업 준비 기록.
서튼이 찬물을 끼얹었다 — ChatGPT 는 지능이 아니다
RL 창시자 리처드 서튼의 인터뷰. LLM 실전 유저 입장에서 들으면 불편하지만, 불편한 만큼 짚어볼 가치가 있는 말들.
Pi Coding Agent 를 30분 만져봤다 — Claude Code 와 뭐가 다른가
오픈소스 코딩 에이전트 Pi. 1000 토큰 이하 시스템 프롬프트, TypeScript 확장, OpenRouter 통합. 가볍게 돌려본 감상.
습관 추적은 도구 문제가 아닌 걸 다시 확인했다
Amplenote 의 습관 추적 튜토리얼을 보고 내 Notion 설정과 비교해봤다. 도구의 차이는 거의 없고 운영 문제가 전부다.
매 세션 README 읽느라 지친다 — Graphify 를 한 번 돌려봤다
프로젝트를 매번 새 세션에 설명하느라 토큰 태우는 게 이제 지겹다. 지식 그래프로 해결된다는 소리가 진짜인지 본 영상 정리.
MCP 는 REST 를 감싸는 래퍼가 아니다 — Anthropic 발표 정리
David Soria Parra 의 MCP 미래 토크. 자동화에 관심 있는 사람 입장에서 가장 귀에 남는 한 줄은 'progressive discovery'.
에이전트가 자기 작업을 칭찬하는 버릇을 고치는 방법
Claude 한 마리가 코드를 쓰고 그 코드를 같은 Claude 가 평가하면 항상 'good job' 이 나온다. GAN 구조로 분리하라는 Anthropic 의 3단계 하네스 정리.
수학 올림피아드 금메달인데 시계는 못 읽는 AI
2026 스탠포드 AI Index 2부 영상. 벤치마크의 간극이 리서치 회사 업무에 어떤 의미인지 내 식으로 정리.