Meta Case Study

musk-think 스킬을
사고법으로 줄이기

일론 머스크 사고법(제1원리 + 5단계)을 Claude Code 스킬로 만든 뒤, 그 스킬 자체에 사고법을 재귀적으로 적용해 4번 반복 개선했다. 결과: 110줄 → 30줄, 73% 압축. 본질은 유지, 군더더기만 삭제.

왜 메타냐 — Dogfooding the Thinking

스킬을 만들고 나서 첫 검증은 "이 스킬이 자기 자신에게 적용 가능한가?" 였다. 제1원리 사고가 정말 도구라면, 그 도구를 만든 도구에도 적용되어야 한다. 적용되지 않으면 그건 도그마지 사고법이 아니다.

적용 규칙

  1. Question — SKILL.md 안에서 받아들이고 있는 가정 3개 찾기
  2. Delete — 그 가정 중 흔들리는 것 통째 삭제. 10% 룰 적용
  3. Simplify — 살아남은 것을 LOC·표 개수·섹션 수로 정량 비교
  4. Accelerate — 사용자 readback 시간 절반화
  5. Automate — description 자동 매칭. 그 이상은 금지

4-iteration 타임라인

v1

최초 — Bloat

110 LOC · 5 tables

SKILL.md 첫 작성. allowed-tools 없는 단순 markdown이지만 *완벽주의*로 모든 섹션을 다 채웠다. 자체검증 표·보조도구 4종·안티패턴 6종·도메인 예시 6행·응답 규칙 별도 섹션·reference.md 별도 파일 예정.

약점: 사용자가 한 번에 다 읽기 어려움. "사고법은 길어야 신뢰감"이라는 가정에 갇힘.

v2

메타 자정

70 LOC · 4 tables (−36%)

"musk-think 스킬을 musk-think로 개선해" — 사용자 트리거. 자체검증 표 통째 삭제(메타 정보, 영구 보관 무가치). reference.md 안 만듦(없는 걸 안 만드는 게 최고의 Delete). 안티패턴 6→3. description 키워드 50→25.

남은 약점: 개발 어휘("헬퍼·LOC·빌드·배포")가 너무 많아 비개발 영역에서 안 통함.

v3

범용화

47 LOC · 2 tables (−33%)

"너무 개발적이야. 범용으로 개선해" — 사용자 트리거. 개발 어휘를 한 단계 추상화. LOC→"측정 가능 단위", 빌드사이클→"결정→실행→피드백 한 바퀴". 도메인 예시 표 신설(코드·사업·시간·관계·돈·진로 6행). Phase 1 sub-step 4→2로 압축.

남은 약점: 도메인 예시 표와 보조 도구가 LLM 본체 지식과 중복.

v4

수렴

30 LOC · 1 table (−36%)

"스킬개선해" — 사용자 트리거. 도메인 표 통째 삭제(LLM이 즉석 번역하면 됨). 보조 도구 한 줄 통째 삭제(LLM 본체에 있음). 안티패턴 3→1(본문 흡수). description 키워드 8→4.

수렴 판정: 다음 후보(Phase 4→2 합치기)는 *순서 강제*라는 본질 손상 → 거부. 여기가 sweet spot.

버전LOC섹션description 단어Δ
v111059~50
v27048~25−36%
v34726~30−33%
v43015~18−36%

매 반복 ~35% 압축. 점근적 수렴 곡선. 누적 73% 삭제.

단계별 Delete — 무엇이 사라졌는가

v1 → v2 (자정)

  • 자체검증 표 (5행) — 메타 정보, 영구 보관 무가치
  • 보조 도구 표 (4행) → 한 줄 압축
  • 안티패턴 6 → 3
  • description 키워드 50 → 25
  • reference.md (예정) — 안 만듦 = 최고의 Delete
  • "LLM의 출력:" boilerplate 라벨

v2 → v3 (범용화)

  • "헬퍼·옵션 객체·중간 레이어" → "중간 단계·중개자"
  • "LOC·의존성 수" → "단계·시간·비용·등장인물"
  • "빌드·테스트·배포 사이클" → "결정→실행→피드백 한 바퀴"
  • "Model 3 production hell" 예시 → 일반 표현
  • Phase 1 sub-step 4 → 2 (재기술·이유 추정 자동 따라옴)
  • 모드 표 → 한 줄

v3 → v4 (군더더기 제거)

  • 도메인 예시 표 (3행) — LLM 즉석 번역으로 대체
  • 보조 도구 한 줄 — LLM 본체 지식에 이미 있음
  • 안티패턴 3 → 1 (본문에 흡수)
  • description 키워드 8 → 4
  • Phase 4 boilerplate 압축
  • "응답 규칙" 별도 섹션 → 본문 마지막 한 줄

수렴 신호 — 멈춰야 할 때

Delete를 무한 반복하면 빈 SKILL.md가 된다. 어디서 멈추는가? 머스크 사고법 자체가 답을 준다: 본질이 깨지는 순간이 stop signal.

v5에서 시도했다면 (했고, 거부했다)

후보: Phase 4개 → 2개로 합치기

  • Q+D = "지워라" (제거 지향 인지)
  • S+A+A = "남은 것 다듬어라" (개선 지향 인지)

겉으로는 깔끔하지만, 머스크 알고리즘의 핵심 IP인 5개 행위의 *순서*가 손상된다. Phase가 합쳐지면 LLM은 다시 "한 번에" 답하려는 본능으로 회귀. 즉 v1의 실패로 돌아간다.

→ 거부. v4를 sweet spot으로 확정.

수렴 판정 룰 (10% 룰의 메타 버전)

  1. 다음 Delete 후보가 본질(=순서, 게이트, exit condition)을 건드리는가?
  2. 건드린다면 → 멈춤
  3. 안 건드린다면 → 한 번 더 반복

v4 최종본 — 30줄

---
name: musk-think
description: "일론 머스크 사고법(제1원리 + 5단계). 도메인 무관 —
  코드·사업·시간·관계·돈·진로. Use when 의사결정·줄이기·요구사항 검증.
  트리거: 제1원리, 5단계, 머스크식, 줄여줘."
---

# 일론 머스크 사고법 — 강제 프로토콜

본질은 5단계가 아니라 **순서 강제**. 인간·LLM 모두 Step 3·4·5
부터 시작하는 본능 → 이 스킬은 그것만 막는다.

> 호출됐다면 "한 번에 5단계 다 답하지 말라"는 뜻.
> 기본 phase별 dialogue. "빠르게" 요청 시 Quick 5줄.

## Phase 1 — Question
- 출처가 누구·어디인가? (조직·문화·"다들 그렇잖아" 금지)
- 가정 3개. 각각 "거짓이면?"
- ≥1개 흔들리면 Phase 2

## Phase 2 — Delete
- 항목 다 나열. 각각 "통째로 없애면?"
- 삭제 후보 N / 실제 삭제 M ≥ 1 강제
- 10% 룰: 10%↑ 되돌릴 것 같다 → 부족

## Phase 3 — Simplify
- 중간 단계 없애기 / 두 개 합치기
- 전/후를 숫자로. "깔끔해 보임" 통과 X

## Phase 4 — Accelerate + Automate
- 한 사이클 시간(분/시간/일)
- 절반 줄일 비자동화 개입 → 그다음 반복화
- 모양 안 잡혔으면 "아직 금지" 명시

## Quick — 5줄
Q / D / S / A / A 한 줄씩

## 안티패턴
**5단계 한 번에 나열** = 머스크 본인이 비판하는 자동완성식 사고.
이 스킬의 존재 이유가 그것 방지.

교훈 — 사고법 스킬을 만들 때

1. Dogfood 즉시

만든 스킬에 그 스킬 자체를 적용하면 첫 반복에서 30%↑ 압축이 거의 보장된다. 작성 시 자동으로 들어가는 boilerplate가 그만큼 많다.

2. 사용자 트리거 = Reward Signal

"스킬개선해"가 RL의 reward와 같다. 사용자가 한 번 더 누르는 한 sweet spot이 아니다. v4 이후 사용자가 더 안 눌렀다면 그게 수렴 증거.

3. 본질 = Stop Signal

Delete를 멈추는 곳은 "더 줄일 게 있냐"가 아니라 "이걸 줄이면 본질이 깨지냐". 무한 압축은 빈 파일로 끝난다.

4. 외부 파일 = 최고의 Delete

reference.md 같은 별도 파일은 *안 만드는 것*이 만드는 것보다 항상 낫다. 한 번 만들면 동기화 부담이 영구적으로 따라온다.

5. LLM 본체 지식 활용

스킬에 "Idiot Index란..."을 적지 마라. LLM은 이미 안다. 스킬은 LLM이 본능적으로 안 하는 행동(=phase별 분리, 순서 강제)만 적어야 한다.

6. description 다이어트

트리거 키워드를 욱여넣으면 false positive(아무 대화에서나 발동)가 늘어 사용자 짜증. 4~6개로 충분. 정확도 > 재현율.

한 줄 요약

"사고법 스킬을 사고법으로 줄였더니
73% 가벼워졌고, 본질은 그대로다.
이게 곧 스킬이 작동한다는 증거."