데이터 정제
/clean-dataNEW기능 설명
연구 데이터셋 표준화, 유효성 검증, 변환. 결측치, 이상치 감지, 변수 리코딩을 처리합니다.
주요 기능
- ✓결측치 요약 및 대체
- ✓이상치 감지 (IQR, Z-score)
- ✓코드북 생성
이 스킬 설치
git clone https://github.com/aperivue/medsci-skills.git
cp -r medsci-skills/skills/clean-data ~/.claude/skills/관련 스킬
연구 설계/design-study
분석 단위, 코호트 논리, 데이터 누출 위험, 검증 전략을 식별합니다.
표본 크기 계산/calc-sample-size결정 트리 기반 검정 선택으로 11개 설계를 지원하는 대화형 표본 크기 계산기. Cox regression EPV 포함.
비식별화/deidentifyLLM 분석 전 임상 연구 데이터를 비식별화합니다. 10개국 로케일 팩을 지원하는 독립 Python CLI. LLM 미사용.
변수 정의/define-variables관찰연구의 문헌 기반 변수 운영화. 데이터 사전 + 연구 질문 → 노출 / 결과 / 보정변수 정의, 컷오프, DB 변수 매핑이 인용으로 뒷받침된 표. Tier 0 dictionary-first 룰로 reviewer reject을 부르는 ad-hoc phenotype 정의를 차단. /search-lit과 /write-protocol Methods를 잇는 다리.