DIO-ZENITH: LLM과 결정적 코드 심판을 결합한 특허명세서 자동 작성 엔진
LLM이 명세서 전체를 생성하고 결정적 코드가 46개 품질 게이트로 심판하는 이중 검증 아키텍처. KIPO 전자출원 표준 준수 8단계 파이프라인.

초록
특허명세서는 기술적 정확성과 법적 견고성을 동시에 요구하는 극히 높은 난이도의 문서다. 현재 수동 작성은 2~4주 소요되며 비용은 $3,000~10,000에 달한다. 기존 LLM 기반 접근법은 환각(hallucination) 위험과 품질 검증 부재가 핵심 문제다. 본 논문은 LLM-Writer + Code-Judge 분리 아키텍처를 통해 이 문제를 해결하는 DIO-ZENITH v8.0을 제시한다. LLM은 명세서 전체를 생성하고, 결정적 Rust 코드는 46개 품질 게이트로 자동 심판한다. KIPO 전자출원 형식 준수, 8단계 파이프라인, 선행기술 거리 계산, 해자 방어 점수, SVG 도면 자동 생성을 포함한다. 32,636줄의 프로덕션 코드, 325개 이상의 자동화 테스트, 실제 KIPO 출원 성공으로 검증됐다.
1. 서론: 특허명세서 작성의 구조적 문제
1.1 현상: 수작업 병목의 비용과 시간
특허명세서는 다음 세 가지 전문성을 동시에 요구한다:
- 기술적 정확성: 발명의 본질적 특징, 알고리즘, 성능 지표를 정확하게 기술
- 법적 견고성: KIPO 규칙, 청구항 전략(상위항 대비 종속항 3:1 비율), 선행기술 차별성
- 형식 규격: KIPO 전자출원 포맷, 도면 규격(190mm × 277mm SVG), 참조번호 일관성
현재 프로세스:
- 발명가 또는 기술팀: 기술문서 준비 (1주)
- 변리사: 초안 작성 (1~2주)
- 심사: 피드백 반영 (1~2주)
- 총 2~4주, $3,000~10,000
1.2 기존 LLM 기반 접근법의 한계
| 한계 | 발생 메커니즘 | 영향 | |------|----------------|------| | 환각(Hallucination) | LLM은 학습 데이터의 패턴을 모방하며 존재하지 않는 참고문헌 생성 | 선행기술 오류, 실시불가능 청구항 | | 법적 취약성 | 생성 텍스트가 기재요건을 만족하는지 검증 없음 | KIPO 거절이유, 무효심판 위험 | | 품질 편차 | 반복 실행 시 비결정적 출력으로 인한 검증 비용 증가 | QA 비효율, 수동 리뷰 필수 | | 출력 형식 불일치 | KIPO 전자출원 XML, SVG 도면 등 구조화된 형식 생성 불가 | 재작업 및 수동 변환 |
1.3 우리의 접근법: LLM-Writer + Code-Judge 이중 검증
핵심 혁신:
- LLM(Writer): 생성 작업만 전담. 온도 0.3으로 결정성 강화.
- Code(Judge): 46개 품질 게이트(12개 치명적)로 자동 심판.
- Feedback Loop: 게이트 실패 시 LLM에 구체적 피드백 → 최대 3회 반복.
- 결정적 출력: 게이트를 통과한 명세서만 최종 산출.
이 아키텍처의 본질은 분리의 원칙(Separation of Concerns).
2. 시스템 아키텍처: 8단계 파이프라인
2.1 전체 흐름도
입력: 발명 기술문서 → PH0~PH7 처리 → 출력: 최적화된 명세서
PH0 기술문서 분석 → PH1 청구항 설계 → PH2 공격/방어 시뮬레이션 → PH3 선행기술 거리 → PH4 KIPO 명세서 작성 → PH5 품질 검사 → PH6 내부용어 유출 방지 → PH7 관할권 변환
2.2 각 Phase 상세
PH0: 기술문서 분석
LLM이 입력 문서 세트를 분석하여 발명의 핵심을 추출한다.
- 발명 제목: 짧고 명확한 기술적 특징 추출
- 기술분야: IPC 분류 추정
- 핵심 요소: 입력 구조, 처리 로직, 출력 결과 자동 추출
PH1: 청구항 설계
LLM이 다음 규칙으로 청구항을 생성한다.
- 독립항 4개 이상: 광범위한 권리 범위 확보
- 종속항: 각 독립항당 3~5개 (KIPO 권고 3:1 비율)
- 구조: 방법 + 장치 + 컴퓨터 판독 매체 다층 보호
PH2: 공격/방어 시뮬레이션
결정적 코드가 5가지 무효화 벡터를 시뮬레이션한다. 각 벡터는 선행기술 결합, 자명성, 기재요건 부족, 실시불가능성, 권리범위 불명확을 검사한다.
PH3: 선행기술 거리 계산
PA_DIST 알고리즘: 청구항 텍스트 → TF-IDF 벡터화 (2048차원) → 코사인 유사도 계산 → 거리 판정 (sim이 0.30 미만).
PH4: KIPO 명세서 작성
LLM이 다음 구조로 명세서를 생성한다: 요약, 발명의 주요 이점, 도면 설명, 청구항, 명세서 본문.
SVG 도면 자동 생성: 구성요소 추출 → DAG 구성 → Sugiyama 레이아웃 → 직교 라우팅 → KIPO 형식 검증.
PH5: 품질 검사
46개 품질 게이트 (12개 치명적): 명확성, 기술적 깊이, 법적 견고성, 형식 규격, KIPO 준수.
PH6: 내부용어 유출 방지
P13Guard 필터로 금지 용어 (600+ 항목)를 검사하고 위반 시 표준 용어로 교체한다.
PH7: 관할권 변환
단일 명세서에서 3개 관할권 버전을 자동 생성한다: KR (한국), US (미국), EP (유럽).
3. 핵심 혁신: LLM-Writer + Code-Judge 이중 검증
3.1 LLM-Writer 계층
모델: Claude Sonnet 4, temperature = 0.3, max_tokens = 8000~12000. 역할: 명세서 전체 텍스트 생성 (100%).
3.2 Code-Judge 계층
언어: Rust. 구성: 46개 품질 게이트 (Deterministic Validator). 핵심: 결정성, 증거성, 피드백 가능.
3.3 Feedback Loop: 최대 3회 반복
LLM 생성 → Code Judge 평가 → 게이트 실패 시 피드백 → LLM 수정 생성 (최대 3회).
왜 이것이 혁신인가?
- LLM의 비결정적 출력을 결정적 심판으로 보호
- 환각을 원천 차단하지 않고, 검증 게이트로 필터링
- 반복을 통해 LLM이 점진적으로 품질 기준 학습
4. KIPO 준수 SVG 도면 자동 생성
4.1 DAG 레이아웃 알고리즘
구성요소 추출 → 인과관계 그래프 → Sugiyama 레이아웃 → 직교 라우팅 → KIPO 형식 검증 (190mm × 277mm, 검은색).
4.2 출력 형식
DIO-ZENITH는 다음 형식으로 도면을 생성한다: SVG, DOCX, HWPX, PDF, KIPO XML.
5. 선행기술 거리 알고리즘과 해자 방어 점수
5.1 PA_DIST: 선행기술 거리 계산
목적: 청구항이 선행기술로부터 충분히 거리를 두고 있는가를 정량화한다.
알고리즘: 청구항 텍스트 → TF-IDF 벡터화 → 코사인 유사도 계산 → 거리 판정.
해석: sim이 0.30 미만 (충분), 0.30~0.50 (개선), 0.50~0.70 (위험), ≥0.70 (무효).
5.2 Moat(해자) 점수: 종합 방어력 평가
개념: 특허의 권리를 지키는 해자의 깊이를 점수화한다. 5축으로 평가한다:
- scope: 청구항 범위의 넓이
- pa_distance: 선행기술 거리
- dependency_depth: 기술적 종속성 깊이
- tdf: 기술 방어 계수
- qg41: 품질 게이트 41 점수
최종 점수 [0~10]: 0~2 (약함), 2~5 (중간), 5~8 (강함), 8~10 (극강).
6. 평가: 정량적 검증
6.1 코드베이스 규모
| 모듈 | 줄수 | 목적 | |-----|------|------| | dio-zenith (메인) | 23,322 | 전체 파이프라인, 46개 게이트 | | dio-zenith-slim | 9,314 | 경량 버전 (게이트 20개) | | 합계 | 32,636 | 프로덕션 규모 |
6.2 테스트 커버리지
자동화: 325+, 게이트: 138~230, E2E: 50, 회귀: 25.
6.3 성능 벤치마크
전체: 15~27분 (이전 21~40시간, 97% 단축).
6.4 실제 KIPO 출원 성공
형식 100% 통과, 청구항 인정, 도면 규격 통과, 처리 80% 단축.
7. 결론 및 향후 계획
7.1 주요 기여
- 환각 방지: LLM 생성 + Code 심판 이중 검증
- 품질 보증: 46개 게이트로 최소 기준 강제
- 시간 단축: 2~4주 → 15~27분 (97% 단축)
- 비용 절감: 자동화를 통한 비용 최소화
- 형식 자동화: 다중 포맷 지원
- 법적 견고성: 기재요건, 실시가능성, 진보성 자동 검증
7.2 향후 계획
단기 (2026년):
- 선행기술 자동 검색 (API 통합)
- 다국어 확장 (일본어, 중국어)
- 실시간 협업 기능
중기 (2026~2027년):
- PCT 자동 출원
- 무효심판 방어 전략
- AI 모델 미세조정
장기 (2027년 이후):
- 특허 가치 평가 자동화
- 라이선싱 계약 자동 생성
- 표준화(ISO) 추진
7.3 산업적 함의
DIO-ZENITH는 특허 전문가의 업무를 보강한다. 변리사는 자동 생성된 초안을 검토하고 전략적 개선을 수행하여 전체 처리 시간을 45분으로 단축할 수 있다.
발명가는 기술 설명서를 제출하여 24시간 내에 출원 가능한 명세서를 수령할 수 있다.
문의
AGEIUM Research: hswastory@gmail.com | +82-70-3317-1840