AGEIUM 자체 설계 · 구현 · 시뮬레이션

AI Cognitive Design

DIO-ZENITH: LLM과 결정적 코드 심판을 결합한 특허명세서 자동 작성 엔진

LLM이 명세서 전체를 생성하고 결정적 코드가 46개 품질 게이트로 심판하는 이중 검증 아키텍처. KIPO 전자출원 표준 준수 8단계 파이프라인.

AGEIUM Research2026년 4월 16일11 min read

초록

특허명세서는 기술적 정확성과 법적 견고성을 동시에 요구하는 극히 높은 난이도의 문서다. 현재 수동 작성은 2~~4주 소요되며 비용은 $3,000~~10,000에 달한다. 기존 LLM 기반 접근법은 환각(hallucination) 위험과 품질 검증 부재가 핵심 문제다. 본 논문은 LLM-Writer + Code-Judge 분리 아키텍처를 통해 이 문제를 해결하는 DIO-ZENITH v8.0을 제시한다. LLM은 명세서 전체를 생성하고, 결정적 Rust 코드는 46개 품질 게이트로 자동 심판한다. KIPO 전자출원 형식 준수, 8단계 파이프라인, 선행기술 거리 계산, 해자 방어 점수, SVG 도면 자동 생성을 포함한다. 32,636줄의 프로덕션 코드, 325개 이상의 자동화 테스트, 실제 KIPO 출원 성공으로 검증됐다.

1. 서론: 특허명세서 작성의 구조적 문제

1.1 현상: 수작업 병목의 비용과 시간

특허명세서는 다음 세 가지 전문성을 동시에 요구한다:

기술적 정확성: 발명의 본질적 특징, 알고리즘, 성능 지표를 정확하게 기술
법적 견고성: KIPO 규칙, 청구항 전략(상위항 대비 종속항 3:1 비율), 선행기술 차별성
형식 규격: KIPO 전자출원 포맷, 도면 규격(190mm × 277mm SVG), 참조번호 일관성

현재 프로세스:

발명가 또는 기술팀: 기술문서 준비 (1주)
변리사: 초안 작성 (1~2주)
심사: 피드백 반영 (1~2주)
총 2~~4주, $3,000~~10,000

1.2 기존 LLM 기반 접근법의 한계

한계	발생 메커니즘	영향
환각(Hallucination)	LLM은 학습 데이터의 패턴을 모방하며 존재하지 않는 참고문헌 생성	선행기술 오류, 실시불가능 청구항
법적 취약성	생성 텍스트가 기재요건을 만족하는지 검증 없음	KIPO 거절이유, 무효심판 위험
품질 편차	반복 실행 시 비결정적 출력으로 인한 검증 비용 증가	QA 비효율, 수동 리뷰 필수
출력 형식 불일치	KIPO 전자출원 XML, SVG 도면 등 구조화된 형식 생성 불가	재작업 및 수동 변환

1.3 우리의 접근법: LLM-Writer + Code-Judge 이중 검증

핵심 혁신:

LLM(Writer): 생성 작업만 전담. 온도 0.3으로 결정성 강화.
Code(Judge): 46개 품질 게이트(12개 치명적)로 자동 심판.
Feedback Loop: 게이트 실패 시 LLM에 구체적 피드백 → 최대 3회 반복.
결정적 출력: 게이트를 통과한 명세서만 최종 산출.

이 아키텍처의 본질은 분리의 원칙(Separation of Concerns).

발명 제목: 짧고 명확한 기술적 특징 추출
기술분야: IPC 분류 추정
핵심 요소: 입력 구조, 처리 로직, 출력 결과 자동 추출

PH1: 청구항 설계

LLM이 다음 규칙으로 청구항을 생성한다.

독립항 4개 이상: 광범위한 권리 범위 확보
종속항: 각 독립항당 3~5개 (KIPO 권고 3:1 비율)
구조: 방법 + 장치 + 컴퓨터 판독 매체 다층 보호

LLM의 비결정적 출력을 결정적 심판으로 보호
환각을 원천 차단하지 않고, 검증 게이트로 필터링
반복을 통해 LLM이 점진적으로 품질 기준 학습

해석: sim이 0.30 미만 (충분), 0.30~~0.50 (개선), 0.50~~0.70 (위험), ≥0.70 (무효).

5.2 Moat(해자) 점수: 종합 방어력 평가

개념: 특허의 권리를 지키는 해자의 깊이를 점수화한다. 5축으로 평가한다:

scope: 청구항 범위의 넓이
pa_distance: 선행기술 거리
dependency_depth: 기술적 종속성 깊이
tdf: 기술 방어 계수
qg41: 품질 게이트 41 점수

최종 점수 [0~~10]: 0~~2 (약함), 2~~5 (중간), 5~~8 (강함), 8~10 (극강).

6. 평가: 정량적 검증

6.1 코드베이스 규모

모듈	줄수	목적
dio-zenith (메인)	23,322	전체 파이프라인, 46개 게이트
dio-zenith-slim	9,314	경량 버전 (게이트 20개)
합계	32,636	프로덕션 규모

환각 방지: LLM 생성 + Code 심판 이중 검증
품질 보증: 46개 게이트로 최소 기준 강제
시간 단축: 2~~4주 → 15~~27분 (97% 단축)
비용 절감: 자동화를 통한 비용 최소화
형식 자동화: 다중 포맷 지원
법적 견고성: 기재요건, 실시가능성, 진보성 자동 검증

7.2 향후 계획

단기 (2026년):

선행기술 자동 검색 (API 통합)
다국어 확장 (일본어, 중국어)
실시간 협업 기능

중기 (2026~2027년):

PCT 자동 출원
무효심판 방어 전략
AI 모델 미세조정

장기 (2027년 이후):

특허 가치 평가 자동화
라이선싱 계약 자동 생성
표준화(ISO) 추진

7.3 산업적 함의

DIO-ZENITH는 특허 전문가의 업무를 보강한다. 변리사는 자동 생성된 초안을 검토하고 전략적 개선을 수행하여 전체 처리 시간을 45분으로 단축할 수 있다.

발명가는 기술 설명서를 제출하여 24시간 내에 출원 가능한 명세서를 수령할 수 있다.

문의

AGEIUM Research: hswastory@gmail.com | +82-70-3317-1840

DIO-ZENITH: LLM과 결정적 코드 심판을 결합한 특허명세서 자동 작성 엔진

초록

1. 서론: 특허명세서 작성의 구조적 문제

1.1 현상: 수작업 병목의 비용과 시간

1.2 기존 LLM 기반 접근법의 한계

1.3 우리의 접근법: LLM-Writer + Code-Judge 이중 검증

2. 시스템 아키텍처: 8단계 파이프라인

2.1 전체 흐름도

2.2 각 Phase 상세

PH0: 기술문서 분석

PH1: 청구항 설계

PH2: 공격/방어 시뮬레이션

PH3: 선행기술 거리 계산

PH4: KIPO 명세서 작성

PH5: 품질 검사

PH6: 내부용어 유출 방지

PH7: 관할권 변환

3. 핵심 혁신: LLM-Writer + Code-Judge 이중 검증

3.1 LLM-Writer 계층

3.2 Code-Judge 계층

3.3 Feedback Loop: 최대 3회 반복

4. KIPO 준수 SVG 도면 자동 생성

4.1 DAG 레이아웃 알고리즘

4.2 출력 형식

5. 선행기술 거리 알고리즘과 해자 방어 점수

5.1 PA_DIST: 선행기술 거리 계산

5.2 Moat(해자) 점수: 종합 방어력 평가

6. 평가: 정량적 검증

6.1 코드베이스 규모

6.2 테스트 커버리지

6.3 성능 벤치마크

6.4 실제 KIPO 출원 성공

7. 결론 및 향후 계획

7.1 주요 기여

7.2 향후 계획

7.3 산업적 함의

문의