API 사용 FAQ - Clova Studio Gov

Chat Completions

어떤 모델을 사용할 수 있나요?

현재 Clova Studio Gov에서 제공하는 주요 모델은 HCX-GOV-THINK (전부 대문자)입니다.API 요청 시 모델 ID:

{
  "model": "HCX-GOV-THINK",
  "messages": [...]
}

주요 특징:

컨텍스트 길이: 128,000 tokens
복잡한 문제 해결, 논리적 추론, 단계별 설명에 적합
한국어 및 영어 지원

다른 모델에 대한 자세한 정보는 언어 모델 종류를 참고하세요.

대화 히스토리는 어떻게 관리하나요?

메시지 배열에 이전 대화를 포함하면 됩니다:

messages = [
    {"role": "system", "content": "당신은 도움이 되는 AI 어시스턴트입니다."},
    {"role": "user", "content": "Python이 뭐야?"},
    {"role": "assistant", "content": "Python은 프로그래밍 언어입니다."},
    {"role": "user", "content": "그럼 어디에 사용돼?"}  # 이전 맥락 유지
]

자세한 예제는 Chat 애플리케이션 Cookbook을 참고하세요.

스트리밍 응답을 사용할 수 있나요?

네, stream: true 옵션을 사용하면 실시간으로 응답을 받을 수 있습니다:

response = requests.post(
    url,
    headers=headers,
    json={
        "model": "HCX-GOV-THINK",
        "messages": messages,
        "stream": True  # 스트리밍 활성화
    },
    stream=True
)

for line in response.iter_lines():
    # 실시간으로 처리
    print(line)

사용자 경험 향상을 위해 스트리밍을 권장합니다. 자세한 예제는 Chat 애플리케이션 Cookbook을 참고하세요.

temperature와 top_p는 무엇인가요?

응답의 창의성과 일관성을 조절하는 매개변수입니다:Temperature (0.0 ~ 1.0):

0.0-0.3: 일관되고 예측 가능한 응답
- 사실 기반 질문, 데이터 분석, 코드 생성에 적합
0.4-0.7: 균형잡힌 응답 (권장, 기본값 0.5)
- 일반적인 대화, 설명, 요약에 적합
0.8-1.0: 창의적이고 다양한 응답
- 브레인스토밍, 창작 글쓰기, 아이디어 생성에 적합

Top-p (0.0 ~ 1.0):

0.1-0.5: 가장 확률 높은 단어만 선택 (보수적)
0.6-0.9: 적절한 다양성 유지 (권장, 기본값 0.9)
0.95-1.0: 다양한 단어 선택 가능 (창의적)

Temperature와 Top P를 동시에 높게 설정하면 응답이 불안정해질 수 있습니다. 일반적으로 둘 중 하나만 조정하는 것을 권장합니다.

최대 토큰 수는 얼마나 되나요?

HCX-GOV-THINK 모델의 컨텍스트 길이:

128,000 tokens

max_tokens 파라미터로 출력 길이 제한 가능:

짧은 답변 (요약, 분류): 256-512 tokens
일반 대화: 1024-2048 tokens
긴 문서 생성: 2048-4096 tokens (기본값)

토큰 계산 팁:

한글: 약 1자 = 1~2 토큰
영문: 약 1단어 = 1~2 토큰

다른 모델의 컨텍스트 길이는 언어 모델 종류를 참고하세요.

시스템 프롬프트는 어떻게 사용하나요?

role: "system" 메시지로 AI의 행동을 정의합니다:

messages = [
    {
        "role": "system",
        "content": "당신은 Python 프로그래밍 전문가입니다. "
                  "항상 코드 예제와 함께 설명하세요."
    },
    {
        "role": "user",
        "content": "리스트 컴프리헨션을 설명해주세요."
    }
]

효과적인 시스템 프롬프트 작성법:

명확한 역할 정의
구체적인 행동 지침
응답 형식 지정
제약 사항 명시

인증 및 API 키

API 키는 어떻게 발급받나요?

API 키는 개발자 또는 관리자 권한이 있는 사용자만 발급받을 수 있습니다.발급 절차:

정보시스템 관리자 메뉴 접속
“API 키 관리” 메뉴 클릭
”+ 새 API 키 생성” 버튼 클릭
표시된 API 키를 복사하여 안전한 곳에 저장

API 키는 생성 시 한 번만 표시됩니다. 반드시 즉시 복사하여 안전하게 보관하세요.

자세한 내용은 API 인증 문서를 참고하세요.

API 키를 분실했어요. 어떻게 하나요?

API 키는 보안상 재확인이 불가능합니다.해결 방법:

정보시스템 관리자 메뉴 > API 키 관리로 이동
분실한 API 키를 삭제
새로운 API 키를 발급받아 안전하게 저장
애플리케이션에서 새 API 키로 업데이트

보안 권장사항:

환경 변수로 API 키 관리
공개 저장소에 절대 커밋하지 않기
주기적으로 API 키 재발급

일반 사용자도 API를 사용할 수 있나요?

아니요, 일반 사용자는 API 키를 발급받을 수 없으며 API를 사용할 수 없습니다.역할별 API 접근 권한:

일반 사용자: ❌ API 사용 불가 (웹 인터페이스만 사용 가능)
개발자: ✅ API 키 발급 및 사용 가능
관리자: ✅ API 키 발급 및 사용 가능

API 사용이 필요한 경우 관리자에게 개발자 권한을 요청하세요. 자세한 내용은 권한 관리를 참고하세요.

API 키는 몇 개까지 만들 수 있나요?

시범 서비스 기간 동안 기본 제한이 적용됩니다.권장사항:

용도별로 API 키를 분리하여 관리 (개발, 스테이징, 프로덕션)
불필요한 API 키는 즉시 삭제
정기적으로 API 키 교체

더 많은 API 키가 필요한 경우 문의해주세요.

에이전트 API

에이전트 API는 어떻게 사용하나요?

에이전트는 웹에서 생성하고 API로 실행합니다.에이전트 사용 워크플로우:

생성 (웹): 정보시스템 관리자 메뉴에서 에이전트 생성 및 구성
배포 (웹): 관리자 승인을 통해 에이전트 배포
실행 (API): A2A 프로토콜을 통해 에이전트 호출

중요: 에이전트 생성 및 설정은 웹에서만 가능하며, API는 이미 생성된 에이전트를 실행하는 용도입니다.자세한 내용은 Agents API 문서를 참고하세요.

Agent ID는 어디서 확인하나요?

Agent ID는 API 호출 시 필수로 필요한 고유 식별자입니다.확인 방법:

정보시스템 관리자 메뉴 > 에이전트 관리 클릭
에이전트 목록에서 에이전트 ID 열 확인
ID 우측의 복사 아이콘을 클릭하여 복사

API 엔드포인트 예시:

POST /api/v1/teams/{team_id}/agent/{agent_workflow_id}/a2a

자세한 내용은 Agent ID 이해하기를 참고하세요.

A2A 프로토콜이 무엇인가요?

A2A (Agent-to-Agent) 프로토콜은 에이전트를 실행하기 위한 JSON-RPC 2.0 기반 통신 규격입니다.주요 특징:

JSON-RPC 2.0 형식 사용
message/send (일반) 또는 message/stream (스트리밍) 메서드 지원
messageId 필수 필드로 메시지 고유 식별

기본 요청 형식:

{
  "jsonrpc": "2.0",
  "method": "message/send",
  "params": {
    "message": {
      "role": "user",
      "messageId": "msg-123456",
      "parts": [{"text": "사용자 질문"}]
    },
    "metadata": {
      "chat_session_id": 123
    }
  },
  "id": "req-12345"
}

자세한 예제는 Agents API 문서를 참고하세요.

messageId는 왜 필요한가요?

messageId는 A2A 프로토콜에서 각 메시지를 고유하게 식별하기 위한 필수 필드입니다.용도:

메시지 추적 및 로깅
중복 메시지 방지
대화 흐름 관리

생성 방법:

# 타임스탬프 사용
message_id = f"msg-{int(time.time())}"

# UUID 사용
import uuid
message_id = f"msg-{uuid.uuid4()}"

각 메시지마다 고유한 ID를 생성하는 것을 권장합니다.

개발 중인 에이전트도 API로 테스트할 수 있나요?

네, 개발자와 관리자는 배포되지 않은 에이전트도 API로 테스트할 수 있습니다.역할별 접근 권한:

일반 사용자: 배포된 에이전트만 사용 가능
개발자: 모든 상태의 에이전트 테스트 가능 (개발 중, 배포 검토 요청, 배포됨)
관리자: 모든 상태의 에이전트 테스트 가능

이를 통해 배포 전에 충분히 테스트하고 검증할 수 있습니다. 자세한 내용은 권한 관리를 참고하세요.

RAG42

RAG42는 무엇인가요?

RAG42는 Retrieval-Augmented Generation을 위한 완전한 문서 관리 및 검색 시스템입니다.주요 기능:

컬렉션 관리
문서 업로드 및 자동 청킹
벡터 검색
하이브리드 검색 (키워드 + 의미)

자세한 내용은 RAG 시스템 구축 Cookbook을 참고하세요.

어떤 파일 형식을 지원하나요?

RAG42가 지원하는 파일 형식:

문서: PDF, DOCX, HWP, HWPX, TXT, MD
스프레드시트: XLSX, CSV
프레젠테이션: PPTX
기타: HTML

파일은 자동으로 텍스트로 변환되고 청크로 분할됩니다.

문서는 자동으로 청킹되나요?

네, 문서를 업로드하면 자동으로 처리됩니다:

파싱: 텍스트 추출
청킹: 의미 단위로 분할
임베딩: 벡터 생성
인덱싱: 검색 가능하게 저장

청킹 전략을 커스터마이즈하려면 문서 처리 파이프라인 Cookbook을 참고하세요.

검색 정확도를 높이려면?

다음 방법들을 시도해보세요:

하이브리드 검색 사용
- 키워드 + 의미 검색 결합
- search_type: "hybrid" 옵션
재순위(Rerank) 적용
- 검색 결과를 재정렬
- 더 관련성 높은 문서 우선
적절한 청크 크기
- 너무 크면: 관련 없는 정보 포함
- 너무 작으면: 컨텍스트 부족
- 권장: 512~1024 토큰
메타데이터 활용
- 문서에 태그, 카테고리 추가
- 필터링으로 검색 범위 좁히기

컬렉션은 몇 개까지 만들 수 있나요?

시범 서비스 기간 동안 기본 제한이 적용됩니다.더 많은 컬렉션이 필요한 경우 문의해주세요.컬렉션 구성 권장사항:

주제별로 분리
문서 타입별로 분리
권한 관리를 위해 분리

문서를 수정하거나 삭제할 수 있나요?

네, RAG42 API를 통해 가능합니다:

문서 수정: PATCH /rag42/documents/
문서 삭제: DELETE /rag42/documents/
청크 수정: PATCH /rag42/chunks/
청크 삭제: DELETE /rag42/chunks/

자세한 API 명세는 RAG42 API 문서를 참고하세요.

Tools

PII 마스킹은 어떻게 작동하나요?

개인정보를 자동으로 감지하고 마스킹합니다:감지 가능한 정보:

이메일 주소
전화번호
주민등록번호
신용카드 번호
주소
이름

response = requests.post(
    f"{base_url}/tools/pii-mask",
    headers=headers,
    json={
        "text": "제 이메일은 user@example.com입니다.",
        "mask_types": ["email"]
    }
)
# 결과: "제 이메일은 [EMAIL]입니다."

자세한 내용은 PII 마스킹 문서를 참고하세요.

텍스트 임베딩은 무엇인가요?

텍스트를 숫자 벡터로 변환하는 기술입니다.용도:

의미 기반 검색
텍스트 유사도 계산
문서 클러스터링
추천 시스템

response = requests.post(
    f"{base_url}/tools/embeddings",
    headers=headers,
    json={
        "texts": ["안녕하세요", "Hello"],
        "model": "clova-embedding"
    }
)
# 각 텍스트가 벡터로 변환됨

문서 파서는 어떤 경우에 사용하나요?

다양한 형식의 문서에서 텍스트를 추출할 때 사용합니다:사용 사례:

PDF 보고서에서 텍스트 추출
Word 문서 내용 파싱
스캔된 이미지에서 OCR
구조화된 데이터 추출

두 가지 파서 제공:

RAG42 파서: RAG 시스템용 최적화
Lomin 파서: 고급 레이아웃 분석

자세한 내용은 문서 파서 문서를 참고하세요.

STT/TTS 음질은 어떤가요?

고품질 음성 처리를 제공합니다:STT (Speech-to-Text):

다양한 음성 환경 지원
한국어/영어 지원
타임스탬프 제공

TTS (Text-to-Speech):

자연스러운 음성 합성
다양한 보이스 옵션
속도/음높이 조절 가능

예제는 음성 처리 Cookbook을 참고하세요.

성능 및 최적화

응답 속도를 개선하려면?

다음 방법들을 시도해보세요:

스트리밍 사용
- 첫 토큰을 빠르게 받음
- 사용자 체감 속도 향상
적절한 max_tokens 설정
- 필요 이상으로 크게 설정하지 않기
병렬 처리
- 독립적인 요청은 동시 실행
캐싱
- 자주 사용되는 응답 캐싱
- 임베딩 결과 캐싱
배치 처리
- 여러 요청을 묶어서 처리

비용을 절감하려면?

효율적인 API 사용 방법:

적절한 모델 선택
- 작업에 맞는 최소 모델 사용
토큰 사용 최적화
- 불필요한 컨텍스트 제거
- 간결한 프롬프트 작성
캐싱 활용
- 반복 요청 줄이기
에러 처리
- 재시도 전에 원인 파악
- 무한 재시도 방지

Rate Limit에 걸렸어요

Rate Limit 대응 방법:

지수 백오프 구현

import time

for attempt in range(max_retries):
    try:
        response = make_request()
        break
    except RateLimitError:
        wait_time = 2 ** attempt
        time.sleep(wait_time)

요청 속도 조절
- 큐 시스템 사용
- 배치 크기 조정
제한 확인
- 응답 헤더에서 제한 정보 확인
- X-RateLimit-Remaining 헤더

자세한 내용은 에러 처리 문서를 참고하세요.

Cookbook

실전 예제 코드

API Reference

API 상세 문서

문제 해결

트러블슈팅

FAQ

​Chat Completions

​인증 및 API 키

​에이전트 API

​RAG42

​Tools

​성능 및 최적화

​관련 문서

Cookbook

API Reference

문제 해결

Chat Completions

인증 및 API 키

에이전트 API

RAG42

Tools

성능 및 최적화

관련 문서