[자료] 금융위, AI 기반 신용평가모형 검증체계 마련

2023-04-17 13:13:50

[장태민닷컴 장태민 기자]
AI 신용평가모형 검증체계AI 보안 가이드라인주요내용


1

추진배경


□ 초지능·초연결·초융합 시대에 인공지능(Artificial Intelligence; AI)은 빅데이터 처리와 혁신적 서비스 개발의 필수·핵심 기술입니다.

ㅇ 특히, 고품질 데이터가 풍부한 금융분야는 빅데이터·인공지능 활용의 잠재력이 매우 큰 분야입니다.

□ 이에 금융위원회는 지난 ‘22.8월 금융권의 AI 활용을 지원하기 위하여 「금융분야 인공지능 활용 활성화 및 신뢰 확보 방안」을 발표하고, 세부과제를 착실히 추진하고 있습니다.

※ 「금융분야 인공지능 활용 활성화 및 신뢰 확보 방안(‘22.8)주요 내용

양질의 빅데이터 확보 지원

금융 AI 데이터 라이브러리 구축, 금융권 협업을 통한 데이터 공동 확보,
데이터전문기관 추가 지정

AI 활성화를 위한 제도 정립

금융 AI 개발·활용 안내서 발간, 설명가능한 AI 요건 마련,
망분리 및 클라우드 규제 개선

신뢰받는 AI 활용 환경 구축

금융 AI 테스트베드 구축, AI 기반 신용평가모형 검증체계 마련,
AI 보안성 검증체계 구축, AI를 활용한 효율적 감독체계 구축


□ 동 방안에 따라 신뢰받는 AI 활용 환경을 구축하기 위해 관계기관과의 지속적인 협의 등을 통해 「AI 기반 신용평가모형 검증체계」와 「금융분야 AI 보안 가이드라인」을 마련하였습니다.

2

AI 기반 신용평가모형 검증체계 및 AI 보안 가이드라인 주요내용


AI 기반 신용평가모형 검증체계 마련


□ 신용평가는 금융소비자의 금융거래 조건 등에 영향을 미치며 금융회사의 리스크 관리에도 밀접한 관련이 있어 신용평가의 투명성과 공정성을 확보할 필요가 있습니다.

ㅇ 이에 CB사의 기존 전통적 신용평가모형에 대해서는 신용정보법에 따라 ’20년부터 「개인신용평가체계 검증위원회*(신정원)」에서 검증하고 있습니다.

* (구성) 위원장(신용정보원장), 학계·연구계, 금융계, 법조계, 소비자보호 전문가 6인

□ 최근 신용정보회사(Credit Bureau; CB) 등은 AI 방법론을 이용한 신용평가모형을 개발·활용하고 있습니다.

ㅇ AI 신용평가모형은 전통적인 신용평가모형에 비하여 더 다양하고 많은 데이터*를 평가항목으로 반영할 수 있어 비금융·비정형 데이터** 활용이 용이하며, 예측력·변별력이 우수하다는 장점이 있으나,

* 전통적인 신용평가모형은 연체이력, 금융거래실적, 금융부채규모 등 금융정보 위주의 제한된 데이터만을 평가에 반영

** (예시) 통신료, 건강보험·국민연금 보험료 납부이력, 온라인 쇼핑 구매 패턴, 모바일 앱 활용 패턴, 개인사업자의 점포가 속한 상권정보 등

ㅇ 복잡한 알고리즘을 사용하기 때문에 평가결과에 대한 직관적인 해석과 설명이 다소 어렵다는 한계 등이 있으므로

ㅇ AI 신용평가모형의 경우 신뢰성 확보와 소비자 보호를 위해 전통적인 신용평가와 같이 객관적인 검증체계를 마련할 필요성이 제기되었습니다.

□ 이러한 측면에서 연구용역, 전문가 TF, 「개인신용평가체계 검증위원회」의 심도있는 논의를 거쳐 CB사에 대한 「AI 기반 신용평가모형 검증체계」를 마련하였습니다.

□ 「AI 기반 신용평가모형 검증체계」가 기존 전통적인 개인신용평가모형에 대한 검증체계와 차별화되는 주요내용은 다음과 같습니다.

① (데이터 관리) 신용평가에 활용하는 비금융·비정형 데이터에 대한 적절한 관리체계를 구축하였는지 점검합니다.

- 비금융·비정형 데이터를 신뢰성 높은 출처로부터 수집하고 데이터의 일관성·정확성* 등을 주기적으로 확인합니다.

* (예시) 개인사업자 매출 데이터가 전월 대비 10% 이상 변동시 동 매출 데이터 오류가능성 재점검

② (모형 선택) 다양한 AI 알고리즘의 특징과 장단점을 고려하여 신용평가에 최적화된 모형을 선택했는지 모형 선정 과정을 점검합니다.

- CB사는 다양한 알고리즘* 중에서 하나를 선택하거나 다양한 알고리즘 결과를 조합하여 모형을 개발하는 만큼, 알고리즘 선정 목적, 변수 선정 과정 등 모형 개발의 상세 과정을 확인합니다.

* AI 신용평가모형의 알고리즘은 크게 ‘신경망’, ‘의사결정나무’ 계열 등으로 구분되며, 다양한 세부 알고리즘이 존재

③ (설명 가능성) 금융소비자에게 신용평가모형 및 신용평가 결과 등을 충분히 설명할 수 있는지 확인합니다.

- CB사는 평가결과에 대한 설명의무*가 있는 만큼, 설명가능한 AI 기법의 적용 여부, 해당 기법을 통한 모형의 해석 가능성 등을 점검합니다.

* 개인은 신용평가 결과, 평가 기준, 평가에 이용되는 정보의 내용 등에 대하여 설명을 요구 가능(신용정보법 제36조의2)

④ (모형 성능) AI 방법론의 특성을 반영하여 모형의 변별력·안정성 등통계적 유의성을 점검합니다.

- 과적합(overfitting*) 가능성 점검, 학습·검증·테스트 데이터의 유사성** 확인 등 AI 모형에 특화된 성능 확인 방법을 마련했습니다.

* 모형이 학습 데이터에 과도하게 의존하는 것을 의미 → 학습 데이터에 대해서는 정확한 예측을 제시하지만 미학습 데이터에 대해서는 부정확하게 예측할 우려

** 학습 데이터와 검증·테스트 데이터의 특성이 지나치게 다른 경우, AI 모형의 성능이 낮은 원인이 AI 모형의 문제인지 데이터 특성이 달라서인지 파악하기 곤란하여 모형 검증의 신뢰성이 낮아짐

금융분야 AI 보안 가이드라인 마련 [별첨]


□ AI 서비스 활용 확대와 더불어 개인정보 유출, 학습 데이터 조작 등 다양한 보안위협이 발생할 우려가 증가하고 있습니다.

ㅇ 보안성을 충분히 확보하지 못하는 경우, AI서비스가 오작동*하거나 악의적인 공격에 노출될 가능성이 있습니다.

* (예시) 정신의학과 챗봇이 정식 출시 전 모의 환자에게 자살을 권유한 사례

□ 특히, AI 개발과정에서 현장 실무자가 유의해야 할 구체적인 보안위협과 대응방안을 다루는 세부적인 안내서가 필요하다는 지적이 제기되었습니다.

□ 이에 금융 AI 서비스 개발 실무자가 활용할 수 있는 개발단계별 세부 보안 안내서인 「금융분야 AI 보안 가이드라인」을 마련하였습니다.

ㅇ 동 가이드라인은 ➊AI 모델 개발단계별 보안 고려사항과 ➋AI 챗봇 서비스에 대한 보안성 체크리스트를 제시하고 있습니다.

□ AI 모델 개발단계별 주요 보안 고려사항은 다음과 같습니다.

① (학습 데이터 수집) 오염된 데이터*를 학습하여 발생할 수 있는 보안 문제와 성능 저하 등을 방지하고, 데이터 관련 공격·장애 발생시 그 원인을 파악할 필요가 있습니다.

* 악의적 목적으로 변조한 데이터 등

→ 신뢰성 높은 출처로부터 학습 데이터를 수집하고, 데이터 출처 및 수집 시점 등을 파악할 수 있는 데이터 관리체계를 구축해야 합니다.

② (학습 데이터 前처리) 수집한 데이터를 학습에 적합한 형태로 가공하여 AI 모델의 품질과 보안성을 높일 필요가 있습니다.

→ 이상치(outlier)를 확인·처리하고, 적대적 예제* 생성·학습 등을 통하여 AI 모델에 대한 적대적 공격**을 예방하여야 합니다.

* AI 모형이 잘못된 예측을 하도록 의도적으로 변조한 데이터

** 적대적 예제를 활용하여 AI 모형이 잘못 판단하도록 조작하는 공격

③ (AI 모델 설계·학습) 잠재적 공격자가 AI 모델에 대한 적대적 공격 등을 쉽게 수행할 수 없도록 AI 모델을 구성할 필요가 있습니다.

→ 잠재적 공격자가 AI 모델에 대한 정보를 쉽게 유추할 수 없도록 지나치게 단순한 설계를 지양하고, AI 모델을 세부 변형하는 보안기법* 등을 적용하여야 합니다.

* (예시) AI 모형의 성능은 유지하면서 AI 모형의 구조를 변경

④ (AI 모델 검증·평가) 학습을 완료한 AI 모델이 잠재적 공격 또는 개인정보 유출 등으로부터 안전한지 보안성을 검증할 필요가 있습니다.

→ AI 모델을 대상으로 선제적인 적대적 공격을 수행하여 AI 모델이 공격을 탐지·방어할 수 있는지 확인하여야 합니다.

→ AI 모델의 입·출력* 횟수를 제한하여 잠재적 공격자가 AI 모델에 대한 정보를 수집하기 어렵게** 하여야 합니다.

* 입력 : 소비자가 AI 모델에 제공하는 문자나 숫자 등(예: 챗봇에 입력하는 질문)
출력 : AI 모델이 산출하는 값(예: 챗봇의 대답)

** 공격자는 AI 모델의 입·출력값을 바탕으로 모델의 정보를 유추하고 공격을 시도 → 공격자가 수집할 수 있는 값 제한 필요(예: 챗봇 대답을 1분에 10회 미만으로 제한)

→ AI 모델을 통하여 개인정보가 출력되는 경우, 개인정보가 타인에게 노출되지 않도록 하여야 합니다.

□ 금융분야에서 AI가 가장 활발히 사용되는 분야 중 하나인 챗봇서비스에 대해서는 「AI 챗봇서비스 보안성 체크리스트」를 별도로 마련하였습니다.

ㅇ AI 챗봇서비스의 보안성 확보에 필요한 사항들을 체크리스트 형태로 구체화해 실무자가 챗봇서비스 개발시 쉽게 활용할 수 있을 것으로 기대됩니다.

(참고) 체크리스트 문항 예시

분류
소분류
연번
보안성 체크리스트
공통
입력제한
6
개인정보를 처리하지 않는 챗봇의 경우 입력창에 개인정보를
입력하지 않도록 이용자에게 사전에 안내하는가?
3

향후계획


□ 금번 발표내용를 통해 「금융분야 인공지능 활용 활성화 및 신뢰 확보 방안」 중 「AI 기반 신용평가모형 검증체계 마련」과 「AI 보안성 검증체계 구축」의 세부과제 이행을 완료하였습니다.

ㅇ 개인신용평가체계 검증위원회는 「AI 기반 신용평가모형 검증체계」를 활용해 ‘23년 중 AI 신용평가모형을 개발·활용 중인 개인사업자CB를 검증하고, 향후 개인CB 등의 AI 신용평가모형에 대해서도 검증을 실시할 계획입니다.

ㅇ 「금융분야 AI 보안 가이드라인」을 「금융보안 레그테크 포털*」에 게시하고, 새로운 보안위협·대응기법 등을 고려하여 지속 개선·보완할 계획입니다.

* 자율보안 평가, 침해사고 대응훈련, 보안 정보 제공 등을 위한 홈페이지(금보원 운영)
https://regtech.fsec.or.kr

□ 「금융분야 인공지능 활용 활성화 및 신뢰 확보 방안(‘22.8월)」의 다른 세부 추진과제에 대해서도 차질없이 추진해나가고 있습니다.

ㅇ (금융 AI 데이터 라이브러리 구축) 신용정보원을 중심으로 금융회사· 핀테크 기업·CB사·데이터 전문기업 등으로 구성된 컨소시엄을 통해 ‘23.2Q 중 금융 AI 데이터 라이브러리를 구축할 예정입니다.

ㅇ (협업을 통한 빅데이터 공동 확보) 금융보안원을 중심으로 은행·카드업권이 이상금융거래정보 공유 TF를 구성하였으며, ‘23.2Q 중 AI 학습 데이터셋을 구축·공유 예정입니다.

ㅇ (데이터전문기관 추가지정) 금융위는 8개 기관*에 대해 데이터전문기관 예비지정을 의결(‘22.12월)했으며, 본지정 심사를 진행할 예정입니다.

* BC카드, LG CNS, 삼성SDS, 삼성카드, 신한은행, 신한카드, 쿠콘, 통계청

ㅇ (설명가능한 AI 요건 마련) 설명가능한 AI(XAI : eXplainable AI) 관련 연구용역을 진행중이며, 연구용역 결과를 반영하여 설명가능한 AI 정의·요건, 모범사례 등을 포함한 안내서를 ‘23.2Q 중 발간할 예정입니다.

ㅇ (망분리 및 클라우드 규제 개선) 망분리 규제 완화 및 클라우드 이용절차 합리화를 위한 「전자금융감독규정」 개정안이 ‘23.1.1일 시행*되었습니다.

* (참고) [보도자료(‘22.11.23.)] 클라우드 이용절차 합리화 및 망분리 규제 완화를 위한 「전자금융감독규정」 개정안 금융위 의결

ㅇ (금융 AI 테스트베드 구축) 신용정보원·금융결제원·금융보안원이 테스트베드 세부 구축방안을 마련*하였으며, 데이터셋·컴퓨팅 자원 확보 등을 거쳐 ‘23.4Q 중 테스트베드를 구축·운영할 예정입니다.

* (신정원) 신용평가 AI, (금결원) 금융사기방지 AI, (금보원) 금융보안 AI

장태민 기자 chang@changtaemin.com

<저작권자 © 장태민닷컴, 무단 전재 및 재배포 금지>

이 기사를 공유하세요.

많이 본 뉴스

Memory

1/5