29가지 평가지표와 약 1천200개의 데이터셋으로 금융 지식 추론 능력, 이해력 등 검증
검증 결과를 바탕으로 기업에 맞는 최적의 LLM 선정할 수 있어

AX전문기업 LG CNS가 생성형 AI를 도입하고자 하는 금융 기업을 위해 금융 맞춤형 AI 평가 도구를 개발했다고 24일 밝혔다.
LG CNS에 따르면, 이 평가 도구는 미리 구축한 데이터셋으로 시중에 공개된 수십개의 개방형 LLM을 평가해 뱅킹, 보험, 증권 등 각 금융 서비스에 가장 적합한 AI 모델을 찾아준다.
개방형 LLM은 공개된 소스코드나 알고리즘으로 누구나 자유롭게 수정하고 활용할 수 있는 거대언어모델(LLM)이다. 대표적으로 LG AI연구원의 엑사원(EXAONE) 3.5, 메타(Meta)의 라마(Llama), 알리바바(Alibaba)의 큐원(Qwen) 2.5 등이 있다.
LG CNS의 금융 특화 평가 도구는 29가지 평가지표와 약 1천200개의 데이터셋으로 구성되어 있다. 주요 평가 항목은 금융 지식을 기반으로 추론하는 능력, 수학적 추론 능력, 복잡한 질문 이해력, 문서요약 능력, 금융 용어 이해도, AI 에이전트(Agentic Tool) 사용 능력 등을 종합적으로 테스트한다.
LG CNS는 특히 AI가 답변하기 어려워하는 금융 관련 추론 문제들을 29개 평가지표에 적용해 더 정확한 성능 검증이 가능하도록 했다. 더불어 LG CNS는 금융 전문가들과의 협업을 통해 데이터셋의 평가 데이터에 실제 금융 현장에서 사용하는 서비스 정보나 전문 지식 등이 정확히 반영됐는지 점검하며 완성도를 높였다.
LG CNS는 이 평가 도구를 통해 금융기업들이 AI를 도입할 때 최적의 LLM 선정부터 커스터마이징, 안정적인 운영까지 금융권에 특화된 생성형 AI 도입 전 단계에서 차별화된 고객가치를 제공해 나갈 계획이다.
LG CNS는 다수의 금융 기업을 대상으로 생성형 AI를 활용한 비즈니스 혁신을 지속하며 금융 AX를 선도하고 있다. 최근 NH농협은행과 생성형 AI 플랫폼 구축 프로젝트에 착수했고, 신한카드와 생성형 AI 기반의 상담사 응대 시스템을 구축 중이다.
LG CNS CEO 현신균 사장은 "금융 서비스에 생성형 AI를 도입하고자 하는 기업의 가장 큰 고민은 어떤 AI 모델이 서비스에 가장 적합할 지 파악하는 것"이라며 "LG CNS의 금융 특화 AI 평가 도구는 금융 기업들의 고민을 빠르게 해결할 수 있는 최적의 솔루션이 될 것"이라고 말했다. [파이낸셜신문=황병우 기자]