Secure AI Implementation: ThanoSQL’s Solutions for Protecting Sensitive Business Data

기업 AI 도입의 걸림돌은 무엇일까?

“우리 회사에 AI를 도입하기가 너무 어렵다” 진짜 이유는 무엇일까?

본 게시글 에서는 아래 기사의 내용을 바탕으로 기업들이 AI 도입을 어려워하는 원인은 무엇이고 어떻게 하면 해결할 수 있을지 방안을 제시하려고 합니다.
ZDNET 기사

응답자 10명 중 7명 “보안 위험 장벽 높아…제대로 된 데이터 인프라·역량·인재도 부족”

“중소기업은 AI를 어떻게 도입해야 할 지 막막합니다. 무엇부터 해야 할까요?”

최근 국내외 기업들이 업무 효율성을 높이고자 AI를 도입하기 위해 앞다퉈 나서고 있지만 상당한 어려움을 겪고 있는 것으로 나타났습니다. AI를 제대로 이용하기 위해 필요한 데이터 인프라와 직원 역량이 뒷받침되지 않고 있기 때문입니다.

지난 8월 10일 클라우데라(Cloudera)가 미국, 유럽, 중동, 아프리카, 아시아-태평양 지역 600명의 IT 리더를 대상으로 ‘기업용 AI 및 최신 데이터 아키텍처 현황’을 조사한 결과, 10명 중 8명이 업무 처리를 위해 AI를 도입했지만 시스템을 유지하기 힘겨워하는 것으로 조사됐습니다.

또 응답 기업의 74%는 AI로 인한 보안과 규정 준수 위험에 대한 우려가 상당히 높다고 밝혔습니다. AI 도구를 관리할 적절한 교육이나 인재 부족(38%), AI 도구의 높은 가격(26%) 등의 문제로 AI 도입을 어렵게 느끼는 기업들도 있었습니다.

AI 도입을 어렵게 하는 요인들 (이미지=클라우데라)

조사를 진행한 관계자는 “AI는 지난 몇 년간 비즈니스 운영을 강화하고 정보에 기반한 의사결정을 내리는 등 혁신을 가속하고 직원과 고객 모두의 경험을 향상시킨다는 이점으로 전 세계적으로 주목받고 있다”면서도 “하지만 모든 기업이 이러한 이점을 경험하진 않는다”고 지적했습니다. 그러면서 “AI가 빠르게 도입되고 있음에도 불구하고 탄력적인 AI 전략의 많은 요소가 무시되거나 고려되지 않고 있다”고 덧붙였습니다.

특히 국내 중소기업들이 AI 도입 시 느끼는 어려움은 더 한 것으로 나타났습니다. 통계청이 올 초 발간한 ‘KOSTAT 통계플러스’ 보고서에 따르면 국내 대기업과 중소기업의 AI, 블록체인 등 신기술 도입 비율은 상당한 격차를 보였습니다. 빅데이터 도입율에선 2021년 기준 대기업이 12.7%, 중소기업이 3.7%로 나타났고, AI는 9.2% 대 2.9%로 조사됐습니다. 클라우드는 12.1%대 3.7%, 사물인터넷(IoT)는 6.9%대 3.1%였습니다.

하지만 많은 기업들이 AI 도입은 거스를 수 없는 흐름이라고 보고 있습니다. AI 기술의 잠재적 이점이 위험보다 많다고 인식하는 이들이 점차 많아지고 있는데다 활용하는 곳도 많아지고 있기 때문입니다. 마이크로소프트가 지난 5월 발표한 ‘업무동향 지표 2024’에선 글로벌 고객사 리더들의 79%가 AI 도입은 필수라고 응답한 바 있습니다.

그렇다면 AI 도입의 가장 큰 걸림돌인 보안 문제를 해결하기 위해 ThanoSQL은 어떻게 하고 있는지 살펴보겠습니다.

ThanoSQL은 ChatGPT 같은 퍼블릭 LLM과 데이터를 주고받을 때 마스킹(데이터를 * 또는 O 로 표시하는 방법)과 Faker(가짜 데이터 생성), 재변환(원래 데이터로 복구) 등의 과정을 통해 개인 식별 정보(PII: Personally Identifiable Information) 또는 기업의 민감한 내부 정보의 유출을 최소화합니다.

그리고 이미지나 동영상 같은 비정형 데이터는 파일이 위치한 경로와 임베딩(실제 객체를 수학적으로 표현한 벡터 뭉치) 값 만을 주고받아 데이터 유출을 원천적으로 차단합니다. 또한 데이터베이스의 스키마(Schema)만을 주고받기 때문에 DB의 내용 자체가 외부로 나가지 않으며, 데이터베이스의 컬럼명이나 테이블명도 Fake Entity를 사용하고 LLM 답변으로부터 재변환 시켜서 보안을 강화합니다.

기업의 보안과 관련하여 이상을 감지하고 리스크를 관리하는 조금 더 구체적인 유스케이스를 살펴보면 다음과 같습니다.

1) 이메일/채팅 등에서 위험도 자동 분석

  • ThanoSQL: 데이터베이스에서 이메일 및 채팅 데이터를 추출하여 분석합니다. 특정 키워드나 패턴을 포함하는 메시지를 필터링하여 위험 요소를 식별합니다.
  • 자연어 분석: LLM을 활용하여 메시지의 전체 문맥을 이해하고, 위험도를 평가합니다. 메시지의 톤이나 내용의 심각성을 분석하여 위험도를 자동으로 분류합니다.

2) 주요 정보 마스킹 기능

  • ThanoSQL: 데이터베이스에서 민감한 정보를 포함하는 데이터를 추출하고, 마스킹 처리를 합니다. 이메일 주소나 전화번호와 같은 민감한 정보를 보호합니다.
  • 자연어 분석: LLM을 활용하여 문맥을 이해하고, 정규식에 어긋나는 경우에도 주요 정보를 식별합니다. 문맥을 기반으로 이름, 주소 등의 엔티티를 자동으로 인식하고 마스킹합니다.

3) 이미지나 첨부 파일 등 비정형 데이터 보안 관리

  • ThanoSQL: 메타데이터를 활용하여 비정형 데이터를 관리합니다. 첨부 파일의 경로와 임베딩 벡터만을 추출하여 데이터베이스에 저장하고 관리합니다.
  • 자연어 분석: LLM을 활용하여 이미지나 첨부 파일의 내용을 분석하고, 중요한 정보를 추출합니다. 이미지나 문서 내의 텍스트와 표를 인식하고 분석하여 리스크를 평가합니다.

4) 송수신 패턴 비교를 통한 이상 신호 모니터링

  • ThanoSQL: 과거 데이터를 기반으로 패턴을 분석하고, 이상 신호를 감지합니다. 특정 시간대에 반복적으로 발생하거나 기존 패턴을 벗어나는 메시지를 필터링하여 이상 신호를 식별합니다.
  • 자연어 분석: LLM을 활용하여 메시지의 내용과 수신인을 분석하고, 이상 신호를 감지합니다. 평소와 다른 톤이나 내용의 메시지를 자동으로 식별하고 경고를 생성합니다.

스마트마인드의 ThanoSQL은 기업내의 모든 정형/비정형 데이터를 데이터베이스의 테이블에 저장하고 최신의 AI 모델을 불러와서 대화형 인터페이스로 분석할 수 있는 올인원 플랫폼입니다. 위에서 살펴본 것처럼 ThanoSQL을 도입하면 데이터 보안 관점에서도 기업 내부의 민감한 데이터 유출을 원천적으로 차단할 수 있습니다.

ThanoSQL 도입 문의

ko_KRKR
위로 스크롤