이 기사는 2024년 2월 29일 THE AI 유료구독자를 대상으로 먼저 공개된 기사입니다.
[편집자 주] AI TOP는 한국 AI 산업 발전을 이끄는 리더들의 진실한 이야기를 전하는 기획입니다. AI TOP에는 국내 공신력 있는 AI 협회인 지능정보산업협회(AIIA)가 선정한 ‘2024 Emerging AI+X Top 100’ 기업 중 AI 전문매체 THE AI가 선별한 기업이 등장합니다. 여러 선별과정을 거친 진정한 AI TOP 리더라고 볼 수 있습니다. 이들의 진실한 이야기를 통해 한국 AI의 현재와 미래를 조명하고자 합니다. 독자 여러분의 많은 관심 부탁드립니다.
“내 아이가 먹는 음식은 좋은 재료로 만들 것일까? 타고 있는 차량은 안전할까? 스마트폰이나 TV에서 나오는 전자파는 어느 수치일까? 회사가 쓰라고 한 프로그램은 보안 위협이 없을까?”
일상에서 종종 부딪히는 질문이다. 일부 제품과 기술에서 부작용이 알려지면 유사 제품에 불신이 생기면서 이러한 질문은 꼬리에 꼬리를 물며 발생한다. 그런데 이 불신을 신뢰로 바꿔주는 마법 같은 존재가 있다. ‘검증’이다. 국산 유기농 식재료를 사용했다는 검증, 검사 결과 이상이 없다는 검증, 이 글자가 들어가게 되면 사용자는 제품을 신뢰한다. 공급자와 소비자의 강력한 연결고리를 만들어주는 요소가 바로 검증이다.
이 검증은 인공지능(AI)과 소프트웨어에도 해당한다. 자동차, 로봇 등에 사용되는 소프트웨어는 안전한지, 또 자율주행 등에 사용되는 AI 기술은 안전한지 검증이 필요하다. 이 검증의 역할은 최근 더 중요해졌다. AI나 자율주행과 같은 새로운 기술이 빠르게 등장하고, 하나의 제품에 탑재되는 소프트웨어가 기하급수적으로 높아져서다.
그만큼 검증 수행 기업은 바빠졌다. 새로운 기술이 등장함에 따라 검증 기술 역시 고도화해야 하고 검증해야 하는 소프트웨어 역시 크게 늘었다. 검증은 제품 상용화에 앞서 가장 깐깐해야 하는 분야이므로 기술 개발과 작업도 허투루 할 수 없다. 백신과 바이러스 관계로 유사하다. 바이러스가 발생하면 이를 탐지하는 백신을 만들어야 하는데, 바이러스가 급증하게 되면 보안 회사는 그만큼 빠르게 백신을 만들어야 한다. 현재 소프트웨어 검증 시장은 수많은 바이러스가 하루가 다르게 등장하고 있다고 볼 수 있다.
국내에서 소프트웨어 검증 시장을 처음 연 ‘슈어소프트테크’ 역시 커진 시장에 행복한 비명을 지르고 있다. 회사에서 추구하는 미션 크리티컬 소프트웨어(고신뢰·고위험 분야 소프트웨어) 검증의 수요가 크게 늘어서다. 물론 대비책도 세웠다. AI를 검증 도구로 활용하는 방법이다. 검증, 즉 테스트에 특화한 AI 모델을 만들어 이를 업무에 적용하는 시도를 하고 있다. 테스트 특화 sLLM(소형화한 대형언어모델)도 올해 하반기 출시를 목표로 개발 중이다.
경기도 성남시에 소재한 사옥에서 만난 배현섭 슈어소프트테크 대표는 현재 Test by AI(AI를 활용한 테스트)와 Test of AI(AI 테스트) 전략으로 사업을 추진하고 있다고 밝혔다. 기존에 하던 소프트웨어 검증에 AI를 도입하는 사업과 AI를 검증하는 사업을 병행하고 있다고 했다.
실제로 슈어소프트테크는 AI 기술 경쟁력 강화를 위해 지난해 8월 빅데이터·AI 기업인 ‘모비젠’을 인수하고, 일부 개발한 제품을 오픈AI의 AI 앱마켓인 ‘GPT 스토어’에 등록하는 등 AI 역량을 강화하고 있다. 하지만 여전히 AI 검증은 난관이 많다. AI로 하는 검증을 소비자가 믿을 수 있는지, 블랙박스가 많은 AI를 어떻게 검증할 수 있는지 등이다. 그렇다면 슈어소프트테크의 전략은 무엇일까. 배현섭 대표와 자세한 이야기를 나눠봤다.
- 슈어소프트테크의 AI 전략은 무엇인가.
“우리는 미션 크리티컬 소프트웨어 검증이 본업이다 보니 이 분야에 AI가 어떤 영향을 미치고 어떻게 발전할까를 고민하고 있다. 현재 하는 것은 크게 Test by AI와 Test of AI다. 기존에 하던 시험검증에 AI를 적용해 생산성을 높이는 것과 최근 활용 폭이 커진 AI를 검증하는 것이다.”
- 미션 크리티컬 시험검증에 AI가 필요한가.
“꼭 필요하다. 아니 필요해졌다. 과거에는 미션 크리티컬 소프트웨어가 작고 한정된 일을 했다. 하지만 지금은 이 소프트웨어 규모가 엄청난 속도로 커지고 있다. 자동차만 보더라도 과거엔 개별적인 소프트웨어들이 지금은 다 연결돼 있다. 엔진과 브레이크를 제어하는 소프트웨어들이 개별적이었지만, 지금은 커넥티드카가 되면서 모두 연동되고 그 규모도 커졌다. 결국 시험검증도 생산성을 생각할 수밖에 없는 분야가 됐다. 검증은 철저하게 해야 하는데 리소스를 무한정으로 쓸 수 없기 때문이다. 이 때문에 검증에 AI를 적용하는 Test by AI를 생각하게 됐다.”
- 시험검증 업무를 하는 사람들을 보조하는 AI라고 보면 되나.
“유사하다. 우리는 미션 크리티컬 소프트웨어 시험검증을 할 때 사용하는 자동화된 솔루션을 만드는 사업도 한다. 자동차, 원자력, 철도, 우주항공 등의 분야에선 이 자동화된 솔루션으로 시험검증을 하고 있다. 그런데 자동화된 솔루션이 있다고 인력이 들어가지 않는 것은 아니다. 당연히 인력이 들어가 이 솔루션을 서비스하고 있는데, 여기에 AI가 또 역할을 한다면 이 인력들의 업무 일부분을 대체할 수 있고, 사람의 생산성은 더 높아질 수 있다. 이러한 AI를 만들고 있다.”
- 시험검증에서 AI가 실제로 도움을 줄 수 있는지 여부가 궁금하다.
“우리가 내부적으로 비엠티(Benchmark Test, 품질성능평가시험)를 해봤다. 범용적으로 사용할 수 있는 챗GPT를 활용해 미션 크리티컬 소프트웨어를 시험 검증할 때 생산성 향상 효과가 얼마만큼 나오는지를 측정했다. 그 결과 신입직원일수록 생산성 향상이 크게 나왔고 선임 직원에게도 도움이 된다는 것을 파악했다. 그런데 미션 크리티컬 분야에서 챗GPT는 사용할 수 없다. 소프트웨어 소스코드나 설계문서 등을 모두 프롬프트로 넣어야 하는데, 보안 문제가 있다. 현대자동차나 삼성전자가 회사의 소스코드 등을 범용적으로 사용되는 AI에 입력할 순 없다. 이 때문에 우리는 테스트에 특화한 AI가 필요하다고 보았고 이 사업을 준비하게 됐다.”
- 테스트 특화 AI라고 하면 sLLM으로 이해해도 되나.
“맞다. 챗GPT와 같은 생성형 AI 발전으로 기업들이 AI 도입에 관심을 두게 됐다. 검증 분야에서도 생성형 AI를 이용하면 생산성이 높아진다는 것을 증명하면 필요로 하는 곳이 많다. 문제는 앞서 얘기했듯 보안이다. 이 때문에 결국 기업들은 내부에 sLLM을 구축하는 방법을 택하게 된다. 우리는 모비젠을 인수한 후 테스트 특화 sLLM 모델을 개발하고 있다. 완성된다면 검증 분야에도 새로운 혁신을 이어갈 수 있을 것으로 본다. sLLM은 올해 하반기 정도에 개발 완료할 예정이다.”
- GPT스토어에 제품을 등록한 것으로도 아는데.
“두 개 제품을 등록했다. GPT스토어에 제품을 등록한 것은 롱테일 전략이다. 우리의 솔루션을 기존 정적 테스팅이나 동적 테스팅에서 생산성을 향상할 수 있다는 것을 보여주고자 했다. 일부 기업은 소스코드나 설계 코드를 GPT에 올려서라도 테스트 생산성을 높이려 하는 곳이 있다. 사업 차이일 수도 있고 기업 규모 차이일 수도 있다. 이러한 기업들을 위해 제품을 등록했다. 이를 통해 검증 분야에서도 AI가 효율적이라는 것을 계속 증명해나가고 알리려고 한다.”
- 검증 분야에서 AI 도입을 시도하는 기업도 글로벌 관점에서 보면 많을 것 같다. 경쟁이 될까.
“한국은 미션 크리티컬 소프트웨어 검증에 유리한 시장이다. 한국은 생각보다 미션 크리티컬 시스템을 많이 한다. 제조, 중화학 산업을 비롯해 자동차, 원자력, 철도, 우주항공, 석유화학 등을 모두 국산화했다. 이런 나라가 전 세계에 별로 없다. 이처럼 한국은 성장할 수 있는 기반을 잘 만들어놓았는데 인구 감소 등으로 생산성 이슈가 나오고 있다. 이를 극복해 줄 기술이 AI다. 한국이 모든 산업을 하다 보니 미션 크리티컬 검증에 유리한 부분이 많고, 이 때문에 한국에서 만든 AI 기술이 차별화될 수 있다고 본다. 우리는 한국에서 기술을 정량적으로 입증해나가 해외에 수출할 예정이다. 이미 전체 매출의 10~15%가 미국, 중국 법인에서 나오고 있다.”
- Test of AI도 궁금한 부분이 많다. 사실 AI는 블랙박스 부분도 많아 검증이 쉽지 않다.
“AI는 그 내부가 깜깜한 블랙박스이다 보니 그 속에서 어떻게 결정 메커니즘이 돌아가는지 알 수 없다. 그래서 이 AI를 믿어도 되는지에 대한 의구심이 많다. 우리는 이 문제를 화이트박스 개념으로 접근하고 있다. 인간의 뇌와 비슷하다. 우리 뇌를 보면 좌뇌는 어떤 역할을 하고 우뇌는 어떤 역할을 하는지가 다 연구됐다. AI도 내부를 보면 한 작업에서 활성화되는 뉴런들이 있다. 이러한 뉴런들을 연구하고 얼마나 결과에 영향을 주는지 등을 연구한다. 이렇게 하면 문제가 있는 뉴런들을 사전 탐지할 수 있고 검증도 가능해진다. 이런 부분으로 Test of AI를 연구하고 있다.”
- AI가 발생하는 탄소배출도 현재 문제 되고 있다. AI 검증이 이 분야에서도 도움을 줄 수 있을 것 같다.
“맞다. AI를 경량화시키면서 전력을 감소시켜 탄소배출을 줄이는 효과도 있다. AI 내부를 분석해보면 해당 서비스에 필요하지 않은 뉴런이 있다. 물론 범용인공지능(AGI)이라면 모든 뉴런이 필요할 수 있다. 하지만 자율주행에 쓰이는 AI라면 모든 뉴런이 필요하지 않다. 사람의 뇌를 비유했을 때 운전할 때 쉬는 뇌세포도 있지 않은가. 이처럼 운전에만 집중하는 AI를 만든다면 대화에 사용되는 뉴런은 빼도 된다. 우리는 이같이 온디바이스 AI를 경량화하고 최적화하는 용도로 검증을 사용할 수 있다고 본다. 화이트박스를 통해 모델을 경량화하게 된다면 AI의 당면 문제인 탄소배출 역시 줄일 수 있다.”
- 앞으로 한국 AI 발전에 기여하고 싶은 점이 있다면.
“AI를 사용했더니 생산성이 높아졌다는 레퍼런스를 테스트 분야에서 증명하고 싶다. 이를 통해 사람들이 AI는 돈 잡아먹는 기계가 아니라 그 돈이 들어간 것 이상의 생산성 효과가 나온다는 인식을 심어주고 싶다. 또한 AI 채택을 주저하는 큰 고객들이 안심하고 AI를 채택할 수 있는 검증의 게이트웨이 역할도 하고 싶다. 이를 통해 모든 산업에서 올바른 AI가 활용될 수 있는 문화를 만들겠다.”