일론 머스크(Elon Musk)가 이끄는 OpenAI가 최근 인공지능 GPT-3의 API(Application Programming Interface, 앱 프로그래밍 인터페이스)의 가격을 공개하였다. GPT-3의 API를 구매한다면, 구매자의 입맛대로 GPT-3를 활용해 창의적이고 생산적인 활동을 할 수 있다. GPT-3는 방대한 양의 학습된 텍스트를 통해 다음 단어를 예측하는 방식으로 구성된 자연어 처리 기반 인공지능이다. 아직은 별도로 신청한 특정 사용자만이 접근할 수 있지만, OpenAI의 가격 정책 공개는 향후 GPT 계열의 새로운 모델이나 이후 발표될 새로운 AI의 상업적 사용을 통한 수입 구조를 만들겠다는 뜻으로 해석된다.
[이미지 제공=OpenAI, 저작권자로부터 이미지 사용 허락을 받음]
올해 6월 대중에게 공개된 GPT-3는 300억 개의 정제된 데이터를 이용하여 사전학습한 자연어처리(NLP) 시스템이다. GPT-3는 일반적인 대화를 나누거나 웹페이지를 생성하고, 데이터를 분석하거나 프레젠테이션 작성 등 다양한 분야의 언어적 작업을 수행한다. 이때, GPT-3는 1,750억 개가 넘는 파라미터(Parameter, 매개변수)를 통한 방대한 양의 텍스트를 통해 다음 단어를 예측하는 방식으로 구동된다. 이렇게 학습된 GPT-3는 엄청난 성능을 보인다. 몇 개의 단어만 있어도 문장을 생성한다. 그동안 시중에 공개된 인공지능 기술보다 우수하다는 평가다. 최근에는 사람이 작성한 기사와 구분이 되지 않는 뉴스를 작성하여 기사 랭킹 1위를 차지하기도 했다.
하지만 GPT-3 모델이 최고는 아니다. GPT-3는 머신러닝을 통해 가장 가장 근접한 답변을 내놓도록 설계됐다. '사람에게는 손이 몇 개 있어?'라는 물음에 정확한 답을 하여도 '사람'과 '손'이나 추상적인 '몇 개' 등의 단어를 이해하여 문장을 해석한 것은 아니라는 것이다. GPT-3은 해당 단어와 연관 있는 단어를 자신의 사전 학습 라이브러리에서 찾아내 적절한 답변을 '예측'한다. 이는 다시 말해, 라이브러리에 학습된 정보가 불완전하다면 GPT-3가 만들어내는 문장은 신뢰할 수 없다는 것이다. 이러한 문제점은 라이브러리를 통한 사전 학습 방식의 근본적인 문제이다. 이를 교정하기 위해서는 거대하면서도 완벽히 정제된 사전 학습 라이브러리가 필요하지만, 이는 엄청난 비용과 시간을 수반한다. 일례로, GPT-3를 구현하기 위하여 OpenAI는 460만 달러, 즉 54억 원을 투입하였다.
이러한 비용적인 문제를 해결하고, 연구에만 집중하기 위해 OpenAI는 Microsoft와 손을 잡았다. 2019년 7월에 OpenAI와 Microsoft의 파트너쉽이 체결되면서 OpenAI는 1억 달러, 즉 1100억 규모의 현금을 보유하게 되었다. 또한, Microsoft의 클라우드 서비스 Microsoft Azure이 가진 강력한 클라우드 컴퓨팅 파워를 통해 GPT-3 등의 인공지능 플랫폼을 개발하고 구현할 수 있게 되었다. 이러한 지원의 대가로 OpenAI는 Microsoft에게 자사의 인공지능 플랫폼을 비롯한 인공지능 분야의 기술을 제공한다. 특히 Microsoft가 27일에 GPT-3 언어 모델의 독점 라이센스를 확보한 것은 주목할 만한 사건이다. Microsoft는 자사의 생산성 서비스에 GPT-3 모델을 활용할 것이라 예측된다. 이러한 협업은 OpenAI의 B2B(Business to Business, 기업 대 기업) 사업으로의 가능성을 엿볼 수 있는 대목이다.
OpenAI는 광범위한 연구와 지속적인 투자를 통해, 다방면에 걸친 특허와 기술을 획득하였다. 이렇게 획득한 정보들을 대중에게 공개하면서, 자연어처리(NLP) 기반 인공지능은 급격히 파이가 커졌다. 이러한 선순환을 통해 대중들이 인공지능을 안전하게 관리하고, 더 효율적으로 사용하게 만드는 것이 OpenAI의 비전이다. 그들의 도전이 좋은 결과를 얻어내 인공지능을 넘어서 광범위한 영향을 끼칠 수 있을지 귀추가 주목된다.
[대한민국청소년기자단 IT·과학부=16기 최준서기자]