AI 슬롭
2화

This Week in AI

오픈AI가 새로운 샐성형 AI 모델, ‘o1’을 공개했다. 과학, 코딩, 수학 분야에서 이전 모델보다 더 어려운 문제를 해결할 수 있다. 특히, 한국인만 알아볼 수 있도록 조작된 한국어를 깔끔하게 번역해 내는 능력을 보여주기도 했다. 출처: 오픈AI

1. 생각하는 AI 모델이 등장했습니다.


오픈AI가 추론 능력을 갖춘 새로운 챗GPT를 출시했습니다. 새로운 모델 ‘o1’은 수학과 코딩 등에서 복잡한 문제를 단계적으로 해결할 수 있다고 하네요. 지난주 전해드렸던 ‘스트로베리’ 프로젝트의 연장선상으로 보면 될 것 같습니다. 수학을 잘하는 AI입니다. 국제 수학올림피아드 예선에서 정답률 83퍼센트를 기록했습니다. 이전 모델이 13퍼센트였다는 것을 생각하면 놀라운 발전입니다. 또, 각종 숙소 사이트 등을 중심으로 사용되는, 한국인만 알아볼 수 있다는 일명 ‘에어비앤비체’도 영어로 깔끔하게 번역해 보여줍니다. ‘직우상 얻떤 번역깃돋 일끌 슈 없쥐많’을 ‘지구상 어떤 번역기도 읽을 수 없지만’으로 번역해낸 겁니다.

직접 사용해 봤습니다. 더 나아진 성능이 체감됩니다. 그런데 느립니다. 평소에는 5초쯤 걸렸던 작업인데, 22초 걸렸습니다. 고급 추론에 들어가는 컴퓨팅 용량이 크기 때문입니다. 그래서 ‘o1 프리뷰’는 일주일에 30개 메시지로 사용량이 제한됩니다. 코딩에 특화된 더 작은 모델도 제공됩니다. ‘o1 미니’입니다. 일주일에 50개 메시지까지 사용할 수 있습니다. 이번 모델은 ‘Process Supervision’ 방식으로 추론 능력을 향상했습니다. 복잡한 문제에 관한 풀이 과정을 학습시켜 LLM의 추론 능력을 높이는 CoT(Chain-of-Thought) 방식과 유사합니다. 정답이 아니라, 정답을 도출하는 ‘과정’에 집중합니다. 통계적으로 정답일 확률이 높은 답변을 내놓았던 기존 방식에서 벗어나, 정말 인간처럼 생각하는 방식을 배웁니다. 생성형 AI는 정말 빠른 속도로 인간에게 다가오고 있습니다.

2. AI 업계의 사기극이 끝났습니다.


세계 최고 성능의 오픈 소스 대형언어모델(LLM)이 등장했습니다. 그런데 단 며칠 만에 이 모델은 사기였다는 사실이 드러났습니다. 주인공은 AI 스타트업 ‘하이퍼라이트’가 내놓은 ‘리플렉션(Reflection)’이라는 모델입니다. 하이퍼라이트는 700억 개의 매개변수로 이루어진 리플렉션 70B가 메타의 Llama 3.1 모델을 파인 튜닝한 결과라며, 오픈AI의 GPT4-o, 구글의 제미나이 등을 뛰어넘었다고 주장했습니다. 처음엔 모두 놀랐습니다. 그리고 믿었습니다. 하이퍼라이트의 CEO, 맷 슈머는 포브스가 선정한 ‘30세 이하 리더’ 명단에도 이름을 올렸으며, 스타트업 창업 경력도 있습니다. 한마디로 업계에서 인정받는 사람이 만든, 인정받는 스타트업이라는 얘기입니다.

그런데 리플렉션 모델이 공개된 후 사용자들이 뭔가 이상한 낌새를 눈치챕니다. 사용해 보니, 하이퍼라이트의 주장과는 달리 성능이 기대에 미치지 못했던 겁니다. 사람들이 리플렉션 모델의 정체를 파헤치기 시작합니다. 그리고 실은 이 모델이 앤트로픽의 클로드, 오픈AI의 GPT-4o 등의 모델을 이용해 호스팅하고 있을 뿐이라는 주장이 나오기 시작합니다. 결국, 맷 슈머는 X를 통해 ‘프로젝트 발표에 있어 앞서나갔다’라며, 과장된 홍보를 인정했습니다. 사기극 아닌 사기극이 밝혀진 것이죠. AI 분야는 아직 많은 부분이 드러나지 않았습니다. 우리는 생성형 AI의 추론 과정을 아직도 제대로 이해하지 못합니다. 만든 사람들조차 말이죠. 그렇다고 대충, 과장하고 부풀려 성과를 주장해도 넘어갈 수 있는 것은 아닙니다. 이 모델을 시험한 사람들의 시간이 사라졌습니다. 그리고 촉망받았던 AI 업계의 예비 스타, 맷 슈머의 명성도 빛이 바랬습니다.

3. 젠슨 황의 한 마디에 주가는 들썩입니다.


엔비디아의 젠슨 황 CEO가 추석 선물을 보내왔습니다. 정확히는 우리 언론들이 그렇게 해석하고 있지요. 지난 11일 골드만삭스가 주최한 테크 콘퍼런스에서 한 발언 때문입니다. 엔비디아는 현재 AI 칩 시장에서 80퍼센트 이상의 점유율을 확보하고 있습니다. 과점도 아니고 독점에 가까운 상황이죠. 지금의 AI 붐을 가능하게 한 주역, 그리고 앞으로도 가능하게 할 주역인 ‘호퍼’ 시리즈와 ‘블랙웰’ 칩이 대표적입니다. 젠슨 황 CEO는 자신감을 감추지 않았습니다. 엔비디아의 AI 칩 공급이 제한적이어서 일부 고객사가 불만을 드러내고 있다고, 긴장감까지 조성되고 있다고 밝힌 겁니다. 곤란하다는 얘기처럼 보이지만, 대놓고 엔비디아 자랑을 늘어놓았습니다. 우리 물건은 없어서 못 판다는 얘기니까요. 이 자신감에 올라탄 엔비디아의 주가는 약 8퍼센트 급등했습니다.

이렇게 잘 팔리면, 더 만들어야 합니다. 기초적인 경제학이죠. 두 모델 모두 생산은 대만의 파운드리 업체, TSMC가 맡고 있습니다. 콘퍼런스에서 젠슨 황 CEO는 TSMC의 뛰어난 대응 능력을 치켜세웠습니다. 하지만, 묘한 말도 남겼습니다. “TSMC가 훌륭해 거래하고 있지만, 필요하다면 언제든 다른 업체를 찾을 수 있다.” 이 발언에서 우리 언론이 삼성전자를 본 겁니다. 그리고 삼성전자 주가가 오랜만에 웃었습니다. 그런데 좀 따져볼 구석이 있습니다. 정말, 젠슨 황이 말하는 ‘다른 업체’가 삼성전자일까요? 물론, 엔비디아의 3나노 AI 칩을 생산할 수 있는 역량을 갖춘 곳이 TSMC를 제외하면 삼성전자 뿐이기는 합니다. 그런데 엔비디아가 원하는 것은 ‘엔비디아의 상품에 잘 맞는’ 3나노 칩입니다. 삼성전자가 만약 그 기준을 잘 맞췄다면 TSMC가 엔비디아의 물량을 독점하다시피 하고 있진 않겠죠. 젠슨 황은 이야기를 뒤집으면, 지금 당장은 TSMC 이외의 다른 업체를 찾을 필요성은 없다는 얘기이기도 합니다. 그러니까, 추석 선물은 빈 상자일 가능성이 꽤 높습니다.
 
3화에서 멤버십 전용 팟캐스트를 들어 보세요. 이번 화에 미처 담지 못한 풍성한 이야기를 전합니다.
다음 이야기가 궁금하신가요?
프라임 멤버가 되시고 모든 콘텐츠를 무제한 이용하세요.
프라임 가입하기
추천 콘텐츠
Close