요즘 전 세계적으로 너무나 큰 이슈가 되고 있는 것이 중국의 AI 스타트업이 만든 딥시크(DeepSeek)입니다. 오늘은 딥시크란 무엇인지와 왜 이슈가 되고 있는지 그리고 사용 방법은 어떻게 되는지를 알아보고 마지막으로 ChatGPT와 간단한 성능 비교를 해보겠습니다.
딥시크란?
딥시크는 중국 헤지펀드사인 환팡퀀트(영문명 High-Flyer Quant)가 설립한 오픈 소스 대형 언어 모델을 개발하는 중국의 인공지능 연구 기업이자 회사의 제품명입니다. 환팡퀀트는 금융 분야에서 복잡한 알고리즘과 데이터 분석을 활용해 왔고 이런 분석 역량을 AI에 접목하면서 대규모 언어 모델 연구에도 뛰어들게 됩니다. 그리고 2023년 환팡퀀트의 공동 창립자 량원펑은 딥시크 연구소를 독립법인으로 분사하고 23년 11월 코딩 특화 모델 DeepSeek Coder를 출시합니다.
그리고 얼마 안있어 범용 대규모 언어모델 DeepSeek LLM 시리즈를 공개하고 24년 5월 성능 향상 및 비용 절감에 초점을 맞춘 DeepSeek-V2를 출시합니다. 이후 24년12월 현재 버전은 V3와 25년 1월 오픈소스 추론 모델은 R1을 공개합니다.
딥시크가 이슈가 되고 있는 이유는?
위에서 소개한 딥시크가 그렇다면 최근에 더욱 이슈가 되고 있는 것은 무엇일까?
역시나 가장 첫 번째 이유는 성능일 것입니다. 일부 성능 테스트에서 오픈AI의 ChatGPT가 작년 9월 출시한 추론 AI 모델 ‘o1’ 보다 앞선다는 평가를 받았기 때문입니다.
두 번째 이유는 오픈 AI의 개발 비용보다 훨씬 적은 비용인 600만 달러 미만의 비용으로 단 두 달 만에 개발했다고 주장하고 있다는 것과 미국의 고성능 칩 수출 규제로 엔비디아가 H100사양을 낮춰 출시한 H800칩으로 개발했다는 점입니다. 또한 AI 칩으로 활용되는 그래픽 처리 장치(GPU)의 수도 2048개에 불과하다는 것입니다. 이렇게 저성능 칩을 사용했다는 것이 중요한 이유인 것은 여태까지는 AI를 학습시키기 위해서는 엔비디아의 최첨단 AI칩이 필요하다는 것이 일반적인 담론이었으나 딥시크가 최첨단 AI칩을 사용하지 않고 저가로 생성형 AI를 개발했기 때문입니다.
세 번째 이유는 딥시크가 오픈소스 AI 모델이라는 점입니다. 오픈소스가 중요한 이유는 전 세계 개발자들이 자유롭게 수정하고 상용화할 수 있도록 허용했다는 것이고 이는 AI 기술의 민주화와 더 많은 기업과 개발자들이 첨단 AI 기술을 활용할 수 있는 기회를 제공하기 때문입니다.
딥시크 사용 방법
딥시크 사용 방법은 너무나 간단합니다.
이미 많은 사람들이 ChatGPT 사용법에 익숙하기 때문에 쉽게 이용하실 수 있을 것이라 생각됩니다.
가장 먼저 DeepSeek를 검색해 Deep시크 사이트에 접속합니다.
사이트 첫 페이지에 바로 노출되어 있는 “Start Now” 버튼을 누르고 로그인 페이지로 이동해줍니다.
그리고 “Log in with Google” 버튼을 통해 구글 ID로 쉽게 로그인하거나 “Sign up” 버튼으로 이메일을 통한 아이디를 만들어 줄 수 있습니다. 아이디를 생성하는 것도 매우 간편하며, 위에 캡처화면 중 오른쪽과 같이 이메일 주소와 비밀번호를 입력하고 해당 이메일로 들어가 코드를 보고 적어주기만 하면 완료됩니다.
그렇게 로그인을 하면 위와 같이 ChatGPT와 유사한 UI의 첫 페이지를 볼 수 있습니다.
가운데 질문을 할 수 있는 텍스트 입력 란에 궁금한 것을 대화형태로 질문해 주면 ChatGPT와 동일하게 답변을 말해줍니다.
밑에 Search버튼을 누르면 인터넷에서 검색한 내용으로 답변을 알려줍니다.
Search 같은 경우 원인을 알 수 없었지만 위에 캡처화면처럼 기술적 문제로 일시적으로 사용이 불가능하다는 안내와 함께 결과를 내보내고 있는 것을 볼 수 있었습니다.
DeepThink(R1) 버튼을 클릭해 준 후 질문 혹은 명령을 입력해 주면 추론을 통한 답변을 알려 줍니다.
추론 사용 예시는 성능 비교에서 보다 자세히 보여드리겠습니다.
그리고 마지막으로 첨부파일 버튼 클릭을 통해 파일을 첨부해서 질문 또는 명령을 할 수 있습니다.
참고로 Get App 버튼을 누르면 QR코드가 뜨고 해당 코드를 통해 앱을 다운로드하여 설치할 수도 있습니다.
성능 비교
성능 비교는 뉴스기사에서 세모 박스에서 공이 돌아다니는 모습을 코딩으로 작성해 달라는 실험을 통해 두 개의 성능을 비교해 본 것을 따라 하여 아래와 같은 질문을 통해 HTML 코드를 작성해 달라고 딥시크와 ChatGPT에 요청했습니다.
공통 질문: "네모 안에서 강아지 캐릭터가 돌아다니는 모습을 HTML 코드로 작성해줘"
1. 딥시크 답변 및 결과
2. ChatGPT 답변 및 결과
단순하게 결과만을 놓고 비교했을 때, ChatGPT의 경우 HTML코드(CSS를 이용했지만)만을 이용해서 정말 간략하게 코드를 작성해 주었고, 딥시크 같은 경우 자바스크립트까지 활용하여 인터랙티브가 가능하도록 구현해 줬습니다. 요청 사항이 많이 애매모호했고 너무 짧았기 때문에 단순하게 어떤 것이 성능이 더 좋다고 말하기 어려운 테스트였지만, 뉴스나 다른 후기에서 말한 것처럼 딥시크가 보다 적극적으로 추론해서 결괏값을 보여주는 건 맞는 것 같습니다.
그러나, 서버 과부하로 인한 오류였던 것인지 아래 캡처화면과 같이 여러 차례 검색 결과를 보여주지 못했던 것은 조금 아쉬운 점이었습니다.
결론
요즘 너무 이슈다 보니 한번 직접 사용해 보고 사용 방법과 성능 비교 등 경험해 본 것을 글로 남겼지만 글을 쓰는 중간에도 딥시크에 대한 의문을 제기하는 기사들이 여럿 보였습니다. 딥시크가 얘기한 개발 비용보다 더 많은 비용이 들었을 것, 정보 유출 문제, 타 회사의 모델 무단 이용 등 각종 의혹들이 제기되고 있는 것 같습니다. 그럼에도 ChatGPT와 유사한 수준의 모델이 중국의 스타트업에서 개발되었다는 것은 꽤나 큰 이슈라고 생각되고 AI 생태계에서 큰 변화를 갖고 올 것은 맞는 것 같습니다.