IT/AI news&info

DeepSeek-R1 Blows My Mind Again! - 5 TESTS on Local Models

soures 2025. 2. 21. 17:12
728x90
반응형

이 영상에서는 DeepSeek-R1 로컬 모델의 테스트를 통해 여러 가지 실험을 진행합니다. 14B 모델을 중심으로 코딩 과제 해결, 창의적 글쓰기, 그리고 모델의 검열여부에 대해 다루며 다양한 응용 방법을 소개합니다. 각 테스트의 결과는 AI 모델의 성능과 활용 가능성을 보여줍니다. 특히 로컬 환경에서 작동하는 AI의 장점을 강조하며 시청자에게 이 모델을 직접 체험해보도록 유도합니다. 이 영상을 통해 ` DeepSeek-R1`이 기술적 실험을 통해 사용자에게 제공할 수 있는 가치를 잘 이해할 수 있습니다.

반응형

1. 🚀 로컬 모델 DeepSeek R1 사용하기 [00:00:00] (4분)

  • DeepSeek R1 모델을 로컬 환경에서 설치하고 실행하기 위한 간단한 가이드가 제공된다. 사용자는 GitHub 링크를 통해 필요한 코드를 찾아 다운받을 수 있다.
  • 14B 모델을 테스트하며 코딩 챌린지를 해결하고 창의적인 글쓰기 테스트를 진행할 예정이다. 이 모델이 실제로 문제를 해결할 수 있는지, 그리고 창의적인 결과물을 생성할 수 있는지 확인할 계획이다.
  • 14B 모델은 많은 하드웨어 자원을 요구하므로, 7B 모델을 사용할 수 있는 대안도 제시된다. 사용자는 자신의 하드웨어에 따라 적절한 모델을 선택해야 하며, 다운로드 및 설치 과정도 안내된다.

 

2. 🤖 DeepSeek R1의 추론 토큰 활용법 [00:04:08] (7분)

  • DeepSeek R1 모델의 추론 토큰을 활용하여 음성을 생성하는 작업이 진행된다. 이는 DeepSeek 모델이 어떻게 질문에 답변하는지를 관찰하기 위함이다.
  • 사용자는 Eleven Labs를 통해 음성을 선택하고, DeepSeek R1 14B 모델에서 "인생의 의미"와 "인공지능은 신인가?"라는 질문에 대한 답을 생성한다.
  • 모델은 인간 지능을 초과할 경우 AI가 신처럼 보일 수도 있지만, 현재는 AI가 의식이나 의도가 없는 도구에 불과하다고 설명된다.
  • 사용자는 랜덤한 숫자를 생성해 이를 추론하는 과정을 탐색하며, 사람들의 선택 경향이 무작위가 아님을 지적한다. 예를 들어, 50이나 25와 같은 숫자는 자주 선택되는 경향이 있음을 언급한다.
  • 생성한 질문과 답변을 바탕으로 무한 콘텐츠 생성 머신을 구현할 수 있으며, 이전 질문에 대한 답변을 통해 새로운 질문이 지속적으로 생성된다. 이 시스템은 계속해서 콘텐츠를 생성할 수 있다.

 

3. 💻 DeepSeek 14B 모델을 활용한 코드 실험 [00:12:02] (8분)

  • DeepSeek 14B 모델을 사용하여 HTML 코드를 작성하는 과제가 주어졌다. 이 코드는 브라우저에서 매트릭스 비를 생성하며 사용자 상호작용이 가능하다.
  • 실험 결과, DeepSeek 14B 모델이 생성한 코드가 빠르게 작동하며, 매트릭스 비가 나타나는 것을 확인할 수 있었다.
  • 비교를 위해 전체 모델과의 코드 결과를 비교한 결과, 전체 모델의 비주얼 효과는 더 전통적이었으나, DeepSeek 14B에서 생성된 코드가 더 선호되었다.
  • DeepSeek 14B 모델이 다양한 코딩 테스트를 통해 일상적인 코딩 작업에 활용될 가능성이 있다.
  • 퍼즐 문제 해결 실험에서도 DeepSeek 모델이 여러 단서를 파악하여 최종 답을 도출하는 데 적절한 성과를 거두었다.

3.1. DeepSeek 14B 모델을 활용한 간단한 코딩 실험 [00:12:02] (2분)

  • DeepSeek 14B 모델을 사용하여 간단한 코딩 테스트를 진행했다.
  • 주어진 과제는 브라우저에서 실행되는 매트릭스 비를 나타내는 HTML 코드 작성이었다.
  • DeepSeek-R1의 전체 버전과 작성된 코드를 비교하기 위해 동일한 코드를 실행했다.
  • 첫 번째 반복에서 생성된 코드가 빠르게 작동하여 매트릭스 비를 성공적으로 구현하였다.
  • 사용자가 클릭하여 상호작용할 수 있는 기능과 줌 기능이 포함되어 있어 인상적이었다.

3.2. 모델 비교 및 실험 결과 [00:14:38] (1분)

  • 전체 모델의 내용으로, 사용되는 중국어 문자를 확인할 수 있다.
  • 여러 효과를 클릭할 때 나타나는 전통적인 비와 다른 효과들로 실험할 수 있다.
  • 14B 모델의 결과가 더 마음에 드는 것으로 언급되며, 더욱 명확한 결과를 제공하지만 첫 번째 모델을 선호한다고 한다.
  • 코딩 테스트는 없으나, 로컬 모델과 API를 활용하여 일상적인 코딩 작업에서 더 탐색할 계획이다.
  • DeepSeek를 통해 코드 작성 실험을 하며, 다른 모델과 결과를 비교하는 재미있는 실험을 강조한다.

3.3. 디프시크(DipSeek)의 퍼즐 해결 과정 [00:16:17] (3분)

  • 퍼즐 설명: 마이크는 40세로 2025년을 배경으로 하고 있으며, 유명한 그림이 있는 박물관에 있다. 또한, 그림의 화가는 TV 시리즈의 좋아하는 캐릭터를 떠올리게 한다.
  • 퍼즐의 단서: 마이크의 캐릭터는 무기를 가지고 있으며, 이에 해당하는 나라의 유명한 음식은 매운 경우도 있다. 퍼즐의 최종 목표는 마이크가 먹고 있는 음식을 찾는 것이다.
  • 첫 번째 시도: 첫 번째 시도에서 디프시크는 그림이 모나리자임을 정확히 찾았으나, 무기에 대한 부분은 실패했다. 결과적으로 이탈리아매운 요리푸타네스카를 연결했으나 정답이 아니었다.
  • 두 번째 시도: 두 번째 시도에서 디프시크는 초밥을 정답으로 판단하였고, 무기로는 카타나를 추측하였다. 그러나 여전히 하나의 중요한 단서를 놓쳤다.
  • 완전한 모델의 평가: 전체 R1 모델은 더욱 효과적으로 단서를 연결하여 청년기에 인기를 끌었던 닌자 거북이를 참고하며, 무기와 음식을 더욱 잘 추론하였다. 그러나 최종 질문에 대한 답은 만족스럽지 못했다.

3.4. 라멘과 모델 비교의 흥미로움 [00:20:10] (48초)

  • 화자는 라멘에 대한 연결성을 강조하며, 이 연결이 다빈치거북이 연결과 보통의 모델과 다른 점을 나타낸다고 언급한다.
  • 전체 모델을 실행하는 것과 로컬 모델을 실행하는 것 사이에 약간의 차이가 존재한다고 주장한다.
  • 로컬 모델을 여러 번 실행하면 결국 비슷한 결론에 도달할 것으로 추정된다.
  • 이전 경험을 바탕으로 한 자신의 퍼즐을 만들어보는 과정이 흥미롭다고 표현한다.

 

4. ✍️ 창의적인 글쓰기 테스트 결과 [00:21:01] (2분)

  • 창의적인 글쓰기 테스트를 위해 웹에서 정보를 가져와 주어진 맥락에 대해 비판적인 시각을 가진 글을 작성하도록 요청했다.
  • 제출된 맥락에서, 2023년에 설립된 한 스타트업이 인공지능 모델을 $5.6 million에 구축했다고 언급하며, 이것이 피자를 주문하는 것보다 더 저렴하다는 점을 강조했다.
  • 미국의 대형 기술 기업들이 주가 하락으로 인해 당황하고 있으며, 이는 그들이 마치 혁신을 처음 발명한 것처럼 사태를 격렬하게 반응하고 있음을 지적했다.
  • 글에서는 혁신을 제한하려는 시도가 오히려 누군가의 예산 친화적인 해결책 발견으로 이어질 수 있음을 암시했다.
  • 첫 인상으로는 꽤 흥미롭고, 오히려 더 재미있게 만들 수 있는 여지가 있다고 평가되었다.
728x90

5. 🔍 딥시크 R1 모델의 검열 테스트 결과 [00:23:23] (4분)

  • 딥시크 R1 모델은 특정 질문에 대해 검열이 존재하는지 탐색되었으며, 1989년 톈안먼 광장에 관한 질문에는 답변을 하지 않았다.
  • 모델이 중국의 대통령에 관한 질문에는 긍정적으로 응답하며, 시진핑을 언급하였다.
  • 에로틱한 이야기를 작성하라는 요청에 대해서는 검열없이 응답했으며, 연결과 친밀성에 대한 단편 이야기를 제공하였다.
  • 모델은 오프라인에서 작동 가능하여 인터넷 연결 없이도 사용이 가능하여 사용자에게 편리함을 제공한다.
  • 딥시크 R1 모델의 테스트는 흥미로웠으며, 오픈 소스 소프트웨어가 가격을 낮추고 더 많은 선택지를 제공하는 긍정적인 영향을 미칠 것이라고 언급되었다.

 
원본영상
https://youtu.be/h_ybuhqw4Y4

LIST