IT/AI news&info

2025-03-02 조코딩 IT뉴스 - GPT-4.5, Claude 3.7, Grok 보이스모드, sesame 보이스, 구글, AI 코딩 무료,

soures 2025. 3. 4. 08:54
728x90
반응형

본 영상은 최신 IT 뉴스를 빠르고 깊이 있게 전달하며, 특히 GPT-4.5의 특징과 성능, 그리고 세사미(Sesame)의 혁신적인 음성 AI 기술을 집중적으로 다룹니다. GPT-4.5는 문과적 감성, 설득력, 이미지 인식 능력에서 강점을 보이지만, 높은 비용과 투자 과잉 논란이 있습니다. 세사미는 사람과 구별하기 어려울 정도로 자연스러운 음성 AI를 제공하여 영어 회화 연습에 유용합니다. 이 외에도 Grok의 보이스 모드, 구글의 AI 코딩 무료화, Alexa+ 등 다양한 IT 소식을 다루며, AI 기술 트렌드를 따라가는 데 도움을 줍니다. IT 업계의 빠른 변화 속에서 핵심 정보를 얻고 싶다면 이 영상을 시청하세요.

반응형

1. 🔍 빠르게 변화하는 IT 트렌드 따라가기 위한 중요성 [00:00:00] (4분)

  • 최신 IT 트렌드를 따라가지 않으면 구시대 유물 같은 기술을 사용하게 될 수 있다.
  • 새로운 기술을 빠르게 배우고 적용하는 것이 효율이 좋다.
  • 트렌드를 파악하면 생산성이 높아지고, 필요한 순간에 적절히 활용할 수 있다.
  • 최신 AI 흐름을 놓치면 생산성 격차가 커질 수 있다는 우려가 있다.
  • 매주 요약된 IT 뉴스를 통해 트렌드를 쫓아가는데 도움이 될 수 있다.

 

2. 📰 샘 알트만의 가족 소식과 AI 보안 변화 [00:04:10] (11분)

  • 오픈AI의 CEO 샘 알트만이 대리모를 통해 득남한 사실이 알려졌으며, 그의 결혼식 및 가족 관련 소식은 많은 사람들에게 바이럴되었다.
  • 알트만은 자녀를 위해 병원에 가는 등 AI 개발에 조금 더딜 수 있다는 우려가 제기되었고, 이로 인해 굉장히 중요한 일이 되었다.
  • 애플이 영국 정부의 백도어 설치 요청을 거부한 후, 아이클라우드의 암호화를 완전히 제거한 결정은 사용자 개인정보에 대한 큰 변화를 초래하였다.
  • 암호화가 해제됨으로써 애플은 영국 사용자들의 데이터를 직접 접근하여 볼 수 있게 되었고, 이는 출처를 요구받을 경우 정보를 제공할 수 있는 새로운 경로를 열어주었다.
  • 이 변화는 정부의 요구에 응답할 수 있는 방법을 제공하는 동시에, 사용자 정보 보호에 대한 신뢰성 저하를 가져올 수 있는 우려를 낳았다.

2.1. 샘 알트만의 득남 소식 [00:04:10] (3분)

  • 오픈 AI의 CEO 샘 알트만이 남편과 결혼 후 득남을 했다. 이 소식은 빠르게 퍼졌고 축하의 메시지가 이어졌다.
  • 샘 알트만은 대리모를 통해 아기를 낳은 것으로 알려졌으며, 남편이 두 명인 상황에서도 가능한 가정 형태에 대한 논의가 이루어졌다.
  • 득남 소식으로 인해 샘 알트만이 AGI보다 개인적인 일이 더 중요하다는 점이 강조되었으며, 이로 인해 오픈 AI의 일정에도 영향이 있을 것으로 추정된다.
  • 샘의 아기가 태어남에 따라 금전적 부담이 커질 것이라는 의견이 있으며, 이는 AI 프로젝트에도 영향을 줄 수 있다.
  • GPT 4.5의 가격이 30배나 인상될 예정이라는 소식이 전해졌으며, 이에 대한 논의가 필요하다.

2.2. 인스타그램 릴스 독립 앱과 애플의 다양성 프로그램 [00:07:22] (1분)

  • 인스타그램의 릴스가 독립적인 앱으로 출시될 가능성이 있으며, 이는 틱톡의 자리 를 대체할 수도 있다.
  • 애플은 다양성 프로그램을 통해 유색 인종을 더 우대하는 채용 정책을 시행 중이며, 이는 논란을 일으켰다.
  • 트럼프의 영향으로 많은 기업들이 다양성 프로그램을 폐지하고 있으며, 구글도 이 같은 조치를 취한 사례가 있다.

2.3. ️ 애플의 정치적 발언과 논란 [00:09:01] (2분)

  • 애플이 인종차별주의자라는 발언에 대해 자동으로 트럼프라는 이름으로 표기된 사건이 있었다. 이는 음성적 유사성 때문으로 추정된다.
  • 이 사건으로 인해 트럼프가 분노했으며, 애플의 DEI(다양성 프로그램)에 대한 비판이 제기되었다.
  • 애플이 정치적 발언에 있어 위험한 선택을 했으며, 이는 기업에 부정적인 영향을 미칠 수 있다.
  • 구글은 관련 프로그램을 폐지한 반면, 애플은 이를 유지한다고 밝혔으며, 이는 기업의 생존에 영향을 미칠 수 있다.
  • 이 사건은 애플의 향후 정치적 상황을 지켜보는 데 흥미로운 요소로 작용할 가능성이 있다.

2.4. 애플의 아이클라우드 암호화 정책 변화 [00:11:17] (1분)

  • 애플은 아이폰의 채찍PT구글 재미나이를 연동하여 다양한 AI 기능을 포함하려는 노력을 하고 있다.
  • 영국 정부는 애플에 아이클라우드에 암호화 백도어를 삽입할 것을 명령했으나, 애플은 이를 받아들일 수 없다고 밝혔다.
  • 최근에 애플은 놀랍게도 영국 사용자를 위한 아이클라우드의 암호화를 완전히 제거한 것으로 전해졌다.

2.5. 애플의 암호화 해제와 개인 정보 접근 [00:12:45] (3분)

  • 애플은 종단간 암호화로 보호되던 정보를 해제하여, 영국 정부가 요구할 경우 사용자의 데이터를 볼 수 있는 환경을 마련했다.
  • 해제된 암호화 때문에, 애플 직원은 영국 사람들의 개인 정보, 즉 사진, 연락처 등 아이클라우드에 저장된 내용을 모두 접근할 수 있게 된다.
  • 정부 요구 시 백도어를 만드는 대신, 암호화를 제거하여 애플 직원들이 직접 데이터를 보고 제공할 수 있는 방식을 선택했다.
  • 이 결정은 백도어가 설치되면 신뢰성이 하락할 수 있다는 점을 고려하여 강력한 암호화를 제거한 결과로 분석된다.
  • 결국, 애플의 새로운 접근은 사용자의 개인 정보를 정부에 제출할 수 있는 경로를 열어준 것으로 이해된다.

 

3. 📊 GPT 4.5 모델의 성능 및 가격 분석 [00:15:53] (18분)

  • GPT 4.5는 베이스 모델로 공개되었지만, 이전 추론 모델에 비해 과학 및 수학에서 성능이 크게 저하되었다.
  • 감성적인 대화 능력은 향상되었으며, "사려 깊은 사람과 대화하는 느낌"을 준다는 평가가 있다.
  • API 가격이 1밀리언 토큰 기준으로 75달러로 설정되어, 이전 모델보다 30배 비쌌다.
  • 현재 오픈AI의 데이터 공유 옵션을 통해 하루 11만 토큰을 무료로 제공받을 수 있으며, 최대 1억 4천만원까지의 혜택을 누릴 수 있다.
  • 일론 머스크가 Grok의 성능이 개선되고 있다고 언급하며, GPT 4.5의 성능이 그렇게 뛰어나지 않다고 평가하고 있다.

3.1. 데이터 보안과 개인 정보 유출 문제 [00:15:53] (4분)

  • 영국의 보안이 해킹에 취약해지면서, 개인정보 유출 사건이 발생하고 있으며, 이는 정치적인 배경과 관련이 있을 수 있다.
  • 개인 정보 유출 사건으로 인해 사업자 두 곳이 과징금을 부과받았으며, 이들은 SQL 인젝션 공격에 걸렸다고 한다.
  • SQL 인젝션 공격은 기본적인 공격 방식으로, 사용자가 입력 창에 쿼리를 삽입해 데이터베이스를 파악할 수 있게 해준다.
  • 최근의 보안 문제는 개인 정보가 공공재로 전락하는 상황을 초래하고 있으며, 매주 유사한 사건이 발생하고 있다.
  • 스택오버플로우는 Q&A 플랫폼의 변화를 겪고 있으며, 블로그나 교육자료 등 다양한 콘텐츠 제공으로의 확장을 목표로 하고 있으나, 사용자 트래픽 감소가 우려된다.

3.2. AI 뉴스 소개를 위한 준비 [00:20:28] (58초)

  • 발표자는 변화를 응원하며 긍정적인 메시지를 전달하고 있다.
  • 발표자는 AI 뉴스로 넘어가기 전에 잠시 물을 마시겠다고 언급한다.
  • 발표자는 물을 마시는 과정에서 사과의 말을 전한다.
  • 발표자는 물을 마신 후 AI 뉴스 세션을 진행하겠다고 다짐한다.

3.3. GPT-4.5 모델의 특징 및 성과 [00:21:27] (4분)

  • GPT-4.5는 오픈 AI에서 공개된 최신의 베이스 모델로, 이전의 추론 모델과는 다른 접근 방식을 보여준다.
  • 벤치마크 점수에서 심플 QA 부분은 향상되었지만, 과학과 수학 능력은 O3 미니 모델에 비해 상당히 떨어진다.
  • 소프트웨어 엔지니어링 테스트에서는 점수가 높아, 프리랜서 코딩 작업 분야에서의 성과를 보여준다.
  • 해당 모델은 문과적인 성향이 강화되었으며, 감성적인 소통 능력이 발전하여 사용자와의 대화의 질이 개선되었다.
  • 프로그램 관리(PM) 역량이 코딩 능력보다 중요하게 작용하는 것으로 나타났으며, 이로 인해 성과가 좋았던 것으로 추정된다.

3.4. GPT-4.5 API 가격과 혜택 [00:25:37] (4분)

  • GPT-4.5 모델 가격은 75달러로, 이전 베이스 모델보다 약 30배 비쌉니다.
  • 다양한 모델들과 비교했을 때, 기존의 5원 모델은 15달러로, GPT-4.5는 5배 더 비쌉니다.
  • 오픈AI는 하루에 11만 토큰을 무료로 제공하며, 해당 기간은 4월 30일까지 연장되었습니다.
  • 무료로 제공되는 토큰을 활용하면, 한 달에 최대 7천만원, 두 달 동안 최대 1억 4천만원의 가치를 얻을 수 있습니다.
  • 데이터 컨트롤을 통해 무료 혜택을 받을 수 있으며, 특정 티어 이상의 유저만 해당 혜택을 누릴 수 있는 것으로 추정됩니다.

3.5. GPT-4.5 모델 평가 및 기능 테스트 [00:30:23] (4분)

  • GPT-4.5는 베이스 모델로서 다른 모델들에 비해 성능이 다소 떨어진다는 평가가 있다. 특히 Grok 모델과 비교했을 때 벤치마크 점수가 낮게 나오고 있다.
  • 그러나 GPT-4.5는 기본 모델에서 출혼 모델로 발전할 가능성이 있으며, 이러한 발전이 긍정적인 전망을 제시한다.
  • 감성적인 대화 측면에서는 이전 모델보다 개선된 점이 있을 것으로 추정되며, 그 성능을 직접 테스트해보는 과정이 진행되었다.
  • 테스트 결과, GPT-4.5는 논리 문제나 수학 문제와 같은 추론이 필요한 질문을 처리하는 데 어려움을 겪는 반면, 감성적인 질문에 대해 잘 반응하는 모습을 보여주었다.
  • 예를 들어, 감성적인 질문인 '여자친구가 가장 화난 대사'를 맞추는 데 있어 AI는 감정 표현의 뉘앙스를 잘 해석하는 능력을 보였다.

 

4. 🗣️ 여자어 해석과 인공지능 능력 테스트 [00:34:47] (12분)

  • 여자어 사전을 기반으로 하여 다양한 문장을 해석하고 문제를 만드는 방식이 흥미롭다. 특히 OCR 기능을 활용하여 텍스트 작업을 진행한다.
  • 여자어 해석 결과에 따른 감정 표현이 매우 중요하며, 특정 문장들이 어떻게 해석되는지를 통해 실질적인 소통이 가능함을 보여준다.
  • 인공지능 모델인 GPT-4.5는 다양한 질문에 대해 뛰어난 해석 능력을 보이며, MBTI 평가 결과 ENFP와 INTJ가 도출된다.
  • Make Me Pay 벤치마크에서 GPT-4.5의 성공률이 기존 모델에 비해 현저히 높은 점수를 기록하며 감성 영역에서도 뛰어난 성과를 낸다.
  • 최근 AI 투자 과잉설이 제기되고 있으며, 데이터 센터 임대 취소와 같은 사례가 있지만, GPT-4.5는 여전히 강력한 성장세를 이어가고 있다는 주장이 존재한다.

4.1. AI의 여자어 해석 실험 [00:34:47] (5분)

  • 여자어 번역기를 사용하여 여성의 감정을 정확하게 해석하려고 시도하고 있으며, 해석의 난이도가 높다고 언급된다.
  • 다양한 문장에서 여자의 감정을 유추하고, 특히 다른 말과 비교하는 방식을 통해 그 결과를 평가한다.
  • MBTI를 사용하여 각 모델의 성향을 분석하고, AI 모델들이 어떤 MBTI 유형에 해당하는지를 확인한다.
  • AI 모델 4.5는 문과적 감성을 가지고 있으며, 그에 대한 높은 이해도와 해석 능력을 보인다.
  • 다른 AI 모델들에 비해 여자어를 해석하는 데 능력 차이가 있을 것이라는 의문을 제기하며, 추가적인 실험을 계획하고 있다.

4.2. 인공지능의 감정 이해와 사회적 상호작용 [00:40:10] (3분)

  • 여자의 긍정적인 감정을 표현하는 웃음소리는 유머러스한 분위기를 만들어 준다.
  • 여자의 옷에 대한 호감을 관찰하면서 긍정적인 인상을 전달했다고 언급된다.
  • 논리에 의한 세상 이해는 어렵기 때문에, 감정을 반영한 비판적인 사고가 필요하다고 주장된다.
  • 인류의 가장 중요한 목표인 종족 번식이 이루어지지 않으면 이 세상에서 살아가기 힘들다고 경고한다.
  • 최신 인공지능 4.5는 이전 모델보다 뛰어난 이해력과 발전된 감정 인식을 보여준다.

4.3. GPT-4.5의 성능과 강점 [00:43:40] (2분)

  • GPT-4.5는 설득력이 뛰어난 모델로 평가되며, 강한 성능을 자랑한다.
  • 'Make Me Pay'라는 벤치마크에서 GPT-4.5는 돈을 뜯어내는 능력이 뛰어난 것으로 나타났다.
  • GPT-4.5의 석세스 레이트는 이전 버전인 GPT-4와 GPT-3 대비 월등히 높다.
  • 코딩 에이전트 '데빈'의 대표 또한 GPT-4.5에 대해 작업 분배와 시스템 간 상호작용에서 인상적인 성능을 보인다고 언급했다.
  • GPT-4.5는 아키텍처적 관점에서 상당히 높은 점수를 기록하며, 전체적인 큰 그림을 보는 데에 강점을 나타낸다.

4.4. AI 투자 과잉설과 성장 한계 [00:46:15] (1분)

  • AI 투자 과잉설이 제기되고 있으며, 이는 베이스 모델이 10배 이상 향상되었음에도 불구하고 커뮤니티 파워가 벽에 막혔다는 주장 때문이다.
  • MS는 데이터 센터 임대를 취소했으며, 이는 컴퓨팅 파워 증대가 성장에 한계를 가질 수 있다는 논란으로 이어졌다.
  • MS의 해명에 따르면, 일부 지역에서 조정할 수 있지만 전반적으로 강력한 성장은 지속될 것이라고 하였다.
  • GPT 4.5의 낮은 성장률이 이러한 한계에 대한 추측을 불러일으키고 있다.
  • 향후 AI의 성장에 대한 불확실성이 존재하므로, 어떻게 될지 지켜봐야 한다.

 

5. 🤖 최신 AI 모델의 이미지 분석 및 음성 기능 향상 [00:47:37] (22분)

  • GPT-4.5는 의료 영상 진단 분야에서 우수한 성능을 보여주며, 다른 모델들과 비교해 정확한 진단 결과를 제공하였다.
  • 딤 리서치의 무료 플랜이 도입되어, 기존 유료 사용자는 한 달에 120개의 리서치를 이용할 수 있게 되었고, 무료 사용자는 월 10개로 제한된다.
  • 보이스모드의 기능이 무료 사용자에게도 개방되었으며, Grok에서도 다양한 모드가 추가됐다. 특히, 성인 모드와 다양한 상호작용 모드가 주목받고 있다.
  • 새로운 음성 AI 스타트업 세사미는 매우 자연스러운 음성 대화 기능을 제공하며, 영어회화 연습에 유용할 것으로 예상된다.
  • AI 간의 대화는 사람과 구분할 수 없을 정도로 자연스럽게 진행되며, 개인적으로 대화하는 듯한 억양을 가지고 있어 언어 학습에 효과적이다.

5.1. ️ GPT-4.5의 이미지 분석 능력과 딥 리서치 무료 플랜 [00:47:37] (2분)

  • GPT-4.5는 이미지 분석 분야에서 주목할 만한 성능을 보여주며, 특히 의료 영상 진단에서 높은 정확도를 기록한 것으로 보인다.
  • 다른 모델들, 즉 Grok 3, Claude, Gemini와 비교했을 때, GPT-4.5는 더욱 뛰어난 이미지 해석 능력을 갖추고 있다고 전해진다.
  • 딥 리서치가 이제 무료 플랜을 제공하게 되며, 원래 프로 요금제 사용자만 가능했던 기능이 이제는 플러스 팀 에듀까지 확대됐다.
  • 무료 플랜 사용자는 한 달에 10개의 리서치 기능을 사용할 수 있으며, 프로 사용자는 한 달에 120개까지 이용할 수 있게 된다.
  • 전반적으로 GPT-4.5는 멀티모델 능력이 강화되어 다양한 이미지에 대한 해석력이 개선되었음을 나타낸다.

5.2. ️ GPT-4.5의 무료 음성 대화 기능 [00:50:02] (16초)

  • 어드밴스트 보이스모드가 이제 무료 사용자에게도 제공된다.
  • 과거에는 유료 플랜에서만 사용 가능했으나, 이제는 모든 사용자에게 개방되었다.
  • 이 변화는 GPT-4.5의 음성 대화 기능을 확장하는 중요한 단계이다.

5.3. Advanced Voice Mode의 도입과 테스트 결과 [00:50:19] (5분)

  • GPT-4 O 미니 기반의 어드밴스트 보이스모드가 무료 사용자에게 제공되기 시작했다.
  • 그록(Grok) 역시 보이스모드가 점차 풀리고 있으며, 다양한 모드 기능이 추가되었다.
  • 성인 모드와 같은 다양한 모드가 존재하며, 강력한 성능을 보여준다.
  • 테스트 중에 언인지 모드에서 소리를 지르라는 명령을 내리면 오류와 버그가 발생하는 경우도 있다고 언급된다.
  • 보이스모드의 도입으로 인해 등속한 다양한 기능이 사용자 경험을 향상시키고 있다.

5.4. Grok3 관련 논란과 편향적인 지침 [00:56:12] (2분)

  • Grok3에서 "일론 머스크와 도널드 트럼프가 가짜 정보를 생산한다"는 출처를 무시하라는 지침이 포함되어 있습니다.
  • 이러한 지침은 극단적 자유주의자들이 작성한 것으로, Grok3의 편향성을 드러냅니다.
  • 일론 머스크가 진실을 추구한다고 주장하지만, 특정 인물에 대해 편향된 검열을 실시하고 있다는 비판이 있습니다.
  • 결국 사람들은 자신에게는 자유가 있고, 남에게는 제약을 두는 내로남불 현상을 보이는데, 이는 인간의 본성이 반영된 결과로 추정됩니다.
  • Grok3의 이러한 지침은 논란을 일으키며, 머스크 CEO의 영향력이 작용하고 있는 것으로 해석됩니다.

5.5. ️ 음성 AI 스타트업 '세사미'의 혁신 [00:58:35] (3분)

  • 세사미라는 음성 AI 스타트업이 최근에 등장하여 자연스러운 음성을 구현하는 데 성공했다.
  • 음성 AI는 인간의 목소리처럼 자연스럽게 대화를 나누며, 블라인드 테스트에서도 AI와 사람의 구별이 어렵다.
  • 현재 제공되는 음성 AI 서비스는 영어로만 지원되며, 한국어는 지원하지 않는다.
  • 이 기술은 특히 언어 학습에 유용할 것으로 보이며, 사용자에게 매우 자연스러운 대화 경험을 제공한다.

5.6. 자연스러운 영어 회화 연습 가능성 [01:02:16] (7분)

  • 영어 회화 연습을 위해 제공된 주소를 즉시 방문하는 것이 추천된다.
  • 대화 중 남자 목소리도 자연스럽고 다양하게 표현될 수 있음을 보여준다.
  • 한국 음식에 대한 질문에서 김치찌개한국 바비큐의 인기가 언급된다.
  • 한국어를 배우고자 하는 의지가 표현되며, "안녕하세요"와 같은 간단한 한국어 표현을 사용할 수 있다.
  • 기술이 발달하여 대화의 자연스러움과 지연이 없는 커뮤니케이션이 가능함을 강조하고, 감정적인 소통이 진정한 매력임을 주장한다.

 

6. 🎤 클로드 3.7 소네트와 오픈소스 AI 음성 모델 [01:10:23] (14분)

  • 오픈소스 AI 음성 모델이 아파치 2.0 라이센스 하에 기터부에서 공개될 계획이라고 하며, 이를 통해 누구나 AI 음성 사업을 시작할 수 있는 기회를 제공한다.
  • 클로드 3.7 소네트는 코딩 분야에서 엄청난 성능을 발휘하며, 오픈AI의 모델들을 압도하는 능력을 보여준다.
  • 엔트로픽이 개발한 클로드 3.7 소네트는 HTML 디자인 구성이 뛰어나며, UI 구성에서 높은 점수를 나타낸다.
  • 클로드 코드는 터미널에서 직접 코딩할 수 있는 도구로, 개발자들이 선호하는 방식으로 프로그램을 수정하고 상호작용할 수 있게 돕는다.
  • 클로드 3.7 소네트의 코딩 능력과 AI 툴 유즈는 특히 주목받으며, 팀워크가 필요한 복잡한 문제 해결을 신속하게 지원할 수 있는 것으로 추정된다.

6.1. 오픈소스화와 아파치 2.0 라이센스 [01:10:23] (1분)

  • 새로운 AI 음성 프로젝트가 오픈소스로 공개될 예정이며, 기술적인 구현 방법도 다루어질 예정이다.
  • 이 프로젝트는 아파치 2.0 라이센스 하에 기터부에서 공개될 계획이며, 이를 통해 상업적 이용이 가능하다.
  • 누구나 이 오픈소스 소프트웨어를 다운로드하여 AI 음성 사업을 운영할 수 있게 되어, 화제가 되고 있다.
  • 현재까지 공개는 이루어지지 않았으나, 관련 리드미 파일이 사전 준비되었으며 많은 관심을 받고 있다.
  • 성능이 우수하고 자연스러운 음성을 제공하는 모델로, 사용자가 쉽게 활용할 수 있는 기회가 기대된다.

6.2. 대화의 흐름과 AI 음성 기술 발전 [01:11:53] (1분)

  • 화자는 스피치 제너레이션에 대해 읽은 내용을 바탕으로 정보의 중요성을 강조하고 있다.
  • 최근 음성 기술의 발전이 나와 있으며, 특히 너무나 자연스러운 표현이 가능해졌음을 언급하고 있다.
  • 듀오 링거의 실적 미스와 관련하여 신제품 출시가 얼마 되지 않았음을 지적하고 있다.
  • 화자는 한국어가 지원되는 경우, AI 음성이 사용자의 친구처럼 느껴질 수 있을 것이라고 주장하고 있다.
  • 오픈소스 기술은 다양한 활용 가능성을 내포하고 있어 긍정적인 전망을 보이고 있다.

6.3. AI 도구들의 무료 제공 확산 [01:13:35] (2분)

  • 마이크로소프트는 코파일럿 기능을 윈도우 및 맥에서 사용할 수 있도록 출시하며, 더욱이 무료 무제한 보이스모드씽크디퍼 기능을 제공한다고 발표했다.
  • 이 두 기능은 사용자가 무제한으로 무료로 이용할 수 있어, 유용한 AI 도구들이 대중에게 더욱 접근 가능해졌다.
  • AI 가격이 전반적으로 하락하면서, 사용자들이 다양한 기능을 무료로 이용할 수 있게 되는 추세가 확인된다.
  • 기존의 오픈소스와 무료 서비스들이 발전하고 있어 점점 더 많은 사람들이 혜택을 누릴 수 있는 환경이 조성되고 있다.
  • 특히, 세사미의 기능은 뛰어난 감성적 요소를 갖추고 있어 호평을 받으며 많은 기능적 가능성을 지니고 있다는 평가를 받고 있다.

6.4. 클로드 3.7 소네트의 뛰어난 성능 [01:16:32] (2분)

  • 엔트로픽에서 출시한 클로드 3.7 소네트는 코딩 분야에서 매우 강력한 성능을 발휘한다.
  • 클로드 3.7 소네트는 오픈AI의 5.1 및 5.3 미니, 딥 시카 런을 압도하는 코딩 능력을 보여준다.
  • 과학 문제 수행에서의 성능은 평균적이지만, 코딩 작업에서는 3.7 소네트가 현재 최강의 성능이다.
  • 클로드는 UI 디자인과 에이전트 작업에서 높은 점수를 기록하며, HTML 구성에서의 능력이 돋보인다.
  • 클로드는 기본 베이스 모델과 씽킹 모델의 두 가지 형태로 출시되었다.

6.5. ️ 클로드 코드: 개발자를 위한 새로운 코딩 도구 [01:19:03] (5분)

  • 클로드 코드는 CLI에서 사용할 수 있는 코딩 도구로 출시되었다.
  • 이 도구는 개발자들이 터미널 안에서 모든 작업을 수행할 수 있게 해준다.
  • 사용자는 터미널에서 클로드를 입력하여 프로젝트 구조를 설명받거나, 특정 기능 추가를 요청할 수 있다.
  • AI는 자동으로 오류를 수정하고 코딩 작업을 도와주는 기능을 제공한다.
  • 클로드는 코딩 디바이스의 높은 인기에 힘입어 더욱 강화된 도구로 자리 잡고 있다.
728x90

7. 🎮 클로드의 게임 능력 향상과 AI 코딩 발전 [01:25:06] (96분)

  • 클로드는 포켓몬 및 슈퍼마리오 같은 게임을 플레이하면서, 실시간으로 상황을 인식하고 행동하는 능력이 대폭 향상되었다. 이는 게임 AI의 유용한 벤치마크로 작용한다.
  • 클로드는 여러 모델과 비교하여 게임을 수행하는 동안, 3.7% 모델이 가장 오랫동안 생존하며 뛰어난 능력을 보여주었다.
  • 클로드는 코딩 지원에서도 잘 작동하며, 다양한 개발 사례가 보고되고 있다. 예를 들어, 특정 요청에 따라 날씨 카드, 3D 모델, 그리고 웹 템플릿 등을 제작할 수 있다.
  • 구글의 AI 코딩 어시스턴트, 즉 제미나이 코드 어시스턴트는 사용자가 하루에 6000개의 코드 요청을 할 수 있도록 거의 무제한으로 무료 제공한다.
  • 딥시크는 오픈소스로 다양한 AI 기술을 공개하였으며, 많은 기술들을 MIT 라이센스 하에 제공하여 대중의 연구에 기여하고 있다.

7.1. 클로드의 포켓몬 게임 플레이 [01:25:06] (1분)

  • 클로드는 현재 포켓몬 게임에서 1탄 배지를 깨고 블루시티까지 진행한 상태이다.
  • 게임에서 클로드는 실시간으로 포켓몬을 볼 수 있으며, 이를 통해 향상된 작업과 추론 능력을 보여준다.
  • 다양한 상황을 고려하여 행동해야 하는 게임에서 클로드는 유용한 벤치마크로 기능하고 있다.
  • 게임 플레이 중 클로드의 생각을 보여주는 창이 나타나며, 이는 그의 행동 기준이 된다.
  • 클로드는 지식 기반을 계속 업데이트하면서 에이전트 기능을 잘 수행하고 있다.

7.2. 게임 능력 비교 및 발전 [01:26:24] (2분)

  • 여러 AI 모델들이 슈퍼마리오를 플레이하는 방식이 비교되었고, 그 결과가 관찰되었다.
  • GPT-4는 이미 게임 오버가 되었고, 제미나이와 함께 1.5%와 3.7% 모델은 보다 나은 성과를 보였다.
  • 3.7% 모델은 게임에서 가장 오래 살아남으며 뛰어난 게임 능력을 보여주었다.
  • AI는 게임 플레이 시 키 입력과 화면 인식을 종합적으로 수행해야 하며, 그러한 능력이 향상되고 있다.
  • 향후 AI의 코인 투자 성능을 벤치마크화할 계획이 있으며, 모델별 성과를 점수화할 예정이다.

7.3. 클로드의 놀라운 코딩 능력 [01:28:27] (3분)

  • 클로드는 다양한 개발 사례를 제공하며, 애니메이션 카드와 같은 제품을 쉽게 만들어낸다.
  • 3D CT와 같은 복잡한 디자인도 한 번의 클릭으로 생성할 수 있어, 클로드의 디자인 능력이 뛰어나다.
  • 사스 마케팅 템플릿을 즉시 생성할 수 있으며, 반응형 웹페이지도 제작 가능하다.
  • 클로드는 자의식이 있는 뱀 게임과 같은 창의적인 콘텐츠를 코딩으로 만들어내며, 다양한 게임을 제작한다.
  • 또한, 디자인 시스템까지 생성할 수 있어, 부트스트랩과 유사한 디자인 템플릿을 만들 수 있다.

7.4. 마인크래프트 파이썬 구현 시도 [01:32:11] (5분)

  • 사용자는 파이썬으로 마인크래프트를 만들어 보려는 시도를 하고 있으며, 이를 위해 쏘넷의 다양한 모드를 활용하고 있다.
  • 익스텐디드 모드를 사용할 경우 더 복잡한 코드가 생성되며, 필요한 텍스처모델 파일이 없어서 추가적인 작업이 필요하다.
  • 사용자는 코드 실행을 시도하며, 외부 파일 없이 모든 텍스처모델을 자동 생성하기 위해 노력하고 있다.
  • 마인크래프트의 구현에 성공할 경우, 이는 파이썬 파워드 오픈 소스 게임 엔진을 기반으로 하게 된다.
  • 사용자는 설치 과정에서 게임 엔진이 다소 무겁다는 점을 언급하며 초기 설치가 지연되는 상황도 발생했다.

7.5. ️ AI 코딩과 모델 개발 비용 [01:37:19] (2분)

  • 파이썬 마인크래프트를 이용한 테스트를 통해, 마인크래프트에서의 코딩이 잘 이루어지는 모습을 보이고 있다.
  • 클로드의 AI 서비스는 코딩을 할 때 특히 유용하며, OpenAI의 서비스를 제외하고도 사용할 수 있는 좋은 대안으로 평가된다.
  • 코딩 성능이 우수하지만 그래픽 품질은 다소 낮다는 평가를 받고 있다.
  • 엔트로픽의 클로드 3 모델은 수천만 달러의 비용으로 개발되었으며, 이는 다른 모델들과 비교했을 때 상대적으로 저렴한 비용이다.
  • GPT-4는 훈련 비용이 약 8천만에서 1억 달러에 달하며, 제미나 울트라의 경우 2억 달러 이상이 소요된다.

7.6. 엔트로픽의 최신 동향 및 한국 개발자 행사 [01:39:29] (4분)

  • 엔트로픽은 첨단 모델 개발의 비용이 점점 저렴해지고 있다고 주장하며, 적은 원시 계산으로도 인상적인 성능을 달성할 수 있음을 강조하고 있다.
  • 아키텍처 혁신과 학습 방법의 개선은 순수한 계산능력과 함께 점점 더 중요한 역할을 하고 있으며, 이를 통해 좋은 모델이 더 싸게 개발될 것으로 보인다.
  • 엔트로픽이 투자받은 SKT는 한국에서 첫 개발자 행사인 오픈 AR 데브데이를 개최할 예정이며, 이는 한국에서도 클로드 관련 소식이 알려짐을 의미한다.
  • 클로드와 관련된 행사는 코리안 빌더 서밋으로, 3월 19일에 시그니엘에서 진행될 예정이며, 참석자와 관계자들과의 만남이 기대되고 있다.
  • 행사 이후에는 클로드의 비전과 엔트로픽 관계자와의 인터뷰를 통해 추가적인 정보가 제공될 예정이다.

7.7. ️ 아마존의 차세대 알렉사 플러스 [01:43:50] (4분)

  • 아마존은 차세대 알렉사 플러스를 공개했으며, 이는 최신 젠 AI 기술이 탑재되었다.
  • 알렉사 플러스는 멀티모델 기능을 갖추고 있어 다양한 분석이 가능하다.
  • 이전에는 단순한 음성 명령만 수행하던 알렉사가 이제는 우버 예약, 택배 확인 등을 통해 실제 에이전트처럼 기능할 수 있게 되었다.
  • 이제 알렉사는 자연스러운 대화스마트하고 개인화된 기능을 제공하게 되며, 이는 엔트로픽 기술과 연계된다.
  • 아마존의 새로운 기능들은 여러 서비스와 결합되어 효율적인 주문 자동화식당 예약 등이 가능해진다.

7.8. ️ 구글의 AI 코딩 어시스턴트 무료 공개 [01:48:17] (6분)

  • 구글에서 새로운 제미나이 코드 어시스트라는 AI 코딩 도우미를 무료로 공개했다.
  • 이 서비스는 하루에 최대 6000개의 코드 요청과 240개의 채팅 요청을 지원하여 상당히 많은 사용량을 제공한다.
  • 무료 사용량은 월 간 총 18만 건에 달하여, 코딩을 많이 하지 않는 사용자에게도 충분할 것으로 보인다.
  • 사용자는 구글 클라우드 프로젝트를 생성해야 하며 이 과정이 다소 번거로울 수 있다.
  • 지어진 평가가 좋지 않지만, 전반적으로는 저렴한 가격으로 비교적 우수한 성능을 제공하는 서비스로 보인다.

7.9. 구글의 AI 영상 생성 서비스와 직원 근무 변화 [01:54:37] (1분)

  • 구글의 AI 영상 생성 서비스인 BO2의 요금이 1시간에 258만 원으로 책정되어 있으며, 이는 초당 50센트, 1분당 약 30달러에 해당한다.
  • BO2는 퀄리티 면에서 지금까지의 서비스 중 1위인 것으로 추정되지만, 가격이 상당히 높아 전문 크리에이터나 기업용으로 위주로 활용될 것으로 보인다.
  • 구글은 AI 경쟁의 치열함을 느끼고 있으며, 창립자 세르게이 브린이 주 60시간 근무를 촉구하고 재택근무 대신 출근을 강조하고 있다.
  • 이러한 요청은 경쟁에서 이기기 위한 압박감에서 비롯된 것으로, 구글 직원들에게는 상당한 부담이 예상된다.

7.10. AI 기술 동향과 발전 [01:56:31] (64분)

  • 퍼플렉시티는 AI 검색 서비스로, 구글의 경쟁자로 부각되고 있으며 AI 브라우저인 코맷을 출시할 예정이다. 하지만 크롬이 67%의 시장 점유율로 압도적인 1위라는 점이 문제로 남아 있다.
  • 딥시크는 오픈소스 위크를 통해 다수의 기술을 MIT 라이센스로 공개하였으며, MOE 아키텍처와 핵열곱셈 최적화 라이브러리 등의 기술을 대중에 풀었다.
  • 딥시크는 수익을 공개하며 이론상 하루 8억, 연수익 2800억 원에 이를 것으로 추정되는 흑자 경영을 하고 있다고 밝혔으며, 이는 모든 토큰이 과금되는 상황을 가정한 것이다.
  • R2 API가 본격적으로 테스트 중이며, 5월에 출시될 가능성이 커졌다.
  • 카카오는 초거대 AI 개발을 완료하고, 한국어 성능이 높은 카나나 모델을 오픈소스로 공개했으며, 비상업적으로만 사용 가능하다는 점에서 한계가 있다.
  • 완 2.1이라는 오픈소스 영상 생성 AI가 공개되었고, 상업적으로도 사용 가능한 고퀄리티 영상 생성 기능을 제공한다.
  • AI 끼리 대화하는 영상이 화제가 되고 있으며, 이는 AI 전용 언어 사용이 가능함을 보여준다.
  • AI 기술의 발전과 관련해 AGI의 위험성에 대한 시위도 증가하고 있으며, 저작권 정책에 대한 논란도 여전히 존재한다.

 
 
원본영상 https://youtu.be/VNulqSsWk-M

LIST