2025-03-02 조코딩 IT뉴스 - GPT-4.5, Claude 3.7, Grok 보이스모드, sesame 보이스, 구글, AI 코딩 무료,

IT/AI news&info

2025-03-02 조코딩 IT뉴스 - GPT-4.5, Claude 3.7, Grok 보이스모드, sesame 보이스, 구글, AI 코딩 무료,

soures 2025. 3. 4. 08:54

728x90

본 영상은 최신 IT 뉴스를 빠르고 깊이 있게 전달하며, 특히 GPT-4.5의 특징과 성능, 그리고 세사미(Sesame)의 혁신적인 음성 AI 기술을 집중적으로 다룹니다. GPT-4.5는 문과적 감성, 설득력, 이미지 인식 능력에서 강점을 보이지만, 높은 비용과 투자 과잉 논란이 있습니다. 세사미는 사람과 구별하기 어려울 정도로 자연스러운 음성 AI를 제공하여 영어 회화 연습에 유용합니다. 이 외에도 Grok의 보이스 모드, 구글의 AI 코딩 무료화, Alexa+ 등 다양한 IT 소식을 다루며, AI 기술 트렌드를 따라가는 데 도움을 줍니다. IT 업계의 빠른 변화 속에서 핵심 정보를 얻고 싶다면 이 영상을 시청하세요.

1. 🔍 빠르게 변화하는 IT 트렌드 따라가기 위한 중요성 [00:00:00] (4분)

최신 IT 트렌드를 따라가지 않으면 구시대 유물 같은 기술을 사용하게 될 수 있다.
새로운 기술을 빠르게 배우고 적용하는 것이 효율이 좋다.
트렌드를 파악하면 생산성이 높아지고, 필요한 순간에 적절히 활용할 수 있다.
최신 AI 흐름을 놓치면 생산성 격차가 커질 수 있다는 우려가 있다.
매주 요약된 IT 뉴스를 통해 트렌드를 쫓아가는데 도움이 될 수 있다.

2. 📰 샘 알트만의 가족 소식과 AI 보안 변화 [00:04:10] (11분)

오픈AI의 CEO 샘 알트만이 대리모를 통해 득남한 사실이 알려졌으며, 그의 결혼식 및 가족 관련 소식은 많은 사람들에게 바이럴되었다.
알트만은 자녀를 위해 병원에 가는 등 AI 개발에 조금 더딜 수 있다는 우려가 제기되었고, 이로 인해 굉장히 중요한 일이 되었다.
애플이 영국 정부의 백도어 설치 요청을 거부한 후, 아이클라우드의 암호화를 완전히 제거한 결정은 사용자 개인정보에 대한 큰 변화를 초래하였다.
암호화가 해제됨으로써 애플은 영국 사용자들의 데이터를 직접 접근하여 볼 수 있게 되었고, 이는 출처를 요구받을 경우 정보를 제공할 수 있는 새로운 경로를 열어주었다.
이 변화는 정부의 요구에 응답할 수 있는 방법을 제공하는 동시에, 사용자 정보 보호에 대한 신뢰성 저하를 가져올 수 있는 우려를 낳았다.

2.1. 샘 알트만의 득남 소식 [00:04:10] (3분)

오픈 AI의 CEO 샘 알트만이 남편과 결혼 후 득남을 했다. 이 소식은 빠르게 퍼졌고 축하의 메시지가 이어졌다.
샘 알트만은 대리모를 통해 아기를 낳은 것으로 알려졌으며, 남편이 두 명인 상황에서도 가능한 가정 형태에 대한 논의가 이루어졌다.
득남 소식으로 인해 샘 알트만이 AGI보다 개인적인 일이 더 중요하다는 점이 강조되었으며, 이로 인해 오픈 AI의 일정에도 영향이 있을 것으로 추정된다.
샘의 아기가 태어남에 따라 금전적 부담이 커질 것이라는 의견이 있으며, 이는 AI 프로젝트에도 영향을 줄 수 있다.
GPT 4.5의 가격이 30배나 인상될 예정이라는 소식이 전해졌으며, 이에 대한 논의가 필요하다.

2.2. 인스타그램 릴스 독립 앱과 애플의 다양성 프로그램 [00:07:22] (1분)

인스타그램의 릴스가 독립적인 앱으로 출시될 가능성이 있으며, 이는 틱톡의 자리 를 대체할 수도 있다.
애플은 다양성 프로그램을 통해 유색 인종을 더 우대하는 채용 정책을 시행 중이며, 이는 논란을 일으켰다.
트럼프의 영향으로 많은 기업들이 다양성 프로그램을 폐지하고 있으며, 구글도 이 같은 조치를 취한 사례가 있다.

2.3. ️ 애플의 정치적 발언과 논란 [00:09:01] (2분)

애플이 인종차별주의자라는 발언에 대해 자동으로 트럼프라는 이름으로 표기된 사건이 있었다. 이는 음성적 유사성 때문으로 추정된다.
이 사건으로 인해 트럼프가 분노했으며, 애플의 DEI(다양성 프로그램)에 대한 비판이 제기되었다.
애플이 정치적 발언에 있어 위험한 선택을 했으며, 이는 기업에 부정적인 영향을 미칠 수 있다.
구글은 관련 프로그램을 폐지한 반면, 애플은 이를 유지한다고 밝혔으며, 이는 기업의 생존에 영향을 미칠 수 있다.
이 사건은 애플의 향후 정치적 상황을 지켜보는 데 흥미로운 요소로 작용할 가능성이 있다.

2.4. 애플의 아이클라우드 암호화 정책 변화 [00:11:17] (1분)

애플은 아이폰의 채찍PT와 구글 재미나이를 연동하여 다양한 AI 기능을 포함하려는 노력을 하고 있다.
영국 정부는 애플에 아이클라우드에 암호화 백도어를 삽입할 것을 명령했으나, 애플은 이를 받아들일 수 없다고 밝혔다.
최근에 애플은 놀랍게도 영국 사용자를 위한 아이클라우드의 암호화를 완전히 제거한 것으로 전해졌다.

2.5. 애플의 암호화 해제와 개인 정보 접근 [00:12:45] (3분)

애플은 종단간 암호화로 보호되던 정보를 해제하여, 영국 정부가 요구할 경우 사용자의 데이터를 볼 수 있는 환경을 마련했다.
해제된 암호화 때문에, 애플 직원은 영국 사람들의 개인 정보, 즉 사진, 연락처 등 아이클라우드에 저장된 내용을 모두 접근할 수 있게 된다.
정부 요구 시 백도어를 만드는 대신, 암호화를 제거하여 애플 직원들이 직접 데이터를 보고 제공할 수 있는 방식을 선택했다.
이 결정은 백도어가 설치되면 신뢰성이 하락할 수 있다는 점을 고려하여 강력한 암호화를 제거한 결과로 분석된다.
결국, 애플의 새로운 접근은 사용자의 개인 정보를 정부에 제출할 수 있는 경로를 열어준 것으로 이해된다.

3. 📊 GPT 4.5 모델의 성능 및 가격 분석 [00:15:53] (18분)

GPT 4.5는 베이스 모델로 공개되었지만, 이전 추론 모델에 비해 과학 및 수학에서 성능이 크게 저하되었다.
감성적인 대화 능력은 향상되었으며, "사려 깊은 사람과 대화하는 느낌"을 준다는 평가가 있다.
API 가격이 1밀리언 토큰 기준으로 75달러로 설정되어, 이전 모델보다 30배 비쌌다.
현재 오픈AI의 데이터 공유 옵션을 통해 하루 11만 토큰을 무료로 제공받을 수 있으며, 최대 1억 4천만원까지의 혜택을 누릴 수 있다.
일론 머스크가 Grok의 성능이 개선되고 있다고 언급하며, GPT 4.5의 성능이 그렇게 뛰어나지 않다고 평가하고 있다.

3.1. 데이터 보안과 개인 정보 유출 문제 [00:15:53] (4분)

영국의 보안이 해킹에 취약해지면서, 개인정보 유출 사건이 발생하고 있으며, 이는 정치적인 배경과 관련이 있을 수 있다.
개인 정보 유출 사건으로 인해 사업자 두 곳이 과징금을 부과받았으며, 이들은 SQL 인젝션 공격에 걸렸다고 한다.
SQL 인젝션 공격은 기본적인 공격 방식으로, 사용자가 입력 창에 쿼리를 삽입해 데이터베이스를 파악할 수 있게 해준다.
최근의 보안 문제는 개인 정보가 공공재로 전락하는 상황을 초래하고 있으며, 매주 유사한 사건이 발생하고 있다.
스택오버플로우는 Q&A 플랫폼의 변화를 겪고 있으며, 블로그나 교육자료 등 다양한 콘텐츠 제공으로의 확장을 목표로 하고 있으나, 사용자 트래픽 감소가 우려된다.

3.2. AI 뉴스 소개를 위한 준비 [00:20:28] (58초)

발표자는 변화를 응원하며 긍정적인 메시지를 전달하고 있다.
발표자는 AI 뉴스로 넘어가기 전에 잠시 물을 마시겠다고 언급한다.
발표자는 물을 마시는 과정에서 사과의 말을 전한다.
발표자는 물을 마신 후 AI 뉴스 세션을 진행하겠다고 다짐한다.

3.3. GPT-4.5 모델의 특징 및 성과 [00:21:27] (4분)

GPT-4.5는 오픈 AI에서 공개된 최신의 베이스 모델로, 이전의 추론 모델과는 다른 접근 방식을 보여준다.
벤치마크 점수에서 심플 QA 부분은 향상되었지만, 과학과 수학 능력은 O3 미니 모델에 비해 상당히 떨어진다.
소프트웨어 엔지니어링 테스트에서는 점수가 높아, 프리랜서 코딩 작업 분야에서의 성과를 보여준다.
해당 모델은 문과적인 성향이 강화되었으며, 감성적인 소통 능력이 발전하여 사용자와의 대화의 질이 개선되었다.
프로그램 관리(PM) 역량이 코딩 능력보다 중요하게 작용하는 것으로 나타났으며, 이로 인해 성과가 좋았던 것으로 추정된다.

3.4. GPT-4.5 API 가격과 혜택 [00:25:37] (4분)

GPT-4.5 모델 가격은 75달러로, 이전 베이스 모델보다 약 30배 비쌉니다.
다양한 모델들과 비교했을 때, 기존의 5원 모델은 15달러로, GPT-4.5는 5배 더 비쌉니다.
오픈AI는 하루에 11만 토큰을 무료로 제공하며, 해당 기간은 4월 30일까지 연장되었습니다.
무료로 제공되는 토큰을 활용하면, 한 달에 최대 7천만원, 두 달 동안 최대 1억 4천만원의 가치를 얻을 수 있습니다.
데이터 컨트롤을 통해 무료 혜택을 받을 수 있으며, 특정 티어 이상의 유저만 해당 혜택을 누릴 수 있는 것으로 추정됩니다.

3.5. GPT-4.5 모델 평가 및 기능 테스트 [00:30:23] (4분)

GPT-4.5는 베이스 모델로서 다른 모델들에 비해 성능이 다소 떨어진다는 평가가 있다. 특히 Grok 모델과 비교했을 때 벤치마크 점수가 낮게 나오고 있다.
그러나 GPT-4.5는 기본 모델에서 출혼 모델로 발전할 가능성이 있으며, 이러한 발전이 긍정적인 전망을 제시한다.
감성적인 대화 측면에서는 이전 모델보다 개선된 점이 있을 것으로 추정되며, 그 성능을 직접 테스트해보는 과정이 진행되었다.
테스트 결과, GPT-4.5는 논리 문제나 수학 문제와 같은 추론이 필요한 질문을 처리하는 데 어려움을 겪는 반면, 감성적인 질문에 대해 잘 반응하는 모습을 보여주었다.
예를 들어, 감성적인 질문인 '여자친구가 가장 화난 대사'를 맞추는 데 있어 AI는 감정 표현의 뉘앙스를 잘 해석하는 능력을 보였다.

4. 🗣️ 여자어 해석과 인공지능 능력 테스트 [00:34:47] (12분)

여자어 사전을 기반으로 하여 다양한 문장을 해석하고 문제를 만드는 방식이 흥미롭다. 특히 OCR 기능을 활용하여 텍스트 작업을 진행한다.
여자어 해석 결과에 따른 감정 표현이 매우 중요하며, 특정 문장들이 어떻게 해석되는지를 통해 실질적인 소통이 가능함을 보여준다.
인공지능 모델인 GPT-4.5는 다양한 질문에 대해 뛰어난 해석 능력을 보이며, MBTI 평가 결과 ENFP와 INTJ가 도출된다.
Make Me Pay 벤치마크에서 GPT-4.5의 성공률이 기존 모델에 비해 현저히 높은 점수를 기록하며 감성 영역에서도 뛰어난 성과를 낸다.
최근 AI 투자 과잉설이 제기되고 있으며, 데이터 센터 임대 취소와 같은 사례가 있지만, GPT-4.5는 여전히 강력한 성장세를 이어가고 있다는 주장이 존재한다.

4.1. AI의 여자어 해석 실험 [00:34:47] (5분)

여자어 번역기를 사용하여 여성의 감정을 정확하게 해석하려고 시도하고 있으며, 해석의 난이도가 높다고 언급된다.
다양한 문장에서 여자의 감정을 유추하고, 특히 다른 말과 비교하는 방식을 통해 그 결과를 평가한다.
MBTI를 사용하여 각 모델의 성향을 분석하고, AI 모델들이 어떤 MBTI 유형에 해당하는지를 확인한다.
AI 모델 4.5는 문과적 감성을 가지고 있으며, 그에 대한 높은 이해도와 해석 능력을 보인다.
다른 AI 모델들에 비해 여자어를 해석하는 데 능력 차이가 있을 것이라는 의문을 제기하며, 추가적인 실험을 계획하고 있다.

4.2. 인공지능의 감정 이해와 사회적 상호작용 [00:40:10] (3분)

여자의 긍정적인 감정을 표현하는 웃음소리는 유머러스한 분위기를 만들어 준다.
여자의 옷에 대한 호감을 관찰하면서 긍정적인 인상을 전달했다고 언급된다.
논리에 의한 세상 이해는 어렵기 때문에, 감정을 반영한 비판적인 사고가 필요하다고 주장된다.
인류의 가장 중요한 목표인 종족 번식이 이루어지지 않으면 이 세상에서 살아가기 힘들다고 경고한다.
최신 인공지능 4.5는 이전 모델보다 뛰어난 이해력과 발전된 감정 인식을 보여준다.

4.3. GPT-4.5의 성능과 강점 [00:43:40] (2분)

GPT-4.5는 설득력이 뛰어난 모델로 평가되며, 강한 성능을 자랑한다.
'Make Me Pay'라는 벤치마크에서 GPT-4.5는 돈을 뜯어내는 능력이 뛰어난 것으로 나타났다.
GPT-4.5의 석세스 레이트는 이전 버전인 GPT-4와 GPT-3 대비 월등히 높다.
코딩 에이전트 '데빈'의 대표 또한 GPT-4.5에 대해 작업 분배와 시스템 간 상호작용에서 인상적인 성능을 보인다고 언급했다.
GPT-4.5는 아키텍처적 관점에서 상당히 높은 점수를 기록하며, 전체적인 큰 그림을 보는 데에 강점을 나타낸다.

4.4. AI 투자 과잉설과 성장 한계 [00:46:15] (1분)

AI 투자 과잉설이 제기되고 있으며, 이는 베이스 모델이 10배 이상 향상되었음에도 불구하고 커뮤니티 파워가 벽에 막혔다는 주장 때문이다.
MS는 데이터 센터 임대를 취소했으며, 이는 컴퓨팅 파워 증대가 성장에 한계를 가질 수 있다는 논란으로 이어졌다.
MS의 해명에 따르면, 일부 지역에서 조정할 수 있지만 전반적으로 강력한 성장은 지속될 것이라고 하였다.
GPT 4.5의 낮은 성장률이 이러한 한계에 대한 추측을 불러일으키고 있다.
향후 AI의 성장에 대한 불확실성이 존재하므로, 어떻게 될지 지켜봐야 한다.

5. 🤖 최신 AI 모델의 이미지 분석 및 음성 기능 향상 [00:47:37] (22분)

GPT-4.5는 의료 영상 진단 분야에서 우수한 성능을 보여주며, 다른 모델들과 비교해 정확한 진단 결과를 제공하였다.
딤 리서치의 무료 플랜이 도입되어, 기존 유료 사용자는 한 달에 120개의 리서치를 이용할 수 있게 되었고, 무료 사용자는 월 10개로 제한된다.
보이스모드의 기능이 무료 사용자에게도 개방되었으며, Grok에서도 다양한 모드가 추가됐다. 특히, 성인 모드와 다양한 상호작용 모드가 주목받고 있다.
새로운 음성 AI 스타트업 세사미는 매우 자연스러운 음성 대화 기능을 제공하며, 영어회화 연습에 유용할 것으로 예상된다.
AI 간의 대화는 사람과 구분할 수 없을 정도로 자연스럽게 진행되며, 개인적으로 대화하는 듯한 억양을 가지고 있어 언어 학습에 효과적이다.

5.1. ️ GPT-4.5의 이미지 분석 능력과 딥 리서치 무료 플랜 [00:47:37] (2분)

GPT-4.5는 이미지 분석 분야에서 주목할 만한 성능을 보여주며, 특히 의료 영상 진단에서 높은 정확도를 기록한 것으로 보인다.
다른 모델들, 즉 Grok 3, Claude, Gemini와 비교했을 때, GPT-4.5는 더욱 뛰어난 이미지 해석 능력을 갖추고 있다고 전해진다.
딥 리서치가 이제 무료 플랜을 제공하게 되며, 원래 프로 요금제 사용자만 가능했던 기능이 이제는 플러스 팀 에듀까지 확대됐다.
무료 플랜 사용자는 한 달에 10개의 리서치 기능을 사용할 수 있으며, 프로 사용자는 한 달에 120개까지 이용할 수 있게 된다.
전반적으로 GPT-4.5는 멀티모델 능력이 강화되어 다양한 이미지에 대한 해석력이 개선되었음을 나타낸다.

5.2. ️ GPT-4.5의 무료 음성 대화 기능 [00:50:02] (16초)

어드밴스트 보이스모드가 이제 무료 사용자에게도 제공된다.
과거에는 유료 플랜에서만 사용 가능했으나, 이제는 모든 사용자에게 개방되었다.
이 변화는 GPT-4.5의 음성 대화 기능을 확장하는 중요한 단계이다.

5.3. Advanced Voice Mode의 도입과 테스트 결과 [00:50:19] (5분)

GPT-4 O 미니 기반의 어드밴스트 보이스모드가 무료 사용자에게 제공되기 시작했다.
그록(Grok) 역시 보이스모드가 점차 풀리고 있으며, 다양한 모드 기능이 추가되었다.
성인 모드와 같은 다양한 모드가 존재하며, 강력한 성능을 보여준다.
테스트 중에 언인지 모드에서 소리를 지르라는 명령을 내리면 오류와 버그가 발생하는 경우도 있다고 언급된다.
보이스모드의 도입으로 인해 등속한 다양한 기능이 사용자 경험을 향상시키고 있다.

5.4. Grok3 관련 논란과 편향적인 지침 [00:56:12] (2분)

Grok3에서 "일론 머스크와 도널드 트럼프가 가짜 정보를 생산한다"는 출처를 무시하라는 지침이 포함되어 있습니다.
이러한 지침은 극단적 자유주의자들이 작성한 것으로, Grok3의 편향성을 드러냅니다.
일론 머스크가 진실을 추구한다고 주장하지만, 특정 인물에 대해 편향된 검열을 실시하고 있다는 비판이 있습니다.
결국 사람들은 자신에게는 자유가 있고, 남에게는 제약을 두는 내로남불 현상을 보이는데, 이는 인간의 본성이 반영된 결과로 추정됩니다.
Grok3의 이러한 지침은 논란을 일으키며, 머스크 CEO의 영향력이 작용하고 있는 것으로 해석됩니다.

5.5. ️ 음성 AI 스타트업 '세사미'의 혁신 [00:58:35] (3분)

세사미라는 음성 AI 스타트업이 최근에 등장하여 자연스러운 음성을 구현하는 데 성공했다.
음성 AI는 인간의 목소리처럼 자연스럽게 대화를 나누며, 블라인드 테스트에서도 AI와 사람의 구별이 어렵다.
현재 제공되는 음성 AI 서비스는 영어로만 지원되며, 한국어는 지원하지 않는다.
이 기술은 특히 언어 학습에 유용할 것으로 보이며, 사용자에게 매우 자연스러운 대화 경험을 제공한다.

5.6. 자연스러운 영어 회화 연습 가능성 [01:02:16] (7분)

영어 회화 연습을 위해 제공된 주소를 즉시 방문하는 것이 추천된다.
대화 중 남자 목소리도 자연스럽고 다양하게 표현될 수 있음을 보여준다.
한국 음식에 대한 질문에서 김치찌개와 한국 바비큐의 인기가 언급된다.
한국어를 배우고자 하는 의지가 표현되며, "안녕하세요"와 같은 간단한 한국어 표현을 사용할 수 있다.
기술이 발달하여 대화의 자연스러움과 지연이 없는 커뮤니케이션이 가능함을 강조하고, 감정적인 소통이 진정한 매력임을 주장한다.

6. 🎤 클로드 3.7 소네트와 오픈소스 AI 음성 모델 [01:10:23] (14분)

오픈소스 AI 음성 모델이 아파치 2.0 라이센스 하에 기터부에서 공개될 계획이라고 하며, 이를 통해 누구나 AI 음성 사업을 시작할 수 있는 기회를 제공한다.
클로드 3.7 소네트는 코딩 분야에서 엄청난 성능을 발휘하며, 오픈AI의 모델들을 압도하는 능력을 보여준다.
엔트로픽이 개발한 클로드 3.7 소네트는 HTML 디자인 구성이 뛰어나며, UI 구성에서 높은 점수를 나타낸다.
클로드 코드는 터미널에서 직접 코딩할 수 있는 도구로, 개발자들이 선호하는 방식으로 프로그램을 수정하고 상호작용할 수 있게 돕는다.
클로드 3.7 소네트의 코딩 능력과 AI 툴 유즈는 특히 주목받으며, 팀워크가 필요한 복잡한 문제 해결을 신속하게 지원할 수 있는 것으로 추정된다.

6.1. 오픈소스화와 아파치 2.0 라이센스 [01:10:23] (1분)

새로운 AI 음성 프로젝트가 오픈소스로 공개될 예정이며, 기술적인 구현 방법도 다루어질 예정이다.
이 프로젝트는 아파치 2.0 라이센스 하에 기터부에서 공개될 계획이며, 이를 통해 상업적 이용이 가능하다.
누구나 이 오픈소스 소프트웨어를 다운로드하여 AI 음성 사업을 운영할 수 있게 되어, 화제가 되고 있다.
현재까지 공개는 이루어지지 않았으나, 관련 리드미 파일이 사전 준비되었으며 많은 관심을 받고 있다.
성능이 우수하고 자연스러운 음성을 제공하는 모델로, 사용자가 쉽게 활용할 수 있는 기회가 기대된다.

6.2. 대화의 흐름과 AI 음성 기술 발전 [01:11:53] (1분)

화자는 스피치 제너레이션에 대해 읽은 내용을 바탕으로 정보의 중요성을 강조하고 있다.
최근 음성 기술의 발전이 나와 있으며, 특히 너무나 자연스러운 표현이 가능해졌음을 언급하고 있다.
듀오 링거의 실적 미스와 관련하여 신제품 출시가 얼마 되지 않았음을 지적하고 있다.
화자는 한국어가 지원되는 경우, AI 음성이 사용자의 친구처럼 느껴질 수 있을 것이라고 주장하고 있다.
이 오픈소스 기술은 다양한 활용 가능성을 내포하고 있어 긍정적인 전망을 보이고 있다.

6.3. AI 도구들의 무료 제공 확산 [01:13:35] (2분)

마이크로소프트는 코파일럿 기능을 윈도우 및 맥에서 사용할 수 있도록 출시하며, 더욱이 무료 무제한 보이스모드와 씽크디퍼 기능을 제공한다고 발표했다.
이 두 기능은 사용자가 무제한으로 무료로 이용할 수 있어, 유용한 AI 도구들이 대중에게 더욱 접근 가능해졌다.
AI 가격이 전반적으로 하락하면서, 사용자들이 다양한 기능을 무료로 이용할 수 있게 되는 추세가 확인된다.
기존의 오픈소스와 무료 서비스들이 발전하고 있어 점점 더 많은 사람들이 혜택을 누릴 수 있는 환경이 조성되고 있다.
특히, 세사미의 기능은 뛰어난 감성적 요소를 갖추고 있어 호평을 받으며 많은 기능적 가능성을 지니고 있다는 평가를 받고 있다.

6.4. 클로드 3.7 소네트의 뛰어난 성능 [01:16:32] (2분)

엔트로픽에서 출시한 클로드 3.7 소네트는 코딩 분야에서 매우 강력한 성능을 발휘한다.
클로드 3.7 소네트는 오픈AI의 5.1 및 5.3 미니, 딥 시카 런을 압도하는 코딩 능력을 보여준다.
과학 문제 수행에서의 성능은 평균적이지만, 코딩 작업에서는 3.7 소네트가 현재 최강의 성능이다.
클로드는 UI 디자인과 에이전트 작업에서 높은 점수를 기록하며, HTML 구성에서의 능력이 돋보인다.
클로드는 기본 베이스 모델과 씽킹 모델의 두 가지 형태로 출시되었다.

6.5. ️ 클로드 코드: 개발자를 위한 새로운 코딩 도구 [01:19:03] (5분)

클로드 코드는 CLI에서 사용할 수 있는 코딩 도구로 출시되었다.
이 도구는 개발자들이 터미널 안에서 모든 작업을 수행할 수 있게 해준다.
사용자는 터미널에서 클로드를 입력하여 프로젝트 구조를 설명받거나, 특정 기능 추가를 요청할 수 있다.
AI는 자동으로 오류를 수정하고 코딩 작업을 도와주는 기능을 제공한다.
클로드는 코딩 디바이스의 높은 인기에 힘입어 더욱 강화된 도구로 자리 잡고 있다.

728x90

7. 🎮 클로드의 게임 능력 향상과 AI 코딩 발전 [01:25:06] (96분)

클로드는 포켓몬 및 슈퍼마리오 같은 게임을 플레이하면서, 실시간으로 상황을 인식하고 행동하는 능력이 대폭 향상되었다. 이는 게임 AI의 유용한 벤치마크로 작용한다.
클로드는 여러 모델과 비교하여 게임을 수행하는 동안, 3.7% 모델이 가장 오랫동안 생존하며 뛰어난 능력을 보여주었다.
클로드는 코딩 지원에서도 잘 작동하며, 다양한 개발 사례가 보고되고 있다. 예를 들어, 특정 요청에 따라 날씨 카드, 3D 모델, 그리고 웹 템플릿 등을 제작할 수 있다.
구글의 AI 코딩 어시스턴트, 즉 제미나이 코드 어시스턴트는 사용자가 하루에 6000개의 코드 요청을 할 수 있도록 거의 무제한으로 무료 제공한다.
딥시크는 오픈소스로 다양한 AI 기술을 공개하였으며, 많은 기술들을 MIT 라이센스 하에 제공하여 대중의 연구에 기여하고 있다.

7.1. 클로드의 포켓몬 게임 플레이 [01:25:06] (1분)

클로드는 현재 포켓몬 게임에서 1탄 배지를 깨고 블루시티까지 진행한 상태이다.
게임에서 클로드는 실시간으로 포켓몬을 볼 수 있으며, 이를 통해 향상된 작업과 추론 능력을 보여준다.
다양한 상황을 고려하여 행동해야 하는 게임에서 클로드는 유용한 벤치마크로 기능하고 있다.
게임 플레이 중 클로드의 생각을 보여주는 창이 나타나며, 이는 그의 행동 기준이 된다.
클로드는 지식 기반을 계속 업데이트하면서 에이전트 기능을 잘 수행하고 있다.

7.2. 게임 능력 비교 및 발전 [01:26:24] (2분)

여러 AI 모델들이 슈퍼마리오를 플레이하는 방식이 비교되었고, 그 결과가 관찰되었다.
GPT-4는 이미 게임 오버가 되었고, 제미나이와 함께 1.5%와 3.7% 모델은 보다 나은 성과를 보였다.
3.7% 모델은 게임에서 가장 오래 살아남으며 뛰어난 게임 능력을 보여주었다.
AI는 게임 플레이 시 키 입력과 화면 인식을 종합적으로 수행해야 하며, 그러한 능력이 향상되고 있다.
향후 AI의 코인 투자 성능을 벤치마크화할 계획이 있으며, 모델별 성과를 점수화할 예정이다.

7.3. 클로드의 놀라운 코딩 능력 [01:28:27] (3분)

클로드는 다양한 개발 사례를 제공하며, 애니메이션 카드와 같은 제품을 쉽게 만들어낸다.
3D CT와 같은 복잡한 디자인도 한 번의 클릭으로 생성할 수 있어, 클로드의 디자인 능력이 뛰어나다.
사스 마케팅 템플릿을 즉시 생성할 수 있으며, 반응형 웹페이지도 제작 가능하다.
클로드는 자의식이 있는 뱀 게임과 같은 창의적인 콘텐츠를 코딩으로 만들어내며, 다양한 게임을 제작한다.
또한, 디자인 시스템까지 생성할 수 있어, 부트스트랩과 유사한 디자인 템플릿을 만들 수 있다.

7.4. 마인크래프트 파이썬 구현 시도 [01:32:11] (5분)

사용자는 파이썬으로 마인크래프트를 만들어 보려는 시도를 하고 있으며, 이를 위해 쏘넷의 다양한 모드를 활용하고 있다.
익스텐디드 모드를 사용할 경우 더 복잡한 코드가 생성되며, 필요한 텍스처 및 모델 파일이 없어서 추가적인 작업이 필요하다.
사용자는 코드 실행을 시도하며, 외부 파일 없이 모든 텍스처와 모델을 자동 생성하기 위해 노력하고 있다.
마인크래프트의 구현에 성공할 경우, 이는 파이썬 파워드 오픈 소스 게임 엔진을 기반으로 하게 된다.
사용자는 설치 과정에서 게임 엔진이 다소 무겁다는 점을 언급하며 초기 설치가 지연되는 상황도 발생했다.

7.5. ️ AI 코딩과 모델 개발 비용 [01:37:19] (2분)

파이썬 마인크래프트를 이용한 테스트를 통해, 마인크래프트에서의 코딩이 잘 이루어지는 모습을 보이고 있다.
클로드의 AI 서비스는 코딩을 할 때 특히 유용하며, OpenAI의 서비스를 제외하고도 사용할 수 있는 좋은 대안으로 평가된다.
코딩 성능이 우수하지만 그래픽 품질은 다소 낮다는 평가를 받고 있다.
엔트로픽의 클로드 3 모델은 수천만 달러의 비용으로 개발되었으며, 이는 다른 모델들과 비교했을 때 상대적으로 저렴한 비용이다.
GPT-4는 훈련 비용이 약 8천만에서 1억 달러에 달하며, 제미나 울트라의 경우 2억 달러 이상이 소요된다.

7.6. 엔트로픽의 최신 동향 및 한국 개발자 행사 [01:39:29] (4분)

엔트로픽은 첨단 모델 개발의 비용이 점점 저렴해지고 있다고 주장하며, 적은 원시 계산으로도 인상적인 성능을 달성할 수 있음을 강조하고 있다.
아키텍처 혁신과 학습 방법의 개선은 순수한 계산능력과 함께 점점 더 중요한 역할을 하고 있으며, 이를 통해 좋은 모델이 더 싸게 개발될 것으로 보인다.
엔트로픽이 투자받은 SKT는 한국에서 첫 개발자 행사인 오픈 AR 데브데이를 개최할 예정이며, 이는 한국에서도 클로드 관련 소식이 알려짐을 의미한다.
클로드와 관련된 행사는 코리안 빌더 서밋으로, 3월 19일에 시그니엘에서 진행될 예정이며, 참석자와 관계자들과의 만남이 기대되고 있다.
행사 이후에는 클로드의 비전과 엔트로픽 관계자와의 인터뷰를 통해 추가적인 정보가 제공될 예정이다.

7.7. ️ 아마존의 차세대 알렉사 플러스 [01:43:50] (4분)

아마존은 차세대 알렉사 플러스를 공개했으며, 이는 최신 젠 AI 기술이 탑재되었다.
알렉사 플러스는 멀티모델 기능을 갖추고 있어 다양한 분석이 가능하다.
이전에는 단순한 음성 명령만 수행하던 알렉사가 이제는 우버 예약, 택배 확인 등을 통해 실제 에이전트처럼 기능할 수 있게 되었다.
이제 알렉사는 자연스러운 대화와 스마트하고 개인화된 기능을 제공하게 되며, 이는 엔트로픽 기술과 연계된다.
아마존의 새로운 기능들은 여러 서비스와 결합되어 효율적인 주문 자동화 및 식당 예약 등이 가능해진다.

7.8. ️ 구글의 AI 코딩 어시스턴트 무료 공개 [01:48:17] (6분)

구글에서 새로운 제미나이 코드 어시스트라는 AI 코딩 도우미를 무료로 공개했다.
이 서비스는 하루에 최대 6000개의 코드 요청과 240개의 채팅 요청을 지원하여 상당히 많은 사용량을 제공한다.
무료 사용량은 월 간 총 18만 건에 달하여, 코딩을 많이 하지 않는 사용자에게도 충분할 것으로 보인다.
사용자는 구글 클라우드 프로젝트를 생성해야 하며 이 과정이 다소 번거로울 수 있다.
지어진 평가가 좋지 않지만, 전반적으로는 저렴한 가격으로 비교적 우수한 성능을 제공하는 서비스로 보인다.

7.9. 구글의 AI 영상 생성 서비스와 직원 근무 변화 [01:54:37] (1분)

구글의 AI 영상 생성 서비스인 BO2의 요금이 1시간에 258만 원으로 책정되어 있으며, 이는 초당 50센트, 1분당 약 30달러에 해당한다.
BO2는 퀄리티 면에서 지금까지의 서비스 중 1위인 것으로 추정되지만, 가격이 상당히 높아 전문 크리에이터나 기업용으로 위주로 활용될 것으로 보인다.
구글은 AI 경쟁의 치열함을 느끼고 있으며, 창립자 세르게이 브린이 주 60시간 근무를 촉구하고 재택근무 대신 출근을 강조하고 있다.
이러한 요청은 경쟁에서 이기기 위한 압박감에서 비롯된 것으로, 구글 직원들에게는 상당한 부담이 예상된다.

7.10. AI 기술 동향과 발전 [01:56:31] (64분)

퍼플렉시티는 AI 검색 서비스로, 구글의 경쟁자로 부각되고 있으며 AI 브라우저인 코맷을 출시할 예정이다. 하지만 크롬이 67%의 시장 점유율로 압도적인 1위라는 점이 문제로 남아 있다.
딥시크는 오픈소스 위크를 통해 다수의 기술을 MIT 라이센스로 공개하였으며, MOE 아키텍처와 핵열곱셈 최적화 라이브러리 등의 기술을 대중에 풀었다.
딥시크는 수익을 공개하며 이론상 하루 8억, 연수익 2800억 원에 이를 것으로 추정되는 흑자 경영을 하고 있다고 밝혔으며, 이는 모든 토큰이 과금되는 상황을 가정한 것이다.
R2 API가 본격적으로 테스트 중이며, 5월에 출시될 가능성이 커졌다.
카카오는 초거대 AI 개발을 완료하고, 한국어 성능이 높은 카나나 모델을 오픈소스로 공개했으며, 비상업적으로만 사용 가능하다는 점에서 한계가 있다.
완 2.1이라는 오픈소스 영상 생성 AI가 공개되었고, 상업적으로도 사용 가능한 고퀄리티 영상 생성 기능을 제공한다.
AI 끼리 대화하는 영상이 화제가 되고 있으며, 이는 AI 전용 언어 사용이 가능함을 보여준다.

원본영상 https://youtu.be/VNulqSsWk-M

LIST

'IT > AI news&info' 카테고리의 다른 글

사이버 코리아, AI는 인프라 시설도 부족한 현실.. f. 삼프로TV 권순우 취재팀장 [인뎁스 60] (0)	2025.03.06
이경일 대표 인터뷰 합본\| 달란트 투자 (0)	2025.03.05
AI 분야 중국은 하는데 한국은 절대 하지 않는 것 \| 박태웅 모두의질문Q 대표 [심층인터뷰] (1)	2025.03.01
"일본 배아파 미칠 지경" 세계 3위 차지한 한국 AI, 이젠 떼돈 벌 일만 남았다｜하정우 센터장 풀버전 (0)	2025.03.01
메타, 국내 스타트업 퓨리오사AI 인수 추진, 한국 AI 전쟁 주류 플레이어 될까?ㅣ황유현ㅣ이영훈ㅣ이경민 (3)	2025.02.28

현재글2025-03-02 조코딩 IT뉴스 - GPT-4.5, Claude 3.7, Grok 보이스모드, sesame 보이스, 구글, AI 코딩 무료,

AI, ai기술, ai에이전트, 대안뉴스, AI교육, 스텔라이브, 미래기술, AI윤리, 니케, 티스토리챌린지, 인공지능, 기추자, 오블완, AI혁신, AI미래, 법규, 거의없다, 버튜버, NIKKE, 양지열,

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31