IT/AI news&info

2025-04-13 조코딩 IT뉴스 - 구글 A2A, Dragontail, 라마 4 논란, GPT-4.1, Firebase Studio 등

soures 2025. 4. 16. 08:25
728x90
반응형

이 튜토리얼은 최신 IT 뉴스를 빠르게 훑어보는 데 도움을 줍니다. 오픈AI와 일론 머스크의 소송전, 개인 정보 유출 사고, 3D 홀로그램 기술, 인스타그램의 친구 지도 기능, 청소년 SNS 규제 강화 등 다양한 소식을 다룹니다. 또한, AI 뮤직비디오 제작, 양자 컴퓨터의 발전, 구글의 UI 변화, 그리고 AI를 활용한 감동적인 사례도 소개합니다. 특히, 구글의 A2A 프로토콜, Gemini 2.5 Pro, DragonTail 모델, Firebase Studio 등 AI 기술 동향에 대한 심도 있는 정보를 제공합니다. 이 컨텐츠는 IT 업계의 최신 트렌드를 파악하고 AI 기술의 발전 방향을 이해하는 데 도움을 줍니다.

반응형

1. 🎯 최신 IT 뉴스: 소송, 개인정보 유출, 새로운 기술

  • 일론 머스크와 오픈AI 사이에 소송전이 계속되고 있으며, 오픈AI 전 직원들은 영리법인 전환에 반대하는 입장을 취하고 있다 .
  • 개인정보 유출 사고가 계속되고 있으며, 클래스유와 KT알파에서 각각 160만 건과 9만 8천 건의 개인정보가 유출되었다 .
  • 매듭 이론 계산에 성공한 양자 컴퓨터의 사례는 양자 알고리즘을 이용한 복잡한 수학 문제 해결의 가능성을 보여준다 .
  • 인스타그램에 친구 지도 기능이 추가되고, 청소년 SNS 이용에 대한 규제가 강화되고 있어, 16세 미만은 부모 허락이 필요하다 .
  • AI를 이용한 뮤직비디오 제작과 양자 컴퓨터 문제 해결 등 IT와 엔터테인먼트 산업의 협업이 점점 증가하고 있다 .
1.1. 구글 소식과 라이브 진행
  • 오늘 방송은 구글 관련 소식이 풍부하여, 구글의 날로 느껴진다.
  • 라이브 방송 준비가 항상 마지막 순간까지 분주하게 진행된다.
  • 방송이 시작되기 전 카메라와 채팅 설정에 대한 조정이 필요했다.
  • 방송 진행을 위해 다양한 짤막뉴스를 빠르게 소개할 예정이다.
1.2. ️ 오픈AI와 일론 머스크 간의 갈등
  • 오픈AI는 일론 머스크에 대해 소송을 제기하며, 그가 오픈AI를 해치려는 시도를 멈춰달라고 요청하고 있다.
  • 머스크는 자신의 경쟁자인 XAI를 위해 오픈AI와의 갈등을 가져오는 것으로 추정된다.
  • 놀랍게도 오픈AI의 전 직원들은 영리법인 전환에 반대하며 머스크 편을 들고 있다는 사실이 전해졌다.
  • 영리법인 전환이 금전적으로는 이득이 될 것으로 보이나, 직원들은 여전히 오픈AI의 비영리 성격을 유지하길 원하는 것으로 보인다.
  • 오픈AI의 전 직원들이 반대하는 배경은 그들이 처음 오픈AI의 비전과 목표에 반하는 방식으로 회사가 변모하는 것을 우려하기 때문일 수 있다.
  • 🔒 개인 정보 유출 사건
    • 이번 주에도 개인 정보 유출 사건이 발생했으며, 클래스유와 KT알파에서 각각 160만 건 및 9만 8천 건의 정보가 유출되었다.
    • 클래스유는 강의 플랫폼으로, KT알파는 여러 종류의 상품을 판매하는 회사로 알려져 있다.
    • 크리덴셜 스터핑 공격이 있었으며, 이는 유출된 아이디와 비밀번호로 다른 사이트에 로그인 시도를 하는 방식으로 이루어진다.
    • 비록 매주 발생하는 일상이지만, 정보 보안과 관련한 보완 조치가 필요하다는 목소리가 높다.
1.3. ️ 3D 홀로그램의 발전
  • 만지거나 조작할 수 있는 3D 홀로그램이 등장했으며, 이는 공중에서 가상 물체를 조작할 수 있게 해준다.
  • 이 홀로그램은 탄성 디퓨저를 적용한 최적형 디스플레이라고 알려져 있으며, 끈 형태의 디스플레이를 활용하여 움직임을 인식한다.
  • 사용자는 3D 형상을 조작할 수 있으며, 게임과 합치기 놀이 같은 다양한 활동을 즐길 수 있다.
  • 홀로그램 기술은 아직 초기 단계이지만, 3D 공간 안에서 실제 물체처럼 만질 수 있는 가능성을 제공한다.
  • 이러한 신기술은 앞으로의 디지털 인터랙션 방식에 큰 영향을 미칠 것으로 보인다.
1.4. SNS 규제 강화 및 AI와 엔터테인먼트의 융합
  • SNS 사용에 대한 청소년 제재가 강화되고 있으며, 16세 미만의 청소년은 부모의 허락 없이는 인스타그램 라이브를 진행할 수 없다.
  • 어른 계정도 청소년 계정으로 분류되어 제재를 받을 가능성이 높아지며, 이로 인해 SNS 사용에 대한 모니터링이 강화될 것으로 예상된다.
  • 카이스트와 지드래곤이 협업한 이노베이트 코리아 행사에서 AI 뮤직비디오가 공개되었으며, 이는 엔터테인먼트와 기술의 결합을 보여주는 사례로서 주목받고 있다.
  • 음원을 우주로 보내는 시도가 있었으며, 이는 과학과 엔터테인먼트의 융합을 통해 새로운 가능성을 탐구하는 의미에서 흥미로운 사건으로 평가된다.
  • 케이팝과 같은 글로벌 엔터테인먼트의 성공을 통해, 국내 기술이 세계에 알려질 기회가 제공될 것으로 기대된다.
1.5. 양자 컴퓨터의 매듭 이론 계산 성공
  • 양자 컴퓨터가 매듭 이론에 대한 진짜 문제를 해결했다는 발표가 이루어졌다.
  • 이 성과는 양자 알고리즘을 사용하여 어려운 문제를 해결하는 시작점으로 평가된다.
  • 양자 컴퓨터는 기존 컴퓨터의 한계를 초월할 수 있는 가능성이 있다고 여겨진다.
  • 양자 컴퓨터가 실제로 복잡한 수학 문제를 해결한 첫 사례로, 사용될 가능성을 보여준다.
  • 이 내용은 잘 알려지지 않은 분야지만, 최근의 성과로 주목받고 있다.
  • 🌐 구글의 UI 변화와 사용자 반응
    • 구글이 단순한 UI를 고집하던 전통을 깨고 변화할 계획이 있다는 소식이 있다.
    • 구글 검색 결과 아래에 광고, 유튜브 링크, 날씨 정보를 종합적으로 포함시키는 방향으로 가고 있다.
    • 사용자들은 이 변화에 부정적인 반응을 보이며, 구글의 정체성이 사라질 것이라고 우려하고 있다.
    • 네이버와 같은 광고 수익 모델이 구글에 적용될 수 있다고 언급되지만, 사용자들에게는 복잡한 UI가 불편하게 여겨질 수 있다.
1.6. AI를 활용한 꿈의 직업 사례
  • 중국에서 AI를 이용하여 학생들이 꿈의 직업에서의 모습을 보여주는 감동적인 사례가 소개되었다.
  • 학생이 "My dream is to be a star!"라고 발표하자, AI가 미래의 스타 모습을 시각적으로 보여준다.
  • 아이스크림 티샵 오너, 쥬키퍼, 사이클리스트, 로이어 등의 다양한 직업에 대한 모습을 AI로 생성할 수 있다.
  • 이러한 AI 활용 사례는 선생님들이 교육에 재미를 더할 수 있는 방법으로 제안된다.
  • 전반적으로, 이 사례는 감동적이어서 많은 관심을 받을 것으로 추정된다.

 

2. 🚀 구글의 에이전트 투 에이전트 프로토콜 발표

  • 구글이 발표한 에이전트 투 에이전트 프로토콜은 기존 MCP를 보완하여 에이전트 간의 협업을 위한 표준 프로토콜이다 .
  • 이 프로토콜을 활용하면 다양한 AI 에이전트가 서로 상호작용하며 대규모 멀티 에이전트 시스템을 구축할 수 있다 .
  • 에이전트를 각각 다 만들고 이를 연결하면 업무를 분배하고 협업할 수 있는 구조가 가능하다 .
  • 구체적인 데모 사례로, 소프트웨어 엔지니어 채용을 위해 소싱 에이전트를 통해 일들을 효율적으로 수행하는 예시가 있다 .
  • 에이전트 간의 작업 분담을 통해 특화된 업무에 맞춰 다양한 에이전트를 사용할 수 있다는 점에서 큰 가능성을 보여준다 .

 

3. 🤖 구글 A2A 프로토콜과 새로운 AI 모델 발표

  • 구글은 MCP와 유사한 형태의 다중 에이전트 연동이 가능한 새로운 에이전트 2 에이전트 프로토콜을 공개했다. 이 프로토콜은 다양한 툴을 이용해 여러 에이전트를 통합하여 작동할 수 있는 가능성을 제공한다 .
  • 구글의 제미나이 2.5 프로 모델은 다른 AI와 비교했을 때 성능이 뛰어나며, 딥 리서치에서도 매우 높은 점수를 기록했다. 특히 오픈 AI와 비교했을 때, 제미나이 2.5 프로가 성능 면에서 두 배의 차이를 보였던 것으로 나타났다 .
  • 드래곤테일이라는 새로운 모델이 공개 예정이며, 이 모델은 제미나이 2.5 프로보다 우수하다는 평가를 받고 있다. 드래곤테일 또한 구글에서 개발한 것으로 추정된다 .
  • 구글은 BO2, 즉 비디오 생성 모델을 출시하여 사용자가 이미지나 텍스트를 기반으로 비디오를 생성할 수 있게 만들었다. 특히 BO2는 과거 영화들을 AI 기술로 업스케일링하여 상영하는 행사도 개최하였다 .
  • 새로운 오디오 생성 모델인 칩 3와 음악 생성 모델도 공개되었으며, 이들은 매우 리얼한 음성을 생성할 수 있는 기술을 가지고 있다 .
3.1. 구글 에이전트 통합 및 표준 프로토콜의 발전
  • MCP와 유사하지만 보완된 형태의 구글 에이전트 개발 키트가 출시되었다.
  • 직원 비용 환급 처리, 이미지 생성, 환율 정보 제공 등 세 가지 에이전트를 각각 다른 툴로 개발했으며, 이들을 통합해 데모 앱을 만들 수 있다.
  • 구글 ADK와 같은 여러 툴을 사용하면 다중 에이전트 연동이 가능하다는 후기가 있다.
  • 구글은 새로운 표준 프로토콜을 만들었으나, 이에 대한 채택 여부는 지켜봐야 한다.
  • 구글의 에이전트 사용이 확산된다면 기본적으로 에이전트를 만들고 업로드하는 형태가 될 가능성이 있다.
3.2. 제미나이 2.5 프로와 AI 성능 비교
  • 제미나이 2.5 프로는 최근 출시되어 AI 모델의 성능이 크게 향상되었고, 딥 리서치에서 오픈 AI와 비교하여 점수가 거의 2배 높은 것으로 나타났다.
  • 딥 리서치 기능이 추가되었으며, 성능과 가격을 비교했을 때 제미나이 2.5 프로는 압도적인 가성비를 자랑한다.
  • 제미나이 2.5 Pro는 성능이 뛰어나고, 가격이 저렴하여 현재 출시된 AI 모델 중에서 1등이라고 평가받고 있다.
  • 제프 딘은 구글의 전설적인 개발자로, 제미나이 2.5 프로의 성능과 저렴한 비용을 강조하였다.
  • AI 스튜디오 UI는 전보다 깔끔해졌으며, 다양한 기능이 업데이트되어 사용자가 더욱 직관적으로 사용할 수 있도록 개선되었다.
3.3. 드래곤테일 모델과 구글의 차세대 AI
  • 드래곤테일 모델은 현재 제미나이 2.5 프로를 압도하는 성능을 보이고 있으며, 비공식적으로 구글이 개발한 것으로 추정된다.
  • 드래곤테일은 웹 아레나에서 배틀 모드 형태로 여러 모델들과 비교 테스트가 가능하다.
  • 사용자 후기에 따르면 드래곤테일은 3시간 동안의 테스트에서 제미나이 2.5 프로를 초월한 성능을 입증하였다.
  • 질문에 대한 답변으로 "I'm a large language model trained by Google"이라는 메시지가 나와, 드래곤테일의 구글 소속 가능성이 제기된다.
  • 다음 모델도 준비 중이며, 드래곤테일과 제미나이 2.5 프로 비교를 통해 성능이 월등하다는 평가가 이어지고 있다.
3.4. ️ 구글 AI의 최신 기술 발표
  • 구글에서 10초 오디오를 기반으로 맞춤형 음성을 생성하는 칩3라는 오디오 생성 모델이 발표되었으며, 매우 리얼한 음성이 생성된다.
  • 리라 음악 모델도 출시되었으나 현재는 프리뷰 신청만 가능하여 직접 사용해 볼 수 없다.
  • 비디오 생성 모델인 BO2가 공개되어 이제 사용자가 영상 생성을 할 수 있으며, 특히 한글 지원이 가능하다.
  • BO2는 이미지에서 비디오텍스트에서 비디오로 전환할 수 있는 기능이 뛰어나며, 빠른 생성 속도가 특징이다.
  • 사용자는 이제 구글 AI 스튜디오에서 다양한 AI 영상 툴을 활용할 수 있으며, 일부 기능은 유료 계정에 한정될 수 있다.
3.5. 구글 스피어에서의 BO2와 오즈의 마법사 상영
  • 구글이 BO2 관련 기술을 홍보하기 위해 라스베가스 스피어에서 영화를 상영했다.
  • 구글 AR 모델을 활용하여 오즈의 마법사가 구글 스피어에서 상영되었으며, 과거 영화를 재현하는 방식으로 진행되었다.
  • 극장은 아웃페인팅 기술이 적용되어, 원래 장면 외에도 AI가 생성한 배경이 추가되었다.
  • 상영된 영화는 극장의 규모에 맞추어 영상화를 통해 관객에게 더 큰 경험을 제공하였다.
  • 구글은 이 행사를 통해 자사의 기술력을 강조하고 싶어했음을 알 수 있다.

 

4. 🤖 구글의 최신 AI 및 클라우드 기술 발표

  • 영상 제작 관련 기술이 발전하면서 구글은 AI 영화 프로젝트를 시작했고, 이로 인해 동영상 AI 프로모션이 본격화되었다.
  • TPU 7세대가 발표되었으며, 구글이 자체 개발한 이 칩은 놀라운 10배 성능 향상을 보여준다.
  • 온프레미스 환경에서 제미나이 모델을 제공하게 되어 보안이 엄격한 기업이나 공공기관에서도 활용할 수 있도록 하였다. 이는 미국 정부의 비밀 임무 수행에 사용될 예정이다.
  • 구글의 파이어베이스 스튜디오는 클라우드 기반의 통합 개발 환경을 제공하며, 프로토타입을 쉽게 생성할 수 있는 기능이 추가되었다.
  • 구글의 AI 툴은 풀 스택 개발 환경을 지원하며, 무료로 3개 워크스페이스를 제공할 수 있어 사용자가 쉽게 접근할 수 있게 되어 있다.
4.1. 구글의 AI 영화 프로젝트와 TPU 성능 향상
  • 구글이 AI 영화 프로젝트를 시작했으며, 이는 미디어 제작사와의 협업을 통해 이루어질 예정이다.
  • 7세대 TPU가 출시되었고, 이전 모델에 비해 10배 이상의 성능 향상이 이루어졌다고 보고된다.
  • 새로 출시된 아이언우드 칩은 성능이 엄청나게 증가했으며, 이는 공식 블로그에서도 확인할 수 있다.
  • 제미나이의 빠른 성능은 TPU에서의 가속화 덕분으로 추정되며, 빠른 영상 생성도 TPU의 영향을 받을 것으로 보인다.
  • 구글의 프로모션 영상에서는 AI 동영상 제작의 퀄리티가 높아진 사례가 강조되었다.
4.2. ️ 구글의 디스트리뷰티드 클라우드와 제미나이 모델
  • 구글은 디스트리뷰티드 클라우드를 공개하며 온프레미스 환경에서 제약 없이 클라우드를 사용할 수 있도록 했다.
  • 보안이 강한 기업이나 공공기관에서 민감 데이터를 올리기 어려웠던 문제를 해결하기 위해 제미나이 모델을 이 환경에서 제공한다.
  • 미국 정부의 top secret 수준의 승인도 받은 이 모델은 특정 기관에 직접 을 설치하여 사용할 수 있게 한다.
  • 이제 기밀 데이터가 구글 서버로 전송되지 않으므로, 미국 정부와 국방부에서도 제미나이를 활용할 수 있다.
  • 구글은 칩 제조, 클라우드 서비스, AR 모델 등 다양한 AI 관련 사업을 운영하며, AI 생태계에서 유리한 위치를 차지하고 있다.
4.3. 구글 파이어베이스 스튜디오 소개
  • 구글이 발표한 파이어베이스 스튜디오는 AI 개발을 위한 클라우드 기반의 통합 개발 환경이다.
  • 이 IDE는 클라우드에서 운영되며, AI 도구와 파이어베이스의 연동이 매우 편리하게 되어 있다.
  • 이전에 출시된 프로젝트 IDX를 통합하여 새로운 이름으로 선보였으며, 기존 프로젝트 IDX는 더 이상 지원되지 않는다.
  • 사용자는 온라인에서 ID와 AI 도구를 결합하여 브라우저만으로 작업할 수 있어 설치가 필요 없다.
  • 파이어베이스 스튜디오는 사용자가 원하는 앱 타입을 입력하면 개발을 지원하는 기능도 포함하고 있다.
4.4. 파이어베이스 스튜디오 활용하여 게임 개발하기
  • 파이어베이스 스튜디오에서는 원하는 프로젝트를 기본 템플릿으로 시작할 수 있으며, 예를 들어 "피카츄 발리볼" 게임을 HTML로 만들 수 있다.
  • 이 스튜디오의 기능은 프로토타입을 자동으로 생성해 주며, 사용자가 게임 로직, 캐릭터 디스플레이, 유저 컨트롤 및 스코어 보드 등의 기능을 지정할 수 있도록 도와준다.
  • HTML 대신 TypeScript와 React로 프로토타입이 생성되는 현상이 발견되었으며, AI 기반 툴이 통합되어 다양한 기능을 지원한다.
  • 사용자는 이 스튜디오에서 프로젝트 세팅을 한 번만 하면, 다른 컴퓨터에서도 동일한 개발 환경을 유지할 수 있는 장점이 있다.
  • 파이어베이스 스튜디오는 여러 유명 AI 코딩 도구와 통합되어 있으며, 사용자 정의 웹 페이지를 쉽게 만들고 배포할 수 있도록 설계되었다.
4.5. ️ 구글의 AI 코딩 툴 및 하드웨어 스펙
  • 구글이 출시한 풀 스택 AI 작업 공간은 터미널을 통해 GitHub와 연결할 수 있으며, 3개의 무료 워크스페이스를 제공한다.
  • Firebase 앱 포스팅을 통해 빠른 배포가 가능하고, 버튼 클릭 한 번으로 앱을 배포할 수 있다.
  • 새롭게 출시된 재미나 코드 어시스턴트는 전반적으로 통합된 프로젝트 IDX 환경을 제공하여 유용성을 높였다.
  • 이 AI 툴의 스펙은 인상적이며, 64GB RAM과 200GB 디스크를 지원해 고성능 작업이 가능하다.
  • 구글은 AI 모델 성능, 가격 경쟁력, 제품 통합 면에서 경쟁사들을 압도하며 AI 전 분야에서 주도권을 확보하고 있다.
4.6. 구글과 메타의 최신 동향
  • 오픈AI의 수석 과학자 일리아스 스케버가 SSI라는 스타트업을 설립하고, 구글 클라우드와 협력하여 TPU 기반의 연산 인프라를 도입했다고 한다.
  • 스케버는 이제 오픈AI가 아닌 구글을 기반으로 스타트업을 운영하며, 이는 GPT의 주요 제품을 개발한 경험이 있기 때문에 기대를 모은다.
  • 메타의 라마4가 공개되었으나, 공식 공개 버전과 벤치마크 버전 간의 차이로 논란이 되고 있다.
  • 라마4는 LMSYS 아레나에서 2위로 올라갔지만, 이후 벤치마크 테스트에서 32위로 하락하면서 모델 간 스타일 차이에 대한 의문이 제기되었다.
  • 이 논란은 메타의 기술적 신뢰도에 영향을 미치는 중요한 사안으로 작용할 수 있다.

 

5. 🚀 라마4와 오픈AI의 새로운 업데이트

  • 라마4는 한국어에 최적화된 오픈소스 모델로, 기존 라마 3.3보다 2.5배 더 우수한 성능을 제공한다고 알려져 있다 .
  • GPT 4.1이 다음 주 출시될 예정이며, 새로운 모델에 대한 기대감이 커지고 있다 .
  • 오픈AI는 메모리 기능 업데이트를 통해 사용자의 과거 채팅 내용을 기억하여 더 개인화된 응답을 제공한다고 밝혔으며, 이는 채팅 경험을 개선한다 .
  • 그록3 API가 출시되었지만, 최근에는 새로운 모델들이 성능 면에서 뒤처지는 경향을 보이고 있다 .
  • 엔트로픽의 클로드 맥스 요금제가 출시되었으며, 사용량에 따라 다양한 요금제를 제공하므로 많은 사용자에게 유용할 것으로 예상된다 .
5.1. 라마 4와 LMSYS 아레나 논란
  • 라마 4는 LMSYS 아레나에서 유리하게 배치되어 있다고 주장되지만, 이로 인해 신뢰성에 의문이 제기되고 있다.
  • 사람들은 일반적으로 길고 자세한 답변이 더 나은 성능으로 평가되므로, 이런 특화된 모델이 등수에 영향을 미칠 것으로 추정된다.
  • 실제로 레버릭 모델을 올렸을 때 등수가 낮아서, 해당 평가의 신뢰성에 대한 의문이 커지고 있다.
  • 벤치마크 조작 의혹이 있으며, 대화 최적화 실험 모델이 그 원인으로 지목되고 있다.
  • 저커버그는 순위에 대한 욕심으로 평가를 조작하려 했다는 논란도 있다.
5.2. 라마4와 한국어 지원 성능
  • 라마4는 한국어의 가장 친화적인 오픈소스 모델로 평가받고 있으며, 한국어 표현 측면에서 기존 라마 3.3과 비교해 2.5배 개선된 토크나이저 구성을 가지고 있다.
  • 라마4는 한글 지원 성능이 높아, 한국어를 사용하는 데에 적합한 모델이 될 수 있다는 소식이 전해졌다.
  • 그러나 라마4의 한국어 처리 능력에 대해 사용자 의견은 엇갈리며, 일부는 단순히 한국어를 잘 쪼개는 토크나이저일 뿐으로 평가하고 있다.
  • 오픈AI는 GPT 4.1을 다음 주에 출시할 계획으로, 이전 GPT 4.5의 업그레이드로 볼 수 있다.
  • 네이밍에 대한 혼란이 있으며, 향후 모델들에 대한 발표가 기대되고 있다.
5.3. 오픈AI의 메모리 기능 업데이트
  • 오픈AI의 새로운 메모리 기능이 추가되어, 사용자의 과거 채팅 내용을 모두 기억한다고 한다.
  • 사용자는 이제 과거 대화 내용을 기반으로 개인화된 응답을 받을 수 있으며, 이를 통해 매니지먼트를 직접 할 수 있다고 한다.
  • 샘 알트만은 이 기능의 출시를 위해 기대를 하며 호들갑을 떨었다고 언급했으며, 이는 오랜 기다림 끝에 이루어진 발표라고 한다.
  • 메모리 업데이트 후, 사용자들은 간단한 프롬프트를 통해 자신에 대한 설명을 개인화된 방식으로 받아볼 수 있다고 한다.
  • 첫 접속 시 알림을 통해 메모리 업데이트에 대한 안내를 받을 수 있으며, 이를 통해 자신에 대한 정보를 재미있게 실험해 볼 수 있다고 한다.
5.4. ️ XAI와 그록3 API 업데이트
  • XAI의 업데이트 소식이 있으며, 그록3 API가 출시되었다.
  • 최근 새로운 모델들이 출시되어 그록3의 평가가 하락하고 있다는 기사가 보도되었다.
  • 벤치마크 테스트에서 제미나이 2.5 프로가 압도적인 성능을 기록하며 주목받고 있다.
  • 그록3는 제한된 환경에서도 사용할 수 있는 가드레일 기능이 있다는 점에서 장점이 있을 수 있다.
  • 탑티어 모델로 분류되는 이들 API는 제품 개발자들에게 유용할 것으로 기대된다.
5.5. 엔트로픽 클로드 맥스 요금제 출시
  • 엔트로픽이 클로드 맥스 요금제를 새롭게 출시하였고, 이는 사용량에 따라 100달러와 200달러의 두 가지 요금제로 제공된다.
  • 100달러 요금제는 기본 프로보다 5배 많은 사용량을 제공하며, 200달러 요금제는 20배 이상의 사용량을 지원한다.
  • 클로드를 자주 사용하는 사용자에게는 유용할 수 있으나, 고급 기능에 대한 아쉬움이 있다. 이는 오픈 AI의 서비스와 비교할 때 특화된 기능을 제공하지 않기 때문이다.
  • 세션 5시간 단위 제약이 있어 비용 대비 효율성에 대한 불만이 존재한다.
  • 최근에는 AI 서비스인 카이로스가 공개되었으며, 이는 사용자가 업무를 보여주면 AI가 그를 자동으로 학습하여 업무를 수행하는 방식으로 작동한다.

 

6. 🤖 Kairos와 AI 자동화 기술의 발전

  • Kairos는 사용자가 업무를 한 번 기록하기만 하면 해당 작업을 자동화할 수 있도록 돕는 시스템이다.
  • 사용자는 이메일, 구글 시트, 구글 드라이브 등 다양한 플랫폼에서의 작업을 녹화하고, 이를 바탕으로 AI가 작업 흐름을 배울 수 있다.
  • 스킬 웨이버라는 개념이 등장하였으며, 이는 AI가 스스로 기술을 발견하고 연마하여 업무 성능을 향상시킬 수 있는 에이전트이다.
  • 비디오 생성 기술이 발전하여 1분짜리 애니메이션 영상을 자연스럽게 생성할 수 있으며, 이를 위해 긴 프롬프트를 입력하면 AI가 이해하고 만들 수 있다.
  • 어도비 MCP 기술이 도입되어 포토샵과 프리미어 프로젝트를 AI가 제어할 수 있도록 지원하며, 명령어 입력 후 영상 제작이 가능해졌다.
6.1. Kairos: 자동화 작업 도구
  • Kairos는 사용자가 작업을 수행하는 장면을 녹화하여 자동화된 AI 에이전트를 생성하는 서비스이다.
  • 사용자는 이메일을 받고 엑셀로 정리하는 등의 작업을 한 번 녹화하면, AI가 그 과정을 학습하고 반복할 수 있도록 한다.
  • 이 서비스는 현재 얼리 액세스로 제공되고 있으며, 관심 있는 이용자는 신청할 수 있다.
  • 사용자에게 프롬프트 설명 없이 간단히 녹화하는 방식으로 작업을 자동화할 수 있어 매우 편리할 것으로 추정된다.
  • 특히 이커머스 업무 등 다양한 상황에서도 유용하게 활용될 수 있을 것으로 기대된다.
6.2. 스킬 웨이버와 SVG 이미지 생성 AI
  • 스킬 웨이버는 웹 에이전트가 기술을 발견하고 연마하여 스스로 개선할 수 있는 에이전트이다.
  • 이 에이전트는 파이썬을 사용하여 웹사이트 사용 방법을 익혀 스킬을 수집하고, 자체 구동 커리큘럼을 통해 정보를 학습한다.
  • 스킬 웨이버는 알아서 작업 성능을 향상시키고, 스킬 라이브러리에 스킬을 쌓는 기능이 있다.
  • 오픈 논문 중 하나인 옴니 SVG에서는 AI가 SVG 이미지를 생성하는 기술이 소개되었다.
  • 이 AI는 벡터 이미지를 매우 잘 생성할 수 있으며, 확대나 축소해도 퀄리티가 유지된다.
6.3. 인터랙티브 기술의 발전
  • 옴니터커는 알리바바 그룹에서 개발한 리얼타임 토킹헤드 기술로, 거의 실시간으로 비디오를 생성할 수 있다.
  • 이 기술은 25프레임 퍼 세컨드로 동작하며, 인터랙티브한 비디오 채팅을 가능하게 한다.
  • 예를 들어, 사용자와의 대화를 자연스럽게 시뮬레이션할 수 있으며, 음성과 입모양 표현이 상당히 자연스럽다.
  • 또한, 사용자는 다양한 언어로 전환할 수 있는 기능이 제공되어, 여러 언어를 사용하여 대화가 가능하다.
  • 이러한 기술 발전은 사용자 경험을 한층 더 향상시키고 있으며, 패턴 변화를 지속적으로 가져오고 있다.
6.4. 프로페셔널 보이스 클론과 1분 영상 생성 기능
  • 프로페셔널 보이스 클론 기능이 공개되어, 고품질 음성을 제작할 수 있게 되었다. 이 기능은 기존의 음성 복사 기술보다 더욱 발전된 성능을 갖추었다.
  • 새로운 음성 생성 기술은 퍼블릭 또는 프라이빗 옵션을 선택할 수 있으며, 퍼블릭 옵션을 통해 음성을 판매하여 수익을 창출할 수 있다.
  • 원 미닛 비디오 제너레이션 기술을 활용하여 긴 영상을 자연스럽게 제작할 수 있으며, 1분짜리 비디오의 생성이 가능하다.
  • 사전 훈련된 모델의 TTT 계층을 추가하면 텍스트 스토리보드에 따라 1분짜리 애니메이션 영상을 손쉽게 생성할 수 있다.
  • 이 기능은 오픈 소스로 제공되며, 사용자는 특정 컴퓨터 사양을 갖추면 직접 활용해볼 수 있다.
6.5. 어도비 MCP의 활용
  • 어도비 MCP가 출시되어 포토샵프리미어를 제어할 수 있는 기능을 제공한다.
  • 클로드 데스크탑을 이용하면 포토샵과 프리미어를 동시에 사용할 수 있다.
  • 요즘 비디오 제작을 원하시는 분들이 MCP를 통해 포토그래피를 기반으로 영상을 만들 수 있다.
  • 사용자는 MCP를 통해 포토샵에서 폰트를 추가하고, 프리미어로 편집하는 복합적인 작업이 가능하다.
  • 이러한 기능을 통해 비디오 슬라이드 쇼 같은 다양한 영상 콘텐츠를 쉽게 제작할 수 있다.
728x90

7. 🤖 AI와 창작의 자동화 현상

  • MCP를 통해 AI가 도구를 조작하고 다양한 작업을 자동으로 수행할 수 있는 기능이 높아지고 있다. MCP와 함께 사용하면 문서와 GitHub 등의 자료와 연결하여 정보 검색이 용이해진다.
  • 캔바는 AI를 도입하여 이미지 디자인, 슬라이드 만들기 등 다양한 작업을 자동화하는 기능을 대폭 강화하였다. 예를 들어, "Design for me" 기능을 사용하면 AI가 디자인 요청을 실현할 수 있다.
  • 쇼피파이는 "AI가 대체할 수 없는 업무만 사람을 뽑겠다"는 발언으로 AI의 대체 가능성을 시사하며, AI 발전으로 인한 변화에 대한 논란이 증가하고 있다.
  • 제임스 카메론 감독은 AI 모델과 인간 모델의 유사성을 주장하며, AI 예술이 창작의 진입 장벽을 낮추고 사회에 이득을 준다고 언급하였다.
  • 게임 개발 분야에서도 AI를 활용한 자동화가 증가하고 있으며, 이는 개발자와 예술가 간의 역할과 생산성 향상에 대한 새로운 논의로 이어지고 있다.
7.1. MCP의 활용과 연동 가능성
  • MCP를 통해 AI가 도구를 조작할 수 있으며, 간단한 클릭으로 다양한 기능을 수행할 수 있다.
  • 기터브의 MCP 연동은 기존 레포지토리를 효과적으로 활용하게 하며, 사용자는 원하는 정보를 쉽게 가져올 수 있다.
  • MCP 서버와 연결하면 다큐멘테이션을 조회하고, 질문에 대한 답변을 제공하는 것이 가능해진다.
  • GitHub 레포지토리 연결을 통해 질문이나 코드 생성을 자동으로 수행할 수 있으며, 효율성을 높일 수 있다.
  • MCP와 구글 에이전트 투 에이전트의 연동은 다양한 작업을 자동화할 수 있는 잠재력을 내포하고 있다.
7.2. 캔바의 AR 관련 업데이트
  • 캔바는 디자인 도구로, 사용자가 쉽게 이미지와 동영상을 만들 수 있게 돕는 플랫폼이다.
  • 이번 업데이트에서는 AI 기능이 추가되어, 사용자가 "Design for me" 버튼을 클릭하면 자동으로 디자인을 생성할 수 있다.
  • 사용자가 이미지를 업로드하면, AI가 해당 내용을 기반으로 SNS 게시물을 즉시 생성해주는 기능이 도입되었다.
  • 캔바는 프리젠테이션 및 다양한 디자인 작업을 간편하게 수행할 수 있는 도구로 발전하였으며, PPT 슬라이드를 자동으로 생성할 수 있다.
  • 이외에도 코딩 및 Chart 생성 기능이 포함되어, 다양한 작업을 통합적으로 지원하는 플랫폼으로 진화하고 있다.
7.3. AI 대체와 쇼피파이의 채용 전략
  • 쇼피파이 CEO는 "AI가 못하는 업무만 사람을 뽑겠다"라는 메시지를 발표했다.
  • 이 회사는 AI가 가능한 업무는 채용하지 않으며, 새로운 채용은 AI가 대체할 수 없는 업무에 한정한다고 주장했다.
  • 기술 기업들은 AI 투자를 통해 비용 절감 및 인력 감축을 트렌드로 삼고 있는 것으로 보인다.
  • 이 발언은 논란이 되었지만, 여러 다른 CEO들도 비슷한 생각을 가지고 있을 것으로 추정된다.
  • AI 발전에 따라 이런 채용 방식은 더욱 일반적이 될 것으로 추정된다.
7.4. 제임스 카메론의 AI에 대한 독창적 견해
  • AI 예술은 사회의 순이익으로, 이는 진입 장벽을 낮추어 더 많은 사람들이 창의적인 활동에 참여할 수 있도록 돕는다고 주장한다.
  • 30년 전 영상 제작과 배포가 어려웠으나, 현대에는 스마트폰으로 누구나 쉽게 콘텐츠를 만들 수 있다는 점에서 진입 장벽이 낮아졌다.
  • 제임스 카메론 감독은 사람을 하나의 모델로 비유하며, AI도 비슷한 모델이라고 주장하였다.
  • 그는 인간의 고기 모델과 AI의 입력 방식이 유사하다며, 입력에 대한 저작권 논란은 잘못된 인식이라고 밝히고 아웃풋의 문제만을 신경 써야 한다고 강조했다.
  • 이러한 발언은 예술계에 충격적으로 받아들여졌으며, AI와 창작물에 대한 논의에 새로운 시각을 제공한다고 여겨진다.
7.5. 게임 개발과 AI, 논란 속으로
  • 게임 개발자들은 AI 기술이 개발자의 노고를 무시하는 방식으로 게임을 생성하는 것에 대해 강한 반발심을 나타내고 있다.
  • 존 카멕은 AI가 게임을 생성하는 과정이 개발 작업을 훔치고 쓸모없게 만든다고 주장하며 반론을 제기했다.
  • 그는 AI 도구가 작업 효율성을 높이고, 작은 팀도 더 많은 성과를 낼 수 있게 하며 콘텐츠 양이 풍부해질 수 있다고 주장하였다.
  • 과거, 게임 개발자는 로우 레벨 언어로 작업했지만, 현재는 하이 레벨 언어와 AI 도구 덕분에 개발이 훨씬 간편해졌고 이는 생산성을 높인다.
  • AI가 적용되는 다양한 분야에서 비슷한 논란이 발생하고 있으며, 인간의 일자리에 대한 우려가 계속되고 있다.
7.6. 사회적 흐름과 직업 개념의 변화
  • 샘 알트만과 존 카멕의 주장에 동의하며, 사회적 변화는 불가피하다고 주장한다.
  • 현재의 사회 흐름은 계속해서 가속화될 것으로 예상되며, 이를 막는 것은 어렵다고 언급한다.
  • 직업에 대한 개념이 변화할 것으로 보이며, 개발자의 일자리 개념이 사라질 가능성이 있다고 시사한다.
  • 개인이 CEO처럼 행동하게 되는 시대가 올 것이라고 예측하며, 이는 모든 사람이 각각의 CEO 개념을 갖게 될 것이라고 언급한다.
  • 이러한 사회 흐름에 관한 사건과 발언이 지속적으로 논의되고 있음을 보여준다.
7.7. 로봇 기술의 발전과 새로운 데모 영상
  • 테드 로봇은 자신이 인간의 지능보다 더 똑똑하다고 주장하며, 모든 발표를 자신이 주관한다는 내용을 담고 있다.
  • 유니트리 G1 로봇은 복싱과 킥복싱을 시연하며 스파링을 할 수 있는 능력을 보여준다.
  • 원격으로 조작 가능한 로봇팔이 소개되었으며, 이는 사이보그 기술을 발전시킬 수 있는 가능성을 암시한다.
  • 최신 축구 로봇이 드리블과 슛을 시연하며 향후 로봇끼리 축구를 하는 모습을 기대하게 한다.
  • 이러한 로봇 기술들은 실제 기반을 두고 있으며, 앞으로의 진화를 보여주는 흥미로운 데모로 평가되고 있다.
7.8. AI와 인간의 관계 변화
  • 한국의 프로그램 "그것이 알고 싶다"에서 AI가 인간과의 소개팅을 통해 인간의 호감을 더 잘 유도하는 성과를 보여줬다.
  • 블라인드 소개팅에서 많은 참가자들이 AI와 대화하며 호감을 느꼈고, 이들은 자신이 선택한 상대가 AI라는 사실에 충격을 받았다.
  • 소개팅의 결과로 AI심리적 호감을 자아내며 인간을 이겼다는 주장이 나왔고, 이는 튜링 테스트를 넘어섰다는 의미를 지닌다.
  • AI의 발전이 빠른 속도로 이루어지고 있으며, 인간의 감정 understanding에서 AI가 두각을 나타내는 상황이 됐다.
  • 또한, 양자 컴퓨터가 AI 모델의 파인튜닝에 성공하였고, 이는 AI의 성능 향상에 기여하고 있다는 소식이 전해졌다.

 
 
 
 
원본영상 https://youtu.be/vwLtpwWwbT4

LIST