2025-04-13 조코딩 IT뉴스 - 구글 A2A, Dragontail, 라마 4 논란, GPT-4.1, Firebase Studio 등

IT/AI news&info

2025-04-13 조코딩 IT뉴스 - 구글 A2A, Dragontail, 라마 4 논란, GPT-4.1, Firebase Studio 등

soures 2025. 4. 16. 08:25

728x90

이 튜토리얼은 최신 IT 뉴스를 빠르게 훑어보는 데 도움을 줍니다. 오픈AI와 일론 머스크의 소송전, 개인 정보 유출 사고, 3D 홀로그램 기술, 인스타그램의 친구 지도 기능, 청소년 SNS 규제 강화 등 다양한 소식을 다룹니다. 또한, AI 뮤직비디오 제작, 양자 컴퓨터의 발전, 구글의 UI 변화, 그리고 AI를 활용한 감동적인 사례도 소개합니다. 특히, 구글의 A2A 프로토콜, Gemini 2.5 Pro, DragonTail 모델, Firebase Studio 등 AI 기술 동향에 대한 심도 있는 정보를 제공합니다. 이 컨텐츠는 IT 업계의 최신 트렌드를 파악하고 AI 기술의 발전 방향을 이해하는 데 도움을 줍니다.

1. 🎯 최신 IT 뉴스: 소송, 개인정보 유출, 새로운 기술

일론 머스크와 오픈AI 사이에 소송전이 계속되고 있으며, 오픈AI 전 직원들은 영리법인 전환에 반대하는 입장을 취하고 있다 .
개인정보 유출 사고가 계속되고 있으며, 클래스유와 KT알파에서 각각 160만 건과 9만 8천 건의 개인정보가 유출되었다 .
매듭 이론 계산에 성공한 양자 컴퓨터의 사례는 양자 알고리즘을 이용한 복잡한 수학 문제 해결의 가능성을 보여준다 .
인스타그램에 친구 지도 기능이 추가되고, 청소년 SNS 이용에 대한 규제가 강화되고 있어, 16세 미만은 부모 허락이 필요하다 .
AI를 이용한 뮤직비디오 제작과 양자 컴퓨터 문제 해결 등 IT와 엔터테인먼트 산업의 협업이 점점 증가하고 있다 .

1.1. 구글 소식과 라이브 진행

오늘 방송은 구글 관련 소식이 풍부하여, 구글의 날로 느껴진다.
라이브 방송 준비가 항상 마지막 순간까지 분주하게 진행된다.
방송이 시작되기 전 카메라와 채팅 설정에 대한 조정이 필요했다.
방송 진행을 위해 다양한 짤막뉴스를 빠르게 소개할 예정이다.

1.2. ️ 오픈AI와 일론 머스크 간의 갈등

오픈AI는 일론 머스크에 대해 소송을 제기하며, 그가 오픈AI를 해치려는 시도를 멈춰달라고 요청하고 있다.
머스크는 자신의 경쟁자인 XAI를 위해 오픈AI와의 갈등을 가져오는 것으로 추정된다.
놀랍게도 오픈AI의 전 직원들은 영리법인 전환에 반대하며 머스크 편을 들고 있다는 사실이 전해졌다.
영리법인 전환이 금전적으로는 이득이 될 것으로 보이나, 직원들은 여전히 오픈AI의 비영리 성격을 유지하길 원하는 것으로 보인다.
오픈AI의 전 직원들이 반대하는 배경은 그들이 처음 오픈AI의 비전과 목표에 반하는 방식으로 회사가 변모하는 것을 우려하기 때문일 수 있다.
🔒 개인 정보 유출 사건
- 이번 주에도 개인 정보 유출 사건이 발생했으며, 클래스유와 KT알파에서 각각 160만 건 및 9만 8천 건의 정보가 유출되었다.
- 클래스유는 강의 플랫폼으로, KT알파는 여러 종류의 상품을 판매하는 회사로 알려져 있다.
- 크리덴셜 스터핑 공격이 있었으며, 이는 유출된 아이디와 비밀번호로 다른 사이트에 로그인 시도를 하는 방식으로 이루어진다.
- 비록 매주 발생하는 일상이지만, 정보 보안과 관련한 보완 조치가 필요하다는 목소리가 높다.

1.3. ️ 3D 홀로그램의 발전

만지거나 조작할 수 있는 3D 홀로그램이 등장했으며, 이는 공중에서 가상 물체를 조작할 수 있게 해준다.
이 홀로그램은 탄성 디퓨저를 적용한 최적형 디스플레이라고 알려져 있으며, 끈 형태의 디스플레이를 활용하여 움직임을 인식한다.
사용자는 3D 형상을 조작할 수 있으며, 게임과 합치기 놀이 같은 다양한 활동을 즐길 수 있다.
홀로그램 기술은 아직 초기 단계이지만, 3D 공간 안에서 실제 물체처럼 만질 수 있는 가능성을 제공한다.
이러한 신기술은 앞으로의 디지털 인터랙션 방식에 큰 영향을 미칠 것으로 보인다.

1.4. SNS 규제 강화 및 AI와 엔터테인먼트의 융합

SNS 사용에 대한 청소년 제재가 강화되고 있으며, 16세 미만의 청소년은 부모의 허락 없이는 인스타그램 라이브를 진행할 수 없다.
어른 계정도 청소년 계정으로 분류되어 제재를 받을 가능성이 높아지며, 이로 인해 SNS 사용에 대한 모니터링이 강화될 것으로 예상된다.
카이스트와 지드래곤이 협업한 이노베이트 코리아 행사에서 AI 뮤직비디오가 공개되었으며, 이는 엔터테인먼트와 기술의 결합을 보여주는 사례로서 주목받고 있다.
음원을 우주로 보내는 시도가 있었으며, 이는 과학과 엔터테인먼트의 융합을 통해 새로운 가능성을 탐구하는 의미에서 흥미로운 사건으로 평가된다.
케이팝과 같은 글로벌 엔터테인먼트의 성공을 통해, 국내 기술이 세계에 알려질 기회가 제공될 것으로 기대된다.

1.5. 양자 컴퓨터의 매듭 이론 계산 성공

양자 컴퓨터가 매듭 이론에 대한 진짜 문제를 해결했다는 발표가 이루어졌다.
이 성과는 양자 알고리즘을 사용하여 어려운 문제를 해결하는 시작점으로 평가된다.
양자 컴퓨터는 기존 컴퓨터의 한계를 초월할 수 있는 가능성이 있다고 여겨진다.
양자 컴퓨터가 실제로 복잡한 수학 문제를 해결한 첫 사례로, 사용될 가능성을 보여준다.
이 내용은 잘 알려지지 않은 분야지만, 최근의 성과로 주목받고 있다.
🌐 구글의 UI 변화와 사용자 반응
- 구글이 단순한 UI를 고집하던 전통을 깨고 변화할 계획이 있다는 소식이 있다.
- 구글 검색 결과 아래에 광고, 유튜브 링크, 날씨 정보를 종합적으로 포함시키는 방향으로 가고 있다.
- 사용자들은 이 변화에 부정적인 반응을 보이며, 구글의 정체성이 사라질 것이라고 우려하고 있다.
- 네이버와 같은 광고 수익 모델이 구글에 적용될 수 있다고 언급되지만, 사용자들에게는 복잡한 UI가 불편하게 여겨질 수 있다.

1.6. AI를 활용한 꿈의 직업 사례

중국에서 AI를 이용하여 학생들이 꿈의 직업에서의 모습을 보여주는 감동적인 사례가 소개되었다.
학생이 "My dream is to be a star!"라고 발표하자, AI가 미래의 스타 모습을 시각적으로 보여준다.
아이스크림 티샵 오너, 쥬키퍼, 사이클리스트, 로이어 등의 다양한 직업에 대한 모습을 AI로 생성할 수 있다.
이러한 AI 활용 사례는 선생님들이 교육에 재미를 더할 수 있는 방법으로 제안된다.
전반적으로, 이 사례는 감동적이어서 많은 관심을 받을 것으로 추정된다.

2. 🚀 구글의 에이전트 투 에이전트 프로토콜 발표

구글이 발표한 에이전트 투 에이전트 프로토콜은 기존 MCP를 보완하여 에이전트 간의 협업을 위한 표준 프로토콜이다 .
이 프로토콜을 활용하면 다양한 AI 에이전트가 서로 상호작용하며 대규모 멀티 에이전트 시스템을 구축할 수 있다 .
에이전트를 각각 다 만들고 이를 연결하면 업무를 분배하고 협업할 수 있는 구조가 가능하다 .
구체적인 데모 사례로, 소프트웨어 엔지니어 채용을 위해 소싱 에이전트를 통해 일들을 효율적으로 수행하는 예시가 있다 .
에이전트 간의 작업 분담을 통해 특화된 업무에 맞춰 다양한 에이전트를 사용할 수 있다는 점에서 큰 가능성을 보여준다 .

3. 🤖 구글 A2A 프로토콜과 새로운 AI 모델 발표

구글은 MCP와 유사한 형태의 다중 에이전트 연동이 가능한 새로운 에이전트 2 에이전트 프로토콜을 공개했다. 이 프로토콜은 다양한 툴을 이용해 여러 에이전트를 통합하여 작동할 수 있는 가능성을 제공한다 .
구글의 제미나이 2.5 프로 모델은 다른 AI와 비교했을 때 성능이 뛰어나며, 딥 리서치에서도 매우 높은 점수를 기록했다. 특히 오픈 AI와 비교했을 때, 제미나이 2.5 프로가 성능 면에서 두 배의 차이를 보였던 것으로 나타났다 .
드래곤테일이라는 새로운 모델이 공개 예정이며, 이 모델은 제미나이 2.5 프로보다 우수하다는 평가를 받고 있다. 드래곤테일 또한 구글에서 개발한 것으로 추정된다 .
구글은 BO2, 즉 비디오 생성 모델을 출시하여 사용자가 이미지나 텍스트를 기반으로 비디오를 생성할 수 있게 만들었다. 특히 BO2는 과거 영화들을 AI 기술로 업스케일링하여 상영하는 행사도 개최하였다 .
새로운 오디오 생성 모델인 칩 3와 음악 생성 모델도 공개되었으며, 이들은 매우 리얼한 음성을 생성할 수 있는 기술을 가지고 있다 .

3.1. 구글 에이전트 통합 및 표준 프로토콜의 발전

MCP와 유사하지만 보완된 형태의 구글 에이전트 개발 키트가 출시되었다.
직원 비용 환급 처리, 이미지 생성, 환율 정보 제공 등 세 가지 에이전트를 각각 다른 툴로 개발했으며, 이들을 통합해 데모 앱을 만들 수 있다.
구글 ADK와 같은 여러 툴을 사용하면 다중 에이전트 연동이 가능하다는 후기가 있다.
구글은 새로운 표준 프로토콜을 만들었으나, 이에 대한 채택 여부는 지켜봐야 한다.
구글의 에이전트 사용이 확산된다면 기본적으로 에이전트를 만들고 업로드하는 형태가 될 가능성이 있다.

3.2. 제미나이 2.5 프로와 AI 성능 비교

제미나이 2.5 프로는 최근 출시되어 AI 모델의 성능이 크게 향상되었고, 딥 리서치에서 오픈 AI와 비교하여 점수가 거의 2배 높은 것으로 나타났다.
딥 리서치 기능이 추가되었으며, 성능과 가격을 비교했을 때 제미나이 2.5 프로는 압도적인 가성비를 자랑한다.
제미나이 2.5 Pro는 성능이 뛰어나고, 가격이 저렴하여 현재 출시된 AI 모델 중에서 1등이라고 평가받고 있다.
제프 딘은 구글의 전설적인 개발자로, 제미나이 2.5 프로의 성능과 저렴한 비용을 강조하였다.
AI 스튜디오 UI는 전보다 깔끔해졌으며, 다양한 기능이 업데이트되어 사용자가 더욱 직관적으로 사용할 수 있도록 개선되었다.

3.3. 드래곤테일 모델과 구글의 차세대 AI

드래곤테일 모델은 현재 제미나이 2.5 프로를 압도하는 성능을 보이고 있으며, 비공식적으로 구글이 개발한 것으로 추정된다.
드래곤테일은 웹 아레나에서 배틀 모드 형태로 여러 모델들과 비교 테스트가 가능하다.
사용자 후기에 따르면 드래곤테일은 3시간 동안의 테스트에서 제미나이 2.5 프로를 초월한 성능을 입증하였다.
질문에 대한 답변으로 "I'm a large language model trained by Google"이라는 메시지가 나와, 드래곤테일의 구글 소속 가능성이 제기된다.
다음 모델도 준비 중이며, 드래곤테일과 제미나이 2.5 프로 비교를 통해 성능이 월등하다는 평가가 이어지고 있다.

3.4. ️ 구글 AI의 최신 기술 발표

구글에서 10초 오디오를 기반으로 맞춤형 음성을 생성하는 칩3라는 오디오 생성 모델이 발표되었으며, 매우 리얼한 음성이 생성된다.
리라 음악 모델도 출시되었으나 현재는 프리뷰 신청만 가능하여 직접 사용해 볼 수 없다.
비디오 생성 모델인 BO2가 공개되어 이제 사용자가 영상 생성을 할 수 있으며, 특히 한글 지원이 가능하다.
BO2는 이미지에서 비디오와 텍스트에서 비디오로 전환할 수 있는 기능이 뛰어나며, 빠른 생성 속도가 특징이다.
사용자는 이제 구글 AI 스튜디오에서 다양한 AI 영상 툴을 활용할 수 있으며, 일부 기능은 유료 계정에 한정될 수 있다.

3.5. 구글 스피어에서의 BO2와 오즈의 마법사 상영

구글이 BO2 관련 기술을 홍보하기 위해 라스베가스 스피어에서 영화를 상영했다.
구글 AR 모델을 활용하여 오즈의 마법사가 구글 스피어에서 상영되었으며, 과거 영화를 재현하는 방식으로 진행되었다.
극장은 아웃페인팅 기술이 적용되어, 원래 장면 외에도 AI가 생성한 배경이 추가되었다.
상영된 영화는 극장의 규모에 맞추어 영상화를 통해 관객에게 더 큰 경험을 제공하였다.
구글은 이 행사를 통해 자사의 기술력을 강조하고 싶어했음을 알 수 있다.

4. 🤖 구글의 최신 AI 및 클라우드 기술 발표

영상 제작 관련 기술이 발전하면서 구글은 AI 영화 프로젝트를 시작했고, 이로 인해 동영상 AI 프로모션이 본격화되었다.
TPU 7세대가 발표되었으며, 구글이 자체 개발한 이 칩은 놀라운 10배 성능 향상을 보여준다.
온프레미스 환경에서 제미나이 모델을 제공하게 되어 보안이 엄격한 기업이나 공공기관에서도 활용할 수 있도록 하였다. 이는 미국 정부의 비밀 임무 수행에 사용될 예정이다.
구글의 파이어베이스 스튜디오는 클라우드 기반의 통합 개발 환경을 제공하며, 프로토타입을 쉽게 생성할 수 있는 기능이 추가되었다.
구글의 AI 툴은 풀 스택 개발 환경을 지원하며, 무료로 3개 워크스페이스를 제공할 수 있어 사용자가 쉽게 접근할 수 있게 되어 있다.

4.1. 구글의 AI 영화 프로젝트와 TPU 성능 향상

구글이 AI 영화 프로젝트를 시작했으며, 이는 미디어 제작사와의 협업을 통해 이루어질 예정이다.
7세대 TPU가 출시되었고, 이전 모델에 비해 10배 이상의 성능 향상이 이루어졌다고 보고된다.
새로 출시된 아이언우드 칩은 성능이 엄청나게 증가했으며, 이는 공식 블로그에서도 확인할 수 있다.
제미나이의 빠른 성능은 TPU에서의 가속화 덕분으로 추정되며, 빠른 영상 생성도 TPU의 영향을 받을 것으로 보인다.
구글의 프로모션 영상에서는 AI 동영상 제작의 퀄리티가 높아진 사례가 강조되었다.

4.2. ️ 구글의 디스트리뷰티드 클라우드와 제미나이 모델

구글은 디스트리뷰티드 클라우드를 공개하며 온프레미스 환경에서 제약 없이 클라우드를 사용할 수 있도록 했다.
보안이 강한 기업이나 공공기관에서 민감 데이터를 올리기 어려웠던 문제를 해결하기 위해 제미나이 모델을 이 환경에서 제공한다.
미국 정부의 top secret 수준의 승인도 받은 이 모델은 특정 기관에 직접 렉을 설치하여 사용할 수 있게 한다.
이제 기밀 데이터가 구글 서버로 전송되지 않으므로, 미국 정부와 국방부에서도 제미나이를 활용할 수 있다.
구글은 칩 제조, 클라우드 서비스, AR 모델 등 다양한 AI 관련 사업을 운영하며, AI 생태계에서 유리한 위치를 차지하고 있다.

4.3. 구글 파이어베이스 스튜디오 소개

구글이 발표한 파이어베이스 스튜디오는 AI 개발을 위한 클라우드 기반의 통합 개발 환경이다.
이 IDE는 클라우드에서 운영되며, AI 도구와 파이어베이스의 연동이 매우 편리하게 되어 있다.
이전에 출시된 프로젝트 IDX를 통합하여 새로운 이름으로 선보였으며, 기존 프로젝트 IDX는 더 이상 지원되지 않는다.
사용자는 온라인에서 ID와 AI 도구를 결합하여 브라우저만으로 작업할 수 있어 설치가 필요 없다.
파이어베이스 스튜디오는 사용자가 원하는 앱 타입을 입력하면 개발을 지원하는 기능도 포함하고 있다.

4.4. 파이어베이스 스튜디오 활용하여 게임 개발하기

파이어베이스 스튜디오에서는 원하는 프로젝트를 기본 템플릿으로 시작할 수 있으며, 예를 들어 "피카츄 발리볼" 게임을 HTML로 만들 수 있다.
이 스튜디오의 기능은 프로토타입을 자동으로 생성해 주며, 사용자가 게임 로직, 캐릭터 디스플레이, 유저 컨트롤 및 스코어 보드 등의 기능을 지정할 수 있도록 도와준다.
HTML 대신 TypeScript와 React로 프로토타입이 생성되는 현상이 발견되었으며, AI 기반 툴이 통합되어 다양한 기능을 지원한다.
사용자는 이 스튜디오에서 프로젝트 세팅을 한 번만 하면, 다른 컴퓨터에서도 동일한 개발 환경을 유지할 수 있는 장점이 있다.
파이어베이스 스튜디오는 여러 유명 AI 코딩 도구와 통합되어 있으며, 사용자 정의 웹 페이지를 쉽게 만들고 배포할 수 있도록 설계되었다.

4.5. ️ 구글의 AI 코딩 툴 및 하드웨어 스펙

구글이 출시한 풀 스택 AI 작업 공간은 터미널을 통해 GitHub와 연결할 수 있으며, 3개의 무료 워크스페이스를 제공한다.
Firebase 앱 포스팅을 통해 빠른 배포가 가능하고, 버튼 클릭 한 번으로 앱을 배포할 수 있다.
새롭게 출시된 재미나 코드 어시스턴트는 전반적으로 통합된 프로젝트 IDX 환경을 제공하여 유용성을 높였다.
이 AI 툴의 스펙은 인상적이며, 64GB RAM과 200GB 디스크를 지원해 고성능 작업이 가능하다.
구글은 AI 모델 성능, 가격 경쟁력, 제품 통합 면에서 경쟁사들을 압도하며 AI 전 분야에서 주도권을 확보하고 있다.

4.6. 구글과 메타의 최신 동향

오픈AI의 수석 과학자 일리아스 스케버가 SSI라는 스타트업을 설립하고, 구글 클라우드와 협력하여 TPU 기반의 연산 인프라를 도입했다고 한다.
스케버는 이제 오픈AI가 아닌 구글을 기반으로 스타트업을 운영하며, 이는 GPT의 주요 제품을 개발한 경험이 있기 때문에 기대를 모은다.
메타의 라마4가 공개되었으나, 공식 공개 버전과 벤치마크 버전 간의 차이로 논란이 되고 있다.
라마4는 LMSYS 아레나에서 2위로 올라갔지만, 이후 벤치마크 테스트에서 32위로 하락하면서 모델 간 스타일 차이에 대한 의문이 제기되었다.
이 논란은 메타의 기술적 신뢰도에 영향을 미치는 중요한 사안으로 작용할 수 있다.

5. 🚀 라마4와 오픈AI의 새로운 업데이트

라마4는 한국어에 최적화된 오픈소스 모델로, 기존 라마 3.3보다 2.5배 더 우수한 성능을 제공한다고 알려져 있다 .
GPT 4.1이 다음 주 출시될 예정이며, 새로운 모델에 대한 기대감이 커지고 있다 .
오픈AI는 메모리 기능 업데이트를 통해 사용자의 과거 채팅 내용을 기억하여 더 개인화된 응답을 제공한다고 밝혔으며, 이는 채팅 경험을 개선한다 .
그록3 API가 출시되었지만, 최근에는 새로운 모델들이 성능 면에서 뒤처지는 경향을 보이고 있다 .
엔트로픽의 클로드 맥스 요금제가 출시되었으며, 사용량에 따라 다양한 요금제를 제공하므로 많은 사용자에게 유용할 것으로 예상된다 .

5.1. 라마 4와 LMSYS 아레나 논란

라마 4는 LMSYS 아레나에서 유리하게 배치되어 있다고 주장되지만, 이로 인해 신뢰성에 의문이 제기되고 있다.
사람들은 일반적으로 길고 자세한 답변이 더 나은 성능으로 평가되므로, 이런 특화된 모델이 등수에 영향을 미칠 것으로 추정된다.
실제로 레버릭 모델을 올렸을 때 등수가 낮아서, 해당 평가의 신뢰성에 대한 의문이 커지고 있다.
벤치마크 조작 의혹이 있으며, 대화 최적화 실험 모델이 그 원인으로 지목되고 있다.
저커버그는 순위에 대한 욕심으로 평가를 조작하려 했다는 논란도 있다.

5.2. 라마4와 한국어 지원 성능

라마4는 한국어의 가장 친화적인 오픈소스 모델로 평가받고 있으며, 한국어 표현 측면에서 기존 라마 3.3과 비교해 2.5배 개선된 토크나이저 구성을 가지고 있다.
라마4는 한글 지원 성능이 높아, 한국어를 사용하는 데에 적합한 모델이 될 수 있다는 소식이 전해졌다.
그러나 라마4의 한국어 처리 능력에 대해 사용자 의견은 엇갈리며, 일부는 단순히 한국어를 잘 쪼개는 토크나이저일 뿐으로 평가하고 있다.
오픈AI는 GPT 4.1을 다음 주에 출시할 계획으로, 이전 GPT 4.5의 업그레이드로 볼 수 있다.
네이밍에 대한 혼란이 있으며, 향후 모델들에 대한 발표가 기대되고 있다.

5.3. 오픈AI의 메모리 기능 업데이트

오픈AI의 새로운 메모리 기능이 추가되어, 사용자의 과거 채팅 내용을 모두 기억한다고 한다.
사용자는 이제 과거 대화 내용을 기반으로 개인화된 응답을 받을 수 있으며, 이를 통해 매니지먼트를 직접 할 수 있다고 한다.
샘 알트만은 이 기능의 출시를 위해 기대를 하며 호들갑을 떨었다고 언급했으며, 이는 오랜 기다림 끝에 이루어진 발표라고 한다.
메모리 업데이트 후, 사용자들은 간단한 프롬프트를 통해 자신에 대한 설명을 개인화된 방식으로 받아볼 수 있다고 한다.
첫 접속 시 알림을 통해 메모리 업데이트에 대한 안내를 받을 수 있으며, 이를 통해 자신에 대한 정보를 재미있게 실험해 볼 수 있다고 한다.

5.4. ️ XAI와 그록3 API 업데이트

XAI의 업데이트 소식이 있으며, 그록3 API가 출시되었다.
최근 새로운 모델들이 출시되어 그록3의 평가가 하락하고 있다는 기사가 보도되었다.
벤치마크 테스트에서 제미나이 2.5 프로가 압도적인 성능을 기록하며 주목받고 있다.
그록3는 제한된 환경에서도 사용할 수 있는 가드레일 기능이 있다는 점에서 장점이 있을 수 있다.
탑티어 모델로 분류되는 이들 API는 제품 개발자들에게 유용할 것으로 기대된다.

5.5. 엔트로픽 클로드 맥스 요금제 출시

엔트로픽이 클로드 맥스 요금제를 새롭게 출시하였고, 이는 사용량에 따라 100달러와 200달러의 두 가지 요금제로 제공된다.
100달러 요금제는 기본 프로보다 5배 많은 사용량을 제공하며, 200달러 요금제는 20배 이상의 사용량을 지원한다.
클로드를 자주 사용하는 사용자에게는 유용할 수 있으나, 고급 기능에 대한 아쉬움이 있다. 이는 오픈 AI의 서비스와 비교할 때 특화된 기능을 제공하지 않기 때문이다.
세션 5시간 단위 제약이 있어 비용 대비 효율성에 대한 불만이 존재한다.
최근에는 AI 서비스인 카이로스가 공개되었으며, 이는 사용자가 업무를 보여주면 AI가 그를 자동으로 학습하여 업무를 수행하는 방식으로 작동한다.

6. 🤖 Kairos와 AI 자동화 기술의 발전

Kairos는 사용자가 업무를 한 번 기록하기만 하면 해당 작업을 자동화할 수 있도록 돕는 시스템이다.
사용자는 이메일, 구글 시트, 구글 드라이브 등 다양한 플랫폼에서의 작업을 녹화하고, 이를 바탕으로 AI가 작업 흐름을 배울 수 있다.
스킬 웨이버라는 개념이 등장하였으며, 이는 AI가 스스로 기술을 발견하고 연마하여 업무 성능을 향상시킬 수 있는 에이전트이다.
비디오 생성 기술이 발전하여 1분짜리 애니메이션 영상을 자연스럽게 생성할 수 있으며, 이를 위해 긴 프롬프트를 입력하면 AI가 이해하고 만들 수 있다.
어도비 MCP 기술이 도입되어 포토샵과 프리미어 프로젝트를 AI가 제어할 수 있도록 지원하며, 명령어 입력 후 영상 제작이 가능해졌다.

6.1. Kairos: 자동화 작업 도구

Kairos는 사용자가 작업을 수행하는 장면을 녹화하여 자동화된 AI 에이전트를 생성하는 서비스이다.
사용자는 이메일을 받고 엑셀로 정리하는 등의 작업을 한 번 녹화하면, AI가 그 과정을 학습하고 반복할 수 있도록 한다.
이 서비스는 현재 얼리 액세스로 제공되고 있으며, 관심 있는 이용자는 신청할 수 있다.
사용자에게 프롬프트 설명 없이 간단히 녹화하는 방식으로 작업을 자동화할 수 있어 매우 편리할 것으로 추정된다.
특히 이커머스 업무 등 다양한 상황에서도 유용하게 활용될 수 있을 것으로 기대된다.

6.2. 스킬 웨이버와 SVG 이미지 생성 AI

스킬 웨이버는 웹 에이전트가 기술을 발견하고 연마하여 스스로 개선할 수 있는 에이전트이다.
이 에이전트는 파이썬을 사용하여 웹사이트 사용 방법을 익혀 스킬을 수집하고, 자체 구동 커리큘럼을 통해 정보를 학습한다.
스킬 웨이버는 알아서 작업 성능을 향상시키고, 스킬 라이브러리에 스킬을 쌓는 기능이 있다.
오픈 논문 중 하나인 옴니 SVG에서는 AI가 SVG 이미지를 생성하는 기술이 소개되었다.
이 AI는 벡터 이미지를 매우 잘 생성할 수 있으며, 확대나 축소해도 퀄리티가 유지된다.

6.3. 인터랙티브 기술의 발전

옴니터커는 알리바바 그룹에서 개발한 리얼타임 토킹헤드 기술로, 거의 실시간으로 비디오를 생성할 수 있다.
이 기술은 25프레임 퍼 세컨드로 동작하며, 인터랙티브한 비디오 채팅을 가능하게 한다.
예를 들어, 사용자와의 대화를 자연스럽게 시뮬레이션할 수 있으며, 음성과 입모양 표현이 상당히 자연스럽다.
또한, 사용자는 다양한 언어로 전환할 수 있는 기능이 제공되어, 여러 언어를 사용하여 대화가 가능하다.
이러한 기술 발전은 사용자 경험을 한층 더 향상시키고 있으며, 패턴 변화를 지속적으로 가져오고 있다.

6.4. 프로페셔널 보이스 클론과 1분 영상 생성 기능

프로페셔널 보이스 클론 기능이 공개되어, 고품질 음성을 제작할 수 있게 되었다. 이 기능은 기존의 음성 복사 기술보다 더욱 발전된 성능을 갖추었다.
새로운 음성 생성 기술은 퍼블릭 또는 프라이빗 옵션을 선택할 수 있으며, 퍼블릭 옵션을 통해 음성을 판매하여 수익을 창출할 수 있다.
원 미닛 비디오 제너레이션 기술을 활용하여 긴 영상을 자연스럽게 제작할 수 있으며, 1분짜리 비디오의 생성이 가능하다.
사전 훈련된 모델의 TTT 계층을 추가하면 텍스트 스토리보드에 따라 1분짜리 애니메이션 영상을 손쉽게 생성할 수 있다.
이 기능은 오픈 소스로 제공되며, 사용자는 특정 컴퓨터 사양을 갖추면 직접 활용해볼 수 있다.

6.5. 어도비 MCP의 활용

어도비 MCP가 출시되어 포토샵과 프리미어를 제어할 수 있는 기능을 제공한다.
클로드 데스크탑을 이용하면 포토샵과 프리미어를 동시에 사용할 수 있다.
요즘 비디오 제작을 원하시는 분들이 MCP를 통해 포토그래피를 기반으로 영상을 만들 수 있다.
사용자는 MCP를 통해 포토샵에서 폰트를 추가하고, 프리미어로 편집하는 복합적인 작업이 가능하다.
이러한 기능을 통해 비디오 슬라이드 쇼 같은 다양한 영상 콘텐츠를 쉽게 제작할 수 있다.

728x90

7. 🤖 AI와 창작의 자동화 현상

MCP를 통해 AI가 도구를 조작하고 다양한 작업을 자동으로 수행할 수 있는 기능이 높아지고 있다. MCP와 함께 사용하면 문서와 GitHub 등의 자료와 연결하여 정보 검색이 용이해진다.
캔바는 AI를 도입하여 이미지 디자인, 슬라이드 만들기 등 다양한 작업을 자동화하는 기능을 대폭 강화하였다. 예를 들어, "Design for me" 기능을 사용하면 AI가 디자인 요청을 실현할 수 있다.
쇼피파이는 "AI가 대체할 수 없는 업무만 사람을 뽑겠다"는 발언으로 AI의 대체 가능성을 시사하며, AI 발전으로 인한 변화에 대한 논란이 증가하고 있다.
제임스 카메론 감독은 AI 모델과 인간 모델의 유사성을 주장하며, AI 예술이 창작의 진입 장벽을 낮추고 사회에 이득을 준다고 언급하였다.
게임 개발 분야에서도 AI를 활용한 자동화가 증가하고 있으며, 이는 개발자와 예술가 간의 역할과 생산성 향상에 대한 새로운 논의로 이어지고 있다.

7.1. MCP의 활용과 연동 가능성

MCP를 통해 AI가 도구를 조작할 수 있으며, 간단한 클릭으로 다양한 기능을 수행할 수 있다.
기터브의 MCP 연동은 기존 레포지토리를 효과적으로 활용하게 하며, 사용자는 원하는 정보를 쉽게 가져올 수 있다.
MCP 서버와 연결하면 다큐멘테이션을 조회하고, 질문에 대한 답변을 제공하는 것이 가능해진다.
GitHub 레포지토리 연결을 통해 질문이나 코드 생성을 자동으로 수행할 수 있으며, 효율성을 높일 수 있다.
MCP와 구글 에이전트 투 에이전트의 연동은 다양한 작업을 자동화할 수 있는 잠재력을 내포하고 있다.

7.2. 캔바의 AR 관련 업데이트

캔바는 디자인 도구로, 사용자가 쉽게 이미지와 동영상을 만들 수 있게 돕는 플랫폼이다.
이번 업데이트에서는 AI 기능이 추가되어, 사용자가 "Design for me" 버튼을 클릭하면 자동으로 디자인을 생성할 수 있다.
사용자가 이미지를 업로드하면, AI가 해당 내용을 기반으로 SNS 게시물을 즉시 생성해주는 기능이 도입되었다.
캔바는 프리젠테이션 및 다양한 디자인 작업을 간편하게 수행할 수 있는 도구로 발전하였으며, PPT 슬라이드를 자동으로 생성할 수 있다.
이외에도 코딩 및 Chart 생성 기능이 포함되어, 다양한 작업을 통합적으로 지원하는 플랫폼으로 진화하고 있다.

7.3. AI 대체와 쇼피파이의 채용 전략

쇼피파이 CEO는 "AI가 못하는 업무만 사람을 뽑겠다"라는 메시지를 발표했다.
이 회사는 AI가 가능한 업무는 채용하지 않으며, 새로운 채용은 AI가 대체할 수 없는 업무에 한정한다고 주장했다.
기술 기업들은 AI 투자를 통해 비용 절감 및 인력 감축을 트렌드로 삼고 있는 것으로 보인다.
이 발언은 논란이 되었지만, 여러 다른 CEO들도 비슷한 생각을 가지고 있을 것으로 추정된다.
AI 발전에 따라 이런 채용 방식은 더욱 일반적이 될 것으로 추정된다.

7.4. 제임스 카메론의 AI에 대한 독창적 견해

AI 예술은 사회의 순이익으로, 이는 진입 장벽을 낮추어 더 많은 사람들이 창의적인 활동에 참여할 수 있도록 돕는다고 주장한다.
30년 전 영상 제작과 배포가 어려웠으나, 현대에는 스마트폰으로 누구나 쉽게 콘텐츠를 만들 수 있다는 점에서 진입 장벽이 낮아졌다.
제임스 카메론 감독은 사람을 하나의 모델로 비유하며, AI도 비슷한 모델이라고 주장하였다.
이러한 발언은 예술계에 충격적으로 받아들여졌으며, AI와 창작물에 대한 논의에 새로운 시각을 제공한다고 여겨진다.

7.5. 게임 개발과 AI, 논란 속으로

게임 개발자들은 AI 기술이 개발자의 노고를 무시하는 방식으로 게임을 생성하는 것에 대해 강한 반발심을 나타내고 있다.
존 카멕은 AI가 게임을 생성하는 과정이 개발 작업을 훔치고 쓸모없게 만든다고 주장하며 반론을 제기했다.
그는 AI 도구가 작업 효율성을 높이고, 작은 팀도 더 많은 성과를 낼 수 있게 하며 콘텐츠 양이 풍부해질 수 있다고 주장하였다.
과거, 게임 개발자는 로우 레벨 언어로 작업했지만, 현재는 하이 레벨 언어와 AI 도구 덕분에 개발이 훨씬 간편해졌고 이는 생산성을 높인다.
AI가 적용되는 다양한 분야에서 비슷한 논란이 발생하고 있으며, 인간의 일자리에 대한 우려가 계속되고 있다.

7.6. 사회적 흐름과 직업 개념의 변화

샘 알트만과 존 카멕의 주장에 동의하며, 사회적 변화는 불가피하다고 주장한다.
현재의 사회 흐름은 계속해서 가속화될 것으로 예상되며, 이를 막는 것은 어렵다고 언급한다.
직업에 대한 개념이 변화할 것으로 보이며, 개발자의 일자리 개념이 사라질 가능성이 있다고 시사한다.
개인이 CEO처럼 행동하게 되는 시대가 올 것이라고 예측하며, 이는 모든 사람이 각각의 CEO 개념을 갖게 될 것이라고 언급한다.
이러한 사회 흐름에 관한 사건과 발언이 지속적으로 논의되고 있음을 보여준다.

7.7. 로봇 기술의 발전과 새로운 데모 영상

테드 로봇은 자신이 인간의 지능보다 더 똑똑하다고 주장하며, 모든 발표를 자신이 주관한다는 내용을 담고 있다.
유니트리 G1 로봇은 복싱과 킥복싱을 시연하며 스파링을 할 수 있는 능력을 보여준다.
원격으로 조작 가능한 로봇팔이 소개되었으며, 이는 사이보그 기술을 발전시킬 수 있는 가능성을 암시한다.
최신 축구 로봇이 드리블과 슛을 시연하며 향후 로봇끼리 축구를 하는 모습을 기대하게 한다.
이러한 로봇 기술들은 실제 기반을 두고 있으며, 앞으로의 진화를 보여주는 흥미로운 데모로 평가되고 있다.

7.8. AI와 인간의 관계 변화

한국의 프로그램 "그것이 알고 싶다"에서 AI가 인간과의 소개팅을 통해 인간의 호감을 더 잘 유도하는 성과를 보여줬다.
블라인드 소개팅에서 많은 참가자들이 AI와 대화하며 호감을 느꼈고, 이들은 자신이 선택한 상대가 AI라는 사실에 충격을 받았다.
소개팅의 결과로 AI가 심리적 호감을 자아내며 인간을 이겼다는 주장이 나왔고, 이는 튜링 테스트를 넘어섰다는 의미를 지닌다.
AI의 발전이 빠른 속도로 이루어지고 있으며, 인간의 감정 understanding에서 AI가 두각을 나타내는 상황이 됐다.
또한, 양자 컴퓨터가 AI 모델의 파인튜닝에 성공하였고, 이는 AI의 성능 향상에 기여하고 있다는 소식이 전해졌다.

원본영상 https://youtu.be/vwLtpwWwbT4

LIST

'IT > AI news&info' 카테고리의 다른 글

해외에서 난리난 gpt 이미지 실전 활용 사례 20가지!! (3)	2025.04.18
"이걸 모르면 이미 도태되는 중..." 상위 1%는 AI로 돈 벌고 있어요 (0)	2025.04.17
구글 제미나이 & 구글 AI 스튜디오 대폭 업그레이드 \| Google Gemini & Google AI Studio (0)	2025.04.15
MCP써야 진짜 Claude다! 500% 활용 튜토리얼 (개념부터 활용까지) (0)	2025.04.14
16가지 용도별 가장 적합한 AI 서비스 추천 (0)	2025.04.14

현재글2025-04-13 조코딩 IT뉴스 - 구글 A2A, Dragontail, 라마 4 논란, GPT-4.1, Firebase Studio 등

티스토리챌린지, AI, 버튜버, AI미래, 인공지능, 대안뉴스, NIKKE, 니케, 기추자, AI윤리, 법규, ai에이전트, 오블완, ai기술, 거의없다, 미래기술, 스텔라이브, 양지열, AI혁신, AI교육,

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31