IT/AI news&info

구글 I/O 2025 Wrap Up

soures 2025. 6. 5. 09:26
728x90
반응형

📌 구글 I/O 2025에서 발표된 가장 핵심적인 내용은 무엇인가?

구글 I/O 2025에서는 영상 생성 모델 BO3와 AI 영상 편집 툴 플로우, 그리고 온디바이스 AI 모델 잼마 3N 등 다양한 AI 기술과 제품들이 공개되었습니다

💡 BO3와 플로우의 주요 기능은 무엇인가?

  • BO3: 소리까지 생성하는 영상 생성 모델로, 다양한 유튜브 영상 스타일(게임, 테크, ASMR 등)을 딸깍 한 번으로 만들 수 있습니다
  • 플로우: AI 영상 편집 툴로, 생성된 영상을 원하는 대로 편집하고 오브젝트를 추가하는 등의 기능을 제공합니다

이번 google i/o 2025에서는 AI 기술의 발전과 다양한 서비스 통합이 두드러졌습니다. 특히, 텍스트 프롬프트로 영상과 음향을 동시에 생성하는 bo3와 AI 기반 영상 편집 툴 플로우는 영상 제작 분야에 혁신을 가져올 것으로 기대됩니다. 또한, gemini live를 통해 향상된 음성 인식, 메모리, 컴퓨터 제어 기능을 선보이며 미래 ai 에이전트의 가능성을 제시했습니다. Gemini 2.5 Pro의 새로운 모드인 deep sink는 벤치마크에서 sota를 달성하며 뛰어난 성능을 입증했습니다. 이 외에도, 스티치, 주스등 개발 생산성을 높이는 도구와 쇼핑, 검색, 화상 회의 등 다양한 서비스에 AI를 통합하여 사용자 경험을 향상시키려는 노력이 돋보였습니다.

반응형

1. 🎥 구글 I/O 2025: 혁신적인 영상 생성 모델 발표

  • 구글 I/O 2025에서는 영상 생성 모델이 소개되었으며, 이 모델은 영상과 소리를 동시에 생성할 수 있는 혁신적인 기술이다. 이 모델은 실제로 사용 가능하여 많은 사용자들이 이를 활용해 이미지를 만들어내고 바이럴 현상을 일으키고 있다.
  • 발표된 영상 생성 모델은 유저들이 게임 영상, 요리 영상, 언박싱 영상 등 다양한 콘텐츠를 쉽게 만들 수 있도록 해주며, 이를 통해 개인 크리에이터가 고품질의 영상을 제작할 수 있는 시대가 열렸다.
  • 이 기술은 애니메이션과 같은 복잡한 장면을 쉽게 생성할 수 있어, 기존의 픽사와 같은 스튜디오에 큰 영향을 미칠 것으로 예상된다. 제작 과정이 단순화되면서 픽사의 직업 구조에도 변화가 생길 수 있다.
1.1. 구글 I/O 2025 행사 정리
  • 구글 I/O 행사는 미국 시간 기준으로 어제 진행되었으며, 현재는 새벽 2시이다.
  • 행사 관련 일정을 마친 후, 핵심 내용을 정리하여 라이브로 전달하기로 결정하였다.
  • 라이브 진행 중에는 마이크와 사운드 세팅 문제를 점검하며 소통을 하였다.
  • 사운드는 문제없이 괜찮다고 확인되었다.
  • 행사에 대한 정보는 빠르게 전달할 예정이라고 언급하였다.
1.2. 구글 I/O 2025 발표 내용 요약
  • 구글 I/O 발표는 정말 많은 내용을 담고 있으며, 여러 기사와 공식 블로그에서 다뤄진 바 있다.
  • 발표의 주요 내용은 이전에 공개된 모델을 기반으로 발전시키거나 응용한 기술들 중심으로 구성되어 있다.
  • 구글은 새로운 모델과 기술을 먼저 공개하고, 그 응용 결과를 구글 I/O에서 발표하는 방향성을 보인다.
  • 계속해서 정보를 공개하는 전략이 있어, 이는 구글이 지속적으로 앞서 나가는 느낌을 줄 수 있다.
  • 전반적으로 구글은 대단한 기업이라는 인상이다.
1.3. 영상 생성 모델의 혁신
  • 영상 생성 모델이 단순한 영상 생성에서 나아가 소리까지 생성할 수 있는 혁신적인 기술로 발전하였고, 이를 통해 영상과 소리를 동시에 생성하는 모델이 가능해졌다.
  • 사용자는 결제를 통해 누구나 이러한 모델을 사용할 수 있으며, 이미 많은 사용자들이 다양한 영상 콘텐츠를 제작하여 바이럴 효과를 누리고 있다.
  • 간단한 클릭으로 자연스러운 영상과 소리를 포함한 완벽한 콘텐츠를 생성할 수 있으며, 과거의 복잡한 작업을 대체할 수 있게 되었다.
  • 물리 법칙을 반영한 사실적인 표현이 가능하여 파도, 바람소리 등 다양한 자연적인 요소들이 잘 재현되고, 애니메이션 제작도 손쉬워진다.
  • 이 기술은 유튜버들에게 새로운 기회와 도전을 제공하며, 기계식 키보드 소리나 요리 영상 등 다양한 분야에서도 활용될 수 있음을 보여준다.
1.4. 다양한 콘텐츠 생성 가능성
  • 유저들이 만든 콘텐츠는 놀라운 가능성을 보여주며, 유튜브 영상을 쉽게 만들어낼 수 있다.
  • 게임 유튜버는 게임 플레이와 해설을 즉시 생성할 수 있어 효율적인 콘텐츠 제작이 가능하다.
  • 테크 유튜버는 언박싱 영상을 만들 수 있으며, ASMR 소리와 함께 많은 종류의 영상을 생성할 수 있다.
  • 음악, 랩, 노래를 포함한 다양한 형식의 콘텐츠도 몇 번의 클릭으로 즉시 생성 가능하다.
  • 스탠드업 코미디와 같은 유머 콘텐츠도 자연스러운 리액션과 함께 제작할 수 있어, 다양한 장르에서 활용되고 있다.
1.5. 딸깍딸깍 시대의 도래
  • 영상과 소리를 간편하게 만들어낼 수 있는 기술이 발달하여, 사용자들이 원하는 내용의 영상을 쉽게 생성할 수 있다.
  • 픽사 애니메이션을 만들기 위해 필요한 직원 수가 약 800명으로, 이제는 개인이 단독으로 애니메이션을 제작할 수 있는 시대가 도래했다.
  • 개인 크리에이터들이 픽사의 브랜드를 활용하여 독립적인 작품을 제작하는 가능성이 높아지며, 이에 따라 기존의 구조 조정이 필요할 것으로 보인다.
  • 이제는 소리가 포함된 영화나 애니메이션도 손쉽게 제작할 수 있는 환경이 조성되었다.
  • 스파게티 벤치마크와 같은 자연스러운 표현 기술이 구현되어, 사용자가 원하는 특정 상황을 매우 현실감 있게 재현할 수 있다.
1.6. 구글의 새로운 영상 편집 툴, 플로우
  • 플로우는 구글이 새롭게 제공하는 AI 기반 영상 편집 툴로, 사용자가 쉽게 영상을 제작할 수 있도록 돕는다.
  • 사용자는 드래그 앤 드롭 방식으로 원하는 요소를 추가하고 각도를 조정하여 편집할 수 있다.
  • 플로우를 이용하면 어도비의 편집 툴이 필요하지 않아지며, 영상을 직접 생성하는 것이 가능하다.
  • 이 툴은 영상 편집의 패러다임을 바꿀 것으로 추정되며, 소리와 시각적 요소의 결합이 큰 차별점을 만든다.
  • 전반적으로 플로우는 대중적으로 큰 임팩트를 가진 발표로 평가된다.

 

2. 🤖 구글의 음성 및 에이전트 기술 발전

  • 구글의 BO3TTS(텍스트-투-스피치) 음성이 더 자연스러워졌으며, 여러 음성 생성 기능이 개선되었다.
  • 제미나이 라이브는 향상된 음성과 메모리 기능을 통해 사용자가 필요로 하는 정보를 실시간으로 제공할 수 있는 능력을 보여준다.
  • 사용자는 제품 설명서를 탐색하고 관련 영상을 찾아볼 수 있으며, 이메일을 통해 필요한 부품도 식별할 수 있다.
  • 인공지능이 대화 맥락을 이해하여 사람처럼 자연스럽게 대처할 수 있는 기능이 구현되었다.
  • 에이전트 모드를 활용하면 사용자가 아파트를 지속적으로 검색하게 할 수 있으며, 맞춤형 기준에 따른 결과를 제공할 수 있다.

 

3. 🚀 구글 I/O 2025: 최신 모델 업데이트 및 혁신 소개

  • 제미나이 2.5프의 업데이트로 새로운 딥싱크 모드가 공개되었으며, 이 기능은 더 심층적인 분석을 가능하게 한다 .
  • 제미나이 2.5프의 성능이 벤치마크 점수에서 소타와 비교해도 높은 수준임을 보여주고 있으며, 수학과 코드 코딩에서 탁월한 점수를 기록하고 있다 .
  • 제미나이 2.5 플래시 모델은 가성비가 뛰어나고 성능도 우수하여 경쟁 모델들에 비해 저렴하면서도 만족할 수준의 성능을 제공한다 .
  • 새로운 구글 디퓨전 기능은 이미지 생성 방식을 적용한 모델로, 리얼 타임으로 높은 속도로 텍스트를 생성하는 것이 가능하다 .
  • 스티치라는 새로운 디자인 툴이 소개되었으며, 이를 통해 웹사이트와 앱 디자인을 쉽게 만들고, 피그마와 코드로 통합할 수 있는 기능이 제공된다 .
3.1. 제미나이 2.5와 딥싱크 업데이트
  • 제미나이 2.5의 업데이트는 미리 공개되었으며, 아이오 에디션 이후 새로운 모드인 딥싱크가 추가되었다.
  • 딥싱크는 사용자가 심층적으로 볼 수 있는 기능으로, 생각한 시간을 길게 주는 역할을 한다.
  • 제미나이 2.5의 딥싱크를 활용 시, 벤치마크에서 수학 문제에서 높이 평가된 점수를 기록하고 있어 성능이 크게 향상되었다.
  • 코딩도 이전 모델인 53, 54보다 우수한 성능을 보여주며, 멀티모델리티 부문에서도 소타 1위를 기록하고 있다.
  • Google은 오픈 AI에 비해 성능 리더십을 강화하며, 제품과의 통합에서 큰 발전을 이루어냈다.
3.2. 구글의 가성비 모델 및 새로운 기술 발표
  • 구글은 가성비 모델인 제미나이 2.5 플래시를 새롭게 공개했다.
  • 제미나이 2.5 플래시는 가격은 저렴하지만, 만족스러운 성능을 제공한다.
  • 성능 비교에서 GPQ의 82%를 달성하며, 오포미니보다 높은 결과를 보인다.
  • 구글은 또 다른 혁신인 구글 디퓨전을 발표했으며, 이는 빠른 이미지 생성을 가능한 모델이다.
  • 디퓨전의 속도는 1479 토큰/세컨드에 달하며, 이는 매우 빠른 성능으로 보여진다.
3.3. 디퓨전 기반 코드 생성의 진화
  • 리얼타임으로 코드가 생성되는 기능이 놀랍다는 것을 강조한다.
  • 데모 시, 속도가 너무 빨라서 늦춰야 했다는 문제점이 있음을 언급한다.
  • 공식 키노트에서 재미나 디퓨전이 공개되었으며, 테스터들이 사용 중임을 알린다.
  • 디퓨전 모델의 성능은 2.5% 정도로 다소 낮지만, 속도는 매우 빠르다고 설명한다.
3.4. 스티치: 혁신적인 디자인 도구
  • 스티치는 훌륭한 디자인UI를 제작하는 제품으로, 다양한 앱 디자인을 쉽게 만들 수 있다.
  • 사용자는 '비치 바이브'와 같은 특정 테마를 선택하여 즉시 디자인을 생성할 수 있으며, 다양한 요소를 간편하게 변경할 수 있다.
  • 기능 추가는 간단한 명령으로 수행 가능하며, 예를 들어 홈스크린에 검색 기능을 추가하는 작업도 즉시 이루어진다.
  • 사용자 디자인은 직접 피그마에 전송할 수 있어, 디자인과 코드를 쉽게 연동하여 작업할 수 있다.
  • 디자인 툴 간의 상호작용이 강화되어, 모바일 및 웹 디자인을 통합 관리할 수 있는 환경이 조성되었다.
3.5. ️ 구글의 AI 코딩 에이전트 '주스' 소개
  • 주스는 AI 기반의 코딩 에이전트로, 제미나의 프로 기반으로 개발되었다.
  • 이 코딩 에이전트는 오픈AI의 코덱스와 유사한 개념을 가지고 있으며, 기터브와의 연동이 가능하다.
  • 주스는 검색 최적화 관련 테스트를 자동으로 생성하며, 여러 작업을 병렬로 처리할 수 있는 기능을 가지고 있다.
  • 다양한 기능이 서로 유사하게 발전하고 있으며, 개발 도구로서의 역할이 강조되고 있다.
  • 코드 보조 도구로서 사용자의 요구에 맞추어 자동으로 수정 및 리뷰를 할 수 있다.

 

4. 🛍️ 구글의 쇼핑 기능과 AI 통합

  • 구글은 트라이온 기능을 통해 사용자가 자신의 사진을 업로드하여 실제로 옷을 착용해 볼 수 있는 기능을 제공하여, 개인에게 맞는 옷을 미리 볼 수 있는 경험을 가능하게 한다 .
  • 새로운 AI 모드는 구글 검색을 개선하여 사용자가 보다 복잡하고 긴 질문을 하더라도 종합적인 답변을 제공하며, 이는 경쟁 서비스인 퍼플렉시티와 유사하다 .
  • 구글 미트에서는 실시간 번역 기능이 추가되어, 영어로 발화된 내용이 즉시 다른 언어로 번역되어 제공될 수 있는 기능이 생겼으며, 이는 전문가 통역사 없이도 소통이 가능하다는 점에서 큰 발전이다 .
  • 개인용 스마트 답장 기능이 포함된 GL에서 사용자는 자신의 문서와 스타일을 반영한 맞춤형 답변을 생성할 수 있으며, 이는 작업의 효율성을 높이는 데 기여할 것으로 보인다 .
  • 새로운 XR 글라시스안경은 사용자에게 실시간 정보 제공, 내비게이션 안내, 번역 자막 등의 다양한 기능을 수행할 수 있도록 하여, 실제 환경에서의 사용 가능성을 넓혀준다 .
4.1. ️ 구글의 쇼핑 기능과 트라이온 서비스
  • 구글은 쇼핑 기능을 통해 사용자가 자신에게 맞는 옷을 미리 볼 수 있는 트라이온 기능을 제공한다.
  • 사용자는 자신의 사진을 올리면 다양한 옷을 입혀 보며 자신의 체형에 맞는 모습을 확인할 수 있다.
  • 이 기능은 여러 스타트업과 오픈 소스 기술들을 융합하여 제품화한 것으로, 효율적으로 구현되었다.
  • 가격 알림과 같은 기능도 제공되어 필요 없는 검색 없이 가격 정보와 알림을 받을 수 있는 시스템을 갖추고 있다.
  • 그러나 이 시스템은 사용자 사진 확인 없이 동작하기 때문에, 악용의 가능성도 존재할 수 있다.
4.2. 구글의 AI 모드 기능 업데이트
  • 구글은 AI 모드를 도입하여 검색 기능을 크게 발전시켰으며, 이는 기존의 AI 검색 도구들과 유사한 형태임을 보여준다.
  • 사용자는 긴 쿼리를 입력해도 AI가 인터넷을 통해 정보를 종합하여 답변을 제공하는 일종의 통합 검색 경험을 할 수 있다.
  • AI 모드는 퍼플렉시티와 같은 경쟁 제품의 기능을 모방하고 있으며, 구글은 사용자에게 유용한 정보를 더 많이 제공하려는 목표가 있는 것으로 보인다.
  • 구글 미트에 실시간 번역 기능이 추가되어, 사용자가 서로 다른 언어로 대화할 경우 AI가 즉시 동시 통역을 제공한다.
  • AI의 발전으로 인해 동시 통역사의 필요성이 줄어들고 있으며, 이는 해당 직종의 생존에 위협이 될 수 있음을 우려하는 목소리가 있다.
4.3. 개인용 스마트 답장 기능과 구글의 발전
  • GL에서 개인용 스마트 답장 기능이 추가되었으며, 이는 구글의 다양한 서비스와 관련이 있다.
  • 구글은 사용자 개인의 문서와 말투를 종합하여 진짜 답변을 작성하는 것처럼 보이도록 답변을 생성할 수 있게 한다.
  • 이 기능은 곧 몇 주 내에 구독자로 출시될 예정이며, 기존에 비슷한 서비스를 제공하는 스타트업들과 차별화된 점이 있다.
  • 개인 정보 관리에 대한 강조가 있으며, 사용자의 동의를 받아야 개인화된 답변이 가능할 것으로 보인다.
  • 최적화된 답변 생성 기술에 따라, 사용자가 에이전트 기능을 활용해 더욱 자동화된 방식으로 응답을 받을 수 있는 환경이 조성될 것으로 보인다.
4.4. 구글 안드로이드 XR 글래시스의 혁신
  • 구글 안드로이드 XR 글래시스는 이전에 티저로 소개된 제품으로, 투명한 안경 형태로 화면 녹화와 다양한 기능을 지원한다.
  • 이 안경은 다른 일반 안경과 거의 비슷한 무게이며, 사용자가 다양한 정보를 실시간으로 확인할 수 있는 기능을 갖추고 있다.
  • 멀티모달 기능을 통해 사진이나 음악을 실시간으로 검색하고 해당 정보를 화면에 표시할 수 있으며, 이미지 설명도 제공한다.
  • 구글은 안경을 통해 네비게이션 기능을 제공하며, 사용자가 아래를 내려다보면 지도도 표시된다.
  • 구글은 젠틀 몬스터와 협업하여 디자인적으로도 매력적인 안경을 선보이며, O스코어 모델 또한 개발되었다고 밝혔다.
728x90

5. 🚀 잼마 모델과 구글 I/O 2025의 혁신

  • 잼마 모델의 3N은 클로즈 3.7 소넷과 비슷한 성능을 가지면서도 작은 크기를 자랑하는 모델이다 .
  • 이 모델은 2GB RAM에서 작동할 수 있어, 성능이 낮은 IoT 디바이스에도 통합이 가능하다 .
  • 온디바이스 AI 모델의 가능성 덕분에 인터넷 연결 없이도 뛰어난 AI 성능을 유지할 수 있다 .
  • 구글의 AI 제품들이 시장에 빠르게 새로 출시되고 있으며, 다양한 분야에서 응용되고 있다고 언급된다 .
  • 구글의 수익화 전략으로는 '울트라 플랜'이 있으며, 이 새로운 요금제로 수익성을 높이려는 시도가 이루어지고 있다 .
5.1. 잼마 모델 3N의 혁신적 성능
  • 잼마 모델의 3N이란 오픈소스 모델이 새롭게 출시되었으며, 이 모델은 클로즈 3.7 소넷과 큰 차이가 없는 성능을 보인다.
  • 이 모델은 다른 멀티모델 성능을 보여주면서도 4빌리언에서 2빌리언의 용량을 가진다고 알려져 있다.
  • 최소 2GB 램만 있으면 작동 가능한 이 모델은 온디바이스에서 매우 작고 효율적인 성능을 보여준다.
  • 성능은 3.7 소넷과 유사하며, IoT 디바이스와 같은 조그만 기기에서도 사용 가능하다는 점이 놀랍다.
  • 이러한 발전으로 인해 인터넷 연결 없이도 강력한 AI 기능을 사용할 수 있는 가능성이 열렸다.
5.2. 구글 I/O 2025 발표 요약
  • 구글 I/O에서 발표된 내용 중 인상적인 점들을 간략하게 정리한 내용이다.
  • 다양한 업데이트가 있었으며, 구글이 AI 분야에서 매우 중요한 기업임을 강조한다.
  • 스타트업에서 하던 기술들이 통합되고 있으며, 구글의 모델들에 대한 지속적인 개발이 이루어지고 있다.
  • 구글은 드라이브, 이메일, 유튜브 등 많은 제품을 보유하고 있어 데이터 활용 가능성이 크다.
  • 발표 외에도 더 많은 재미있는 내용이 있으며, 전체적으로 많은 정보를 제공하고 있음을 암시한다.
5.3. 구글의 AI 시대와 수익화 전략
  • 구글의 AI 기반의 새로운 서비스와 제품이 출시되면서, 가능성이 엄청나고 새로운 시장이 열리고 있는 상황이다.
  • 그러나 주가는 큰 변동이 없으며, 이는 구글의 수익과 연결되지 않을 가능성에 대한 의문을 일으킨다.
  • 구글은 울트라 플랜이라는 새로운 수익화 수단을 도입했으며, 요금제는 약 250달러, 즉 35만 원 정도로 설정됐다.
  • 구글은 검색 광고로부터의 수익 비율이 60%에 달하나, AI 모드도입으로 인해 수익 구조가 변화할 것으로 예상된다.
  • 여러 스타트업처럼 구글도 고객 유치를 위해 자금을 소모하며 적극적으로 기능을 확대하고 있는 상황이다.
5.4. 일론 머스크의 옵티머스 세 영상 공개
  • 일론 머스크가 옵티머스에 대한 세 개의 새로운 영상을 공개했다.
  • 첫 번째 영상은 춤추는 옵티머스를 보여주고, 두 번째 영상은 쓰레기를 버리는 장면을 포함한다.
  • 학습 방식으로는 비디오를 통해 데이터를 수집하여 훈련되었다고 한다.
  • 비디오 기반 학습이 가능해지면서, 향후 여러 버전의 로봇이 현실화될 가능성이 있다고 추정된다.
  • 전반적으로 구글 I/O와 관련된 소식 정리를 통해 새로운 기술의 발전 가능성을 느낄 수 있었다.
5.5. 구글 I/O 2025 요약 및 프로젝트 무한
  • 구글 I/O 발표 중 인상 깊었던 점을 정리하고 있으며, 참석자에게 좋아요 요청을 하고 있다.
  • 프로젝트 무한은 비전 프로와 유사한 경험을 제공하며, 재미나이가 포함되어 있어 실용성이 높다는 인상을 주고 있다.
  • 무한 프로젝트는 삼성과 협력하여 개발되었으며, 가벼운 안경 형태로 실용성 좋은 디스플레이를 갖추고 있다는 의견이 제시되었다.
  • 안경의 해상도 및 프레임은 비전 프로보다 좋지는 않지만, 가벼워서 사용 시 편안하다는 평가가 있다.
  • 한국으로 돌아가는 일정과 타임존 차이를 언급하며 시청자에게 인사를 전하고 있다.

 

 

원본영상 https://youtu.be/gXJbsvwuk-g

LIST