IT/AI news&info

2025-04-20 조코딩 IT뉴스 - 오픈AI o3, o4-mini, gpt-4.1 공개, 구글 돌고래 번역 AI, Gemini 2.5 Flash, Grok 3-mini, MS 비트넷 등

soures 2025. 4. 21. 19:06
728x90
반응형

이 IT 뉴스 영상은 오픈ai구글의 최신 ai 모델발표를 중심으로 IT 업계의 동향을 빠르게 짚어줍니다. 오픈aio3, o4 mini, gpt-4.1 공개와 구글돌고래 번역 ai, gemini 2.5 Flash 등 다양한 모델을 소개하며, 각 모델의 특징과 활용 사례를 설명합니다. 특히, o3의 이미지 추론능력과 gemini 2.5 Flash의 가성비에 대한 심층적인 분석은 시청자에게 유용한 정보를 제공합니다. 이 영상은 AI 기술의 발전과 경쟁 속에서 기업들이 어떤 방향으로 나아가고 있는지 보여주는 AI 기술 경쟁의 현황을 담고 있습니다.

반응형

1. 🛸 외계 생명체에 대한 흥미로운 뉴스 모음

  • 1990년대 작성된 미국 CIA 보고서에 따르면, UFO가 소련군을 돌로 만들었다는 내용이 포함되어 있다는 주장이 있다 .
  • 보고서에는 우크라이나에서 소련군이 UFO를 격추한 후 외계인들이 소련군을 돌로 변하게 했다는 내용이 담겨 있다 .
  • 최근 제임스 웹 우주 망원경을 사용해 120광년 떨어진 외계 행성 K2-18b에서 생명체의 존재를 시사하는 화학물질이 발견되었다 .
  • 디메틸 설파이드디메틸 디설파이드는 생명 활동에 의해 생성될 가능성이 높은 화학물질로, 외계 생명체 존재의 유력한 단서로 주목된다 .
  • 그러나 124광년의 거리 때문에 외계인과의 실질적인 만남은 현재 기술로는 어려운 상황이나, 미래의 기술 발전 가능성을 상상할 수 있는 이야기이다 .

 

2. 📰 구글 제미나이와 르세라핌의 협업 및 구글의 법적 위기

  • 르세라핌과 구글의 제미나이가 협업해 뮤직비디오 '컴 오버'를 제작했다는 소식이다.
  • 뮤직비디오에는 제미나이와 소통하는 장면이 포함되어 있으며, 광고적 요소도 있다는 주장이 있다.
  • 구글은 온라인 검색 시장에서의 불법 독점 문제로 인해 강제 사업 분할 위기에 처해 있다.
  • 구글은 이 판결에 동의하지 않으며, 이에 대한 항소할 계획을 세우고 있다는 입장을 보였다.
  • 광고 사업이 쪼개질 경우, 이는 유튜브와 기타 구글사업에도 큰 영향을 미칠 수 있다.

 

3. 🚀 놀라운 AI 발전 소식

  • 중국의 과학자들이 현재 기술보다 만 배 빠른 플래시 메모리를 개발했다고 한다. 이러한 연구는 네이처에 게재되어 놀라움을 자아낸다.
  • 오픈ai의 o3와 O4 미니 모델이 출시되었으며, 벤치마크에서 놀라운 점수를 기록했다. o3미니는 AIME 수학 점수 기준으로 91.6점을 기록하고, O4 미니는 더 높은 성적을 보인다.
  • o3 모델은 이미지 기반의 추론 능력이 향상되어, 미로를 완벽하게 통과하는 등의 성과를 보여주었다. 이는 o3가 이미지와 코드 기반으로도 우수한 퍼포먼스를 보임을 나타낸다.
  • O4 미니 하이는 70점의 아티피셜 아날리시스 점수를 기록하면서, o3보다도 뛰어난 성능을 지니고 있다. 다양한 벤치마크에서 높은 점수로 인정받고 있으며, 실제 성능 사례도 다수 보고되고 있다.
  • 이미지를 통해 위치 추정 및 답변 제공이 가능한 ai 모델이 새롭게 주목받고 있다. 사용자가 올린 사진을 분석하여 정확한 정보를 제공하는 능력이 크게 향상되었다.
3.1. 중국 과학자들의 혁신적인 플래시 메모리 개발
  • 중국의 과학자들이 현재 기술보다 만 배 빠른 플래시 메모리를 개발했다고 한다.
  • 이 연구는 네이처에 실렸으며 연속적인 기술 혁신을 보여주고 있다.
  • 만 배 빠른 속도를 통해 메모리의 성능이 어마어마하게 향상될 것으로 예상된다.
  • 이러한 혁신적인 소식은 기술 분야에서 큰 주목을 받고 있으며, 미래의 발전 가능성을 제시한다.
3.2. 오픈AI의 모델 발표 소식
  • 오픈ai에서 추론 모델 o3와 O4 미니를 출시했으며, 이는 도구 활용이 가능한 모델이다.
  • o3는 이전에 공개된 벤치마크를 통해 91.6점의 수학 성적을 기록하였고, O4 미니는 이보다 더 높은 점수를 나타냈다.
  • 추가로 O4 미니는 코드포스에서 엄청난 점수를 기록하며, 인간 최고 수준의 코딩점수와 비슷한 결과를 보였다.
  • 다양한 분야별 벤치마크점수가 존재하며, o3는 GPQA 과학 분야에서 더 높은 점수를 보이는 반면, Humanity Last Exam에서는 O4 미니가 높은 점수를 기록할 수 있다.
  • O4 미니 하이는 더 높은 추론 능력을 지니며, 이는 최대치로 활용되는 모델로 볼 수 있다.
3.3. O3 및 O4 모델의 높은 성능 분석
  • o3와 O4 모델은 멀티 모델 성능 및 이미지 기반 추론 능력에서 우수성을 보이고 있으며, 다양한 영역에서 높은 점수를 기록하고 있다.
  • 특히 이미지 출원이 가능해지면서, 기존의 텍스트 기반에서 벗어나 코드 및 이미지를 이용한 출원이 가능해졌다.
  • O4 미니는 벤치마크에서 높은 점수를 기록하며, o3보다 성능이 우수한 것으로 나타났고, 프론티어 메스와 같은 여러 기준에서도 뛰어난 성능을 보인다.
  • o3는 IQ 점수 136을 기록하여, 인간 평균 IQ 100을 상회하는 뛰어난 지능을 나타내고 있으며, 최근 모델들의 성능이 지속적으로 상승하고 있다.
  • o3의 롱 컨텍스트 처리 능력도 우수하여, 긴 문맥을 다루는 데 강점을 보이고 있으며, 특정 조건에서 거의 100점에 달하는 성과를 기록되었다.
3.4. 이미지 기반 추론 기술의 발전
  • 최근 오스리의 이미지 기반 추론 기술이 주목받고 있으며, 이 기술은 사진을 통해 위치를 추론할 수 있는 기능을 제공한다.
  • 사용자가 사진을 올리면 AI는 클루를 분석하여 지역 정보를 추정하는데, 예를 들어 번호판 및 건축 양식 등을 통해 상세히 분석한다.
  • 사용자의 사진을 올리면 AI가 비슷한 이미지들을 검색하여 어디인지 추적할 수 있으며, 이는 인스타그램과 같은 플랫폼에서도 이루어진다.
  • 이 기술은 심지어 도서관의 책 사진에서도 위치를 추정할 수 있을 정도로 정확하다.
  • 이러한 발전으로 인해 개인의 위치 정보가 쉽게 노출될 수 있으므로, 사용자들은 더욱 주의해야 한다.
3.5. 셀카와 AI의 상호작용
  • 사용자가 셀카를 올리자 AI는 이를 인식하고 과거의 사진이라고 설명했다.
  • 사진의 배경에 있는 장소는 스티브 잡스가 창립한 애플의 시작점인 차고로, 이 정보도 즉시 제공되었다.
  • AI는 사용자의 질문에 대해 정확하고 빠르게 위치 정보를 알려주는 능력을 갖추고 있다.
  • 이는 사용자가 직접 경험한 결과, AI의 기능이 매우 성공적이라는 점을 보여준다.

 

4. 🤖 오픈AI의 새로운 모델과 변화

  • 오픈ai의 gpt 4.1 api는 코딩에 특화되어 있으며, 3가지 모델 (4.1, 미니, 나노)로 구성되어 있다 .
  • gpt4.1은 100만 토큰당 2달러로 가격이 저렴하고, 미니와 나노 모델은 각각 0.4달러와 0.1달러로 더욱 경제적이다 .
  • gpt4.1은 소프트웨어 엔지니어 벤치 개발 기준에서 gpt 4.5보다 21% 향상된 성능을 보여준다 .
  • gpt4.1 모델은 4.5 모델이 종료될 예정이며, 2025년 7월 14일에 서비스가 종료된다 .
  • gpt4 모델도 종료되며, 이전 버전들과의 혼란을 드리는 복잡한 네이밍 체계가 주목받고 있다 .
4.1. 셀카 분석과 추론의 재미
  • 주차한 위치를 기억하기 위해 사진을 찍고 이는 추론하는 과정에서 흥미로운 경험이 된다.
  • 찍은 사진을 기반으로, 산타모니카의 특정 주차 구조를 짐작하고 이를 찾기 위한 과정을 수반한다.
  • 이미지를 확대하고 잘라내어 세부 정보를 분석하는 과정은 흥미롭고, 파이썬 코드를 사용하여 수행된다.
  • 타일과 같은 특징을 기반으로 추론을 진행하며, 여러 디테일을 분석하는 과정이 더 큰 그림을 이해하는 데 도움을 준다.
  • 마지막으로, 사진을 통해 얻은 결과가 타당한지 검증하는 과정을 보여주면서, 전체적인 추론의 과정이 즐겁다고 표현한다.
4.2. ️ 한국의 관광지를 AI가 추측하는 과정
  • AI는 한국의 관광지에 대한 정보를 제공하기 위해 네이버 검색을 제안하며, 가로수길을 첫 번째로 고려한다.
  • 여러 장소 중에서도 가로수길창원을 언급하지만, 특히 창원은 인지하기 어렵다고 판단한다.
  • AI는 한국에 특유의 번호판을 통해 한국이라는 지역을 추측할 수 있다고 언급하며, 이는 추측의 근거가 된다.
  • 애플스토어 가로수길 앞에 대한 정보가 AI에게 제공되면서, 명동과의 유사성을 지적하며 결국 위치를 정확히 맞추고 성공을 경험한다.
  • AI는 사람들의 복장과 디스플레이를 관찰하며, 이를 통해 특정 장소를 인식하는 데 필요한 디테일을 잘 파악하고 있다.
4.3. ️ 지오게서 게임과 이미지 기반 추론 능력
  • 지오게서 게임은 특정 위치를 맞추는 재미를 가지고 있으며, AI가 이 게임을 플레이할 수 있는 가능성을 보여준다.
  • 스크린샷으로 캡처한 이미지는 메타데이터가 남지 않아 정확한 정보 추출이 어렵다.
  • AI는 라운드 1에서 뉴질랜드 웰링턴을 정확히 맞추는 데 성공하여, 이미지의 다양한 요소를 바탕으로 추정할 수 있음을 증명했다.
  • AI는 주행 방향 등 주변 환경의 특징을 이용해 위치를 추론하는 능력이 탁월하다는 점이 강조되었다.
  • 이미지 기반 추론 능력이 향상됨에 따라, 개인의 위치 노출에 주의가 필요하며, 셀카와 같은 사진을 올릴 때에는 배경을 가리는 것이 좋다.
4.4. O3와 GPT 4.1 성능 분석
  • o3의 성능은 개선되었으나, 환각률이 48%로 높아지는 단점이 있다. 이는 추측컨대 단순한 개선이 아니라 환각문제도 존재함을 나타낸다.
  • 코딩에 특화된 gpt 4.1 api가 새롭게 출시되었으나, gpt 4.1은 채찍 PT UI에서는 사용할 수 없다. 오직 api로만 제공된다는 점이 주목된다.
  • gpt 4.1은 복잡한 작업을 위한 가장 똑똑한 모델로 소개되고 있다. 따라서, 이 모델은 효율성과 성능이 상대적으로 높을 것으로 예상된다.
  • api 사용자는 오픈ai 플랫폼에서 느리게 접속할 수 있는데, 이는 방문자가 많기 때문일 수 있다. 따라서, 사용 시 주의가 필요할 것으로 보인다.
4.5. ️ 코딩 특화 모델 GPT 4.1 시리즈 발표
  • 코딩에 특화된 모델로서 gpt4.1, 4.1 미니, 4.1 나노가 출시되었다.
  • gpt4.1은 성능이 엄청나게 향상되어 있으며, 특히 소프트웨어 엔지니어 벤치 개발 코딩능력 기준으로 매우 뛰어난 결과를 보인다.
  • 가격은 100만 토큰당 2달러로 설정되었으며, 4.1 미니는 0.4달러, 나노는 0.1달러로 매우 경쟁력 있는 가격이다.
  • 4.1 모델은 코딩 능력이 4.5에 비해 21% 향상된 것으로 평가되며, 지시를 따르고 멀티모델 간 문맥 이해 능력도 개선되었다.
  • gpt4와 4.5는 종료 예정이며, 4.1 시리즈가 코딩특화와 가격 대비 성능 면에서 다양하게 개발되었다.

 

5. 📊 오픈AI 모델 업데이트 및 변경 사항

  • gpt-4는 gpt-4.5로 대체되며 종료되는데, 가격이 비쌌고 사용 이유가 부족했기 때문이다 .
  • o3Pro가 출시될 예정이며, o3와 o4 mini는 가성비가 좋고 가격이 저렴한 모델로 추천된다 .
  • 오픈ai는 커스텀 gpts에서 이미지 생성 기능을 추가하여 사용자 편의성을 높였다 .
  • 플렉스 프로세싱 api는 느리게 응답하나 50% 저렴하게 제공되어 개발용 테스트에 유용하다 .
  • 오픈ai는 AI 코딩스타트업 윈드서프를 인수하고, 이를 통해 코드 수정 기능을 강화할 계획이다 .
5.1. GPT-4 종료 및 업데이트 정보
  • gpt-4는 더 이상 사용되지 않으며, gpt-4.5로 완전히 대체될 예정이다.
  • gpt-4는 가격이 비쌌고, 이제 활용할 이유가 없어졌다.
  • 오픈ai는 gpt-4를 종료함으로써 관리에 들어가는 에포트를 줄이려 한다.
  • 하지만 api에서는 gpt-4를 계속 사용할 수 있어, 채팅 기능에서는 없어질 예정이다.
  • gpt-4를 사용하는 사용자들은 빠르게 gpt-4.5로 업데이트하는 것이 권장된다.
5.2. ️ 오픈AI O3 Pro와 O4 Mini 출시 정보
  • o3Pro는 프로티어로 출시될 예정이며, 몇 주 안에 출시될 계획이다.
  • o3Pro는 이전 출시된 O1 Pro와 같이 성능이 가장 우수한 라인으로, o3버전으로 업데이트된다.
  • 가성비를 고려할 때 o3와 o4 mini가 더 좋은 선택일 수 있으며, o4 mini는 가격이 매우 저렴하다.
  • o4 mini는 여러 추론 작업 시 1달러의 비용으로 제공되며, o3는 1밀리언 토큰당 10달러로 가격이 상대적으로 높다.
  • 코딩태스크에는 O4.1이 특화되어 있어 이를 활용하는 것이 좋다고 알려져 있다.
5.3. ️ 오픈AI의 새로운 업데이트와 코딩 도구 출시
  • 오픈ai는 최근 여러 가지 업데이트를 진행하였고, 특히 터미널에서 사용할 수 있는 오픈 소스 코딩도구인 코덱스 cli를 출시하였다.
  • 코덱스 cli는 터미널 내에서 코딩을 지원하며, 오픈ai모델을 기반으로 하여 코드 수정 등의 기능을 제공한다.
  • 이 도구는 클로드의 코딩도구와 유사하게 CLI 기반으로 작동한다는 점에서 주목할 만하다.
  • 초기에는 새 모델인 코덱스의 출시로오해될 여지가 있었지만, 실제로는 기존 오픈ai모델을 활용하여 개발된 것이다.
5.4. 오픈AI 업데이트 내용
  • 오픈ai의 커스텀 gpts에서 gpt-4 이미지 생성 기능이 추가되었다.
  • 사용자는 gpt를 기반으로 한 자신만의 gpt를 만들 수 있으며, 추가된 이미지 생성 기능을 통해 지브릿 스타일로 자동 변환할 수 있다.
  • 오픈ai는 o3, O4 미니를 저렴하게 사용할 수 있는 방법인 플렉스 프로세싱을 출시하였다.
  • 플렉스 프로세싱은 천천히 처리되지만 50% 저렴한 가격에 제공되며, 필요할 때 개발용으로 사용할 수 있다.
  • 이 방식은 응답 속도가 급하지 않은 상황에서 유용하게 활용될 수 있다.
5.5. 오픈AI의 새로운 사업과 동향
  • 오픈ai가 소셜미디어 플랫폼을 개발 중이며, 이는 이미지 생성 및 공유에 초점을 맞춘 SNS로 알려져 있다.
  • 오픈ai가 30억 달러에 AI 코딩스타트업인 윈드서프를 인수한다고 하며, 이 도구는 AI가 사용자의 코드를 수정할 수 있는 기능을 제공한다.
  • 윈드서프는 AI 코딩도구 커서와 유사한 기능을 갖추고 있으며, 오픈ai와의 결합으로 더 나은 성능을 기대할 수 있다.
  • 오픈ai는 현재 gpt 4.1을 무료로 제공 중이며, 이벤트가 곧 종료되므로 사용자들은 등록 후 활용해볼 것을 권장한다.
  • api접근을 위해 신분증 검사를 도입하였으며, 이는 딥시크의 출력을 차단하기 위한 조치로 분석된다.
728x90

6. 🛠️ 구글의 새로운 AI 모델과 가성비 비교

  • 구글의 새로운 모델인 제미나이 2.5 플래시는 가성비가 뛰어나며 저렴한 요금으로 인풋과 아웃풋을 제공한다.
  • 제미나이 2.5 플래시의 Non-Thinking 기준 아웃풋 요금은 0.6달러로, Pro 기준 10달러와 비교하여 10분의 1에 불과하다.
  • 다양한 설정을 통해 씽킹 모드를 조정할 수 있으며, 사용자가 요구하는 추론의 강도를 선택할 수 있는 기능이 있다.
  • 구글 AI 스튜디오에서 제미나이 2.5 플래시를 직접 사용해볼 수 있으며, 인풋과 아웃풋 기준으로 가성비가 매우 좋다.
  • 구글의 새로운 모델인 젠마3는 저사양 GPU에서도 사용 가능하며, VRAM 요구량이 크게 줄어들었다.
6.1. 구글 제미나이의 가성비 분석
  • 구글의 모델인 o3와 o4 mini는 성능이 우수하지만, 가격이 비싸다.
  • 제미나이 2.5 프로는 가성비가 굉장히 좋고 저렴한 편이다.
  • 딥시크와 비교 시에도 제미나이는 상대적으로 저렴하다.
  • 구글은 제미나이 2.5 플래시라는 하이브리드 모델을 출시하여 가성비를 더욱 높였다.
  • 현재로서는 구글제미나이가 가성비를 고려했을 때 좋은 선택입니다.
6.2. ️ 제미나이 2.5 플래시의 가성비
  • 하이브리드 인공지능 모델인 제미나이 2.5 플래시가 출시되었으며, 출현력을 껐다 켰다 할 수 있다.
  • 제미나이 2.5 프로보다 훨씬 가성비 좋게 사용할 수 있는 제미나이 2.5 플래시가 공개되었다.
  • 제미나이 2.5 프로의 인풋 요금이 1.25 달러인 반면, 플래시는 0.15 달러로 매우 저렴하다.
  • Non-Thinking 기준으로 제미나이 2.5 플래시 아웃풋 요금은 0.6 달러로, 프로 기준의 10달러보다 10분의 1 가격이다.
  • 이렇게 가성비 좋은 모델인 제미나이 2.5 플래시는 가성비작업에 매우 유용한 선택지가 될 것으로 추정된다.
6.3. 하이브리드 추론 모델과 벤치마크 성능
  • 이 시스템은 씽크 모드씽킹 버젯 기능을 통해 사용자가 추론의 양을 조절할 수 있게 한다.
  • 구글검색과 결합하는 그라운딩 위드 구글 서치 기능이 추가되어, api를 통해 정보 검색을 더 효율적으로 할 수 있다.
  • 가성비 측면에서, 새로운 모델들은 인풋 아웃풋에서 저렴하고 성능이 뛰어나며, 특히 O4 미니와 비교했을 때 상당히 경제적이다.
  • 벤치마크 점수에서 O4 미니는 높은 점수를 기록하였고, 제미나이 2.5 플래시도 리더보드에서 공동 2위를 차지했다.
  • 그래도 플래시 모델이 괜찮은 성능을 보여주는 것은 인상적이다, 일반적으로 비용 대비 성능이 뛰어난 평가를 받고 있다.
6.4. ️ 구글의 이미지 및 비디오 추론 업데이트
  • 구글의 제미나이 모델에서 이미지 추론기능을 실행해보았고, 다양한 이미지에 대한 추론이 가능함을 확인하였다. 그러나 오픈 AI의 방식처럼 극단적으로 확대하거나 세부적인 코드 실행은 지원하지 않는 것으로 추정된다.
  • 구글의 이미지 추론결과, 특정 장소인 캘리포니아 컬버시티의 주차장을 추론했으나, 화자는 자신의 기억과의 일치 여부에 의문을 제기하였다.
  • 구글은 새로운 비디오 모델 vo2를 업데이트하여 텍스트 입력에 기반해 영상을 생성하는 기능을 추가하였다. 이 과정은 대체로 1-2분 내에 완료된다.
  • vo2를 활용하여 "대한민국 남성이 노트북으로 카페에서 코딩하는 영상"과 같은 텍스트를 입력하면, 해당 내용에 맞춘 영상이 생성된다.
  • 구글의 위스크 이미지 생성 기능이 다소 인기를 끌고 있으며, 이를 통해 제작된 이미지가 비디오로 변환될 수 있는 가능성을 시사하고 있다.
6.5. 위스크 애니메이트 및 젬마 모델 경량화 소개
  • 새롭게 추가된 위스크 애니메이트 기능을 통해 사용자는 이미지를 만들고 영상을 생성할 수 있는 가능성이 있다.
  • 구글의 젬마3 모델은 경량화되어 기존의 54기가 VRAM에서 14.1기가로 줄어들어 소비자용 GPU에서도 사용 가능하게 되었다.
  • 이제 사용자는 고성능 GPU 없이도 젬마 모델을 연결하여 오픈소스 형태로 사용할 수 있게 되었다.
  • 영상 생성 시 속도가 개선되어, 사용자가 빠르게 결과물을 확인할 수 있는 장점이 있다.
  • 위스크 사용자들은 새로운 기능을 통해 이미지에서 영상 제작까지 간편하게 할 수 있어 활용성이 높아졌다.
6.6. 구글의 새로운 모델 및 AI 개발 현황
  • 구글은 클레이브록이라는 코드명으로 UI, UX 코딩에 특화된 모델을 출시할 예정이다. 이 모델은 간단한 입력으로 바로 결과물을 생성할 수 있다.
  • 두 번째 모델 데이허시는 포켓몬을 생성하는 데 있어 퀄리티가 뛰어나며, 기존 모델인 2.5 프로와 비교할 때 UI가 더 명확하게 드러난다.
  • 구글은 UI, UX 개발을 위한 ai 모델을 실험하고 있으며, 향후 출시가 기대된다.
  • 구글딥마인드는 재미나이 2.5 울트라 모델을 내부적으로 테스트 중이며, 향후 더 많은 모델이 공개될 것으로 보인다.
  • 구글최대 개발자 행사인 구글 아이오가 5월 20일과 21일에 개최되며, 이 자리에서 새로운 기술과 모델이 발표될 것으로 예상된다.

 

7. 🐬 구글의 돌고래 언어모델 공개

  • 구글이 돌고래 통역기인 돌핀 젬마를 공개했으며, 이는 실제로 돌고래와 대화할 수 있는 언어 모델이다 .
  • 이 모델은 구글 픽셀폰에 탑재되어 가벼운 성능으로도 작동 가능하며, 4억 개의 매개 변수를 가진 경량 모델로 설계됐다 .
  • 돌고래의 소리 소통 방식인 클릭 소리와 휘파람 소리를 이해하려는 연구를 기반으로 하여 ai 모델이 개발된 것으로, 이는 오픈 소스로 공개될 예정이다 .
  • 돌고래와의 의사소통이 가능해짐으로써 인간과 돌고래 간의 대화 시대가 열릴 것으로 예상된다 .
  • 돌고래의 뛰어난 지능과 협동성을 바탕으로 기술 발전이 기대되며, 과거 연구들로부터 얻은 데이터를 통해 진보한 AI의 가능성이 강조되고 있다 .
7.1. 구글의 돌고래 언어 모델 '돌핀 젬마' 공개
  • 구글은 돌핀 젬마라는 돌고래 통역기를 공개하였고, 이를 통해 돌고래와의 의사소통이 가능해졌다.
  • 이 모델은 구글 픽셀폰에 탑재되어 가벼운 구조로 인해 핸드폰에서도 작동할 수 있다.
  • 돌고래의 소리를 토큰화하여 4억 개의 매개 변수를 가진 경량 모델이 개발되었으며, 이는 돌고래의 언어 이해에 기여할 것이다.
  • 구글은 이 모델을 오픈 소스로 공개할 계획이 있어, 사용자가 개인적으로 돌고래와 대화할 수 있는 기회를 제공할 예정이다.
  • 돌고래의 소통 방식은 클릭 소리, 휘파람 소리 등으로 다양한 연구를 통해 데이터가 축적되었고, 이를 바탕으로 모델이 만들어졌다.
7.2. XAI 그록의 최신 업데이트와 기능
  • XAI 그록에 메모리와 캔버스 기능이 추가되어, 대화 기억과 즉시 실행이 가능해졌다.
  • 최근 테스트에서 그록의 코드 생성 퀄리티가 향상되어, 피카츄 배구 게임을 만드는 데 성공했으며 실제로 게임을 플레이할 수 있을 정도로 완성도가 높다.
  • 또한, 비전 모드 기능이 추가되어 카메라를 통해 이미지 인식이 가능해지고, 최신 업데이트를 통해 비전 기능을 사용할 수 있다.
  • AI 기업들이 서로의 기능을 벤치마킹하며 업데이트를 진행하는 경향이 보여지며, 각기 다른 기업 간의 기술 전이가 이루어지는 상황이다.
7.3. ️ 그록3 미니 API의 가성비와 특장점
  • 가성비가 뛰어난 그록3 미니 api는 벤치마크점수에서 2.5 플래시 싱킹보다 높은 결과를 보여준다.
  • 아웃풋 기준으로 3.5 모델은 1회 사용당 0.5달러로, 상당히 저렴한 가격에 제공된다.
  • 그록3 미니는 사용자의 발언의 자유를 보장하며, 테스트 프롬프트에 대해 96.2%의 응답률을 기록하여 훌륭한 성능을 발휘한다.
  • 다른 모델은 20% 이상의 거부율을 보이는 반면, 그록은 3.8%에 불과해 가장 개방적인 모델로 평가된다.
  • 이러한 특장점 덕분에 그록 api는 민감한 대화가 필요한 서비스에서도 유리하게 작용할 수 있다.
7.4. 오픈AI와 AI 생태계의 변화
  • 오픈ai는 타사 위험 모델 출시 시 자신의 안전 테스트 단축 가능성을 제기하고 있으며, 안전 테스트의 필요성 때문에 지연되고 있는 상황이 있다.
  • 1등으로 출시할 경우 비판을 받을 수 있다는 점에서, 후발 주자들이 더 많은 자유를 누릴 수 있는 기회를 제공받는 것으로 보인다.
  • 오픈ai와 다른 개발자들이 검열의 약화를 통해 자유롭게 제품을 개발할 수 있는 환경을 기대하고 있으며, 이는 사용자에게 긍정적인 영향을 미칠 수 있을 것으로 추정된다.
  • 엔트로픽도 비슷한 경향을 보이며, 다양한 리서치 기능을 출시하여 AI 기능들이 점점 비슷해지고 있다는 분석이 있다.
  • 구글워크스페이스와의 결합을 통해 리포트 작성 기능이 강화되었고, 다양한 정보에 접근할 수 있는 기능이 추가되었다.
7.5. 엔트로픽과 마이크로소프트의 최신 기술 동향
  • 엔트로픽은 음성모드가 없는 상태에서, 클로드 음성모드를 이달 중으로 출시할 예정이다.
  • Fast api를 사용하는 api를 빠르게 MCP 형태로 변환할 수 있는 도구가 등장했으며, 이는 유용할 것으로 예상된다.
  • UV라는 새로운 도구가 등장했지만, 기존의 pip와의 차이가 크지 않다는 의견도 있다.
  • 마이크로소프트는 비트넷이라는 1비트 LLM 추론 프레임워크를 오픈 소스로 공개하여, CPU에서 100억 매개변수 모델을 실행할 수 있게 되었다.
  • 1비트 LLM은 경량화된 구조로 CPU에서도 구동 가능하나, 정확도는 떨어질 수 있는 가능성이 있다.
7.6. AGI 테스트와 AI 모델 성능
  • 최근 AGI 테스트에서 o3및 재미나 2.5 프로와 같은 ai 모델들이 손가락 수를 정확히 인식하지 못하고 다섯 개로 착각하는 결과를 보였다.
  • 여러 ai 모델이 손가락 수를 물어보면, 실제로는 여섯 개인 손가락을 다섯 개라고 잘못 인식하여 할루시네이션 현상이 발생했다.
  • 이러한 결과들은 AI의 인식 능력을 측정하는 새로운 벤치마크가 될 것으로 보이며, 테스트한 AI 모두가 결과를 틀렸다.
  • ai 모델들이 이미지에서 손가락 개수를 잘못 인식함으로써, 인간과 AI 모두가 불완전한 인식을 가지고 있다는 점을 강조한다.
  • 이러한 테스트 결과는 앞으로 ai 모델의 성능을 평가하는 데 유용하게 활용될 수 있을 것으로 보인다.
7.7. 클링 2.0의 향상된 비디오 생성 기술
  • 클링 2.0은 비디오 입력 기능을 추가하여 업데이트되었으며, 퀄리티가 더욱 향상되었다.
  • 이전 버전인 1.6에 비해 모션, 이모션, 감정 표현이 개선되었고, 실제 인간의 연기와 유사하게 동작한다.
  • 여러 사례를 통해 클링 2.0이 생성한 영상의 퀄리티가 매우 뛰어난 것을 확인할 수 있다.
  • 비디오 편집 중 인물의 변경이나 특정 요소 삭제와 같은 작업을 클링을 통해 쉽게 수행할 수 있다.
  • 향상된 카메라 무빙과 함께 다이나믹한 액션을 구현할 수 있어 전문가들도 클링의 성능에 만족하고 있다.
7.8. AI와 스마트 안경의 혁신
  • 크레아 AI에서 출시한 3D 편집 도구는 "카우보이 무비 씬"과 같이 3D 오브젝트를 조작하여 씬을 만들 수 있도록 지원한다.
  • 구글안경은 사용자와의 대화 중 기억을 바탕으로 질문에 대한 정확한 답변을 제공하며, 물건 분실 시 찾는데 도움을 줄 수 있다.
  • 구글글래스는 내비게이션 기능을 통해 사용자가 원하는 장소로 안내하며, 위치와 경로를 시각적으로 보여준다.
  • 애플은 스마트 안경 개발을 진행 중이며, 메타와 함께 여러 기업이 경쟁하고 있어 향후 기술 발전이 기대된다.
  • AR 기술의 발전은 게임과 같은 사용자 경험을 풍부하게 만들어줄 수 있을 것으로 보이며, 현실 세계와 상호작용이 가능해질 것이다.
7.9. 중국의 휴머노이드 로봇 하프 마라톤 대회
  • 중국에서 최초의 휴머노이드 하프 마라톤 대회가 개최되어 로봇들이 인간과 경주했다.
  • 로봇들은 21km를 뛰며 배터리를 교체할 수 있었고, 교체 시 10분의 페널티가 주어졌다.
  • 결승선을 통과한 로봇의 이름은 티양궁 울트라로, 완료하는 데 40분이 걸렸으며, 3번의 배터리 교체가 있었다.
  • 다양한 종류의 로봇들이 참가하여 마라톤 대회가 성황리에 진행되었고, 이는 중국의 로봇 기술을 자랑하는 기회가 되었다.
  • 대회는 로봇이 마라톤을 뛸 수 있는 시대가 도래했음을 보여주는 흥미로운 사례로 주목받고 있다.

 

 

 

원본영상 https://youtu.be/cxI-8FpHJ3g

LIST