당신의 현재 위치는:화이트스타일뉴스 > 탐색하다
"1시간 영화도 단숨에 처리한다"…구글, 제미나이 1.5 공개
화이트스타일뉴스2024-03-29 05:50:54【탐색하다】8사람들이 이미 둘러서서 구경했습니다.
소개제미나이 1.5 프로, 최대 100만 토큰까지 처리 가능구글 "내부 테스트서 1.0 프로 대비 87% 성능 향상"영상 분석해 대화·사건·이미지 등 종합해 추론까지[이데일리 한광범
제미나이 1.5 프로,시간영화도단숨에처리한다구글제미나이공개 최대 100만 토큰까지 처리 가능
구글 "내부 테스트서 1.0 프로 대비 87% 성능 향상"
영상 분석해 대화·사건·이미지 등 종합해 추론까지[이데일리 한광범 기자] 구글이 16일 자사 초거대 인공지능(AI) 제미나이(Gemini)의 차세대 모델인 ‘제미나이 1.5’를 공개했다.
구글이 이날 공개한 모델은 중형 멀티모달 모델인 ‘제미나이 프로 1.0’을 업그레이드한 ‘제미나이 프로 1.5’이다. 기존의 1.0 프로에 비해 동시에 정보를 처리할 수 있는 능력이 크게 향상돼 긴 문맥을 이해하는 역량이 뛰어나다는 것이 구글의 설명이다. 구글은 내부 테스트 결과 제미나이 1.5 프로가 기존 제미나이 1.0 프로 대비 87% 더 향상된 성능을 보였다고 밝혔다.
구글 제미나이는 학습양에 따라 최상위 버전인 울트라와 그 아래로 프로와 나노로 구분된다. 이번에 초기 테스트 버전으로 공개된 제미나이 1.5는 중형 모델인 제미나이 프로의 차세대 모델인 것이다. 앞서 구글이 지난해 12월 처음 세상에 내놓은 제미나이는 1.0 버전이었는데, 당시 나노와 프로 모델만 공개한 바 있다. 최상위 모델인 울트라 1.0 모델은 지난주에 일반 사용자에게 서비스를 시작했는데, 구글은 해당 모델이 역대 최상위 AI 모델이라고 설명하고 있다.
구글은 중형 모델인 제미나이 프로 1.5가 최상위 모델 제미나이 울트라 1.0과 유사한 성능을 발휘한다고 설명했다. 순다 피차이(Sundar Pichai) 구글 및 알파벳 CEO는 이날 “제미나이 1.5 프로는 다양한 부문에서 놀라운 발전을 이뤘다”며 “더 적은 컴퓨팅 자원으로 (최상위 모델인) 제미나이 1.0 울트라에 필적하는 성능을 갖추고 있다”고 밝혔다.
음성 11시간·단어 70만개도 단숨 처리 가능
모델이 한 번에 처리할 수 있는 정보의 양을 ‘콘텍스트 윈도(context window)’라고 하는데, 이는 정보를 처리하는 구성 요소인 ‘토큰(token)’으로 이뤄진다. 토큰은 단어, 사진, 영상, 음성 및 코드 등으로 구성될 수 있다. 제미나이 1.5 프로의 토큰 처리 규모는 기존 1.0 프로의 3만2000개 토큰을 넘어 최대 100만까지 가능하다.
오픈AI의 GPT-4 터보의 12만8000개를 훌쩍 뛰어넘는 규모라는 것이 구글의 설명이다. 이 같은 처리 규모는 제미나이 1.5 프로가 △영상 1시간 △음성 11시간△코드 3만줄 △단어 70만개 등의 방대한 정보를 한 번에 처리할 수 있다는 것이다.
제미나이 1.5 프로는 주어진 프롬프트에 답하기 위해 더욱 매끄럽게 방대한 양의 콘텐츠를 분석, 분류해 요약해 준다. 일례로 달탐사 미션 수행을 위해 발사됐던 우주선 아폴로 11호와 관련된 402페이지 분량 기록이 제미나이 1.5 프로를 통해 문서 전반에서 발견되는 모든 자세한 정보들과 대화, 사건, 이미지 등을 종합해 추론해 낼 수 있다.
구글은 제미나이 1.5 프로가 영상 등 다양한 모달리티에서도 고도로 정교화된 이해 능력과 추론 능력을 보인다고 전했다. 예를 들어 44분 분량의 미국 배우 버스터 키튼 주연의 무성 영화가 입력되면 제미나이 1.5 프로가 정확하게 주요 줄거리 포인트와 사건들을 분석하고 영화 내 사소한 디테일까지도 추론해 낼 수 있다는 설명이다.
기존에 본 적이 없던 정보도 빠르게 학습 가능
제미나이 1.5 프로는 더 긴 코드 블록에서도 연관성이 더 높은 문제 해결 작업을 수행할 수 있다. 일례로 10만줄 이상의 코드가 포함된 프롬프트가 주어져도 예시를 통해 더 잘 추론하고 유용한 수정 사항을 제안하며 코드의 여러 부분들이 어떻게 작동하는지에 대해 설명을 제공한다.
특정 사실이나 진술이 포함된 작은 텍스트 조각을 긴 텍스트 블록 안에 의도적으로 배치하는 NIAH(Needle In A Haystack) 평가에서도 100만 토큰 길이의 데이터 블록에서 99%의 정확도로 해당 문구가 포함된 텍스트를 찾아냈다는 것이 구글의 설명이다.
이와 함께 문맥 기반 학습(in-context learning) 기능도 갖추고 있어 추가적 미세 조정 없이도 주어진 긴 프롬프트 내 정보에서 새로운 기술을 학습할 수 있다.
구글은 기존에 본 적이 없던 정보도 얼마나 잘 학습하는지 테스트한 결과에서도 뛰어는 성능을 보였다고 설명했다. 일례로 전 세계적으로 사용하는 사람이 200명이 채 안되는 칼라망(Kalamang)어 문법 매뉴얼이 주어졌을 때도 동일한 내용을 사람이 학습하는 것과 비슷한 수준으로 영어를 칼라망어로 번역하는 방법을 학습했다.
제미나이 1.5 프로는 개발자를 위한 AI 개발 도구인 ‘구글 AI스튜디오’와 기업들이 AI 모델을 활용할 수 있는 플랫폼 ‘버텍스 AI’를 통해 프리뷰 버전으로 100만개의 토큰 콘텍스트 윈도를 제공할 예정이다. 다만 실제 출시될 경우엔 기본 12만8000개 토큰 콘텍스트 윈도를 기준으로 추가 요금을 받는 식으로 서비스를 할 예정이다.
구글 "내부 테스트서 1.0 프로 대비 87% 성능 향상"
영상 분석해 대화·사건·이미지 등 종합해 추론까지[이데일리 한광범 기자] 구글이 16일 자사 초거대 인공지능(AI) 제미나이(Gemini)의 차세대 모델인 ‘제미나이 1.5’를 공개했다.
구글이 이날 공개한 모델은 중형 멀티모달 모델인 ‘제미나이 프로 1.0’을 업그레이드한 ‘제미나이 프로 1.5’이다. 기존의 1.0 프로에 비해 동시에 정보를 처리할 수 있는 능력이 크게 향상돼 긴 문맥을 이해하는 역량이 뛰어나다는 것이 구글의 설명이다. 구글은 내부 테스트 결과 제미나이 1.5 프로가 기존 제미나이 1.0 프로 대비 87% 더 향상된 성능을 보였다고 밝혔다.
구글은 중형 모델인 제미나이 프로 1.5가 최상위 모델 제미나이 울트라 1.0과 유사한 성능을 발휘한다고 설명했다. 순다 피차이(Sundar Pichai) 구글 및 알파벳 CEO는 이날 “제미나이 1.5 프로는 다양한 부문에서 놀라운 발전을 이뤘다”며 “더 적은 컴퓨팅 자원으로 (최상위 모델인) 제미나이 1.0 울트라에 필적하는 성능을 갖추고 있다”고 밝혔다.
음성 11시간·단어 70만개도 단숨 처리 가능
모델이 한 번에 처리할 수 있는 정보의 양을 ‘콘텍스트 윈도(context window)’라고 하는데, 이는 정보를 처리하는 구성 요소인 ‘토큰(token)’으로 이뤄진다. 토큰은 단어, 사진, 영상, 음성 및 코드 등으로 구성될 수 있다. 제미나이 1.5 프로의 토큰 처리 규모는 기존 1.0 프로의 3만2000개 토큰을 넘어 최대 100만까지 가능하다.
오픈AI의 GPT-4 터보의 12만8000개를 훌쩍 뛰어넘는 규모라는 것이 구글의 설명이다. 이 같은 처리 규모는 제미나이 1.5 프로가 △영상 1시간 △음성 11시간△코드 3만줄 △단어 70만개 등의 방대한 정보를 한 번에 처리할 수 있다는 것이다.
|
구글은 제미나이 1.5 프로가 영상 등 다양한 모달리티에서도 고도로 정교화된 이해 능력과 추론 능력을 보인다고 전했다. 예를 들어 44분 분량의 미국 배우 버스터 키튼 주연의 무성 영화가 입력되면 제미나이 1.5 프로가 정확하게 주요 줄거리 포인트와 사건들을 분석하고 영화 내 사소한 디테일까지도 추론해 낼 수 있다는 설명이다.
기존에 본 적이 없던 정보도 빠르게 학습 가능
제미나이 1.5 프로는 더 긴 코드 블록에서도 연관성이 더 높은 문제 해결 작업을 수행할 수 있다. 일례로 10만줄 이상의 코드가 포함된 프롬프트가 주어져도 예시를 통해 더 잘 추론하고 유용한 수정 사항을 제안하며 코드의 여러 부분들이 어떻게 작동하는지에 대해 설명을 제공한다.
특정 사실이나 진술이 포함된 작은 텍스트 조각을 긴 텍스트 블록 안에 의도적으로 배치하는 NIAH(Needle In A Haystack) 평가에서도 100만 토큰 길이의 데이터 블록에서 99%의 정확도로 해당 문구가 포함된 텍스트를 찾아냈다는 것이 구글의 설명이다.
|
구글은 기존에 본 적이 없던 정보도 얼마나 잘 학습하는지 테스트한 결과에서도 뛰어는 성능을 보였다고 설명했다. 일례로 전 세계적으로 사용하는 사람이 200명이 채 안되는 칼라망(Kalamang)어 문법 매뉴얼이 주어졌을 때도 동일한 내용을 사람이 학습하는 것과 비슷한 수준으로 영어를 칼라망어로 번역하는 방법을 학습했다.
제미나이 1.5 프로는 개발자를 위한 AI 개발 도구인 ‘구글 AI스튜디오’와 기업들이 AI 모델을 활용할 수 있는 플랫폼 ‘버텍스 AI’를 통해 프리뷰 버전으로 100만개의 토큰 콘텍스트 윈도를 제공할 예정이다. 다만 실제 출시될 경우엔 기본 12만8000개 토큰 콘텍스트 윈도를 기준으로 추가 요금을 받는 식으로 서비스를 할 예정이다.
대박입니다!(41126)
관련 기사
- 美, 인텔에 '뭉칫돈' 승부수…인텔, 1천억 달러 투자로 반도체 왕좌 탈환
- '대선 한 달 전' 옥중 급사 나발니…독극물 테러도 이겨낸 '푸틴 정적'
- [주간政談<하>] 어수선한 개혁신당, '이삭줍기' 역효과?
- “50개 모은다고?” 안 쓰면서 자랑만 하는 텀블러 수집 열풍…다 쓰레기 됩니다 [지구, 뭐래?]
- 한동훈, '용혜인 비례 재선'에 이상한 거 다 동의…김예지엔 침묵
- [주말엔 음식] 하루에 물 2ℓ는 마셔야?…과다 섭취는 오히려 '독' 된다
- 자폐아 '뺨 25대' 때린 언어센터 재활사…경찰, 구속영장 신청
- ‘이틀 전엔 멀쩡했는데’…'푸틴 정적' 나발니, 시베리아 감옥서 사망
- 일교차 심해지자 콜록콜록…기침 한 달 넘으면 천식 의심을
- [투나잇이슈] 국민의힘, 22곳 경선 발표…민주 컷오프 회동 사실 아냐
인기 기사
역장추천
우정 링크
- [연합시론] 의료개혁과 건보재정 건전화, 두마리 토끼 다 잡아야
- 골프 거리측정기 보이스캐디, 2024년 신제품 런칭쇼 개최
- 2024시즌 WK리그, 3월 16일 킥오프…챔프전은 11월
- 7년 만에 동·서부 자존심 싸움 펼친 NBA…올스타전 승자는 동부
- [프로배구 전적] 18일
- [연합시론] 돌고 돌아 원점으로…또 위성정당 '꼼수 총선판' 재연 예고
- [연합시론] 돌고 돌아 원점으로…또 위성정당 '꼼수 총선판' 재연 예고
- NBA 브루클린, 올스타 휴식기에 본 감독 해고
- [논&설] '∼멍·∼멍·∼멍'…멍때리기 신드롬
- IBK기업은행, GS칼텍스 완파하고 봄 배구 희망가…블로킹 11
- “나발니 시신 멍자국, 경련과 관계”
- 에펠탑 내부관광 19일 하루 중단…운영협회 노조 파업
- 美 LA 등 캘리포니아에 또 폭풍우…3천700만명 홍수 '위험'
- 김경율 "임종석 평창동 주택, 호형호제하는 고향 기업인 회사 소유"
- bhc, 값싼 브라질산 닭고기로 슬쩍 바꾸고 '가격까지 인상'
- 커지는 野 공천 잡음…'친문' 뺀 여론조사에 '밀실공천' 논란(종합)
- EU 집행위원장 연임 도전 공식 선언…"국방이 우선순위"(종합)
- 넷플릭스 CEO "尹과의 만남 큰 영광…韓창작자들과 동행 걸음마"
- 바이든, 나발니 사망 관련 "러시아 추가 제재 고려"
- 트럼프 '굴복 안해' 운동화 완판…"2시간만에 품절"
- [알림] 연합뉴스 콘텐츠 저작권 고지
- CNBC "EU 이어 美도 러시아 전쟁 지원 中기업 제재 검토"