GPT-4 깔아뭉개기?구글, 최강 AI 모델 해독 발표

북경시간으로 12월 7일 새벽, 구글은 갑자기"지금까지 가장 강대하고 가장 통용되는 모델"인 Gemini를 내놓았다.Gemini 모델은 Google 및 전 세계에서 가장 먼저 출시 된 다중 모드 모델로서 클라우드 및 에지 테스트에서 작동합니다.
관련 테스트 데이터 표면에 따르면 Gemini Ultra는 MMLU (대규모 멀티태스킹 언어 이해) 면에서 인간 전문가의 모델보다 우수하며, 가로 대비로 볼 때 여러 임무 성능이 GPT-4를 능가하기 때문에 GPT-4의 가장 강력한 라이벌로 간주된다.
업계에서 볼 때, Gemini의 횡공은 대형 모델의 응용 장면이 한층 더 확장될 것이며, 다른 한편으로는 계산력 수요의 지속적인 업그레이드를 가져올 수 있을 것이며, 동시에 GPT-5를 포함한 후속 대형 모델의 출시에 더 많은 촉매를 가져다 줄 것이다.

세 가지 버전

알아본데 따르면 Gemini는 구글이 1년동안 준비한 GPT-4의 진정한 경쟁품이며 현재 구글이 내놓을수 있는 기능이 가장 강하고 가장 령활한 대모델이기도 하다.Gemini는 Transformer decoder를 기반으로 구축된 다중 모드 모델로, 동영상, 오디오, 텍스트 등 다양한 콘텐츠 형태의 정보를 처리할 수 있다.
최신 Gemini 모델은 이전 기술과 비교하여 더 복잡한 추리를 할 수 있고 더 미세한 정보를 이해할 수 있습니다.이번에 첫 번째 버전인 Gemini 1.0은 Ultra, Pro, Nano 등 3가지 다른 사이즈 모델을 선보였다.
1) Ultra 버전은 가장 강력한 버전으로 해당 TPU 인프라에서 최고의 효율을 보여줄 수 있으며 여러 테스트에서 Ultra 버전은 GPT-4V보다 성능이 높습니다.
2) Pro 버전은 성가비 최적화 버전으로 추리, 다중모드 등 방면에서도 비교적 강한 능력을 가지고 있으며, Pro 버전은 양호한 확장성을 가지고 있어 몇 주 내에 사전 훈련을 완료할 수 있으며, 여러 테스트에서 GPT-4V에 버금가는 PaLM2, Claude2, LLAMA2, GPT3.5 등 주류 대형 모델보다 강하다;
3) 나노 버전은 다른 모델을 증류하여 얻은 4비트 모델로 1.8B와 3.25B 두 버전으로 각각 저메모리와 고메모리 장치를 대상으로 로컬 배치를 지원한다.
현재 Gemini 1.0은 챗봇 Bard와 스마트폰 Pixel 8 Pro에 접속하는 등 다양한 구글 제품과 플랫폼에서 출시되고 있다.앞으로 몇 달 동안 Gemini는 Search, Ads, Chrome 및 Duet AI와 같은 Google의 더 많은 제품과 서비스에 적용될 것입니다.

GPT-4 성능 롤오버?

Gemini 모델은 Google 및 전 세계에서 가장 먼저 출시 된 다중 모드 모델로서 클라우드 및 에지 테스트에서 작동합니다.관련 테스트 데이터 표면에 따르면 Gemini Ultra는 MMLU (대규모 멀티태스킹 언어 이해) 면에서 인간 전문가의 모델보다 우수하며 수평 대비로 볼 때 여러 임무 성능이 GPT-4를 능가한다.
소개에 따르면 자연영상, 음성, 영상리해에서 수학추리에 이르기까지 대형언어모형의 연구와 개발에 널리 사용되는 32개 학술기준중 Gemini Ultra의 성능은 30개가 모두 현재 가장 선진적인 수준을 초과했다.
이 중 MMLU(대규모 멀티태스킹 언어 이해) 테스트에서 Gemini Ultra의 득점률은 90.0% 로 인간 전문가를 능가하는 최초의 모델이며 GPT-4의 득점률은 86.4% 입니다.이미지 이해는 새로운 MMMU 벤치마킹에서도 Gemini Ultra가 59.4%, GPT-4V가 56.8% 로 더 우수했다.
또한 Gemini 1.0은 정보를 읽고 필터링하고 이해하여 수십만 건의 파일에서 견해를 추출하는 복잡한 추리력을 가지고 있습니다.Google 엔지니어는 Gemini가"20만 개의 과학 연구 문헌"의 핵심 정보를 추출하는 예를 시연했습니다.
2021년 이후 이 연구 분야에는 20만 건 이상의 연구 논문이 새로 추가돼 기존 연구에 갱신해야 한다.이전에는 과학 연구자들이 수동으로만 처리할 수 있었지만, 지금은 Gemini가 연구 분야와 관련된 문헌 정보를 자동으로 구분하고 필터링할 수 있어 점심 한 끼만 있으면 과학자들이 20만 편의 논문을 읽고 데이터 정보를 업데이트한 새로운 그림을 그릴 수 있다.
Gemini Ultra는 현재 대규모 신뢰 및 보안 검사를 완료하고 있으며, 모델의 완성 과정에서 Google은 일부 고객, 개발자, 파트너 및 보안 및 책임 전문가에게 Gemini Ultra를 제공하여 초기 실험과 피드백을 제공할 것입니다.내년 초 개발자와 기업 고객에게 이 모델을 제공할 예정이다.

하드웨어, 알고리즘, 데이터 세트 혁신

민생증권의 한 연구보 오피니언은 50개가 넘는 기준테스트에서 Gemini 모델 시리즈를 평가함으로써 모델 규모가 증가함에 따라 Gemini 모델은 추리, 수학/과학, 긴 텍스트 방면에서 지속적으로 품질을 향상시켰다.Gemini Ultra는 6가지 기능 중 가장 우수한 모델입니다.
Gemini Pro는 Gemini 모델 제품군에서 두 번째로 큰 모델로서 성능에서도 매우 경쟁력이 있으며 서비스를 제공할 때 더욱 효율적입니다.
이 기관은 Gemini 훈련 과정도 인프라, 알고리즘, 데이터 세트를 혁신할 수 있다고 말한다.특히 구글은 이번에 첨단 AI 모델을 훈련할 수 있도록 지원하기 위해'가장 강력한'TPU 시스템인 클라우드 TPU v5p도 발표했다.구글 측은 이전 세대 TPU v4에 비해 성가가 2.3배 높아졌다고 밝혔다.
차세대 TPU는 Gemini의 개발을 가속화하여 개발자와 기업 고객이 대규모 생성식 AI 모델을 더 빨리 훈련하여 신제품과 새로운 기능을 더 빨리 출시할 수 있도록 도울 것이다.
알고리즘의 경우 구글은 단일 제어 알고리즘, XLA 컴파일러 등의 기술로 훈련 과정을 최적화하고, SDC 등의 문제 예방을 통한 안정적 훈련도 수행한다.데이터 세트 측면에서 Google은 분사 기술을 통해 Gemini 훈련과 추론 속도를 향상시키고 일련의 필터링 방법을 통해 훈련에 사용되는 데이터의 높은 품질을 보장합니다.

GPT-5와 같은 모델에 촉매

구글 Gemini의 발표는 다른 AI 대형 모델의 반복 업그레이드에 새로운 촉매를 가져올 수밖에 없다.
중신증권은 현재 검색 장면에서 Gemini가 약 40% 의 지연을 줄일 수 있다고 분석했다.전체 산업에 있어서 구글의 제품화, 상업화의 추진도 업계 전체의 변화를 가져올 것이다.이 기관은 앞으로 점점 더 많은 AI 장면과 제품의 출현, 하드웨어 업그레이드, 알고리즘 최적화에 따른 비용 최적화 중첩, To C 제품의 진전이 기대된다고 전망했다.
이와 동시에 이 기구는 또 Gemini의 발표는 다모태모형에 대한 더욱 많은 기대를 가져다줄것이며 산업에 있어서 다모태재료는 계산력수요의 제고를 이끌게 될것이며 동시에 후속GPT-5 등 모형의 발표에 더욱 많은 촉매를 가져다줄것이라고 인정했다.
현재 간과할 수 없는 것은 오픈 AI의 월간 사용자 수가 5월부터 감소하기 시작하여 10월에 17억으로 반등했다는 것이다.구글의 검색엔진인 배드와 비교한 사용자 수는 2억6천만명이다.그렇다면 Open AI 사용자들은 구글로 옮겨갈 것인가?
이 문제에 대해 국내 한 헤드 대형 모델 업체 인사는 단기 오픈 AI는 여전히 우세하지만 장기적으로 구글이 갖춘 대량의 사용자와 제품 생태는 강력한 세력이 될 것이라고 분석했다.
OpenAI에 비해 구글은 대량의 PC와 휴대폰단 사용자를 축적하여 대량의 실시간 데이터 (그러나 OpenAI의 데이터는 구글을 포함한 인터넷에 의존함) 를 보유하고 있으며 사용자의 휴대폰 통합 GPT를 통해 지하철 네비게이션과 같은 대량의 사용자 정보를 제공하고 있다."압력은 Open AI에 주어져 제품 생태를 보완해야 한다."상술한 인사들은 이렇게 분석했다.

인피니온: 2024 회계연도 영업수입 동기대비 8% 하락

4분기 매출 하락을 끝내고 텐센트 뮤직은 유료 가입자를 계속 발굴해야 한다

다다그룹 3분기 수익성 지속 개선'쌍11'기간 초송 온라인 주문량 일일 최고치 신기록

아마존, 무료 스트리밍 서비스 Freevee 폐쇄할 듯