|
최강의 양자 칩을 발표한 데 이어 구글은 AI에서 중요한 움직임을 보이고 있다.
북경시간으로 12월 12일 새벽, 구글은 OpenAI가 ChatGPT가 정식으로 아이폰에 상륙한다고 선포하기전에 새로운 모델 Gemini 2.0을 발표했다.
산다르 피차이 구글 CEO는 구글이 지금까지 가장 강력한 모델이라고 말했다.기본 이미지와 기본 오디오의 출력 등 다중 모드 방면의 향상으로 Gemini 2.0은 새로운 AI 지능체를 구축할 수 있어 구글이 범용 어시스턴트 구축의 비전에서 한 걸음 더 나아갈 수 있게 되었다.
Gemini 2.0은 주로 개발자 및 신뢰할 수있는 테스트 인력에게 개방된다는 점을 지적해야합니다.현재 Gemini 2.0 Flash 체험판 모델은 모든 Gemini 사용자에게 개방되어 있습니다.
Gemini 2.0 Flash는 1.5 Flash를 기반으로 한 모델이며 이전에 1.5 Flash는 Google에서 개발자에게 가장 인기있는 버전이었습니다.Gemini 2.0 Flash는 1.5 Flash에 비해 빠른 응답 시간에 성능이 향상되었습니다.구글 측에 따르면 2.0 플래시는 핵심 벤치마킹에서 1.5 프로보다 두 배 빠른 1.5 프로를 추월하기도 했다.
또한 2.0 Flash는 이미지, 비디오 및 오디오와 같은 다중 모드 입력을 지원할 수 있을 뿐만 아니라 이미지와 텍스트가 혼합된 내용을 직접 생성할 수 있고 제어 가능한 다중 언어 텍스트 음성 변환 (TTS) 오디오를 기본 생성하는 등 다중 모드 출력을 지원할 수 있는 새로운 기능을 갖추고 있다.또한 Google Search, 코드 실행 및 타사 사용자 정의 함수와 같은 도구를 기본 호출할 수 있습니다.
전 세계 Gemini 사용자들은 이제 컴퓨터와 모바일에서 2.0 Flash를 기반으로 최적화된 채팅 대화를 경험할 수 있으며 이 버전은 곧 Gemini 모바일 앱에서 출시될 예정이다.이 새로운 모델을 기반으로 사용자는 Gemini 도우미도 경험할 수 있습니다.구글은 내년 초에도 Gemini 2.0을 더 많은 제품으로 확장할 예정이다.
Gemini 2.0의 가장 큰 변화는 중심을 AI 지능체로 옮겨 모든 AI 지능체의 베이스 모델을 만들려는 데 있다.이에 따라 Gemini 2.0은 사용자가 적절한 작업을 수행할 수 있도록 도와주는 일련의 프로토타입을 출시했습니다.
그 중 Project Astra의 업그레이드 버전은 미래의 범용 AI 어시스턴트 능력의 연구 프로토타입을 탐색하는 데 사용됩니다.Google은 Google I/O 컨퍼런스에서 Project Astra를 출시한 이후 Android 휴대폰에서 이를 사용하는 신뢰할 수 있는 테스트 직원들에게 피드백을 수집해 왔다.이번에 출시되는 업그레이드 버전은 다양한 언어와 혼합 언어 간의 대화를 가능하게 하고, 구글 서치, 구글 렌즈, 구글 맵 등 새로운 도구를 사용하여 10분에 달하는 세션 내용을 기억하고 인간 대화의 지연에 가까운 언어를 이해할 수 있다.
새로운 Project Mariner는 브라우저에서 시작하여 사람과 지능체의 상호작용의 미래발전을 탐색한다.Project Mariner는 Gemini 2.0이 구축한 초기 연구 프로토타입을 사용하여 픽셀과 텍스트, 코드, 이미지, 양식 등 웹 페이지 요소를 포함한 브라우저 페이지의 정보를 이해하고 추론한 후 실험적인 크롬 확장 프로그램을 통해 사용자가 해당 작업을 수행할 수 있도록 돕는다.이번 업그레이드로 Project Mariner는 원래 속도가 느렸던 문제를 개선했습니다.
간단히 말해서, 사용자는 이 기능을 사용하여 브라우저 자신이 특정 작업을 완료할 수 있도록 할 수 있다. 예를 들어 일부 사이트의 이메일 주소를 대량으로 찾아서 어느 정도 브라우저의"자동 실행"을 실현할 수 있다.
Jules는 개발자를 위한 코딩 지능체로서 GitHub 워크플로우에 직접 통합하여 개발자가 개발 임무를 완수할 수 있도록 돕는다.
구글의 시연 동영상에서 시연자는 상세한 프로그래밍 문제가 담긴 제시어를 길게 입력한 뒤 Jules는 이런 요구를 분석해 3단계 프로그래밍 솔루션을 제시하고 동의를 클릭하면 모델이 자동 프로그래밍을 시작해 코드를 생성한다.이것은 의심할 여지 없이 개발자가 업무 효율을 한층 더 높이는 데 도움이 된다.
작년 말 구글은 Gemini 1.0 모델을 발표했으며 주요 능력은 정보를 통합하고 이해하는 것입니다.Gemini 2.0은 정보를 더욱 유용하게 만듭니다.순다르 피차이는 Gemini 2.0의 진전은 구글이 10년 동안 전잔식 AI 혁신 연구에 투입한 덕분에 구글의 맞춤형 하드웨어 6세대 TPU Trillium을 기반으로 구축됐다고 밝혔다.
구글이 가장 강력한 모델로 눈길을 끌었을 때 OpenAI는 12일간의 제품 발표 행사를 여전히 진행 중이다.같은 날 OpenAI는 ChatGPT와 애플 애플 인텔리전스의 통합을 대외적으로 보여주며 다소 밋밋한 내용을 담고 있다.구글 Gemini 2.0의 갑작스러운 발표는 분명히 많은 OpenAI의 인기를 끌었다.
Gemini 2.0의 추가 하에 구글이 단숨에 세 가지 지능체 제품을 출시한 것은 마이크로소프트와 OpenAI, 아마존과 Anthropic을 연결하는 경쟁에서 또 하나의 중요한 발걸음을 내디뎠음을 의미한다.
지능체는 이미 대형 모델 분야 경쟁의 핵심 방향이 되었다.지능체란 환경을 감지하고 의사결정을 하며 특정 목표를 달성하기 위해 행동을 취할 수 있는 시스템으로 대언어모델 (LLM) 이 착지하여 응용되는 핵심 담체로 간주된다.
최근 두 달 전 마이크로소프트는 판매, 운영 등 장면을 대상으로 10개의 AI 지능체를 연발한 데 이어 코파일럿 스튜디오 플랫폼이 사용자의 자체 지능체 구축을 지원했다고 발표하면서 미리 구축된 지능체 5개를 발표했다.방금 끝난 2024 re: Invent에서 아마존은 단숨에 6가지 큰 모델을 발표했는데, 그 중 Amazon Nova Premier 역시 복잡한 추리 임무를 위해 태어난 다중 모드 큰 모델이다.
소비단이든 기업단이든 장면에서 AI 지능체는 모두 비교적 많은 상상공간이 있으며 상업화전망도 비교적 명확하다.여러 업계 관계자들은 2025년이 AI 지능체 상용화가 폭발하는 해가 될 것으로 예상하고 있다.그때가 되면 구글, OpenAI 등 과학기술거두들의 지능체를 둘러싼 경쟁세는 반드시 더욱 치렬해질것이다. |
|