|
이번 주 인공지능 분야의 헤드라인은 의심할 여지 없이 OpenAI와 구글의 제품 대결이다.
OpenAI 회사는 경쟁사의 주요 제품 발표회에 앞서 자사의 제품을 앞질러 발표함으로써 뉴스의 초점을 선점하는 것을 일관되게 좋아하고 있으며, 이번 주에도 예외가 아니다.
OpenAI는 이전부터 대중에게 높은 기대치를 주었다. 월요일 (5월 13일), 이 회사는 예정대로 GPT-4의 업그레이드 버전을 발표했다. GPT-4o ("o"는 omni 전방위를 대표한다).GPT-4o는 휴대폰이나 태블릿의 개인 비서 역할을 하기 위해 설계되었으며, 향상된 음성 인터렉션 기능을 갖추고 있으며, 장치 카메라가 찍은 사진을 해석하고 추리할 수 있으며, 더 강력한 언어 번역 능력과 더 빠른 응답 시간을 가지고 있다.
GPT-4o 뒤의 기술 혁신은 인상적이다. 이 모델은 다중 모드로 실시간으로 오디오, 시각 및 텍스트를 수신, 추론하고 텍스트, 오디오 및 이미지의 임의의 조합 출력을 생성할 수 있다.이 모델은 이전 버전과 비교할 때 사용자의 목소리를 텍스트로 변환하고 처리하는 단계를 생략하여 전체 프로세스가 더욱 빠르다는 것을 의미한다.
GPT-4o는 또한 모델이 특정 수의 token을 처리하는 데 걸리는 시간 (영어 텍스트의 경우 하나의 token은 일반적으로 하나의 반 단어와 같음) 을 단축시켜 OpenAI의 이전 최고 모델인 GPT-4 Turbo보다 더 빠르고 저렴하게 실행할 수 있도록 했다.
화요일 (5월 14일), 구글도 연달아 큰 수를 두어 정면으로 OpenAI를 강경하게 했다.
구글의 I/O 개발자 대회에서 구글은 Gemini 모델의 광범위한 업그레이드, 미래의 인공지능 어시스턴트'Astra', 생성식 인공지능 부여 구글 검색, 이미지, 음악, 동영상과 관련된 일련의 생성식 AI 도구를 포함한 일련의 새로운 인공지능 기능과 곧 발표될 제품을 발표했다.
Google은 회의에서 Gemini 1.5 Pro 모델의 개선을 발표하여 100 만 tokens의 컨텍스트 창을 200 만 개로 더 확대하고 더 자연스러운 사운드, 오디오 및 이미지를 더 잘 이해하고 더 나은 논리적 추론 및 계획 능력, 더 나은 컴퓨터 코드 생성 능력을 가질 수 있도록 했습니다.
또한 구글은 오디오, 비디오 등 다중모드의 입력 내용을 처리하기 위한 고급 시각 및 대화 응답 지능체 프로젝트 아스트라를 발표했다.Astra는 OpenAI의 GPT-4o가 정적 이미지만 처리할 수 있는 것에 비해 동영상도 처리할 수 있다.데모 비디오에서는 카메라 비디오를 통해"무엇이 소리를 낼 수 있는가","지금 어디에 있는가"등의 명령을 식별할 수 있습니다.그러나 그 대응은 지연되거나 지연되고 있으며, 구글의 미래 버전의 인공지능 개인 비서는'아스트라'를 통해 개발되고 있는 것으로 알려졌다.
인공지능 어시스턴트의'하이라이트 순간'
OpenAI와 구글의 제품 발표에서 볼 수 있듯이, 기술 회사들은 모두 인공지능 어시스턴트의 연구 개발을 매우 중시하고 있으며,"첫 인공지능 킬러 응용"의 위치는 이미 실리콘 밸리 각 회사의"반드시 쟁탈하는 곳"이 되었다.
이번 주 제품 발표 상황을 보면 오픈AI와 구글의 인공지능 어시스턴트가 각각 우세하다.GPT-4o는 음성을 직접 수신하고 생성할 수 있어 음성을 텍스트로 전환하는 과정을 생략할 수 있다;Astra는 비디오와 같은 동적 이미지를 처리할 수 있다는 것이 큰 장점입니다.
이 두 제품의 발표는 실리콘밸리의 또 다른 두 거물인 애플과 아마존을 불리하게 만들었다.그들은 이러한 새로운 경쟁사의 능력을 따라잡기 위해 음성 비서 Siri와 Alexa를 업그레이드해야합니다. 그렇지 않으면 이러한 제품은 어려움을 겪을 것입니다.현재 알려진 정보와 관련해 아마존이 투자한 Anthropic은 강력한 Claude AI 모델을 사용할 수 있습니다.앞서 애플이 단기간에 기술 허가를 받기 위해 OpenAI와 협상하고 있다는 보도도 나왔다.
그러나 이런 새로운 인공지능 어시스턴트는 미래의'인공지능 킬러급 애플리케이션'이 될 것인가?이 결론은 아직 결론이 나지 않았으며, 완전히 다음에 무슨 일이 일어날지에 달려 있다.
현재의 인공지능 어시스턴트의 용례를 보면, 그들은 아직 인류의 일상생활에서 어디에나 있는 필수 제품이라고 할 수 없다. 번역 기능 외에 사람들이 일을 완성할 수 있도록 돕는 것에 관한 것은 거의 없다.
이러한 지원은 프록시 속성이 더 많을 때 변경될 수 있다는 분석이 있습니다.만약 어느 날, 그들이 진정으로 인류의 개인적인 선호도를 이해하고, 사람들의 취향에 따라 임무를 완수할 수 있으며, 일상생활에서 일부 일 (예를 들면 온라인 쇼핑, 보험 양식 작성, 휴가 예약 등) 을 처리하는 것을 도울 수 있다면, 이때의 인공지능 어시스턴트는"킬러 앱"이 될 가능성이 높다.
구글은 현재 이런 제품을 개발하고 있다고 밝혔지만 제품 발표 일정은 제시하지 않았다.OpenAI도'곧'흥미진진한 미래 공고를 발표한다고 계속 밝혔다.다음 주에 Microsoft는 Build 개발자 컨퍼런스를 개최합니다. |
|