예상치 못한 경기장, 구글과 OpenAI는 AI 어시스턴트를'카드 테이블'로 옮겼다

aming0412 · 发表于 2024-5-16 12:13:49

만인이 기대하는 AI 검색이 아니라 경쟁의 초점이 갑자기 AI 스마트 어시스턴트로 옮겨졌다.
최근 OpenAI는 다양한 입력을 받아들이고 그에 상응하는 출력을 생성할 수 있는 만능 모델 GPT-4o를 출시해 밀리초급 반응과 다중모드 인터렉션의 새로운 능력을 선보였다.이와 함께 구글은 I/O 개발자 콘퍼런스에서 AI 어시스턴트 아스트라와 플래그십 대형 모델 게미니를 선보였다.
일부 업계 관계자들은 OpenAI가 이번에 기대에 부응하지 않고 기존 기술을 통합한 것으로 보고 있다.또한 구글의 AI 검색 분야 배치와 혁신, 스마트폰 운영체제 최적화 노력은 AI 분야에서의 깊은 축적과 전략적 배치를 보여준다.
경기가 과열단계에 이르렀을 때 이미 단순한 기술경쟁과 작별한것 같으며 더우기는 응용과 사용자체험의 경쟁이다.영향 요소가 복잡해지면 큰 모델의 최전방에 집중하는 OpenAI가 승자가 될 확률은 얼마나 됩니까?
구글 급습, OpenAI 먼저 AI 개인비서 발표
예상했던 AI 검색을 둘러싼 전쟁은 시작되지 않았고, 초점은 AI 스마트 어시스턴트로 옮겨갔다.
OpenAI는 5월 13일 (현지 시각) 구글 I/O 콘퍼런스를 하루 앞두고 발표회를 열고 최신 제품인 GPT-4o를 발표했다.'o'는 옴니로'만능'을 의미한다.OpenAI 홈페이지는 GPT-4o는 텍스트, 오디오, 이미지의 임의의 조합을 입력 내용으로 받아들이고 텍스트, 오디오, 이미지의 임의의 조합 출력 내용을 생성하기 때문에 더 자연스러운 휴먼 컴퓨터 인터렉션으로 나아가는 단계라고 소개했다.
OpenAI 최고기술책임자 밀라 무라티는 발표회에서 GPT-4o가 기존 GPT-4 터보보다 속도가 두 배 빠르지만 비용은 절반에 불과하다고 밝혔다.GPT-4o는 텍스트, 오디오 및 이미지를 실시간으로 추론 할 수 있으며 응답 시간은 거의 인간 수준입니다.
26분간의 생방송에서 GPT-4o는 밀리초급 반응, 인류의 정서를 식별하여 음향영상상호작용을 진행하고 다중모식입력/출력 등 일련의 새로운 능력을 보여주었다.이와 동시에 GPT-4o는 데스크톱과 APP를 덮어쓰고 사용자에게 완전히 무료로 제공된다.
구글은 I/O 개발자 대회에서 만능의 AI 능력을 과시했다.회의에서 AI 어시스턴트 Astra, 문생도 모델 Imagen3, 소라를 표기한 문생비디오 모델 Veo, 플래그십 대형 모델 Gemini 등 10여 개의 제품을 연속적으로 발표, 업데이트했다.
구글의 시연 영상에서 AI 어시스턴트 아스트라를 사용할 때 휴대전화 카메라를 켜고 임의의 물건에 맞추면 AI는 물건의 이름을 정확하게 말할 수 있다.휴대전화 카메라를 어떤 물체에 조준하기만 하면 Gemini는 이를 식별할 수 있다. 예를 들어 빨간 애플이나"렌즈 속 무엇이 소리를 낼 수 있는가"와 같은 질문에도 대답할 수 있다.
또한 구글은 여름에는 Live라고 불리는 음성으로 깊이 있는 양방향 대화를 할 수 있는 능력을 추가하는 등 Gemini의 다중모드 기능을 확장할 것이라고 밝혔다.GeminiLive를 통해 사용자는 Gemini와 대화할 수 있으며 다양한 자연스러운 소리 중에서 응답하는 소리를 선택할 수 있습니다.사용자는 심지어 자신의 리듬에 따라 말을 하거나 대답하는 과정에 문제를 끊고 해명할수 있는데 마치 그 어떤 인류대화에서처럼 말이다.
매일경제신문은 언론을 인용해 최근 애플이 OpenAI와 올해 후자의 일부 기술을 아이폰에 도입하기로 합의한 것으로 드러났다고 보도했다.이번 발표회에서 Sameer Samat 구글 제품관리 부사장은 구글이 Gemini를 통해 안드로이드 운영체제를 더욱 최적화할 것이라고 분명히 밝혔다.이런 최적화는 구글 자사 휴대전화인 픽셀에서 먼저 구현될 것으로 보인다.
GPT-5 결석, OpenAI 스핀다운?
OpenAI의 기습 업데이트에 대해 업계는 더 이상 통일된 찬탄이 아니다."발표회는 놀랍지만 구글이 다 보면 당황하지 않을 것이다."라고 치타 모바일 회장 겸 CEO인 오리온 스타 에어 회장 푸성이 개인 웨이보에서 말했다.
웨이보 캡처
5월 14일 공개된 짧은 동영상에서 푸성은"모든 국내 인공지능 종사자들이 밤을 새워 바다 건너 핵폭탄을 터뜨리기를 기다리고 있지만 핵폭탄을 터뜨리지 않고 한 무더기의 낙포를 꺼낼 줄은 몰랐다"고 말했다.그는 이런 논평은 농담이지만 실망스러운 것은 이번 OpenAI가 GPT-5.0을 발표하지 않고 GPT-4.5도 보지 못하고 오히려 GPT-4o를 발표했다는 것이라며"그림, 문자, 소리와 같은 일련의 엔진을 결합해 다시 전환할 필요가 없다"고 말했다.
그러나 푸성은 후속으로"OpenAI는 이번에 더 많은 사용자들이 사용할 수 있도록 리벳을 박았다고 할 수 있다. 일련의 응용, API 가격 인하, GPT 무료, 우리는 당연히 OpenAI가 이 업계를 더 잘 발전시킬 수 있기를 바란다. 우리도 열심히 공부할 수 있다. 이번 발표회는 진정으로 우리에게 응용이 유망하고 모든 사람들이 노력해야 한다고 알려준다"고 말했다.
"GPT-4o가 나오면 원래보다 훨씬 진보한다. 그 (OpenAI) 는 매번 업그레이드할 때마다 일부 회사를'죽인다'. 이번에 GPT의 실시간 음성 인터렉션을 하는 일부 팀은 직접 해산을 선언할 수 있다."GPT-4o가 발표된 다음 날, 한 대형 모델 업계 창업자는 매일경제신문 기자에게 감탄했다.
청화대학 신문학원 원우주문화실험실 주임 심양도 이튿날 GPT-4o를 시험적으로 사용했는데 그가 발표한 영상번호에서 문생도차원에서 GPT-4o는 모발의 섬세도, 광영효과 등 세부면에서 더욱 우수하다고 언급했다.
양측이 스마트 어시스턴트에서 맞붙으면서 선양은 현재의 경쟁 구도가 더욱 명확해졌으며 구글은 Gemini에 기반한 AI 어시스턴트를 더욱 추진하고 있으며 애플과 OpenAI도 초보적으로 협력해 아이폰에 ChatGPT를 탑재할 것이라고 주장했다.
선양은 이번 발표회를 전환점으로 ChatGPT가 소울메이트로 개조돼 사실상 시리이기 때문에 산업 구도가 명확해졌다고 밝혔다. 애플이 내장된 ChatGPT로 구글 Gemini의 휴대전화 어시스턴트에 대항하는 것이다.메타도 Llama 기반 휴대전화 도우미를 오픈할 예정이다.산업에 있어서 AI 어시스턴트는 1억 체급의 사용자 수에서 10억 체급으로 나아갈 것으로 보인다.
"GPT-4o, 어제 발표했을 때 그것은 매우 강대하다고 생각했지만, 오늘 나는 구글의 최신 발표도 완전히 그것의 이러한 성적을 따라잡았다고 생각한다. 나는 뒤에 OpenAI가 더욱 긴장해야 한다고 생각한다. 왜냐하면 응용회사, 슈퍼플랫폼회사가 모두 따라잡았기 때문이다. 그것의 우세는 점점 더 적어진다."순복자본의 창시자이자 행AI 회장인 리밍순은"매일경제신문"기자에게 현재 OpenAI의 사용자 증가는 이미 이 가장 좋은 응용모델과 이 너무 강하지 않으며, 이 동시에 이 응용의 사용자 집합은 이번 응용 응용 프로그램의 응용 응용 프로그램의 배경은 이미 그다지 않다. 한 수 위.
리명순의 견해에 의하면 다음단계에 미국의 플랫폼응용회사는 마이크로소프트, 애플, Dell 및 중국의 텐센트, 바이트, 알리를 포함하여 륙속 자신의 응용과 대모형능력을 결합하여 슈퍼응용을 출시하고 점차 종합경쟁시대로 나아갈것이며 하나의 큰 모형으로 강산을 타산하는것은 더욱 어려울것이다.
검색 싸움이 끝나지 않아 구글이 OpenAI를'토벌'했다
거물의'케이크'를 먹는 것은 그렇게 쉽지 않다.
발표회에 앞서 시장에는 검색 레이아웃을 둘러싼 OpenAI의 연막탄이 넘쳐났고, OpenAI가 ChatGPT 기술을 기반으로 한 새로운 검색 엔진을 출시할 가능성이 높다는 보도가 나왔다.이와 함께'GPTSearch'라는 웹페이지가 오픈됐지만, 현재는 회원만 방문할 수 있다.유명 기자 PeteHuang도 트위터를 통해 GPTSearch가 5 월 9 일에 공식적으로 출시 될 것이라고 예고했다.
결국 이번 맞대결에서 구글은 진지를 지켰다.구글의 CEO 인 순다르 피차이 (Sundar Pichai) 는 연설에서 Gemini가 가져온 가장 흥미로운 변화 중 하나는 Google 검색에서"우리의 가장 큰 투자와 혁신 분야 중 하나는 우리의 창립 제품인 검색"이라고 언급했다.
발표회를 보면 구글은 이미 먼저 AI 능력을 검색엔진과 결합시켰다.구글 측은 구글의 검색엔진 결과를 정리할 수 있는'AI 개관'(AI Overviews) 기능을 이번 주 미국에서 출시한다고 발표했다.이 기능에서 구글은 AI가 생성한 답을 사용자에게 보여준다.
구글에 따르면 AI 개관은 비교적 복잡한 검색에 응답해 사용자가 해결책을 찾을 수 있도록 돕기 위한 것이다.예를 들어 사람들이 채식 준비나 여행 계획을 검색할 때 AI가 제공하는 답안이 검색 페이지 상단에 나타난다.
구글은 또 검색의 시각 기능을 향상시켜 동영상을 통한 문제 제기를 지원한다.I/O 콘퍼런스에서 구글은 음반기 고장에 직면했을 때 사용자가 동영상을 촬영하면서 질문하고, 새로운 검색을 통해 수리 절차와 자원을 포함한 AI 개관을 받을 수 있도록 시연했다.
스마트 어시스턴트 차원에서 구글 신제품을 먼저 저격했지만 시장이 기대하는 검색 제품에 대해서는 GPT-3.5 출시 이후 큰 기대를 모았던 이 혁명적인 기능이 연막탄을 거듭한 뒤에도 더 이상 움직이지 않고 있다.검색 시장에서 구글의 기본 디스크는 여전히 견고하며, 동시에 전면적인 AI 능력은 은근히 포위망을 형성하고 있다.
거물들과 영지를 쟁탈하는 다른 한 면은 OpenAI에게 있어서 내우의 우환이 여전히 남아있다.
지난해 내투 여파 이후 GPT-4o 발표 하루 만에 오랫동안 대중의 시선에서 사라졌던 OpenAI 공동창업자인 최고과학자 Ilya Sutskever 관선이 OpenAI를 떠났다.지난해 11월 OpenAI 경영진이 동요하자 Sutskever는 이 파문의 배후로 지목됐다.얼마 전 OpenAI 창립 멤버 중 한 명인 AndrejKarpathy도 Sora 발표를 앞두고 물러났다.
이 새로운 기술혁명에서 경쟁의 중점이 대형모형기술에서 더욱 책임적인 응용측으로 전환됨에 따라 다크호스의 자태로 한때 방향을 이끌었던 OpenAI가 속도를 낮추기 시작하면서 새로운 전환점이 이미 나타났을수도 있다.

用户名		自动登录	找回密码
密码			立即注册

예상치 못한 경기장, 구글과 OpenAI는 AI 어시스턴트를'카드 테이블'로 옮겼다

相关帖子