첫 페이지 报纸 본문

期待されていたAI検索ではなく、競争の焦点は突然AIスマートアシスタントに移った。
最近、OpenAIは多種類の入力を受け入れ、対応する出力を生成することができる万能モデルGPT-4 oを発表し、ミリ秒級反応と多モードインタラクションの新しい能力を示した。一方、グーグルはI/O開発者大会でAIアシスタントのアストラとフラッグシップモデルのGeminiを披露した。
一部の業界関係者は、OpenAIは今回予想された突破には至らず、既存の技術を統合したと考えている。また、グーグルのAI検索分野のレイアウトと革新、スマートフォンオペレーティングシステムの最適化への取り組みは、AI分野での深い蓄積と戦略的なレイアウトを示している。
試合は白熱化の段階に達し、単なる技術競争に別れを告げたようで、さらに応用とユーザー体験の競争である。影響要因が複雑になり、大きなモデルの最前線に集中しているOpenAIが勝者になる確率はどれくらいですか。
グーグルを奇襲、OpenAIがAIパーソナルアシスタントを一足先に発表
予想されていたAI検索をめぐる戦争は終わらず、AIスマートアシスタントに焦点が移った。
OpenAIは現地時間5月13日、グーグルのI/O総会の前日に発表会を開き、最新製品GPT-4 oを発表した。「o」はOmniであり、「全能」を意味する。OpenAI公式サイトによると、GPT-4 oは、テキスト、オーディオ、画像の任意の組み合わせを入力コンテンツとして受け入れ、テキスト、オーディオ、画像の任意の組み合わせの出力コンテンツを生成するため、より自然なヒューマン・マシン・インタラクションへの一歩だという。
OpenAIのミラ・ムラッティ最高技術責任者は発表会で、GPT-4 oの速度は既存のGPT-4 Turboより2倍速いが、コストはその半分にすぎないと述べた。GPT-4 oはリアルタイムでテキスト、音声、画像を推理することができ、応答時間はほぼ人間レベルに達する。
26分間の生放送では、GPT-4 oはそのミリ秒級の反応、人間の感情を識別して音声ビデオ対話を行い、多モード入出力が可能であるなどの一連の新能力を示した。一方、GPT-4 oはデスクトップとAPPをカバーし、ユーザーに完全に無料で提供しています。
グーグルはI/O開発者大会で、自分の万能なAI能力を示した。会議ではAIアシスタントのアストラ、文生図モデルのImagen 3、対標Soraの文生ビデオモデルのVeo、旗艦大モデルのGeminiなど、10種類以上の製品を連続して発表、更新した。
Googleのデモ動画では、AIアシスタントのAstraを使用する際に、携帯電話のカメラを開けて、任意のアイテムを合わせるだけで、AIはアイテムの名前を正確に言うことができます。携帯電話のカメラをある物体に向けるだけで、Geminiはそれを識別することができ、例えば赤いアップルのように、「レンズの中で何が音を出すことができるのか」という質問にも答えることができる。
また、グーグル側は、音声で深い双方向対話を行う能力を増やすことを含むGeminiのマルチモーダル機能を夏に拡張すると発表した。この機能はLiveと呼ばれる。GeminiLiveにより、ユーザーはGeminiと話すことができ、さまざまな自然な音の中から応答する音を選択することができます。ユーザーは自分のペースで話をしたり、回答中に質問を中断したり、明らかにしたりすることもできます。まるで人間の会話の中のようです。
毎日経済新聞はメディアの報道を引用して、アップルがOpenAIと今年、後者の技術の一部をiPhoneに導入することで合意していることを明らかにした。今回の発表会で、グーグル製品管理副社長のSameer Samat氏は、グーグルがGeminiを通じてアンドロイドOSをさらに最適化することを明らかにした。この最適化は、まずグーグルの自宅携帯電話Pixelに反映されるだろう。
GPT-5が欠席、OpenAIは減速?
OpenAIの突然の更新に対して、業界はもはや統一された称賛ではない。「発表会は驚いたが、グーグルが見終わったのは慌てなかったはずだ」とチーターモバイル会長兼CEOで、チーター星空会長の傅盛氏は個人の微博(ウェイボー)で述べた。
マイクロブログのスクリーンショット
5月14日に発表された短い動画で、傅盛氏は「すべての国内の人工知能従事者が夜更かしして海の向こうで核爆弾を発射するのを待っていたが、核爆弾が発射されていないのに、たくさんの砲を取り出した」と語った。彼は、このようなコメントは冗談だが、失望したのは今回のOpenAIがGPT-5.0を発表しておらず、GPT-4.5も見ておらず、むしろGPT-4 oを発表していることだと述べた。「画像、文字、音など、一連のエンジンを結合することで、切り替えに戻る必要はない」。
しかし、傅盛氏は続けて、「OpenAIは今回、より多くのユーザーに利用してもらうためには、リベットが十分に力を入れていると言えます。一連のアプリケーション、APIの値下げ、GPTの無料化、もちろんOpenAIがこの業界をより発展させ、私たちも真剣に学ぶことができることを望んでいます。今回の発表会は、アプリケーションが大いに役立つことを教えてくれました。すべての人が努力すべきです」と述べた。
「GPT-4 oが出てきて、また元より大きく進歩して、それ(OpenAI)はアップグレードするたびにいくつかの会社を“死”に追いやることができて、今回GPTのリアルタイム音声インタラクションをするいくつかのチームは、直接解散を宣言することができました」GPT-4 oが発表された翌日、ある大手モデル業界の創業者は「毎日経済新聞」の記者に感嘆した。
清華大学新聞学院元宇宙文化実験室主任の瀋陽氏も翌日、GPT-4 oを試用したが、発表された動画番号の中で、文生図の面では、GPT-4 oは毛髪の繊細さ、光影効果などの細部においてさらに優れていると述べた。
双方のスマートアシスタントでの接触に伴い、瀋陽氏は、現在の競争構図がより明確になったとみて、グーグルはGeminiベースのAIアシスタントをさらに推進しており、アップルとOpenAIも初歩的に協力し、アップルの携帯電話にChatGPTを搭載することに合意した。
瀋陽氏によると、今回の発表会を転換点として、ChatGPTはソウルメイトに改造され、実際にはSiriだったため、アップルが内蔵されたChatGPTでグーグルのGeminiに対抗する携帯電話アシスタントであることが産業構造が明らかになった。MetaもLlamaベースの携帯電話アシスタントをオンラインにする。産業にとって、AIアシスタントは1億人規模のユーザーから10億人規模への移行が期待されている。
「GPT-4 o、昨日発表された時は強大だと思っていましたが、今日はグーグルの最新の発表も完全にこれらの成績を追いつけたと思います。後のOpenAIはもっと緊張すべきだと思います。アプリ会社、超大手プラットフォーム会社がすべて追いつき、その優位性はますます少なくなっているからです」と順福キャピタルの創業者であり、銀行AIの李明順会長は「毎日経済新聞」の記者に語った。今のところOpenAIのユーザーの成長はあまり明らかではなく、技術のリードもコストの優位性も必ずしも最適ではなく、同時に、強応用時代はますます速く到来している。この背景の下で、グーグルは今回、すべてのアプリと大モデルを集合させ、より強いユーザーの粘性とユーザー依存度を形成するか、それともより優れている。
李明順氏によると、次の段階では、米国のプラットフォームアプリケーション会社、マイクロソフト、アップル、デル、中国のテンセント、バイト、アリが続々と自分のアプリケーションと大モデルの能力を結合し、スーパーアプリケーションを発売し、徐々に総合競争時代に歩み、大モデルで江山を打つのはさらに難しいだろう。
グーグルがOpenAI「包囲討伐」に対抗、検索争いは終わらず
大手の「ケーキ」を食べるのはそんなに簡単ではない。
発表会の前には、検索レイアウトをめぐるOpenAIの煙弾が市場にあふれており、OpenAIはChatGPT技術に基づく新しい検索エンジンを発売する可能性が高いとの報道があった。同時に、「GPTSEarch」というウェブページがオンラインになっていますが、現在は会員のみがアクセスできるようになっています。有名ジャーナリストのPeteHuang氏もツイッターで、GPTSEarchが5月9日に正式にオンラインになると予告した。
最終的にこのラウンドでグーグルは陣地を守った。グーグルのサンダル・ピチャイ最高経営責任者(Sundar Pichai)は講演で、Geminiがもたらした最もエキサイティングな変革の1つはGoogle検索における「私たちの最大の投資と革新分野の1つは、私たちの創始製品である検索」だと述べた。
発表会を見ると、グーグルはAI能力と検索エンジンを先に結合した。グーグル側は、グーグルの検索エンジンの結果をまとめられる「AI概要」(AI Overviews)機能を今週、米国で発売すると発表した。この機能では、GoogleはAIが生成した答えをユーザーに示します。
グーグルによると、AIの概要は複雑な検索に対応し、ユーザーがソリューションを求めるのを支援するためだという。例えば、菜食の準備や旅行計画を検索すると、AIが提供する答えが検索ページの上部に表示されます。
グーグルは検索の視覚機能も向上し、動画を通じた問題提起をサポートしている。I/O大会でグーグルは、レコードプレーヤーの故障に直面した際に、ユーザーが動画を撮影しながら質問し、新しい検索を通じて修理手順やリソースを含むAIの概要を得ることができることをデモした。
スマートアシスタントレベルでグーグルの新製品を一足先に狙撃したが、市場が期待している検索製品については、GPT-3.5が発表されて以来期待されていた革命的な機能だが、煙弾が相次いだ後も、さらなる動きは見られなかった。検索市場では、グーグルの基本的なディスクは依然として安定しており、同時にその全面的なAI能力はかすかに包囲の勢いを形成している。
大手と領地を争うもう一つの側面は、OpenAIにとって内憂の隠れた危険がある。
昨年の内闘の余波の後、GPT-4 oが発表されてから1日後、大衆の目に長く消えていたOpenAI共同創業者で首席科学者のIlya Sutskever官がOpenAIを去ると宣言した。昨年11月、OpenAI経営陣は動揺し、Sutskeverはこの波紋の背後にある推進者とされていた。先日、OpenAI創設メンバーの1人であるAndrejKarpathyもSoraの発表を前に退職した。
この新しい技術革命では、競争の重点が大モデル技術からより責任ある応用側に移るにつれ、ダークホースの姿勢で一度方向をリードしたOpenAIが減速し始め、新たな転換点が現れているかもしれない。
Tags: ベンチ
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
您需要登录后才可以回帖 登录 | Sign Up

本版积分规则

  • 11월 14일, 세계예선 아시아지역 제3단계 C조 제5라운드, 중국남자축구는 바레인남자축구와 원정경기를 가졌다.축구 국가대표팀은 바레인을 1-0으로 꺾고 예선 2연승을 거두었다. 특히 이번 경기 국내 유일한 중계 ...
    我是来围观的逊
    어제 15:05
    Up
    Down
    Reply
    Favorite
  • 계면신문기자 장우발 4분기의 영업수입이 하락한후 텐센트음악은 다시 성장으로 돌아왔다. 11월 12일, 텐센트음악은 최신 재보를 발표했다.2024년 9월 30일까지 이 회사의 3분기 총수입은 70억 2천만 위안으로 전년 ...
    勇敢的树袋熊1
    3 일전
    Up
    Down
    Reply
    Favorite
  • 본사소식 (기자 원전새): 11월 14일, 다다그룹 (나스닥코드: DADA) 은 2024년 3분기 실적보고를 발표했다. 수치가 보여준데 따르면 고품질발전전략에 지속적으로 전념하고 사용자체험을 끊임없이 최적화하며 공급을 ...
    家养宠物繁殖
    그저께 15:21
    Up
    Down
    Reply
    Favorite
  • 11월 12일 소식에 따르면 소식통에 따르면 아마존은 무료스트리밍서비스 Freevee를 페쇄하고 일부 종업원과 프로를 구독서비스 Prime Video로 이전할 계획이다. 올해 초 아마존이 내놓은 몇 편의 대형 드라마의 효 ...
    度素告
    3 일전
    Up
    Down
    Reply
    Favorite
zhw2587 新手上路
  • Follow

    0

  • Following

    0

  • Articles

    1