找回密码
 立即注册
搜索
热搜: Apple Tesla Amazon
查看: 143|回复: 0

OpenAI技術生中継第6弾:ChatGPT「目を覚まして世界を見る」AI付き添い/AI教育の新ベンチマーク?

[复制链接]

34

主题

0

回帖

126

积分

注册会员

积分
126
发表于 7 일전 | 显示全部楼层 |阅读模式

技術共有日の6日目、OpenAIはより「本意」に近いものを提供した--ChatGPTは高級音声モードをオープンした:リアルタイムビデオ通話、画面共有、画像アップロード。
なぜ「本意」に近いのか。
OpenAIのAltman CEOはこれまでSalesforceのインタビューで、自分が一番好きなAI映画は『彼女』(『Her』、ある男が彼に恋をしたAI仮想アシスタントの物語)で、「会話言語インタフェースの考えは信じられないほど予見性がある」と語っていた。The Informationは記事の中で、Altmanは最終的にこの映画のAIアシスタントのように、迅速に応答できる仮想アシスタントを開発したいと考えていると述べている。
『Her』のロボットガールフレンドは、身体知能の究極の形態を代表しており、人とバリアフリーで対話できる。
これまで、ChatGPTのDANモデル(Do anything nowの略称)はAIがより自由な方法でユーザーと会話することを許可してきたが、その「人間臭さ」の重さはすでに驚くべきものであり、低遅延コミュニケーションだけでなく、人間の語調を真似して情緒的価値を提供することもできる。今回、ChatGPTは聞き取れるだけでなく、視覚能力もロック解除し、カメラを通じて「目を開けて世界を見る」ことができた。
今回のシェアライブでは、Sam Altman CEOは現れず、OpenAIのKevin Weilチーフプロダクトオフィサー、OpenAIプロダクトマネージャーのJackie Shannon、マルチモーダルを担当するOpenAI技術チームのMichelle Qin、Rowan Zellersの4人の従業員がアップデートの機能を紹介した。
高級音声モードのリアルタイムビデオ通話機能が最も優れている。OpenAIのチームメンバーがChatGPTビデオに順番に挨拶し、一定の認識が得られた後、トナカイの角を連れた同僚の名前は何ですか。ChatGPTはサンタクロース限定音声で正解を与え、「記憶」能力を示した。
次に、チームはChatGPTが手でコーヒーを入れる装置の操作を教える方法をデモし、ChatGPTに「ビデオ通話」をかけるだけで、目の前の器具に合わせて、手で各ステップを教えることができます。デモ全体の過程で、ChatGPTの声は自然で親切で、語調も調整され、人間のように大笑いすることもできた。
画面共有機能は、画面共有を通じてChatGPTに画面を「見て」もらうことであり、リアルタイムのビデオ理解能力でもある。ユーザーは右下の高度な音声モードアイコンをクリックし、ドロップダウンメニューから共有画面を選択するだけで、的確なヘルプを得ることができます。
OpenAIチームメンバーとその共有に成功した後、ChatGPTに自分のメールを閲覧させ、指導返信を要求した。ChatGPTは「高情商」の一面を見せ、相手のクリスマス装飾を褒めることを提案した。
紹介によると、高級音声モードは50言語以上、9種類の迫真出力音声オプションをサポートし、各音声には独自のニュアンスと特徴がある。その背後にあるGPT-4 oは、音声をテキストに変換するだけでなく、呼吸や感情など、オーディオの他の機能を理解し、マークすることができます。
50以上の言語をサポートするChatGPTは現実世界のシーンをリアルタイムで理解することができ、ChatGPTのAI付き添いツールとしての体験感を大幅に向上させるだけでなく、より効率的で強力なAI教育ツールのためにも模範を示した。
これらの機能は本日からChatGPTモバイルアプリケーションで提供され、次の1週間以内にすべてのチームユーザー、およびほとんどのPlusとProユーザーに公開されます。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|www.LogoMoeny.com

GMT+8, 2024-12-20 00:33 , Processed in 0.094642 second(s), 8 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表