谷歌“Her”抢跑落地 OpenAI语音AI仍在“hold on”
啾久啾久
发表于 2024-8-14 20:39:27
1143
0
0
根据谷歌的介绍,用户可以与Gemini Live进行自由流畅的对话,而不是通过传统的输入和输出设置。
在对话过程中,用户可以打断以询问更多细节,或者暂停一段时间后再继续。
为了使对话更加自然,谷歌还提供了十种声音以供用户选择。谷歌称,“这就像你的口袋里有一个伙伴,你可以和它谈论新想法或练习重要的对话。”
Open AI此前发布的GPT-4o高级语音模式,也允许用户在对话过程中打断,并能感知和回应用户的情绪波动。在语音设置方面,Open AI提供了四种声音,均与专业的配音演员合作制作。
此外,谷歌还将Gemini Live与其他应用程序和工具连接。谷歌表示,将在未来几周推出Keep、Tasks、Utilities、Calendar、YouTube Music等扩展功能。
谷歌描述了这些功能的具体应用场景。比如用户需要举办一场晚宴,可以让Gemini Live找到特定的食谱,并把食材添加到Keep购物清单中,还能定制一份“让人想起90年代末”的歌单;再比如只需要拍一张音乐会海报的照片,Gemini Live就可以回答用户当天是否有空,并提醒用户买票。
不过,在“Made by Google”大会现场演示Gemini Live功能时,却出现了一点小插曲。谷歌高管Dave Citron询问Gemini Live他的日程表上有没有活动,接连尝试了两次Gemini Live都没有响应,直到第三次换了一个设备才演示成功。
目前,谷歌已向Android手机上的Gemini高级订阅用户提供英语版,并将在接下来的几周内扩展到iOS上,同时提供更多语言模式。谷歌发布的最新款Pixel 9系列手机也搭载了Gemini Live功能。
业内人士认为,Gemini Live的发布是人工智能交互发展的一个重要里程碑。通过引入语音中断和选择功能,谷歌既是在与OpenAI竞争,也是在推动人机交互的方式,从而改变人工智能聊天机器人市场的竞争格局,倒逼其他公司创造出更多自然、实用、吸引人的人工智能助手。
同时,人机交互的创新发展也带来了新的问题和挑战。例如,人工智能将如何快速处理话题变化,同时保持上下文的统一和相关性?如何在不丢失重要线索的情况下处理干扰信息?更重要的是,随着人工智能的深入发展,其与现实生活的边界在哪里?
而OpenAI早在3个月前就已经公开介绍过的GPT-4o,至今尚未完全落地。8月9日,OpenAI发布了一篇关于安全性的博客文章,详细介绍了公司在开发GPT-4o时所做的安全努力,并探讨了这些技术可能对社会带来的风险。
OpenAI在该报告中指出了人工智能的类人社交模式可能造成的风险。OpenAI认为,用户可能会与人工智能建立社交关系,而减少对人类互动的需求。这有利于孤独的个体,但会影响健康的人际关系。
OpenAI透露,在GPT-4o的早期测试时,他们观察到用户与模型的互动语言开始出现微妙的变化,例如,“这是我们在一起的最后一天”等等,这种看似无害的表达,背后可能隐藏着更大的问题。
此外,OpenAI还提到,GPT-4o有时会无意间生成模仿用户声音的输出,这意味着,AI语音引擎可能会被用来欺诈。
而这些安全问题,也是OpenAI把控GPT-4o落地节奏的原因之一。至于谷歌Gemini Live是否解决了类似的安全隐患,并未披露。
所有与安全相关的隐患,无论是我们能够意识到的,还是“潘多拉魔盒”附带的更多可能性,都是人工智能事业需要进一步解决的问题,以保证“技术的进步是为了服务于人类”。
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
You may like
- 云计算巨头入局AI人才争夺战 收购AI语音代理公司Tenyx
- Salesforce拟收购人工智能语音代理公司Tenyx
- 突发!高管离职、计划重组!OpenAI怎么了?
- 苹果公司据悉不再参与OpenAI融资轮谈判
- Apple reportedly no longer participates in OpenAI funding round negotiations
- アップルはOpenAI融資ラウンド交渉に参加しないという
- 애플은 OpenAI 융자 라운드 협상에 더 이상 참여하지 않는 것으로 알려졌다
- OpenAI称收到英伟达DGX B200工程机
- OpenAI claims to have received the NVIDIA DGX B200 engineering machine
- OpenAI는 엔비디아 DGX B200 공정기를 받았다고 한다
-
11월 14일, 세계예선 아시아지역 제3단계 C조 제5라운드, 중국남자축구는 바레인남자축구와 원정경기를 가졌다.축구 국가대표팀은 바레인을 1-0으로 꺾고 예선 2연승을 거두었다. 특히 이번 경기 국내 유일한 중계 ...
- 我是来围观的逊
- 1 시간전
- Up
- Down
- Reply
- Favorite
-
"영비릉: 2024회계연도 영업수입 동기대비 8% 감소"영비릉은 2024회계연도 재무제보를 발표했다.2024 회계연도 매출은 149억5500만 유로로 전년 동기 대비 8% 감소했습니다.이익은 31억 500만 유로입니다.이익률은 ...
- 勇敢的树袋熊1
- 3 일전
- Up
- Down
- Reply
- Favorite
-
계면신문기자 장우발 4분기의 영업수입이 하락한후 텐센트음악은 다시 성장으로 돌아왔다. 11월 12일, 텐센트음악은 최신 재보를 발표했다.2024년 9월 30일까지 이 회사의 3분기 총수입은 70억 2천만 위안으로 전년 ...
- 勇敢的树袋熊1
- 그저께 15:27
- Up
- Down
- Reply
- Favorite
-
본사소식 (기자 원전새): 11월 14일, 다다그룹 (나스닥코드: DADA) 은 2024년 3분기 실적보고를 발표했다. 수치가 보여준데 따르면 고품질발전전략에 지속적으로 전념하고 사용자체험을 끊임없이 최적화하며 공급을 ...
- 家养宠物繁殖
- 어제 15:21
- Up
- Down
- Reply
- Favorite