OpenAI首批“王炸”来了!上线满血版o1大模型 速度提升近50% 错误率降低了34% 支持图片输入
今早我梦醒了坎
发表于 6 일전
114
0
0
OpenAI称,该套餐的订阅用户可以大规模访问OpenAI旗下最佳的模型和工具,包括无限制访问OpenAI最智能的模型OpenAI o1以及同系列较小模型o1-mini、GPT-4o、类人的ChatGPT高级语音模式Advanced Voice。
此外,ChatGPT Pro的套餐中还可以包括名为o1 pro mode的新o1版本,也是ChatGPT Pro独有的o1版本。OpenAI称,这个新版本使用更多的计算,能更深入地思考,并为最困难的问题提供更好的答案。希望未来为ChatGPT Pro添加更强大的计算密集型生产力功能。
OpenAI表示,与预览版本相比,现在的o1模型“思维已经被训练得更加简洁”(大概快50%),同时在回答困难现实问题时,出现重大错误的概率减少了34%。
在演示中,在回答“列出2世纪罗马皇帝的名字、任期和主要成就”时,o1模型“思考”了14秒,而o1预览版花了34秒。顺便一提,能力更差的GPT-4o在回答这个问题时会犯错。
o1模型的另一个重要更新在于支持图片输入,现在可以在询问模型“太空数据中心散热问题”时,附上一张手绘的示意图。OpenAI表示,计划在未来几个月里增加网页浏览、文件上传等功能的支持。
在数学、科学和编码等具有挑战性的机器学习(ML)基准测试中,o1 pro mode的表现均胜过o1 和 o1-preview。在数学方面,o1 pro mode得分86,o1 和 o1-preview分别为78和50,在编码方面,o1 pro mode得分90,o1 和 o1-preview分别为89和62,在问答博士级别的科学问题方面,o1 pro mode得分79,后两者分别为76和74。
为了突出o1 pro mode的主要优势——可靠性更高,OpenAI还提高了评估门槛,要求只有在四次尝试中四次全部能够正确回答问题、而不是仅一次答对时,才能算作模型解决了问题。即使在这种高标准要求下,o1 pro mode的表现也明显强于o1和o1-preview。
下图可见,在以上四次答问都必须正确的标准下,o1 pro mode相比o1和o1-preview的优势更大。数学方面,o1 pro mode得分80,o1和o1-preview分别为67和37,在编码方面,o1 pro mode得分75,o1和o1-preview分别为64和26,在问答博士级别的科学问题方面,o1 pro mode得分74,后两者分别为67和58。
值得注意的是,ChatGPT Pro是OpenAI推出的最新订阅档次,比ChatGPT Plus贵上10倍。
花费1个月200美元后,用户可以无限量地使用o1模型(Plus用户目前的限制是每周50条信息),以及无限量使用o1 mini和高级语音模式,同时也能用上o1 pro模式。
官方的定义称,o1 pro会使用更多的计算资源进入深入思考,并为“最难的问题提供最好的答案”。OpenAI未来也会给这个订阅档次,添加更多更强大、计算密集型的功能。
在演示中,OpenAI演示了通过设定一系列苛刻的条件,让o1 pro筛选出符合条件的蛋白质。
在OpenAI的公告中,也提到向10名医学研究人员赠送了免费的ChatGPT Pro,研究领域涵盖孤儿病、癌症、痴呆等。这大概也是使用这个订阅服务的人群画像。
在整场发布会的最后,奥尔特曼也提到明天的演示会有“对开发者很棒的东西”。
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
-
"대적전 창시자 장충모: 인텔이 AI 물결을 따라잡지 못한 삼성의 문제는 경영전략에 있지 않다"12월 9일, 대적전 창시자 장충모의 자서전 전집의 신간 발표회가 중국 대만에서 개최되였다.행사장에서 경쟁사인 인텔 ...
- 西西里柠檬2017
- 그저께 14:46
- Up
- Down
- Reply
- Favorite
-
12월 11일 CNN에 따르면 엘론 머스크의 순자산은 4000억 달러에 달해 사상 처음으로 이 관문을 돌파했다. 머스크의 재산은 그의 우주 탐사 기술 회사와 관련이 있는 200억 달러 가까이 다시 늘어난 것으로 알려졌다 ...
- 真不是我干的的
- 6 시간전
- Up
- Down
- Reply
- Favorite
-
미국 동부 시간으로 월요일, 미국 주식 3대 지수는 집단적으로 하락하여 마감 마감되었는데, 나지는 0.62%, S & P500 지수는 0.61%, 지수는 0.54% 하락했다. 나스닥 중국 진룽지수는 8.54% 상승해 인기 있는 중국계 ...
- 强绝商爸摇
- 그저께 13:58
- Up
- Down
- Reply
- Favorite
-
샤오펑자동차 웨이보 12월 11일 소식에 따르면 샤오펑 P7 + 는 출시 4주 만에 10000대의 샤오펑 P7 + 를 정식 인도했다.
- 崔炫俊献
- 어제 12:18
- Up
- Down
- Reply
- Favorite