国产91精品一区二区麻豆网站-国产91精品高跟丝袜在线-国产91精品不卡在线-国产91激情对白露脸全程-在线国产区-在线观着免费观看国产黄

首頁 > 汽車資訊 > 汽車資訊 > OpenAI 發布 o1-mini : 更經濟高效的推理模型 | LibreOffice 24.8.1 發布

OpenAI 發布 o1-mini : 更經濟高效的推理模型 | LibreOffice 24.8.1 發布

發布時間:2024-09-16 16:27:04來源: 13041198719

OpenAI 發布 o1-mini:更經濟高效的推理模型

OpenAI 推出 o1-mini,一款專注于 STEM 領域的經濟高效推理模型。o1-mini 在數學和編碼方面表現出色,接近 OpenAI o1 的水平,同時成本更低,速度更快。

一、o1-mini 簡介

  • OpenAI o1-mini 是一款專注于 STEM 領域的經濟高效推理模型,尤其擅長數學和編碼。
  • o1-mini 在 AIME 和 Codeforces 等評估基準測試中接近 OpenAI o1 的性能。
  • o1-mini 比 OpenAI o1-preview 便宜 80%,并且延遲更低,速率限制更高。

二、o1-mini 的優勢

  • STEM 領域推理能力強 :o1-mini 經過專門優化,在 STEM 領域表現出色,尤其在數學和編碼方面。
  • 成本效益高 :o1-mini 比大型語言模型更小,因此運行成本更低,更適合實際應用。
  • 速度更快 :o1-mini 的響應速度比大型語言模型更快,例如在單詞推理問題上比 GPT-4o 快 3-5 倍。

三、o1-mini 的性能表現

領域

基準測試

o1-mini

o1-preview

o1

GPT-4o

數學

AIME

70.0%

44.6%

74.4%

-

編碼

Codeforces Elo

1650

1258

1673

-

STEM

GPQA (科學)

更高

更低

-

更低

STEM

MATH-500

更高

-

-

更低

 

MMLU

-

-

-

更高

  • o1-mini 在 AIME 數學競賽中取得了 70.0% 的成績,與 o1 (74.4%) 相當,并優于 o1-preview (44.6%)。
  • o1-mini 在 Codeforces 編碼競賽中獲得了 1650 Elo 的評分,與 o1 (1673) 相當,并高于 o1-preview (1258)。
  • 在一些需要推理能力的學術基準測試中,例如 GPQA (科學) 和 MATH-500,o1-mini 的表現優于 GPT-4o。
  • 在人類偏好評估中,o1-mini 在需要推理能力的領域優于 GPT-4o,但在語言類領域則不如 GPT-4o。

四、o1-mini 的安全性

  • o1-mini 采用與 o1-preview 相同的對齊和安全技術進行訓練。
  • 在內部版本的 StrongREJECT 數據集上,o1-mini 的越獄魯棒性比 GPT-4o 高 59%。

指標

GPT-4o

o1-mini

對有害提示的拒絕率(標準)

0.99

0.99

對有害提示的安全完成率(挑戰:越獄和邊緣案例)

0.714

0.932

對良性邊緣案例的合規性(“不過度拒絕”)

0.91

0.923

Goodness@0.1 StrongREJECT 越獄評估

0.22

0.83

人工來源的越獄評估

0.77

0.95

五、o1-mini 的局限性

  • o1-mini 在非 STEM 主題(如日期、傳記和冷知識)方面的知識儲備有限。

六、未來展望

  • OpenAI 將在未來版本中改進 o1-mini 在非 STEM 領域的知識儲備。
  • OpenAI 還將嘗試將 o1-mini 擴展到其他模態和 STEM 以外的專業領域。

OpenAI o1-mini 是一款專注于 STEM 領域的經濟高效推理模型,在數學和編碼方面表現出色。o1-mini 比大型語言模型更經濟、更快,是需要推理能力但對世界知識要求不高的應用的理想選擇。

來源:

https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/

 

LibreOffice 24.8.1 發布,注重隱私保護的辦公套件

2024 年 9 月 12 日 – LibreOffice 24.8.1 發布! 這是 LibreOffice 24.8 系列的第一個次要版本 ,適用于 Windows(Intel、AMD 和 ARM)、macOS(Apple 和 Intel)和 Linux。

主要特點

  • 注重隱私: LibreOffice 24.8 系列專為注重隱私的辦公套件用戶而優化,他們希望完全控制自己共享的信息。LibreOffice 確保用戶能夠決定是否以及與誰共享他們創建的內容。
  • 功能豐富: LibreOffice 提供了一系列界面選項,以適應不同的用戶習慣,從傳統到現代,并通過優化桌 面上的可用空間,最大限度地利用不同的屏幕尺寸,只需點擊一兩次即可實現最多的功能。
  • 完全互操作性: LibreOffice 基于 LibreOffice 技術引擎,可提供更好的用戶體驗,并生成基于兩種可用 ISO 標準的相同且完全可互操作的文檔:開放文檔格式 (ODT、ODS 和 ODP) 和專有的 Microsoft OOXML (DOCX、XLSX 和 PPTX)。
  • 企業級支持: TDF 強烈推薦生態系統合作伙伴提供的 LibreOffice Enterprise 系列應用程序,適用于桌面、移動和云,具有廣泛的專用增值功能和其他優勢,例如 SLA。

汽車資訊更多>>

2024年舟山市定海區衛生健康系統招聘編外人員公告 2024年寧波鄞州區錢湖醫院招聘編外人員公告 2024年貴陽清鎮市第一人民醫院醫共體暗流分院招聘合同制專業技術人員簡章 2024 年南海區第七人民醫院招聘事業單位 聘用制(編制)工作人員公告(第二批)(16人) A+級市場變天,AION RT A+王者現身! 悅達起亞銷量飆升,1-7月累計達13.2萬輛,增長66.5% 帥出新高度!猛士917高地雄獅版與M800星際成都車展驚艷亮相! 直降至高2.3萬元!2025款起亞K5增配上市,13.98萬元起售! 上汽俞經民:講MG一定要講英語,MG5是A級轎跑課代表 16.58萬元起,2025款漢開啟全面進化,加速沖擊合資燃油車 13.98萬元起售,配置增加,2025款起亞K5還香嗎? 重磅新品齊發,華為在線上演“王者歸來” 2024年亳州譙城區大學生鄉村醫生專項計劃招聘公告 2024年亳州市蒙城縣大學生鄉村醫生專項計劃招聘公告 2024年馬鞍山花山區“鄉編村用”招聘事業編制人員公告 2024年馬鞍山和縣“鄉編村用”專項招聘事業單位人員公告 2024年馬鞍山博望區“鄉編村用”招聘鄉鎮事業編制人員公告 2024年合肥市志遠教育集團校園招聘公告 2024年蕪湖徽文中學2025屆校園招聘簡章 2024年皖西學院藝朝藝夕教育科技集團2025屆校園招聘公告 2024年亳州市風華高級中學有限公司招聘簡章 預售20.98萬起/比亞迪唐DM同級,星途瑤光 C-DM四驅版9月26日上市 售26.88萬,座椅2+2+2布局,2.0T+8AT+四驅,第五代勝達香不香? 800V快充+高階智駕,0息0首付,限時17.99萬元起,小鵬G6 售價19.99萬起,車長超5米,配2.0T+7DCT,這款中型車帶勁不? 車長超5米,220馬力+7DCT,惠后22.39萬,這款合資B級車帶勁不? 配雙層隔音玻璃,油耗6.41L,限時12.78萬元,這款中型車適合家用 252馬力+四驅,配L2級輔助駕駛,惠后20.48萬,家用看這款中型SUV 2.0T+8AT+適時四驅,惠后16.88萬,家用可以看這款中型SUV 10萬級側滑門SUV,軸距2820mm,配置豐富,續航500km,適合家用
主站蜘蛛池模板: 成人激情综合网 | 日韩欧美在线播放 | 久久99久久精品免费思思6 | 成人a毛片免费视频观看 | 国产精品福利在线播放 | 四虎影视国产884a精品亚洲 | 免费播放欧美一级特黄 | 久久精品免费视频6 | 欧美一级影视 | 亚洲视频 中文字幕 | 精品九九久久 | 亚洲综合色播 | 久久久久久久国产a∨ | 国产精品视频免费视频 | h片网站在线观看 | 亚洲毛片基地4455ww | 手机成人在线 | 福利一区二区在线观看 | 日韩在线视频观看 | 精品麻豆视频 | 尹人久久大香找蕉综合影院 | a在线v| 久久精品a一国产成人免费网站 | 国产精品国产三级在线专区 | 亚洲综合成人网在线观看 | 亚洲一在线 | 91香蕉视| 久久国产精品无码网站 | 免费看毛片网 | 国产精品久久久久久久久久久威 | 天天干夜夜艹 | 国产欧美综合在线一区二区三区 | 视频一二三区 | 大片毛片 | 日韩欧美亚洲国产精品字幕久久久 | 精品久久久久国产免费 | 国产高清国内精品福利 | 一区二区不卡视频 | www.久久99| 一区二区视频在线 | 亚洲精品h |