首页 > 生活知识 > 生活知识 > OpenAI 发布 o1-mini : 更经济高效的推理模型 | LibreOffice 24.8.1 发布

OpenAI 发布 o1-mini : 更经济高效的推理模型 | LibreOffice 24.8.1 发布

发布时间:2024-09-16 16:27:04来源: 13041198719

OpenAI 发布 o1-mini:更经济高效的推理模型

OpenAI 推出 o1-mini,一款专注于 STEM 领域的经济高效推理模型。o1-mini 在数学和编码方面表现出色,接近 OpenAI o1 的水平,同时成本更低,速度更快。

一、o1-mini 简介

  • OpenAI o1-mini 是一款专注于 STEM 领域的经济高效推理模型,尤其擅长数学和编码。
  • o1-mini 在 AIME 和 Codeforces 等评估基准测试中接近 OpenAI o1 的性能。
  • o1-mini 比 OpenAI o1-preview 便宜 80%,并且延迟更低,速率限制更高。

二、o1-mini 的优势

  • STEM 领域推理能力强 :o1-mini 经过专门优化,在 STEM 领域表现出色,尤其在数学和编码方面。
  • 成本效益高 :o1-mini 比大型语言模型更小,因此运行成本更低,更适合实际应用。
  • 速度更快 :o1-mini 的响应速度比大型语言模型更快,例如在单词推理问题上比 GPT-4o 快 3-5 倍。

三、o1-mini 的性能表现

领域

基准测试

o1-mini

o1-preview

o1

GPT-4o

数学

AIME

70.0%

44.6%

74.4%

-

编码

Codeforces Elo

1650

1258

1673

-

STEM

GPQA (科学)

更高

更低

-

更低

STEM

MATH-500

更高

-

-

更低

 

MMLU

-

-

-

更高

  • o1-mini 在 AIME 数学竞赛中取得了 70.0% 的成绩,与 o1 (74.4%) 相当,并优于 o1-preview (44.6%)。
  • o1-mini 在 Codeforces 编码竞赛中获得了 1650 Elo 的评分,与 o1 (1673) 相当,并高于 o1-preview (1258)。
  • 在一些需要推理能力的学术基准测试中,例如 GPQA (科学) 和 MATH-500,o1-mini 的表现优于 GPT-4o。
  • 在人类偏好评估中,o1-mini 在需要推理能力的领域优于 GPT-4o,但在语言类领域则不如 GPT-4o。

四、o1-mini 的安全性

  • o1-mini 采用与 o1-preview 相同的对齐和安全技术进行训练。
  • 在内部版本的 StrongREJECT 数据集上,o1-mini 的越狱鲁棒性比 GPT-4o 高 59%。

指标

GPT-4o

o1-mini

对有害提示的拒绝率(标准)

0.99

0.99

对有害提示的安全完成率(挑战:越狱和边缘案例)

0.714

0.932

对良性边缘案例的合规性(“不过度拒绝”)

0.91

0.923

Goodness@0.1 StrongREJECT 越狱评估

0.22

0.83

人工来源的越狱评估

0.77

0.95

五、o1-mini 的局限性

  • o1-mini 在非 STEM 主题(如日期、传记和冷知识)方面的知识储备有限。

六、未来展望

  • OpenAI 将在未来版本中改进 o1-mini 在非 STEM 领域的知识储备。
  • OpenAI 还将尝试将 o1-mini 扩展到其他模态和 STEM 以外的专业领域。

OpenAI o1-mini 是一款专注于 STEM 领域的经济高效推理模型,在数学和编码方面表现出色。o1-mini 比大型语言模型更经济、更快,是需要推理能力但对世界知识要求不高的应用的理想选择。

来源:

https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/

 

LibreOffice 24.8.1 发布,注重隐私保护的办公套件

2024 年 9 月 12 日 – LibreOffice 24.8.1 发布! 这是 LibreOffice 24.8 系列的第一个次要版本 ,适用于 Windows(Intel、AMD 和 ARM)、macOS(Apple 和 Intel)和 Linux。

主要特点

  • 注重隐私: LibreOffice 24.8 系列专为注重隐私的办公套件用户而优化,他们希望完全控制自己共享的信息。LibreOffice 确保用户能够决定是否以及与谁共享他们创建的内容。
  • 功能丰富: LibreOffice 提供了一系列界面选项,以适应不同的用户习惯,从传统到现代,并通过优化桌 面上的可用空间,最大限度地利用不同的屏幕尺寸,只需点击一两次即可实现最多的功能。
  • 完全互操作性: LibreOffice 基于 LibreOffice 技术引擎,可提供更好的用户体验,并生成基于两种可用 ISO 标准的相同且完全可互操作的文档:开放文档格式 (ODT、ODS 和 ODP) 和专有的 Microsoft OOXML (DOCX、XLSX 和 PPTX)。
  • 企业级支持: TDF 强烈推荐生态系统合作伙伴提供的 LibreOffice Enterprise 系列应用程序,适用于桌面、移动和云,具有广泛的专用增值功能和其他优势,例如 SLA。

生活知识更多>>

江苏苏州大学科研助理岗位招聘10人公告 2024年湖北随州市随县高新技术产业武汉服务中心引进人才8人公告 江苏苏州高新区(虎丘区)机关事务管理处公益性岗位招聘2人简章 2025年河南南阳市宛西中等专业学校校园招聘教育紧缺人才15人公告 2024年海南儋州市教育局面向2025届毕业生招聘中学教师75人公告 2024年湖北黄冈市蕲春县乡镇事业单位招聘14人公告 2024年湖北黄冈市黄梅县事业单位招聘三支一扶服务期满人员12人公告 2025年云南德宏芒市招聘公益性岗位人员24人公告(第一批) 2024年江苏南京玄武区数据局编外人员招聘2人公告 别看长得很复古 它可是纯电动SUV!iCAR V23上市 售9.98万起 2024年河南信阳市浉河区招聘教师31人公告 2024年河南驻马店正阳县县直事业单位选聘20人方案 2024年河南郑州市第六人民医院招聘15人公告 2024年南昌市劳动保障事务代理中心招聘派遣制工作人员公告 2024年内江市教育和体育局部分学校、教育单位招聘教师(教研员)补充公告 2024年邢台广宗县招聘教师公告 2024年黔南都匀市引进2025届公费师范生公告 2024年宿州市埇桥区大学生乡村医生专项计划招聘公告 云南临沧市面向2024届医学专业高校毕业生招聘大学生乡村医生公告 2024年贵州工业职业技术学院招聘80人方案 2024年内蒙古扎赉诺尔区卫生健康委员会所属事业单位引进人才7人公告 2024年辽宁阜新市公安局招聘辅警89人公告 2025年内蒙古通辽市科左后旗部分事业单位引进急需紧缺人才39人公告 2024年德州天衢中学急需紧缺人才引进公告 2024年洛阳市教育局局属事业单位招才引智工作实施方案 2024年湖南医药学院总医院高层次人才招聘公告(56人) 2024年德保县实施乡村振兴战略指挥部招聘公告(4人) 2024年度鄂东医养集团所属三家医院关于招聘事业编制工作人员的公告(18人) 2024年黔西南兴义民族师范学院附属中学秋季赴省内外高校引进高层次、急需紧c缺人才测评方案 2025年宁德市霞浦县教育局招聘紧缺急需及高层次人才(宁德师范学院专场)公告