鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

卷疯了！开源社区离Openai o1越来越近~

发布于 2024-10-9 13:05

浏览

0收藏

小长假结束了~ 本来打算梳理一下假期的信息的，但是内容有点多，放弃了~

今天这个标题对应假期的2个新闻。

思科的大佬，假期发了一篇medium博客，使用2个复杂数据集，进行了一系列模型的基准测试。
Blog: https://medium.com/@harishhacker3010/can-we-make-any-smaller-opensource-ai-models-smarter-than-human-1ea507e644a0
Prompt: https://gist.github.com/philschmid/34747bf5bc8280f3a5f10f5fd8d1cd4b
Github: https://github.com/harishsg993010/LLM-Research-Scripts

简单总结

🧠 结合动态思维链+反思+语言强化promp，以严格的学术测试为基准（JEE Advanced、UPSC、IMO、Putnam）
🏆 Claude 3.5 Sonnet 的性能优于 GPT-4 和匹配的 O1 型号
🔍 LLMs可以创建内部模拟并对复杂问题采取 50 多达推理步骤
📚 适用于较小的开源模型，如 Llama 3.1 8B +10%（Llama 3.1 8B 33/48 与 GPT-4o 36/48）
❌ 由于计算和预算限制，没有像 MMLU、MMLU pro 或 GPQA 那样进行基准测试
📈 高token使用量 - Claude Sonnet 3.5 仅 7 个问题就使用了大约 100 万个令牌

open o1 项目

github: https://github.com/OpenSource-O1/Open-O1
space: https://huggingface.co/spaces/happzy2633/open-o1
hf: https://huggingface.co/O1-OPEN

Open-O1 项目，主要是期望对齐闭源 OpenAI O1 模型的强大功能，为社区提供先进的开源替代方案。通过精心筛选一组 O1 风格的思考数据来开发训练，这些数据用于训练 LLaMA 和 Qwen 模型。这种训练方法赋予了较小的模型长期推理和解决问题的能力。

有一些初步的微调成果，但是看起来不太显著，readme上有挺多不错的输出样例。开源模型：https://huggingface.co/happzy2633/qwen2.5-7b-ins-v3/tree/main

卷疯了！开源社区离Openai o1越来越近~-AI.x社区

本文转载自 NLP前沿，作者：热爱AI的

标签

赞

收藏

回复

举报

回复

相关推荐

2024年的百度大模型，离「钱」越来越近

liutao988 • 2397浏览 • 0回复
Open LLM集中爆发的一周，卷疯了！

PaperAgent • 1960浏览 • 0回复
刚刚，OpenAI发布史上最强模型-o1，推理能力超人类博士！

Aceryt • 2047浏览 • 0回复
OpenAI o1很强，也能被玩坏！

PaperAgent • 1993浏览 • 0回复
OpenAI发布新模型：o1系列模型，更像理科生的模型

大语言模型论文跟踪 • 3601浏览 • 0回复
使用 OpenAI o1 的五种方法「详细指南」

51CTO技术栈 • 4915浏览 • 0回复
OpenAI o1推理模型基础入门

51CTO内容精选 • 1964浏览 • 0回复
草莓OpenAI o1的规划能力怎么样？泰斗Subbarao Kambhampati给你答案！

AIGC最前线 • 2200浏览 • 0回复
OpenAI o1：用内部思维链进行复杂推理

shizhi02 • 2117浏览 • 0回复
击败GPT-4o、仅次于o1！英伟达重磅开源超强大模型--Nemotron

Aceryt • 2749浏览 • 0回复
向o1看齐，Google开源RAG推理扩展，提升近60%

NLP前沿1 • 1660浏览 • 0回复
OpenAI o1 模型到来后，谈谈提示词工程的未来

Baihai_IDP • 1727浏览 • 0回复
Nature: LLM变得越来越像大脑

ceesoft • 1687浏览 • 0回复
开源版o1！中国大模型让国外陷入疯狂，成本猛降90%

Aceryt • 2605浏览 • 0回复
Kimi深夜炸场：满血版多模态o1级推理模型！OpenAI外全球首次！Jim Fan：同天两款国产o1绝对不是巧合！

51CTO技术栈 • 1446浏览 • 0回复
DeepSeek R1横空出世，超越OpenAI o1，教你用Ollama跑起来

小虎哦哦 • 1.4w浏览 • 0回复
DeepSeek R1 Vs OpenAI o1！全球顶级推理模型训练技术对比大解密！

51CTO技术栈 • 4172浏览 • 0回复
Vision-R1：多模态领域的DeepSeek R1-Zero，7B参数比肩OpenAI O1

Syrupup • 1398浏览 • 0回复
阿里扔出王炸：全球首个开源全模态大模型Qwen2.5-Omni：7B搞定看听说写，AI越来越像人了

算家计算 • 1012浏览 • 0回复

数字化助推器

LV.4

致力于企业信息化解决方案，数字化转型，AI大模型赋能

觉得TA不错？点个关注精彩不错过

44

帖子

601

声望

0

粉丝

关注

最近发布

llama 4，开源！ 7天前发布
Deepseek-R1，论文番外篇! 2025-03-28 00:47:51发布

热门推荐

王炸！MCP 架构设计深度剖析 & 使用 Spring AI + MCP 四步教你实现 Agent 智能体开发 0回复

实操干货！MCP 全解析，手把手教你基于 MCP 开发 Agent 0回复

从 Manus 到 DeepSearcher，2025年最值得关注的十大 Agent 智能体架构设计 0回复

Dify从入门到高阶系列二：手把手教学！超详细的Dify知识库配置全攻略 0回复

MCP协议之MCP-server(sse方式)实践 0回复

上一篇： Meta刚开源llama 3.2多模态，就被打败了！

下一篇：现实再次给大模型带来沉重打击

社区精华内容

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载