Aceryt
LV.6
这个用户很懒,还没有个人简介
声望 1243
关注 0
粉丝 1
私信
主帖 138
回帖
微软研究院发布了最强小参数模型——Phi4。Phi系列模型自今已经发布了5代,Phi4也延续了之前的小参数模式只有140亿。但在GPQA研究生水平、MATH数学基准中,分别达到了56.1和80.4超过了GPT4o,同时也超过了同类型的开源模型Qwen2.514B和Llama3.370B。而在美国数学竞赛AMC的测试中,Phi4达到了惊人的91.8分,再次超过了GeminiPro1.5、GPT4o、Claude3.5Sonnet、Qwen2.5等知名开闭源模型,甚至整体性能可以与4050亿参数的Llama3.1相...
6天前 171浏览 0点赞 0回复 0收藏
今天凌晨2点,OpenAI开启了第六天技术直播,发布了高级实时视频对话和屏幕共享功能。用户通过高级视频对话功能,可以实时与ChatGPT进行交流,并且可以打断它的叙述进行提问,例如,让ChatGPT实时帮你讲解一道高难度的数学题,就像和家教老师聊天一样。所以这个功能在教育、旅游等需要实时讲解的领域帮助巨大。而屏幕共享,可以实时的将你的屏幕与ChatGPT共享,例如,在处理电子邮件、文档编辑等任务时,可以直接将屏幕内容分享...
9天前 1452浏览 0点赞 0回复 0收藏
今天凌晨1点,全球首个AIAgent程序员Devin宣布全面开放使用,实现商业化。只是价格不是一般的贵,前几天OpenAI发布的ChatGPTPro可以无限使用满血o1、新版本Sora等功能,一个月才200美元。Devin直接一步到位500美元一个月,也是目前最贵的生成式AI产品之一。网友表示,这是一个糟糕的商业模式。大团队的费用微不足道,小团队或个人的费用却高得难以承受。你最起码出一个,个人订阅模式吧。500美元真的很贵了。最好的一个月,好产...
2024-12-11 13:16:46 352浏览 0点赞 0回复 0收藏
AI研究机构Ai2开源了最新大模型OLMo2,这是一款在各方面都真正开放的人工智能模型。OLMo,即OpenLanguageModel,与Llama和Gemma等流行的开放权重模型不同,它不仅提供模型权重,还包括了工具、数据集、训练配方等所有用于开发模型的内容。OLMo2包括了7B和13B两个参数版本,能力都相当优秀。7B版本在英语学术基准测试中超越了Meta的Llama3.18B,而13B版本即使在训练时使用的计算能力较少的情况下,也超过了Qwen2.57B。开源地址:...
2024-11-29 09:42:50 348浏览 0点赞 0回复 0收藏
今年10月,OpenAI高级研究科学家、德扑AI之父NoamBrown,曾在美国旧金山举办的TEDAI大会上提出了一个惊人的理论——让AI模型思考20秒所带来的性能提升,相当于将模型扩大100,000倍并训练100,000倍的时间。Noam所指的技术便是System12thinking,也是OpenAI最新模型o1正在使用的技术。谷歌DeepMind研究人员则直接把这项技术集成到AIAgent中开发了TalkerReasoner框架,让其具备“快”、“慢”两种拟人化思考方式。这对于解决复杂、...
2024-11-29 09:36:50 319浏览 0点赞 0回复 0收藏
阿里巴巴重磅开源了新模型——QwQ32BPreview。QwQ32B的主要特点就是推理很强,可以给出很长的透明化推理流程,这与国内DeepSeek前不久刚发布的R1Lite很相似。尤其是在数学、代码以及各种复杂推理任务上,QwQ32B可以生成数万字的推理流程,让用户深度了解模型生成内容的全过程。开源地址:https:huggingface.coQwenQwQ32BPreviewGithub:https:github.comQwenLMQwen2.5在线demo:https:huggingface.cospacesQwenQwQ32Bpreview根...
2024-11-28 09:59:40 1852浏览 0点赞 0回复 0收藏
今年7月,微软首次开源了超大知识索引GraphRAG,仅4个多月的时间在Github已超过19000颗星,成为目前最火的RAG框架之一。但GraphRAG在处理全局数据查询时成本非常高,尤其是应用在那些大参数的AI模型中格外明显,查询的过程中也存在延迟、不准确等问题。今天凌晨,微软研究院发布了GraphRAG迭代版本——LazyGraphRAG。这个RAG的最大亮点之一就是成本非常低,数据索引成本只有完整版GraphRAG的0.1%,同时采用了全新混合数据搜索方...
2024-11-26 10:10:31 298浏览 0点赞 0回复 0收藏
今天凌晨,微软在芝加哥召开“Microsoftignite2024”全球开发者大会,AIAgent成为本次大会的重点。微软发布的这些AIAgent包括简单易用的开发、维护一站式平台AzureAIFoundry、AzureAIAgent,同时也有集成在Microsoft365、Dynamics365等主打产品。这体现出了微软力推AIAgent商业化的决心。这些AIAgent的基础模型全部由OpenAI的GPT4o、o1提供技术支持,可视化操作界面简单易用,没有编程经验的业务人员也能快速完成开发,同时内置...
2024-11-20 10:06:12 440浏览 0点赞 0回复 0收藏
今天凌晨,法国著名开源大模型平台Mistral.ai,开源了超大多模态模型——PixtralLarge。PixtralLarge有1240亿参数,支持128K上下文,能理解文本、图表、图像等,也是Mistral.ai自家聊天助手leChat目前正在使用的视觉模型。支持中文、法文、英文等十多种主流语言。根据测试数据显示,PixtralLarge在MMMU、MathVista、ChartQA、DocVQA、VQAv2等基准测试的数据,超过了GPT4o、Gemini1.5Pro、Claude3.5Sonnet、Llama3.290B,成为目...
2024-11-19 09:48:05 392浏览 0点赞 0回复 0收藏
OpenAI联合创始人兼总裁GregBrockman,转发了一个特殊的ChatGPT实际用例。一位5岁小孩用高级语音模式与ChatGPT深聊了超过45分钟,并且在聊天的过程中问了很多问题,ChatGPT细心为他解答了这些难题并且从头至尾都保持着耐心,这对于幼儿教育领域来说非常有开创性。分享这个案例的是《永远不够》的作者、Tiny的联合创始人AndrewWilkinson。他的5岁儿子是从关于汽车是如何制造的问题开始的,ChatGPT以一种他能够理解的方式解释了这...
2024-11-19 09:45:08 311浏览 0点赞 0回复 0收藏
开源大模型领域迎又来一位重磅玩家——腾讯。腾讯一出手就是个超大模型,开源的HunyuanLarge是目前市面上最大基于Transformer架构的专家混合(MoE)模型。一共有3890亿参数,其中激活参数为520亿,具备处理长达256K上下文能力。根据腾讯公开测试数据显示,HunyuanLarge不仅超过了社交巨头Meta开源的最新、最大模型LLama3.1405B,并且在激活参数数量显著减少的情况下,实现了高达3.2%的性能提升。在数学、日常推理、文本生成等方...
2024-11-06 09:58:50 383浏览 0点赞 0回复 0收藏
OpenAI首席执行官SamAltman接受了20VC最新专访,主要讨论了OpenAI如何改进模型来保持技术创新?过去10年Sam的领导力发生了哪些变化?模型迭代的缩放定律还能维持多久?等问题。在谈到AGI时,Altman认为,在未来5年,AI、科技会进入疯狂发展阶段,这种进步的速度可能会让人们达到AGI时刻,帮助我们将在AI研究以及所有其他科学领域发现新事物。但是社会本身变化却会出乎意料地小。例如,5年前人们可能认为如果计算机通过图灵测试...
2024-11-05 10:12:05 531浏览 0点赞 0回复 0收藏
11月5日,大模型平台BrownBaconAI与著名意大利餐厅CiboVino合作,推出了全球首个使用生成式AI辅助服务员的餐厅。据悉,该产品的功能、使用方法与ChatGPT基本一样,但提供的知识主要聚焦在餐饮上,CiboVino通过将自己的菜品、酒水、活动等数据与AI模型相结合,可以根据顾客的心情、用途、季节等场景,提供高达270万种菜品、酒水组合建议。同样支持多轮深度对话,可以对推荐的菜品进行解读,辅助餐厅服务员,帮助他们快速了解餐厅...
2024-11-05 10:06:05 539浏览 0点赞 0回复 0收藏
在训练深度学习模型时,优化复杂的非凸损失函数是一个非常难的挑战。目前广泛使用的优化器是Adam、AdamW等,主要依赖于EMA(指数移动平均)来累积梯度信息,但这种方法存在一些局限性。例如,在训练超大规模数据集和复杂架构模型时,EMA可能无法有效地捕捉到梯度的变化趋势,可能会忽略掉一些重要的局部信息,导致模型在训练过程中陷入局部优解,而无法找到全局最优解。为了解决这一难题,苹果和瑞士洛桑联邦理工学院的研究人员...
2024-11-04 09:59:45 333浏览 0点赞 0回复 0收藏
今天凌晨1点,OpenAI正式发布了ChatGPT网络搜索功能,能实时、快速获取附带相关网页来源链接的答案。用户通过自然语言就能获取各种网络信息,例如,帮我看看今天华尔街日报的头条新闻是什么;雅虎体育板块中的NBA热门新闻有哪些;CNBC的热门财经新闻报道了哪些内容,ChatGPT都能快速帮你找到这些并附带原始链接。同时ChatGPT搜索功能也会结合上下文提问,提供更有深度的搜索结果,例如,当你想找一家三星米其林餐厅时,还会告诉...
2024-11-01 10:48:28 361浏览 0点赞 0回复 0收藏
全球最大开源平台之一GitHub发布了最新AI大模型编程产品——GitHubSpark。据悉,Spark支持GPT4o、ClaudeSonnet3.5、o1preview和o1mini四款超强编程模型,用户无需任何代码和部署环境,通过桌面或移动端用自然语言方式就能轻松开发微应用程序。例如,想开发一款用于家庭预算的管理应用,只要把你的需求用普通语言向Spark描述,就能快速生成一个预览页面,并允许进一步定制程序的各种细节。对于很多人来说,编程是一个学习难度高...
2024-10-31 11:09:14 1029浏览 0点赞 0回复 0收藏
今天凌晨,OpenAI开源了最新基准测试集SimpleQA,可以帮助开发者轻松检测、校准大模型的真实性能力。目前,很多大模型会出现一本正经胡说八道的问题,例如,你提问NBA历史上得分最多的是谁,它回答是迈克尔乔丹,实际上是勒布朗詹姆斯。包括OpenAI自己发布的GPT4o、o1preview、o1mini等前沿模型都有这些“幻觉”难题。所以,SimpleQA对于开发者来说,可以精准测试大模型能否输出正确的答案,并对模型的说谎能力进行校准然后进行...
2024-10-31 11:01:47 552浏览 0点赞 0回复 0收藏
今天凌晨3点,OpenAI宣布ChatGPT新增重磅功能——聊天记录搜索。现在,用户可以快速一键搜索自己的聊天记录,或者从中断的地方继续聊天了。无论你开了多少个聊天页面、这个聊天有多难找,都能通过一键搜索轻松把它找出来。也就是说,用户可以轻松打造独属自己的聊天数据库了。这对于写作、教育、金融、医疗等,对聊天交互频繁的行业来说帮助巨大。值得一提的是,这个是用户期待已久的功能,向OpenAI反馈了很多次终于上线了,也...
2024-10-30 10:28:40 600浏览 0点赞 0回复 0收藏
丰田在官网宣布与波士顿动力联合开发实体大型行为模型(LBM)机器人,以加速Atlas的通用能力和商业化场景。LBM的运行模式与ChatGPT等大模型类似,但LBM不能生成文本、图片等,而是帮助实体机器人能够通过观察人类行为来学习各种物理任务,例如,炒菜、做饭、照顾老人等。丰田希望将自己的LBM技术与波士顿动力的招牌机器人Atlas相结合,将很多不可能、电影中的场景实现。丰田自研的LBM技术通过分析大量的人类互动数据,使机器人...
2024-10-18 09:11:09 386浏览 0点赞 0回复 0收藏
今天凌晨OpenAI宣布向所有ChatGPTPlus、Enterprise、Team和Edu用户,提供Windows桌面应用早期版本。用户可在微软的应用商店中下载,安装完成后通过Alt+Space快捷键就能迅速启用,提供文件分析、搜索对话、文本生成等功能,使用体验相当丝滑和Office一样。目前,OpenAI已经开放了Mac、Windows两大操作系统的桌面版本,唯独没有对Linux做出明确的发布时间安排,所以,不少用户询问何时能开放该平台版本。OpenAI还没有给出详细的日...
2024-10-18 09:06:06 909浏览 0点赞 0回复 0收藏
获得成就
已积累 2.8w 人气
获得 1 个点赞
获得 0 次收藏