Aceryt
LV.6
这个用户很懒,还没有个人简介
声望 1333
关注 0
粉丝 1
私信
主帖 151
回帖
早在去年11月25日,知名文生视频模型平台Runway首次展示了,全新文生图片模型Frames。Frames不仅能够保持风格的一致性和可控性,还允许用户进行广泛的创意探索,能生成复古、数码、杂志、动态、运动、拼图等不同类型风格的图片。但那个时候Frames仅向高级用户提供使用。现在,Runway已经向所有用户开放了Frames使用权,可以在其官网使用了。Runway联合创始人兼首席执行官CristóbalValenzuela表示,Frames专为创意领域打造,其...
2025-01-22 11:39:30 267浏览 0点赞 0回复 0收藏
前不久,国产大模型平台DeepSeek开源的v3模型,受到了AndrejKarpathy等业内大神的盛赞,在算法、数据等方面非常棒。现在,DeepSeek又重磅开源了R1模型。根据其公布测试数据显示,在美国AIME2024测试中R1拿下79.8分,超过了OpenAI的o1模型的79.2分;在MATH500,R1为97.3分,同样超过了o1的96.4分;在SWEbenchVerified,R1为49.2分再次超过了o1的48.9分。而在代码测试Codeforces中,R1仅比o1模型低0.3分;MMLU低1分;GPQA低4.2分...
2025-01-21 10:54:31 699浏览 0点赞 0回复 0收藏
今天凌晨,微软宣布其开源AIAgentAutoGen发布0.4版本,全面重新设计的库,在代码稳定性、鲁棒性、通用性和可扩展性方面更好,可以开发前沿高级AIAgent应用。开源地址:https:github.commicrosoftautogen自微软开源AutoGen以来在github已获得超37000颗星,成为AIAgent领域应用最多的框架之一。由于开发者的快速增长,也带来了API效率低下以及调试和干预功能有限等难题。同时开发者对AIAgent自动化行为的可观测性、控制能力、多层...
2025-01-15 10:14:52 396浏览 0点赞 0回复 0收藏
OpenAIo1和o3模型的发布证明了强化学习能够让大模型拥有像人一样的快速迭代试错、深度思考的高阶推理能力,在基于模仿学习的ScalingLaw逐渐受到质疑的今天,基于探索的强化学习有望带来新的ScalingLaw。近日,清华大学NLP实验室联合上海AILab,清华大学电子系及OpenBMB社区提出一种新的结合过程奖励的强化学习方法——PRIME(ProcessReinforcementthroughIMplicitREwards),采用PRIME方法,研究人员不依赖任何蒸馏数据和模仿学...
2025-01-09 11:50:30 474浏览 0点赞 0回复 0收藏
今天凌晨,微软研究院开源了目前最强小参数模型——phi4。去年12月12日,微软首次展示了phi4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中,超过了OpenAI的GPT4o,也超过了同类顶级开源模型Qwen2.514B和Llama3.370B。在美国数学竞赛AMC的测试中phi4更是达到了91.8分,超过了GeminiPro1.5、GPT4o、Claude3.5Sonnet、Qwen2.5等知名开闭源模型,甚至整体性能可以与4050亿参数的Llama3.1媲美。当时很多人就希望...
2025-01-09 11:47:07 462浏览 0点赞 0回复 0收藏
全球AI领导者NVIDIA(英伟达)在2025年CES展会上,开源了全新世界大模型NVIDIACosmos。Cosmos能从数据整合、训练再到定制各个开发阶段的,大规模模拟、构建物理世界的基础模型,同时支持自定义微调。例如,你想开发一个实体仓储机器人,但没有真实大型仓储环境为机器人提供货物搬运、拣选、分拣等训练环境,通过Cosmos就能轻松创建一个模拟的物理仓储环境,来训练、观察、优化机器人各种动作。在自动驾驶领域,想观察汽车在大雨...
2025-01-08 11:19:35 684浏览 0点赞 0回复 0收藏
传统的生成语音方法通常是先使用ASR将输入语音转录为文本,再使用纯文本的大语言模型生成文本,最后通过TTS将生成的文本合成为语音。但这种方式在建模和生成表达性语音方面有很大技术局限性。例如,当我们想要生成一段带有特定情感的语音时,这种多步骤的方法可能无法很好地捕捉情感信息,导致生成的语音在表达上不够自然。为了解决这些难题,Meta开源了多模式模型SPIRIT–LM,可以轻松混合文本和语音使生成的效果更逼真、拟人...
2025-01-07 10:20:17 214浏览 0点赞 0回复 0收藏
昨天,OpenAI首席执行官兼联合创始人SamAltman,在他的个人博客发布了最新深度文章——Reflections(反思)。主要回顾了OpenAI创立这9年的时间:从最初的不被外界看好,到2022年发布ChatGPT掀起全球AI革命用户一路暴涨超过3亿,再到他突然被解雇,整个OpenAI陷入混乱状态。这也让他意识到自己的管理挺失败的,好在恢复过程中他比较幸运有很多人帮助了他,随后整改了OpenAI董事会实现多元化管理。在技术展望方面,Sam特意写道“...
2025-01-07 10:16:34 264浏览 0点赞 0回复 0收藏
今天凌晨3点,全球社交巨头Meta分享了一个创新研究——Memorylayers(记忆层)。目前,Transformer架构的预训练大模型在存储、查询数据时,随着参数的变大对算力的需求呈指数级增长。“记忆层”提出了新的高效查询机制替代了传统的查询方法,通过比较查询键与两个较小集合中的键,可以快速找到最相关的键,而无需遍历模型的整个记忆层。这也就是说,可以在不增加算力的情况下显著增加大模型的参数。例如,研究人员在仅有1.3亿参...
2025-01-03 10:09:19 522浏览 0点赞 0回复 0收藏
Midjourney、DALLE3、SD3等模型的出现,使得文生图像赛道实现了快速发展。但这些模型的参数非常大,在推理、生成的过程中占用了大量内存,极大限制了使用场景和设备。为了解决这一难题,字节跳动的研究人员发布了创新的量化方法,不需要访问任何实际的图像数据,仅依赖模型自身的自监督信号即可。研究人员在著名开源文生图像模型FLUX进行了实验。结果显示,成功将FLUX的模型量化到1.58位权重,仅用{1,0,+1}三种值就能表示而不是...
2025-01-02 13:58:20 545浏览 0点赞 0回复 0收藏
全球四大会计事务所之一的pwc(普华永道)发布了2025年AI领域6大预测报告。普华永道表示,生成式AI的出现,使得开发AI应用变得更加容易。一个通用的大模型只需进行少量定制,就能打造适用于金融、财务、开发、客服等不同领域的产品。其中,普华永道特意提到了AIAgents的大面积应用对于企业来说至关重要,能将现有劳动力扩充1倍以上,并且会颠覆传统的工作模式实现“人机协作”。一、AI战略:决定企业未来走向的关键抉择AI战略对...
2025-01-02 13:55:35 551浏览 0点赞 0回复 0收藏
2024年成为生成式AI实现商业化落地的关键年,在各个行业中脱颖而出正在对全球经济产生难以置信的影响。而企业也在不断探索其应用潜力,开发出新的商业用例。例如,在电信领域,Lumen通过Copilot每周为销售人员节省平均四小时,相当于每年节省5000万美元。在医疗保健领域,奇美医疗中心的医生现在只需15分钟而不是一小时就能完成医疗报告的撰写,护士可以在不到5分钟内记录患者信息。为了指导组织在生成式AI转型旅程中的方向,微...
2024-12-25 09:16:10 396浏览 0点赞 0回复 0收藏
根据OpenAI公布的数据显示,新模型o3在Codeforces上的评级为2727,比全球99.8%程序员都要好。如果转化为智商大约在157,历史上的爱因斯坦还能与AI较量一下。他没有正式测试过智商,但外界普遍认为其智商在160以上。虽然AI还没有情商,只论智商的话,目前人类已经无法看到AI的追尾灯了。其实,OpenAI今年发布GPT4o时智商也只有115,属于正常人范围。o1预览版模型达到了123,相当于博士级水平。从完整版的o1开始达到惊人的135,o3...
2024-12-24 10:21:16 346浏览 0点赞 0回复 0收藏
微软研究院发布了最强小参数模型——Phi4。Phi系列模型自今已经发布了5代,Phi4也延续了之前的小参数模式只有140亿。但在GPQA研究生水平、MATH数学基准中,分别达到了56.1和80.4超过了GPT4o,同时也超过了同类型的开源模型Qwen2.514B和Llama3.370B。而在美国数学竞赛AMC的测试中,Phi4达到了惊人的91.8分,再次超过了GeminiPro1.5、GPT4o、Claude3.5Sonnet、Qwen2.5等知名开闭源模型,甚至整体性能可以与4050亿参数的Llama3.1相...
2024-12-16 13:01:48 442浏览 0点赞 0回复 0收藏
今天凌晨2点,OpenAI开启了第六天技术直播,发布了高级实时视频对话和屏幕共享功能。用户通过高级视频对话功能,可以实时与ChatGPT进行交流,并且可以打断它的叙述进行提问,例如,让ChatGPT实时帮你讲解一道高难度的数学题,就像和家教老师聊天一样。所以这个功能在教育、旅游等需要实时讲解的领域帮助巨大。而屏幕共享,可以实时的将你的屏幕与ChatGPT共享,例如,在处理电子邮件、文档编辑等任务时,可以直接将屏幕内容分享...
2024-12-13 10:26:43 4737浏览 0点赞 0回复 0收藏
今天凌晨1点,全球首个AIAgent程序员Devin宣布全面开放使用,实现商业化。只是价格不是一般的贵,前几天OpenAI发布的ChatGPTPro可以无限使用满血o1、新版本Sora等功能,一个月才200美元。Devin直接一步到位500美元一个月,也是目前最贵的生成式AI产品之一。网友表示,这是一个糟糕的商业模式。大团队的费用微不足道,小团队或个人的费用却高得难以承受。你最起码出一个,个人订阅模式吧。500美元真的很贵了。最好的一个月,好产...
2024-12-11 13:16:46 715浏览 0点赞 0回复 0收藏
AI研究机构Ai2开源了最新大模型OLMo2,这是一款在各方面都真正开放的人工智能模型。OLMo,即OpenLanguageModel,与Llama和Gemma等流行的开放权重模型不同,它不仅提供模型权重,还包括了工具、数据集、训练配方等所有用于开发模型的内容。OLMo2包括了7B和13B两个参数版本,能力都相当优秀。7B版本在英语学术基准测试中超越了Meta的Llama3.18B,而13B版本即使在训练时使用的计算能力较少的情况下,也超过了Qwen2.57B。开源地址:...
2024-11-29 09:42:50 525浏览 0点赞 0回复 0收藏
今年10月,OpenAI高级研究科学家、德扑AI之父NoamBrown,曾在美国旧金山举办的TEDAI大会上提出了一个惊人的理论——让AI模型思考20秒所带来的性能提升,相当于将模型扩大100,000倍并训练100,000倍的时间。Noam所指的技术便是System12thinking,也是OpenAI最新模型o1正在使用的技术。谷歌DeepMind研究人员则直接把这项技术集成到AIAgent中开发了TalkerReasoner框架,让其具备“快”、“慢”两种拟人化思考方式。这对于解决复杂、...
2024-11-29 09:36:50 519浏览 0点赞 0回复 0收藏
阿里巴巴重磅开源了新模型——QwQ32BPreview。QwQ32B的主要特点就是推理很强,可以给出很长的透明化推理流程,这与国内DeepSeek前不久刚发布的R1Lite很相似。尤其是在数学、代码以及各种复杂推理任务上,QwQ32B可以生成数万字的推理流程,让用户深度了解模型生成内容的全过程。开源地址:https:huggingface.coQwenQwQ32BPreviewGithub:https:github.comQwenLMQwen2.5在线demo:https:huggingface.cospacesQwenQwQ32Bpreview根...
2024-11-28 09:59:40 2849浏览 0点赞 0回复 0收藏
今年7月,微软首次开源了超大知识索引GraphRAG,仅4个多月的时间在Github已超过19000颗星,成为目前最火的RAG框架之一。但GraphRAG在处理全局数据查询时成本非常高,尤其是应用在那些大参数的AI模型中格外明显,查询的过程中也存在延迟、不准确等问题。今天凌晨,微软研究院发布了GraphRAG迭代版本——LazyGraphRAG。这个RAG的最大亮点之一就是成本非常低,数据索引成本只有完整版GraphRAG的0.1%,同时采用了全新混合数据搜索方...
2024-11-26 10:10:31 572浏览 0点赞 0回复 0收藏
获得成就
已积累 3.8w 人气
获得 1 个点赞
获得 0 次收藏