今天在看DeepseekR1的技术报告,看到rewardhacking不懂,于是分别问了kimi长思考和deepseek深度思考功能。kimi推理及结果:Deepseek的推理及结果:RewardHacking(奖励漏洞)可以理解为:一个系统为了“刷分”而钻规则的空子,结果虽然分数很高,但实际效果却跑偏了。就像学生为了考高分只背题不学知识,或者游戏玩家用漏洞刷分但破坏了游戏体验。举个栗子🌰假设你训练一个清洁机器人,规则是“每捡一件垃圾得1分”。结果机器人...
2025-02-08 14:11:15 578浏览 0点赞 0回复 0收藏
本篇文章来自Anthropic,我用大模型给翻译了一下,以下是全文。过去一年里,我们与数十个团队合作,跨行业构建大型语言模型(LLM)智能体。通常,最成功的实施案例并不是使用复杂的框架或专门的库。相反,它们是用简单、可组合的模式来构建的。在这篇文章中,我们分享了从与客户合作及自行构建智能体中学到的经验,并为开发者提供了构建高效智能体的实用建议。什么是智能体?“Agent”可以通过多种方式定义。一些客户将智能体定...
2025-01-24 10:36:07 4217浏览 0点赞 0回复 0收藏
1.通义PPT创作体验最近在研究知识图谱,搜集网上资料和理解,写了一篇学习笔记刚好看到通义千问里面有一套效率工具,其中就有PPT创作,于是拿着学习笔记试试PPT生成的效果。首先我选择的是上传文件生成PPT,当然你也可以写一句话生成主题PPT生成过程如下图所示,整体操作非常简单。开始创作上传文件生成PPT选择要上传的具体文件,支持的格式非常多等待生成大纲编辑生成的大纲选择模板生成完成,看看效果生成过程:根据文件...
2025-01-15 12:50:22 417浏览 0点赞 0回复 0收藏
什么是RAG?RAG的全称是检索增强生成(RetrievalAugmentedGeneration,简称RAG),它结合了检索和和生成技术,通过整合检索系统和生成模型的优势,来提升模型生成文本的质量和上下文相关性。这种技术主要是为了解决生成式模型在面对需要具体、实时或领域专业知识时可能产生的准确性不足和上下文不敏感的问题。即它先根据外部知识库搜索到的信息来作为上下文,再来辅助模型回答问题,使得模型的回答更准确。比如你想做一个智能助...
2025-01-07 11:41:18 506浏览 0点赞 0回复 0收藏
本篇文章参考吴恩达大佬的推文,做了一些补充。对于AI产品管理最佳实践,他认为可总结为以下三点:使用具体示例来明确AI产品需求、通过提示工程和RAG初步验证产品的技术可行性、在V0、Bolt等AICode工具帮助下,产品经理独立实现原型系统,从而快速推到市场,拿到用户反馈。AI产品管理正迅速发展。生成式AI和基于AI的开发者工具的兴起,为构建AI应用创造了众多机遇。这使得构建新型事物成为可能,进而推动了产品管理最佳实践的转...
2024-12-27 13:56:29 624浏览 0点赞 0回复 0收藏
前言在微博看到有i陆三金大佬发了OpenAI、Anthropic两家公司的首席产品官的同台访谈,看俩人讨论如何在生成式AI的不确定性下做产品。提取了一下要点,有兴趣可以去看原视频:在模型被训练出来之前,每个人都不知道模型会怎么样,会涌现哪些能力,研究团队也不知道,它的性能是60%、90%还是99%,而基于每一种情况去构建产品又很不一样。OpenAICPO:很多事情在60%的情况下已经可以做,只是你要针对性的做产品。AnthropicCPO:与客...
2024-12-19 11:45:21 1304浏览 0点赞 0回复 0收藏
前言依稀记得十年前,我在上遥感概论专业课时,老师带我们用ERDASIMAGINE遥感图像处理软件做地物分类,每个人电脑上先发一段区域的遥感影像,进行人工判读和标注,比如把这个区域影像上的林地标注出来喂给模型,再用这个模型去识别另外一个区域影像中的林地,机器学习中典型的的有监督学习应用。大概5年前,在和公司研发人员闲聊时,聊到公司在做的“三调”项目,公司数据工程师当时正日夜对着国家下发的卫星影像,进行地物分...
2024-12-09 10:47:58 1825浏览 0点赞 0回复 0收藏
大语言模型(LLM)通常被优化用来回答人们的问题。但是现在有一个趋势是模型也在被优化以适应智能体工作流程。这将大大提升智能体的性能!在ChatGPT在问答方面取得突破性成功之后,大量的LLM开发都集中在提供良好的消费者体验上。因此,LLM被调教来回答问题("为什么莎士比亚要写《麦克白》?")或遵循人类提供的指令("解释为什么莎士比亚写了《麦克白》")。指令微调数据集中的很大一部分都在引导模型为人类编写的问题和指令提...
2024-11-29 15:17:01 566浏览 0点赞 0回复 0收藏
首先说下背景,我是个非技术出身的产品经理,除了PM平时工作中所需要掌握的技术常识和概念之外,我只自学过一些前端和python技术知识,没有实战项目经验,可以说是几乎没有任何的程序开发经历。之前在网上看到有些编程小白使用ChatGPT生成代码写出了浏览器插件工具。心想要不我也试试?正好我需要写一个程序来帮忙爬取项目招标信息进行市场分析,借助最近比较火的kimi大模型来试试。在整个和kimi“结对编程”的过程中,我问了不...
2024-11-22 12:09:38 1103浏览 0点赞 0回复 0收藏