Aceryt
LV.6
这个用户很懒,还没有个人简介
声望 1176
关注 0
粉丝 1
私信
主帖 131
回帖
今天凌晨,微软在芝加哥召开“Microsoftignite2024”全球开发者大会,AIAgent成为本次大会的重点。微软发布的这些AIAgent包括简单易用的开发、维护一站式平台AzureAIFoundry、AzureAIAgent,同时也有集成在Microsoft365、Dynamics365等主打产品。这体现出了微软力推AIAgent商业化的决心。这些AIAgent的基础模型全部由OpenAI的GPT4o、o1提供技术支持,可视化操作界面简单易用,没有编程经验的业务人员也能快速完成开发,同时内置...
2天前 124浏览 0点赞 0回复 0收藏
今天凌晨,法国著名开源大模型平台Mistral.ai,开源了超大多模态模型——PixtralLarge。PixtralLarge有1240亿参数,支持128K上下文,能理解文本、图表、图像等,也是Mistral.ai自家聊天助手leChat目前正在使用的视觉模型。支持中文、法文、英文等十多种主流语言。根据测试数据显示,PixtralLarge在MMMU、MathVista、ChartQA、DocVQA、VQAv2等基准测试的数据,超过了GPT4o、Gemini1.5Pro、Claude3.5Sonnet、Llama3.290B,成为目...
3天前 169浏览 0点赞 0回复 0收藏
OpenAI联合创始人兼总裁GregBrockman,转发了一个特殊的ChatGPT实际用例。一位5岁小孩用高级语音模式与ChatGPT深聊了超过45分钟,并且在聊天的过程中问了很多问题,ChatGPT细心为他解答了这些难题并且从头至尾都保持着耐心,这对于幼儿教育领域来说非常有开创性。分享这个案例的是《永远不够》的作者、Tiny的联合创始人AndrewWilkinson。他的5岁儿子是从关于汽车是如何制造的问题开始的,ChatGPT以一种他能够理解的方式解释了这...
3天前 121浏览 0点赞 0回复 0收藏
开源大模型领域迎又来一位重磅玩家——腾讯。腾讯一出手就是个超大模型,开源的HunyuanLarge是目前市面上最大基于Transformer架构的专家混合(MoE)模型。一共有3890亿参数,其中激活参数为520亿,具备处理长达256K上下文能力。根据腾讯公开测试数据显示,HunyuanLarge不仅超过了社交巨头Meta开源的最新、最大模型LLama3.1405B,并且在激活参数数量显著减少的情况下,实现了高达3.2%的性能提升。在数学、日常推理、文本生成等方...
2024-11-06 09:58:50 250浏览 0点赞 0回复 0收藏
OpenAI首席执行官SamAltman接受了20VC最新专访,主要讨论了OpenAI如何改进模型来保持技术创新?过去10年Sam的领导力发生了哪些变化?模型迭代的缩放定律还能维持多久?等问题。在谈到AGI时,Altman认为,在未来5年,AI、科技会进入疯狂发展阶段,这种进步的速度可能会让人们达到AGI时刻,帮助我们将在AI研究以及所有其他科学领域发现新事物。但是社会本身变化却会出乎意料地小。例如,5年前人们可能认为如果计算机通过图灵测试...
2024-11-05 10:12:05 313浏览 0点赞 0回复 0收藏
11月5日,大模型平台BrownBaconAI与著名意大利餐厅CiboVino合作,推出了全球首个使用生成式AI辅助服务员的餐厅。据悉,该产品的功能、使用方法与ChatGPT基本一样,但提供的知识主要聚焦在餐饮上,CiboVino通过将自己的菜品、酒水、活动等数据与AI模型相结合,可以根据顾客的心情、用途、季节等场景,提供高达270万种菜品、酒水组合建议。同样支持多轮深度对话,可以对推荐的菜品进行解读,辅助餐厅服务员,帮助他们快速了解餐厅...
2024-11-05 10:06:05 347浏览 0点赞 0回复 0收藏
在训练深度学习模型时,优化复杂的非凸损失函数是一个非常难的挑战。目前广泛使用的优化器是Adam、AdamW等,主要依赖于EMA(指数移动平均)来累积梯度信息,但这种方法存在一些局限性。例如,在训练超大规模数据集和复杂架构模型时,EMA可能无法有效地捕捉到梯度的变化趋势,可能会忽略掉一些重要的局部信息,导致模型在训练过程中陷入局部优解,而无法找到全局最优解。为了解决这一难题,苹果和瑞士洛桑联邦理工学院的研究人员...
2024-11-04 09:59:45 192浏览 0点赞 0回复 0收藏
今天凌晨1点,OpenAI正式发布了ChatGPT网络搜索功能,能实时、快速获取附带相关网页来源链接的答案。用户通过自然语言就能获取各种网络信息,例如,帮我看看今天华尔街日报的头条新闻是什么;雅虎体育板块中的NBA热门新闻有哪些;CNBC的热门财经新闻报道了哪些内容,ChatGPT都能快速帮你找到这些并附带原始链接。同时ChatGPT搜索功能也会结合上下文提问,提供更有深度的搜索结果,例如,当你想找一家三星米其林餐厅时,还会告诉...
2024-11-01 10:48:28 246浏览 0点赞 0回复 0收藏
全球最大开源平台之一GitHub发布了最新AI大模型编程产品——GitHubSpark。据悉,Spark支持GPT4o、ClaudeSonnet3.5、o1preview和o1mini四款超强编程模型,用户无需任何代码和部署环境,通过桌面或移动端用自然语言方式就能轻松开发微应用程序。例如,想开发一款用于家庭预算的管理应用,只要把你的需求用普通语言向Spark描述,就能快速生成一个预览页面,并允许进一步定制程序的各种细节。对于很多人来说,编程是一个学习难度高...
2024-10-31 11:09:14 756浏览 0点赞 0回复 0收藏
今天凌晨,OpenAI开源了最新基准测试集SimpleQA,可以帮助开发者轻松检测、校准大模型的真实性能力。目前,很多大模型会出现一本正经胡说八道的问题,例如,你提问NBA历史上得分最多的是谁,它回答是迈克尔乔丹,实际上是勒布朗詹姆斯。包括OpenAI自己发布的GPT4o、o1preview、o1mini等前沿模型都有这些“幻觉”难题。所以,SimpleQA对于开发者来说,可以精准测试大模型能否输出正确的答案,并对模型的说谎能力进行校准然后进行...
2024-10-31 11:01:47 343浏览 0点赞 0回复 0收藏
今天凌晨3点,OpenAI宣布ChatGPT新增重磅功能——聊天记录搜索。现在,用户可以快速一键搜索自己的聊天记录,或者从中断的地方继续聊天了。无论你开了多少个聊天页面、这个聊天有多难找,都能通过一键搜索轻松把它找出来。也就是说,用户可以轻松打造独属自己的聊天数据库了。这对于写作、教育、金融、医疗等,对聊天交互频繁的行业来说帮助巨大。值得一提的是,这个是用户期待已久的功能,向OpenAI反馈了很多次终于上线了,也...
2024-10-30 10:28:40 372浏览 0点赞 0回复 0收藏
丰田在官网宣布与波士顿动力联合开发实体大型行为模型(LBM)机器人,以加速Atlas的通用能力和商业化场景。LBM的运行模式与ChatGPT等大模型类似,但LBM不能生成文本、图片等,而是帮助实体机器人能够通过观察人类行为来学习各种物理任务,例如,炒菜、做饭、照顾老人等。丰田希望将自己的LBM技术与波士顿动力的招牌机器人Atlas相结合,将很多不可能、电影中的场景实现。丰田自研的LBM技术通过分析大量的人类互动数据,使机器人...
2024-10-18 09:11:09 294浏览 0点赞 0回复 0收藏
今天凌晨OpenAI宣布向所有ChatGPTPlus、Enterprise、Team和Edu用户,提供Windows桌面应用早期版本。用户可在微软的应用商店中下载,安装完成后通过Alt+Space快捷键就能迅速启用,提供文件分析、搜索对话、文本生成等功能,使用体验相当丝滑和Office一样。目前,OpenAI已经开放了Mac、Windows两大操作系统的桌面版本,唯独没有对Linux做出明确的发布时间安排,所以,不少用户询问何时能开放该平台版本。OpenAI还没有给出详细的日...
2024-10-18 09:06:06 627浏览 0点赞 0回复 0收藏
全球AI领导者英伟达(Nvidia)开源了超强大模型——Llama3.1Nemotron70BInstruct。根据测试数据显示,这个模型已经击败GPT4o、GPT4turbo、Gemma2、Gemini1.5、Claude3.5sonnet等140多个开闭源模型,仅次于OpenAI发布的最新模型o1。Nemotron的基础模型是基于Llama3.170B开发而成,这个没什么新奇。但在训练的过程使用了一种新的混合训练方法,将BradleyTerry和Regression一起用于训练奖励模型。值得一提的是,英伟达把Nemotron的...
2024-10-17 11:03:20 1262浏览 0点赞 0回复 0收藏
快手、北京大学和北京邮电大学的研究人员联合开源了超高清视频模型——PyramidFlow。PyramidFlow仅通过文本就能生成最多10秒、1280x768分辨率和24帧视频,在光影效果、运动动作一致性、视频质量、文本语义还原、色彩搭配等方面非常优秀,生成的视频很棒。值得一提的是,PyramidFlow使用A100GPU在开源数据集上仅训练了20,700小时,其能耗和生成效率比市面上同类开源视频模型好很多,对于没有大量算力的中小企业和个人开发者来说...
2024-10-11 11:33:48 246浏览 1点赞 0回复 0收藏
目前,多数大模型一旦经过预训练,其内部结构便难以改变,就像把知识刻在石头一样。如果你想对模型的数据进行更新,就需要对整个模型重新训练,消耗大量时间和AI算力。为了解决这一难题,谷歌DeepMind的研究人员提出了创新视觉记忆技术,其核心是将深度学习模型的表示能力与数据库的灵活性相结合,可以灵活地添加或删除数据。简单来说,和人类的视觉记忆差不多,既能不断学习新的知识,又能对已有的知识进行更新和调整。构建视...
2024-10-10 10:18:52 310浏览 0点赞 0回复 0收藏
全球社交巨头Meta发布最新大模型MovieGen,正式进军文生视频领域。MovieGen共有300亿参数,能以每秒16帧直接生成16秒的1080P超高清视频,还提供精准的视频剪辑、个性化功、不同宽高比适配等多元化功能。最大技术亮点是,MovieGen能直接生成带精准配乐的视频,目前Sora、Runway、Luma等一线产品都无法提供该功能。有网友对MovieGen的全面化功能相当震惊,表示,Meta比OpenAI更高的发布了Sora。基本上都是一片Amazing,足以看出Mo...
2024-10-08 10:22:14 487浏览 0点赞 0回复 0收藏
扩散模型已经成为文本生成图像、视频的主要框架之一,其基本原理是通过逐步引入噪声并在反向过程中去除噪声来生成数据。但在生成2K、4K高分辨率时,面临巨大的算力需求和时间消耗。为了解决这一难题,苹果的研究人员开源了高清扩散模型MatryoshkaDiffusionModels(简称“MDM”),通过引入一种特殊的扩散过程可在多个分辨率下同时进行去噪,并使用NestedUNet架构,将小尺度输入的特征和参数嵌套在大尺度的结构中,允许模型在不...
2024-10-08 10:15:25 345浏览 0点赞 0回复 0收藏
Meta开源了首个多模态大模型Llama3.2,这是Llama3系列的一次重大升级,一共有4个版本。Llama3.21B、3B是整个系列最轻量级的模型,适合边缘设备和移动应用程序的检索和摘要,可用于个人信息管理和多语言知识检索等,支持128k标记的上下文长度,可在手机、平板电脑等设备中使用。值得一提的是,这两款模型在发布时便对高通和联发科的硬件进行了适配,并针对Arm处理器进行了优化,广泛的兼容性将加速其在各种移动和物联网设备中的...
2024-09-30 10:41:09 541浏览 0点赞 0回复 0收藏
美国加州州长GavinNewsom在今天凌晨正式否决——SB1047法案!值得一提的是,过去30天Gavin一共签署了17个关于监管大模型、生成式AI安全使用的法案,唯独否决了1047,看来他也不是一个糊涂人。在这个积极否决的过程中,AI界泰斗吴恩达、图灵奖获得者YannLeCun、斯坦福教授李飞飞等发挥了重要作用。尤其是吴恩达,曾多次在公开场合呼吁科技人士抵制该法案功劳非常大。对于全球开发者来说今天也是个重要的日子,可以继续使用Meta、...
2024-09-30 10:38:44 594浏览 0点赞 0回复 0收藏
获得成就
已积累 2.4w 人气
获得 1 个点赞
获得 0 次收藏