公众号矩阵

移动端

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

ceesoft

LV.3

这个用户很懒，还没有个人简介

帖子 27

声望 288

关注 0

粉丝 0

社区头条作者

私信

关注

主帖 28

回帖

KGGen用语言模型从纯文本中提取知识图谱

社区头条

从事大模型应用的读者都可能受到知识图谱（KG）不足的困扰，知识图谱的构建与运营常常是耗时费力的手工过程。斯坦福最新工作KGGen【文献1】，利用大语言模型（LLM）从非结构化文本中自动生成高质量知识图谱，等于从LLM提取出语义。简介知识图谱是信息检索等应用中基本的数据结构，通过主谓宾三元组表示实体之间的关系。然而，许多现有的KG存在不完整性，缺乏实体之间的众多关系，这对下游任务如KG嵌入和基于图的推理造成了挑战...

3天前 291浏览 0点赞 0回复 0收藏

有感于微信接入DeepSeek

图片趋势判断2月5日笔者对大模型行业发展的判断：“总结一句话：大模型全栈都应围绕DeepSeek做生态”。之后见证芯片企业一拥而上，设备商争先恐后，大模型厂家被动跟随，应用集体嗨翻天。芯片>编译器>设备>大模型>Agent智能体，过去两周国内全面拥抱DeepSeek形势如海啸一般。2月16日微信接入DeepSeek则是标志性事件，灵珠魔丸合体，官媒助力，同仇敌忾的感觉。下一步，DeepSeek需要规划好版本发行的节奏，创新参数融合机制，减...

2025-02-20 11:33:14 259浏览 0点赞 0回复 0收藏

DeepSeek-R1-Zero激发了推理Scaling Law

社区头条

本文将散落在近期多篇文章中笔者围绕激发推理ScalingLaw的思考做了一下整理。方向MIT对大模型数理原理的强有力证明中总结：基于宏大的人类知识提取出来丰富范畴，形成众多领域的本体知识结构，这是大模型通过预训练已经构建的内部世界模型；提高推理采样的机制，通过训练达成学习推理的scalinglaw，是大模型下一步努力提升的方向。相比传统方法，新的大模型机理，具备更高维度的新颖性、对能力和技术细节的探索，可以通过揭示隐...

2025-02-13 12:20:37 509浏览 0点赞 0回复 0收藏

后DeepSeek时代，大模型领域如何开工大吉

这个春节是DeepSeek的狂欢节，从R1发布到席卷全球仅不到两周，霸占140多个国家AppStore下载排行榜榜首。今日节后第一天开工，几位朋友不约而同咨询我大模型未来走向，这里简单分享一下我的看法，抛砖引玉。总结一句话：大模型全栈都应围绕DeepSeek做生态重要的事情通常得说三遍，但这件事只需说一遍，却无比重要，攸关资金、人力、时间等资源投入和业务创新与价值产出。大模型全栈这是笔者整理的大模型全栈：芯片>编译器>设备>...

2025-02-05 17:14:47 306浏览 0点赞 0回复 0收藏

从“Nature局部核重整化学习机制”说开去

局部核重整化学习机制自然通讯2025年1月10日刊发一篇题为“局部核重整化作为超参数化卷积神经网络中特征学习的机制”的文章【文献1】，学者们称“确定了一种完全不同的内核重整化形式：全连接架构的内核只是由单个标量参数全局重整化，而卷积核则经历局部重整化，这意味着网络可以选择局部分量，这些分量将以数据依赖的方式为最终预测做出贡献”。这一发现强调了一种简单的特征学习机制，CNN的重整化内核表达式中展示的核重整化...

2025-01-21 13:42:33 237浏览 0点赞 0回复 0收藏

在离散域上求解抛物线偏微分方程的框架

最优传输距离数值求解拉格朗日成本下的神经最优传输一文中，笔者整理了三个要点：1.最优传输距离（也称推土距离）将统一深度学习概率分布距离计算2.大模型Transformer等价的重整化群流都将会沿着最优传输的方向进行3.拉格朗日成本处理神经网络最优传输能更有效地建模复杂的系统动力学文章提到最优传输距离目前受到数值计算效率的制约，影响了其广泛应用。这也是笔者一直关注的方向之一。文中介绍的纽约大学和Meta的AI学者创新的...

2025-01-10 12:50:40 292浏览 0点赞 0回复 0收藏

人工智能可能永远无法拥有意识

精华

一、受罗杰·彭罗斯启发的猜想1989年，在他的重要著作《皇帝的新思维》中，罗杰·彭罗斯提出了一个引人注目的假设[1]。他认为量子过程对于形成意识的物理基础至关重要。这个观点具有吸引力，因为量子力学的方程告诉我们，在任何时刻，一个物体——无论是我，还是整个世界——都处于多种状态的叠加中。然而，在任何给定的时刻，我们只体验其中的一种。为了说明这一点，想象一个研究员走到谷歌量子AI实验室的一台量子计算机前，观...

2025-01-02 12:13:19 873浏览 0点赞 0回复 0收藏

Nature: LLM变得越来越像大脑

哥伦比亚大学和范斯坦医学研究所学者最近研究了LLM与脑神经反应的相似性。目的与发现研究的目的是确定最新的LLM是否与人脑表现出相似之处，有可能提高对LLM和大脑的理解，尤其在理解和生成语言方面。研究结果发表在《自然机器智能》上【文献1】，表明随着LLM越来越先进，不仅性能更高，也变得更像大脑。研究方法研究人员通过植入神经外科患者大脑的电极记录了他们在听语音时的脑神经反应。并将同一语音的文本提供给LLM并提取...

2024-12-23 09:30:14 629浏览 0点赞 0回复 0收藏

理化诺奖、人工智能与知识领域的融合

社区头条

引言近期的发展标志着人工智能领域的一个激动人心的时期。2024年诺贝尔物理学奖授予了约翰·霍普菲尔德（JohnHopfield）和杰弗里·辛顿（GeoffreyHinton），以表彰他们在人工智能领域的奠基性工作；而化学奖则颁给了大卫·贝克（DavidBaker）、德米斯·哈萨比斯（DemisHassabis）和约翰·琼珀（JohnJumper），以表彰他们利用人工智能解决蛋白质折叠问题的成就——这是科学界长达50年的重大挑战。随着人工智能在物理学和化学中的...

2024-12-03 14:21:26 1121浏览 0点赞 0回复 0收藏

AI 赋能量子计算突破

一、量子计算薛定谔的爱情与狄拉克的996一文中笔者带大家领略了量子力学的魅力，并简单探讨了量子计算（QC:QuantumComputing）。QC处于技术创新的最前沿，业界期待其解决传统计算平台无法有效解决的复杂问题，特别是突破当下AI大模型遇到的算力瓶颈。另一方面，新的大模型机理具备更高维度的新颖性，可以通过揭示隐藏的联系建立更广泛有用的创新框架，成为科学和哲学探索的有力工具，包括QC。二、AI赋能QC牛津大学、NVIDIA、...

2024-11-25 15:56:58 843浏览 0点赞 0回复 0收藏

推演大模型局限与发展脉络

图片概括为：1、重整化从海量语料中提取出范畴，2、持续重整化驱动范畴解构重组结晶，3、生成过程于范畴中采样做变分推理。进一步，从这个数理原理出发，可以推演出大模型未来可能的发展脉络，潜在的能力，以及可能的脆弱点，最近不少文献分别印证了这几点。一、训练语料的颗粒度、覆盖面受限，无法囊括人类现有的所有知识，甚至都无法包含某个单一领域的完备的知识，重整化出来的内部世界模型的结晶可能是局部的，相对于完备的...

2024-11-18 16:07:32 721浏览 0点赞 0回复 0收藏

被GPT4o的读图能力震撼到了

Iwillsendyou11picturesandpleaseexplainwhatisinthepictureandguessitsusage,giveyouranswerinEnglishandthentranslateintoChinese我会发给你11张图片，请解释图片中有什么并猜测其用途，用英语给出你的答案，然后翻译成中文🤖Sure,goaheadanduploadthepicturesonebyone.I'lldescribeeachpictureandguessitsusage,thenprovidethetranslationinChineseforyou.当然可以，一张一张上传照片。我将描述每个图片并猜测其用法，然后为...

2024-10-23 12:19:53 643浏览 0点赞 0回复 0收藏

图解LLM-Agent大模型智能体

LLMAgent大模型智能体热度空前，但智能体是什么、为什么、怎么办，行业还没有统一认知，典型的小学语文课本里“小马过河”的现实版。是什么一、OpenAI工程师LilianWeng的定义2023.6.23规划子目标和分解：将大型任务分解为更小的、可管理的子目标。反思和改进：对过去的行动进行自我批评和自我反省，从错误中学习。记忆短期记忆：上下文学习都是利用模型的短期记忆来学习。长期记忆：长期保留和回忆信息的能力。工具使用调用外部...

2024-10-16 16:15:50 1078浏览 0点赞 0回复 0收藏

在大语言模型中分离语言和思想

译者注：维特根斯坦提出他的“语言游戏”核心哲学概念的时候，还没有大语言模型，不然什么是语言活动的意义，如何通过语言的使用过程研究语义，怎样才能不把语言看作孤立静止的描述符号，而是看作体现生活的动态人类活动？什么又是大语言模型的建设性的、持续性的动态人类活动？遗憾人们已经没有机会听到这位哲学天才的看法了。概要大语言模型（LLM）是迄今为止所有模型中最接近掌握人类语言的模型，但对其语言和认知能力的看法...

2024-09-23 10:53:14 2148浏览 0点赞 0回复 0收藏

Nature: 受热力学启发的人工智能解释

介绍根据观测数据执行预测是广泛科学学科中普遍关注的问题。传统上，科学家们通过开发数学模型来解决这个问题，这些模型利用他们对潜在物理过程的了解将观察与预测联系起来。然而，在许多实际情况下，由于缺乏系统特定信息，构建这种显式模型是不可行的.近年来，出现了一类涉及人工智能（AI）的纯数据驱动方法，并取得了显著的成功.这些方法通常被称为黑盒模型，因为它们不依赖于对系统内部工作原理的深入理解，并且旨在直接从...

2024-09-11 12:01:33 1577浏览 0点赞 0回复 0收藏

巧妙应用机器学习引导科研理解

图1：理解物理现象的途径有很多，其中原因α产生结果β。(a)不受控制的观察会导致原因和结果之间的松散联系。(b)结合已知物理定律的精心设计的实验可以得到简单的因果关系，但为复杂现象设计这样的实验可能极具挑战性。(c)通用的机器学习（ML）模型（神经网络）通过优化许多参数来拟合复杂数据，但解析这些黑箱（例如，数百万个）参数的意义是非常困难的。(d)包含一些限制或简化操作（白色）的机器学习模型使得识别复杂现象的因...

2024-09-06 15:11:11 1037浏览 0点赞 0回复 0收藏

站在香农与玻尔兹曼肩上，看深度学习的术与道

在《迷人的数据与香农的视角》一文中，我介绍了自己的“顿悟”：事物由不同层次的随机变量展现出来的信息来表达，不同层次上的随机变量携带不同的信息，共同组合影响上一层的随机变量的信息表达，而随机变量对外表达的信息则取决于该随机变量的条件概率分布。不少朋友赞同，同行更认为与深度学习相通。如果真正理解了这句话的涵义，你其实已经理解了深度学习的精髓。例如识别一个人，体形、肤色、脸型、眼睛、鼻梁、嘴角等等，...

2024-07-26 13:07:48 970浏览 0点赞 0回复 0收藏

从CUDA到Keras,这些年你应该了解的深度学习工具

“风起于青萍之末”，十年前，Nvidia被人工智能（AI）清风拂面，推出CUDA，成功把自己打造成风口上的飞猪。“Nvidia还从没有抢到过像人工智能这样强的风口，这意味着我们在GPU领域的成就无以伦比”，在AI淘金热潮中，N记这家“卖水的”走到了2017CES聚光灯下。“据估计，世界上目前有3000家AI初创公司，大部分都采用了Nvidia提供的硬件平台”，如果大家最近在某东关注过游戏本，可以直观感受到N记这种成功。一切得从GPU说起。GP...

2024-07-09 09:39:12 1361浏览 0点赞 0回复 0收藏

科学美国人: 大模型永远不会停止幻觉

去年夏天，一名联邦法官对纽约市一家律师事务所处以5,000美元的罚款，原因是一名律师使用人工智能工具ChatGPT起草了一起人身伤害案件的摘要。文本中充满了虚假信息，包括超过六个完全捏造的过去案例，旨在为人身伤害诉讼建立判例。斯坦福大学（StanfordUniversity）和耶鲁大学（YaleUniversity）的研究人员在最近对三种流行的大语言模型（LLM）的研究预印本中发现，类似的错误在人工智能生成的法律输出中非常普遍。当生成式AI模...

2024-07-05 09:56:12 1367浏览 0点赞 0回复 0收藏

新智能模型可能颠覆生物学、遗传学、医学和人工智能

精华

一个新兴的智能模型发现在细胞及其以上层次存在灵活的问题解决能力，这不仅威胁到生物学和遗传学，还涉及医学、人工智能和意识研究等多个领域的颠覆。这可能是合法科学研究中最有趣、最具颠覆性和哲学深度的研究。MichaelLevin在细胞智能、生物电通讯和具身心智方面的工作“将颠覆一切”。这些想法确实非常疯狂，所以在我们开始之前，重要的是要知道MichaelLevin并不是民科或怪人。他是塔夫茨大学艾伦探索发现中心的主任，也是...

2024-07-03 09:31:44 1275浏览 0点赞 0回复 0收藏

获得成就

已积累 6944 人气

获得 0 个点赞

获得 0 次收藏