全民LongLLM时代终于到来。本月,中国初创AGI(通用人工智能)公司月之暗面宣布旗下大模型工具KimiChat正式升级到200万字参数量,与五个月前该大模型初次亮相时的20万字相比,提升十倍。KimiChat的升级彻底引爆市场,同时也引起长文本大模型(LongLLM)细分赛道更加激烈的竞争。(图源:阿里通义千问)昨日,阿里旗下的大模型工具通义千问宣布迎来重磅升级,向所有人开放最高1000万字的长文本处理能力,更重要的是,这项升级完...
2024-03-28 10:18:48 1104浏览 0点赞 0回复 0收藏
“2024年是大模型应用场景元年,中国完全可以走出一条具有中国特色的大模型发展之路。”周鸿祎的预测还言犹在耳,经历了“百模大战”的国产大模型胜出者们,已经吹响了商业场景落地之战的号角。3月14日,大模型独角兽智谱AI创始人兼CEO张鹏披露了公司目前的商业化进展:已有超2000家生态合作伙伴,实现了超1000个大模型规模化应用,与超200家企业进行深度共创,涵盖了传媒、咨询、消费、金融、新能源、互联网、智能办公等多个细...
2024-03-28 10:13:53 1068浏览 0点赞 0回复 0收藏
今年以来,如火如荼的AIGC领域出现了众多不同的声音。前不久,某中国著名投资人在一个行业论坛上表示:“大模型行业已经过热了,在通用大模型领域,已经没有什么机会了”。行业现实,也呈现出不同的面貌,一方面,不少AI创业公司迟迟找不到可持续的商业模式,融资困难;另一方面,看似主营产品还是十分传统的老牌玩家却做的风生水起,譬如微软去年推出了WindowsAIStudio,开发者可以在其中访问各种AI模型,并根据自己的需求进行...
2024-03-28 10:09:48 758浏览 0点赞 0回复 0收藏
核心摘要:生命循环,人机共育在宏观层面上,如果把人工智能看作一种生命体,AIGC+教育的内涵其实是碳基生命和硅基生命的交互和培育问题。AIGC技术是对人脑计算、思考、判断等内在能力的延伸,是人的智能在机器形态上的规模化聚集、运作和反应。由此,部分基础性的专业工作被替代,AI在劳动贡献、价值创造中逐渐与人比肩甚至超越人类,AI和人类共同成为社会贡献主体。在中观层面上,AIGC技术在知识量、信息获取和处理方面的强势...
2024-03-28 10:03:44 1032浏览 0点赞 0回复 0收藏
核心摘要:古人有云:日就月将,学有缉熙于光明。人类对人工智能学的潜心钻研终于再度获得重大突破,大模型的涌现能力与AIGC的应用普及为那不一定是AGI但一定更AI的未来提供了确定性的加速度。AI2.0时代的加速到来,不仅是把AI能力融入到现有应用中,更是未来产业范式的再塑造。AI正跳跃式地加速渗透进各行各业,推动一场新的生产力与创造力革命。AI产业链各环节参与者的角色功能、产品服务和应用生态可能将发生变化。对此,艾...
2024-03-28 09:55:11 1720浏览 0点赞 0回复 0收藏
大家常说,作业是影响家庭和谐的“罪魁祸首”。一到写作业时间,家里往往鸡飞狗跳还会上演闹剧,父母互相甩锅,学生嚎啕大哭……如果让AI加入,会擦出什么不一样的火花?可以想象一下,情绪稳定的AI伙伴耐心启蒙辅导、学识渊博的AI知识库为学生答疑解惑、AI助手实时批改认真纠错。这一切已经开始成为现实,如今生成式AI、大模型等诸多前沿技术引发的技术革命,正在席卷各行各业,其中教育被看作最具潜力的赛道之一。AI正在为以...
2024-03-28 09:43:11 1071浏览 0点赞 0回复 0收藏
不久前,我们推出了最强大的基础模型Gemini。Gemini是一个多模态模型,它既可以接受文本输入,也可以接受图像输入。我们为Android开发者们介绍一种方法,以帮助您在设备上使用我们最小规模的模型:GeminiNano。GeminiNano可以通过AICore在特定设备上使用。AICore是一种处理模型管理、运行时、安全功能等任务的系统服务,有助于简化开发者的工作。现在,我们将向您介绍访问GeminiPro模型的全新方法,该模型可以在Google的数据中...
2024-03-28 09:36:51 1470浏览 0点赞 0回复 0收藏
一、引言知识图谱和大型语言模型都是用来表示和处理知识的手段。不同于大型语言模型,知识图谱中的知识通常是结构化的,这样的结构让其具有更强的准确性和可解释性。知识图谱嵌入(KnowledgeGraphEmbedding,KGE)是一种将知识图谱中的实体和关系转化为低维度、连续的向量空间表示的技术。这种转化使得复杂的关系和属性能够以向量形式表达,从而便于机器学习算法进行处理。这些技术为各种知识密集型任务(例如信息检索、问答和...
2024-03-28 09:27:03 731浏览 0点赞 0回复 0收藏
一、引言现阶段,程序代码是解决基于大型语言模型(LLM)的复杂推理任务的有效的方式之一,这类方法通常被称为"程序或代码思维链"(programofthought)。与传统思维链(chainofthought)方法相比,代码思维链方法将复杂问题分解为可执行的代码片段,并且利用代码执行器逐步解决子问题,可以较大程度提升基于大型语言模型的推理能力。然而目前代码程序数据本身的形式与大模型推理能力之间的相关性仍是未解之谜,我们对于构造何种代码...
2024-03-27 13:44:37 1655浏览 0点赞 0回复 0收藏
一、引言视觉语言模型(VLMs)已在多种多模态理解和生成任务中展现了显著的性能表现。然而,尽管这些多模态模型在广泛的任务中表现出色,但是它们能否有效地捕获结构化知识(即理解对象间关系以及对象与其属性间关系的能力)仍然是一个未解决的问题。如图(a)所示,我们在分析CLIP模型时发现,与图像不匹配的标题(Ahorseisridinganastronaut)相比,图像与正确匹配的标题(Anastronautisridingahorse)之间的CLIP分数(即语义相...
2024-03-27 11:05:11 906浏览 0点赞 0回复 0收藏
一、引言知识图谱嵌入(KGE)已被证明是解决知识图补全(KGC)任务的有效方法。关系模式是指具有特定语义的关系、表示为图形模式,是影响KGE模型性能的重要因素。虽然之前的工作从理论上分析了KGE模型在不同关系模式下的能力,并建立了更好的关系模式建模与更好的KGC性能之间的粗略联系,但对关系模式上的KGE模型的全面定量分析仍然缺乏,因此不确定KGE对关系模式的理论支持如何有助于与该关系模式相关的三元组的性能。二、关系模式...
2024-03-27 10:55:49 1498浏览 0点赞 0回复 0收藏
引言随着人工智能的飞速发展,机器学习,特别是深度学习,在过去几十年中在许多领域和应用中取得了显著的成就。例如,卷积神经网络(CNN)在图像分类和视觉对象识别方面的准确性常常超过人类,推动了自动驾驶车辆、面部识别、手写识别、图像检索和遥感图像处理等应用的快速发展。同样,循环神经网络(RNN)和基于Transformer的模型在序列学习和自然语言理解方面取得了成功,这些技术推动了机器翻译、语音识别和聊天机器人等应用...
2024-03-27 10:42:52 1117浏览 0点赞 0回复 0收藏
引言在自然语言处理(NLP)的众多应用场景中,大型语言模型(LargeLanguageModel,LLM)展现了其卓越的文本理解与生成能力,不仅在传统的文本任务上成绩斐然,更在生物学、计算化学、药物研发等跨学科领域证明了其广泛的应用潜力。尽管如此,生物分子研究领域的特殊性—比如专用数据集的缺乏、数据标注的高复杂度、知识的多元化以及表示方式的不统一—仍旧是当前面临的关键挑战。针对这些问题,本文提出MolInstructions,这是一...
2024-03-27 10:32:48 742浏览 0点赞 0回复 0收藏
引言基于知识图谱嵌入的方法在实体对齐领域取得了巨大成功。本文以生成模型的视角重新解构了目前实体对齐方法的范式,展示了其与生成模型间的相似之处,并从理论上揭示了现有的基于生成对抗网络的方法的局限性。通过引入新的互变分自编码器(MutualVAE)作为生成模型,本文构建了一个生成式实体对齐框架(GEEA)。GEEA实现了知识图谱之间的实体转换,并且能够从随机噪声中生成新的实体。通过理论分析、实体对齐实验,以及实体合...
2024-03-27 10:21:44 1303浏览 0点赞 0回复 0收藏
引言药物发现的核心环节之一是合成和设计具有理想化学特性的分子。随着语言模型展现出在解析复杂分子分布方面的潜力,研究人员开始尝试将分子的SMILES描述符与预训练语言模型相结合。然而,SMILES描述符的语法特质并不总能保障所生成化学结构的有效性,经常导致生成化学上无意义的字符串。除此之外,虽然分子语言模型在预训练过程中学习了大量的分子结构信息,它们仍难以准确捕捉到现实世界中化学与生物特性的复杂关系。这使得...
2024-03-27 10:14:43 854浏览 0点赞 0回复 0收藏
一、引言随着大型语言模型的兴起,自然语言处理(NLP)社区面临的主要挑战之一是如何高效地对模型进行微调。如果需要短期内改变模型的某些行为,重新进行参数微调可能会过于耗时和昂贵,在这种情况下,模型知识编辑(KnowledgeEditing)技术就显得尤为重要。本文主要研究模型知识编辑的鲁棒性,并重点探索两个新问题:知识冲突(KnowledgeConflict)和知识扭曲(KnowledgeDistortion)。二、背景本文研究的知识编辑方法均为修改...
2024-03-27 10:00:53 1743浏览 0点赞 0回复 0收藏
一、引言多模态知识图谱补全(MMKGC)通过将实体的结构、视觉和文本信息纳入知识图谱的表示学习模型中,来预测多模态知识图谱中缺失的三元组。在这个过程中,来自不同模态的信息将共同用于度量一个三元组的合理性。现有的MMKGC方法往往默认MMKG上的模态信息是完整的,或者采用简单的方法完成缺失模态信息的补全,忽视了实体之间模态信息的不平衡问题,导致模态信息融合不充分以及原始模态信息的低效利用。模态信息的不平衡性主...
2024-03-27 09:52:57 897浏览 0点赞 0回复 0收藏
Sora生成的视频效果好吗?确实好。Sora算得上AGI发展历程上的里程碑吗?我个人觉得算。我们知道它效果好就行了,有必要知道Sora到底是怎么做的吗?我觉得最好是每个人能有知情的选择权,任何想知道的人都能够知道,这种状态比较好。那我们知道Sora到底是怎么做出来的吗?不知道。马斯克讽刺OpenAI是CloseAI,为示道不同,转头就把Grok开源了。且不论Grok效果是否足够好,马斯克此举是否有表演成分,能开源出来这行为就值得称赞...
2024-03-27 09:38:12 4341浏览 0点赞 0回复 1收藏