出品 | 51CTO技术栈(微信号:blog51cto)
讯飞星火终于交卷了!
6月27日,讯飞星火V4.0 发布,在8个国际主流测试集中排名第一,以一份惹眼的成绩单,成为国内大模型的先行者:七大核心能力持续突破,全面对标GPT-4 Turbo。
1.8个国际权威测试集测评第一星火V4.0 全面对标GPT-4 Turbo
基于全国首个国产万卡算力集群“飞星一号”,讯飞星火大模型V4.0不仅实现对标GPT4-Turbo,更是在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现超越。
图片
由国内外知名高校、研究机构发布的12项主流测试集中,讯飞星火V4.0在8项中排名第一,超越GPT4-Turbo等国际大模型。不论是复杂指令、复杂推理、空间推理,还是基于逻辑关系的多模理解,讯飞星火V4.0均实现了明显提升。
图文识别领域,讯飞星火V4.0能够实现复杂版面的全要素解析、融合篇章语义的文字识别、专业领域的符号识别。长文本能力方面,针对长文档知识问答的幻觉治理,讯飞星火V4.0构建业界首发的内容溯源功能。
图片
依托大模型底层能力的迭代,讯飞星火加速实现从抓住技术先机到价值落地的目标,已成为千万用户的智能助手。
在科研领域看到,讯飞星火也取得了可喜的成绩:借用讯飞星火,中国科学技术大学刘海燕教授团队,将蛋白质设计成功率从0.1%提到到20%,设计时间从6个月降至1天,形成的相关成果已被《Nature》子刊接收。
同样,在日常办公生活中,讯飞星火辅助媒体工作者完成内容创作,解放生产力,助力听障人士圆了文学梦,释放想象力!
2.讯飞星火App全面升级从通用AI助手到懂你的AI助手
自去年9月全面开放以来,讯飞星火APP在安卓端累计下载量达到1.31亿次,在国内大模型APP中位列前茅,涌现出文案大师、写作助手、PPT大纲助手等一大批用户喜爱的热门助手,在工作、学习、生活等刚需场景满足用户需求。
图片
尽管通用大模型的智慧涌现已融入普通人的日常工作与生活,但大模型依旧无法“共情”每个用户需求和背景。如何让通用大模型满足千万用户的个性化需求?
大模型个性化时代已经到来!依托底层能力跃迁,基于用户画像的个性化表达、个人资料增强学习和使用历史的记忆学习,讯飞星火正式升级成为懂你的AI助手。
图片
3.个人空间:专属私域知识库
通过上传 Word、PDF、PPT、图片、Excel 表格、音频与视频等常见文件,用户可随时基于文件内容完成知识问答、个性化写作、翻译和PPT生成等操作。
同时针对具体文档,通过AI创作轻松实现文本润色、改写、扩写等。基于场景标签的选择,也能够轻易对个人空间内的诸多文件实现高效管理、精准搜索。
例如,简单上传销售报表、述职文档、产品资料和行研报告等,就能借助讯飞星火轻松生成有理有据且切实可用的《个人半年度述职汇报》。同时,还能对汇报材料进行润色修改,实现工作效率极大提升。
4.智能体:面向特定场景打造专属助手
讯飞星火开放超过16000智能体,覆盖职场、生活、创作等多场景,打造开箱即用的大模型应用。面向专业垂直场景,讯飞星火APP/Desk 首批上线14个智能体,包括讯飞晓医、晓知、星火合同助手、讯飞智作、讯飞智文等。
拿到体检报告后看不懂晦涩的数据指标?看病时不知如何选择科室?药物不知道有哪些使用禁忌?统统都可以打开讯飞晓医询问。搭载了讯飞星火医疗大模型的“讯飞晓医”,能够让你足不出户即可享受到个性、系统、科学的医疗服务。
同时,讯飞星火APP/Desk已与讯飞办公本、讯飞录音笔等智能硬件能够实现账号互联、数据互通和操作联动,让数百万讯飞智能硬件用户一键拥有星火全家桶,打造每个人更便捷的AI助手。
5.人设标签:创作个性化内容
让大模型输出专业内容,我们需要在Prompt设定角色,让其扮演领域专家。但对话过程中,大模型依旧会忘记角色,同时表达风格也难以固定。
讯飞星火V4.0全新上线“人设标签”功能,简单选择就能激活专属你的AIGC风格,轻松在“逻辑严密、幽默诙谐、中立客观”等数十种风格自由切换。
在半年度汇报方案,可以选择激活“逻辑严谨、数据导向和观点明确”等人设标签,从而快速生成专业汇报方案。当需要撰写一篇自媒体文章时,可以选择“吸引眼球、活泼跳跃、亲切友善”等标签,从而更有可能创作10w+爆款。
据悉,在发布会前,讯飞星火App已经“超前”上线主流应用商店,让全网用户都可以真机实测大模型效果。