Kimi视觉思考模型k1发布:数理化超越OpenAI o1、GPT
12月16日消息,视觉思考今日,模型月之暗面国产大模型Kimi发布视觉思考模型k1,布数k1基于强化学习技术打造,理化原生支持端到端图像理解和思维链技术,视觉思考并将能力扩展到数学之外的模型更多基础科学领域。
k1已陆续上线最新版Kimi智能助手的布数Android和iPhone APP以及网页版kimi.com。
在最新版手机APP或网页版Kimi+页面找到Kimi视觉思考版,理化即可拍照或传图体验。视觉思考
据了解,模型在数学、布数物理、理化化学等基础科学学科的视觉思考基准能力测试中,初代k1模型的模型表现超过了全球标杆模型OpenAI o1、GPT-4o以及Claude 3.5 Sonnet。布数
官方表示,K1模型真正意义上实现了端到端的图像理解和思考能力,模型可以直接处理用户输入的图像信息并进行思考得出答案,不需要借助外部的OCR或额外视觉模型进行信息处理。
从模型训练的角度看,k1的训练分为两个阶段,先通过预训练得到基础模型,再在基础模型上进行强化学习后训练。
k1的基础模型重点优化了字符识别能力,在OCRBench上得到903分的当前最好(state-of-the-art)结果,在MathVista-testmini、MMMU-val 和DocVQA基准测试集上分数分别为69.1、66.7和96.9,处于全球第一梯队水平。
据介绍,k1的强化学习后训练在数据质量和学习效率方面做了进一步优化,在强化学习的规模化(scaling)上取得了新的突破,这是k1视觉推理模型在基准测试中取得行业领先成绩的最关键原因。
月之暗面坦言,在内部测试中也发现了一些k1视觉思考模型存在的局限性,例如在分布外(out-of-distribution)的泛化、在更复杂问题上的成功率、在更多噪声场景的准确率、多轮问答效果等方面,有很大提升空间。
在一些场景和泛化能力上,k1模型与OpenAI的o1系列模型相比仍有差距。
相关文章
- 2024年女排世俱杯,朱婷和李盈莹收获最佳主攻奖。颁奖仪式上,李盈莹对朱婷说:“能在顶峰相见很不容易。”李盈莹赛后表示:“朱姐非常优秀,实力毋庸置疑,能不断从她身上学到很多东西。能跟她同时在决赛相见的2024-12-28
- 11月6日消息,今天,俞敏洪在微博上晒出了小米15钻石限定版的开箱视频,他表示,这台手机由雷军同志赠送。在视频中,俞敏洪体验了小米15的AI写作助手工具,基于AI大模型,小米智能写作助手帮助俞敏洪规划2024-12-28
莫拉塔为5家俱乐部攻入欧冠进球,仅少于为6家俱乐部破门的伊布
直播吧11月6日讯 在欧冠第四轮比赛中,莫拉塔破门,帮助米兰客场3-1击败皇马。据德国转会市场统计,莫拉塔为5家不同俱乐部在欧冠破门皇马、尤文、切尔西、马竞、米兰),仅次于为6家俱乐部进球的伊布。为不2024-12-28欧冠前瞻:巴塞罗那状态极佳冲击欧冠三连胜 红星此前三连败士气低迷
北京时间11月7日凌晨4:00,欧冠联赛将迎来第4轮的一场对决,贝尔格莱德红星坐镇主场迎战来访的巴塞罗那。贝尔格莱德红星是一支来自于塞尔维亚超级联赛的豪门球队,他们在联赛中统治多年,在本赛季的联赛中,2024-12-28中国电动车销量即将反超燃油车:2025年有望突破1200万台
12月27日消息,根外媒报道,到2025年,中国电动汽车市场将实现显著增长,销量预计将同比增长约20%,突破1200万辆,是2022年590万辆销量的两倍多。与此同时,传统燃油车销量预计将下滑超过102024-12-28- 《盗贼之海》的第14赛季即将来临。Rare已经确认,在10月17日,它将为这款多人海盗冒险游戏带来一大堆新的潜行好物。我们上次听到关于第14赛季的消息还是在三月份,当时Rare公布了2024年的内容计2024-12-28
最新评论