发布时间:2024-11-18 11:08:50 来源: sp20241118
本报记者 孙奇茹
能看懂能听懂世界、理解人类情绪、无延迟实时交互的AI助手令不少人大呼震撼,通用人工智能似乎已离我们越来越近……国际AI巨头近几日上演“神仙打架”,Open AI、谷歌相继发布各自在大模型方面的重大进展。国内大模型企业在努力赶超的同时,也在努力进行着摆脱“烧钱”路线的良性商业化探索。
“贾维斯”真的上线了
过去两天,全球AI圈很是热闹,作为全球人工智能领域的两大主要玩家,Open AI、谷歌相继秀出了各自的技术“肌肉”。
与此前各种智能语音助手反馈始终有延迟不同,在短短两三百毫秒的时间内,Open AI新推出的GPT-4o就能对人类的话语做出反应,达到了人类的反馈级别。在另一个演示场景下,工作人员手写了一个方程,并打开摄像头拍给ChatGPT,让它扮演“在线导师”的角色帮助自己解题,而且ChatGPT全程只能给出提示,不能直接说答案。此后,ChatGPT一步一步引导工作人员解题,即便答题者思路错了它也耐心引导,循循善诱,最终工作人员成功解出了这道题。
除了快速反应能力和极强的理解力,此次发布的GPT-4o令不少人感觉到大模型的“人味儿”浓了。在演示视频中,它对人类的各种情绪、语气理解得十分自然精准,能够接受人类交谈中的打断习惯,及时停顿并给出流畅的回复。它甚至能从人类急促的喘气声中理解到“紧张”的情绪,并且安抚、指导人进行深呼吸。与GPT-4o交流时,有人不免感叹,“贾维斯”(电影《钢铁侠》中的人工智能助理)真的上线了。
随后,谷歌在北京时间周三凌晨的开发者大会上,发布了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo等一系列“全家桶”式成 果。其中,Project Astra的表现同样令全球观众震撼。例如,当AI助手通过镜头扫视了周围的室内环境后,它立刻记住了一闪而过的眼镜,并准确回答出位置。当人类将摄像头对准办公室的各个地方,并与它就办公室里的物品、黑板上的流程草图、电脑屏幕上的代码交流时,它都能如同一位博学的人类助手一般,秒读代码、看懂草图甚至给出优化建议。
国内玩家需“两条腿”走路
国内大模型玩家也动作频频。本周一,李开复亲自下场创业的零一万物发布千亿参数Yi-Large闭源模型,并宣布已启动下一代Yi-XLarge MoE模型训练,将冲击GPT-5的性能与创新性。几天前,零一万物在国内推出的首个面向消费者的大模型应用“万知”刚刚上线。
“今天我们非常自豪地说,我们狂奔了一年,在模型方面至少赶上了美国一年前发布的产品,今后还将继续努力。”李开复表示,在MMLU、GPQA、HumanEval、MATH等权威评测集中,仍在初期训练中的Yi-XLarge MoE与其他最新旗舰模型互有胜负,训练完成后的性能令人期待。
值得注意的是,国内主流的大模型玩家并未走上烧钱式发展路线,而是从深耕细分行业等角度切入来探索可持续的商业化路径。从去年9月开始,零一万物便聚焦生产力、社交赛道于海外应用展开探索,已有4款产品陆续上线。李开复透露,目前其海外生产力应用总用户接近千万,营收今年预期过亿元,已摆脱烧钱获客模式。
李开复坦言,中国大模型公司没有美国大厂的GPU数量,必须采取更务实的战术和战略,一边自研人工智能基础架构技术,一边将大模型能力与高价值的应用场景深入结合,探索商业化路径。
人类面对“终身迭代”挑战
“震惊,人类准备迎接新世纪吧。”“人类可能要开始考虑,碳基生命和硅基生命如何共存的问题。”“我们所学的东西都会被AI学会,那我们学习还有用吗?”在国内外巨头相继带来的新技术震撼之下,一些人不禁发出疑问,随着通用人工智能能力逐渐成熟,人类将如何与AI共处,如何应对AI的替代性威胁?
对此,北京大学光华管理学院应用经济学系教授、光华人工智能与社会科学交叉学科横向发展平台召集人翁翕表示,除了面临算力、数据资源等限制因素外,眼下我国与人工智能相关的认知瓶颈和人才短缺的障碍也亟待解决。在教育变革领域,新兴专业课程要响应现实需求,着重培养既通晓计算机和经管知识又熟悉垂直行业的复合型人才。
在北京大学光华管理学院应用经济系教授、北京大学行为科学与政策干预研究中心主任孟涓涓看来,从人类在人际交往能力方面更有优势、人类与算法可能有着不同的目标和偏好等角度来考虑,AI即便在未来也无法完全替代人类。她呼吁,在人才培养方面,更需要在初始教育中营造充满爱、鼓励好奇心和培养创造力的环境。“未来,你可以不懂人工智能,但要懂人,擅长与人打交道。在人工智能时代,每个人都需要有终身迭代的学习能力,保有好奇心去开创新领域。”孟涓涓认为,这些是人类难以被AI替代的价值。
(北京日报) 【编辑:唐炜妮】