世界今亮点！知乎大模型“知海图AI”来了，要与GPT-4掰掰手腕

2023-04-21 17:54:44来源：三易生活公众号

此前一直被看作是“ChatGPT概念股”的知乎，终于做出了自己的大模型。在日前举行的“2023知乎发现大会”上，知乎方面公开了与面壁智能共建的大模型产品“知海图AI”，而双方的合作则将以联合研发与战略投资的方式展开。据悉，目前该大模型的首个功能“热榜摘要”已启动内测，其将对知乎热榜上的问题回答进行抓取、整理和聚合，并把回答梗概展现给用户。

作为一个在toC内容平台上线的大语言模型项目，“知海图AI”是基于清华NLP实验室和面壁智能CPM-Bee（10B）模型的技术支撑。按照官方的说法，针对知乎热榜问题中的所有回答，在“热榜摘要”这个特定场景中将“知海图AI”大模型的效果与GPT-4进行比较发现，两个模型的表现几乎持平。

要知道，在王小川眼中，国内目前的大模型与GPT的差距是三年，即使乐观如李彦宏也只是喊出了，“百度的文心一言和OpenAI的差距是2个月”。而到了知乎这里，知海图AI就敢说与GPT-4在特定场景能战成平手了。

(资料图片)

从某种意义上来说，知乎方面似乎是学习了手机厂商的“好榜样”，毕竟只要定语加的足够多，谁都能成为“第一”。在许多业内人士看来，对于知乎而言，将“知海图AI”的首秀放在知乎热榜是恰到好处的，毕竟要是去拼技术底蕴、拼应用范围，它可能不是百度文心一言、阿里通义千问的对手。

事实上，知乎入局大语言模型赛道，加入“百模大战”几乎是一种必然。如今在移动互联网红利近乎于枯竭的环境下，未来无疑是混沌的，因此抓住可能通往未来的船票就成为了互联网厂商拥抱变化的必然。用大语言模型来变革业务层、为具体的业务落地场景赋能，这也已经是诸多互联网厂商的共同策略。并且在当下这个存量市场中，在效率上的些许变化就已经能兑现为竞争优势。

当下做大语言模型已经不仅仅是追赶潮流，更是内容平台属性突出的知乎，保持市场竞争力的一种方式。无论老用户如何吐槽，知乎依旧还是目前国内互联网中数一数二的优质内容平台。君不见，微软集成了ChatGPT的New Biphpng在回答用户问题时，参考资料大量来源于知乎，由此也足以证明知乎的内容质量已经受到了海外科技巨头的认可。

要知道，ChatGPT这类大语言模型之所以比以往的人工智能产品更加智能，靠的就是“力大砖飞”，也需要海量的语料库做支撑，而语料库本身的质量更优秀、产出的结果也就会更好。有得天独厚的资源作为基础，知乎如果对大语言模型视而不见，未免就过于暴殄天物了。

反过来说，大语言模型其实也需要知乎的优质答主来帮助其实现迭代，让大语言模型的文本理解和上下文关联能力进一步升级。

众所周知，基于人类反馈的强化学习（RLHF）是ChatGPT得以爆发的秘密武器，虽然目前OpenAI还没有开源RLHF，外界只知道它是强化学习(RL)的一个扩展，是将人类的反馈纳入训练过程，为机器提供一种自然的、人性化的互动学习过程。

而ChatGPT自己给出的解释，就是与传统的RL相比，RLHF的优势在于能更好地与人类的意图保持一致，允许机器掌握明显嵌入人类经验中的决策要素，并从各种类型的反馈中进行学习，且根据需要对反馈进行整理。

所以人类的反馈无疑是ChatGPT智能化的关键，那么知乎能不能扮演这样的一个角色呢?答案显然是肯定的，因为知乎是基于“认知盈余”建立起来的问答社区。如果将AI生成的回答放到知乎上，让不同领域的专业用户来验证，就可以在反复调校中优化AI的性能。反过来讲，高质量的原创内容也更容易被AI发现，这有助于改变知乎在如今泥沙俱下的环境里、优质内容越来越难以被用户发现的困局。

至于为什么要将知海图AI的第一个应用场景聚焦在“热榜摘要”，知乎CEO周源在接受媒体采访时就表示，这是从早期产品“回答总结”中汲取的灵感。他表示，“那个功能（回答总结）是开放给所有用户，大家进行wiki一样的编辑，后来发现编程客栈这个事情太困难了，回答数量多了以后成本非常高，而且效果并不好，现在则可以通过技术的方式，帮人来完成这样的事情。”

如果直接用大语言模型来进行创作，并回答知乎上的问题，结果几乎一定是灾难性的的。相信许多朋友在使用ChatGPT、文心一言，以及New Bing时就会发现，生成式人工智能有一个非常突出问题，那就是一本正经的胡说八道。但之所以用户知道ChatGPT在胡说，是因为在提问前你就已经对答案有了一个大概的认识，是有能力判断他所给出的结果正确与否。可如果用户对问题的答案没有概念呢?

知海图AI在热榜摘要上小试牛刀，可以说是知乎因地制宜来实现以点破面的方式，因为这个功能是面向内容消费者、而非生产者的。通过近似于“长话短说”的热榜摘要功能，用户不需要仔细浏览具体的回答，就可以大致了解大家围绕热榜话题进行了哪些评论，这对于以实时消息为主的知乎编程客栈热榜而言，最大的好处就是将信息浓缩、以帮助用户提高效率。

在这个内容消费不断碎片化的时代，短视频的脱颖而出就已经证明了用户对于仔细“咀嚼”内容，以提炼信息这件事，是越来越没有耐心了。高质量的内容虽然是知乎的立身之本，但随着邀请制被废除，门槛降低后的大众化策略除了带来海量的用户外，也让知乎的大环境泥沙俱下，有价值的内容被发掘的难度越来越大。而有了热榜摘要，用AI来帮助用户发掘优质内容，自然也就能盘活资源。

不过对于创作者来说，热榜摘要可能并非一个福音。将热榜问题的回答去粗取精、再整理到用户js面前，尽管满足了用户无障碍获取信息的痛点，但代价是用户既然已经看完了精华，还会不会去继续查看具体的回答呢。所以结果会是做出了优质回答的答主可能不会被用户发现并关注，这也就代表着属于优质答主的流量无形中会变少。

顺着这一思路再发散一下会发现，既然用户寻找答案的工作被AI代替，也就意味着热榜摘要有减少用户使用时长的风险。在其他APP都在想方设法让用户留下的情况下，知乎这无疑是反其道而行之。并且对于一个依赖广告和商业化内容解决方案的平台而言，用户停留时间短几乎就等于流量变差，所以这似乎并非一个好的结果。

标签：

资源

券商股集体异动华西证券涨停光大证券直线拉涨

河北发布首个总林长令全面助力“林长治”深入开展

七旬老人百本剪报册见证铁路百年变迁

用心品尝，残疾人在这家黑暗餐厅寻找“光明”

安全隐患巨大，拿什么遏制电动自行车改装乱象？

世界今亮点！知乎大模型“知海图AI”来了，要与GPT-4掰掰手腕

资源

课程

“居家学习”遇见教育数字化转型教师如何保证教学质量?

仓储物流“成渝圈”如何乘势而上？

时隔三千年的再次相遇！两件西周青铜簋成功配对

“医保砍价”不是一个人在战斗

“购物成瘾”真的是一种病……何种程度算成瘾？

稻城海拔4000多米无人区辅警通宵搜救失联男子

追凶15年！成都警方破获部督特大命案积案

一批反映南京大屠杀历史的新书发布

电影《亲爱的》里面没有的结局，在我眼前“上映”

睡眠障碍成现代人健康隐患 57%失眠人听助眠音乐

老年教育面临缺口：老年大学常常“一座难求”

孙海洋被拐14年儿子如何找到的？线索来自另一起案件

北京天文馆、圆明园将对未成年人免费开放

今年全国粮食总产量再创新高连续7年保持在1.3万亿斤以上

血管里的“垃圾”分类赶快学起来！

没人应该被放弃！医保目录公布那天，好多家长哭了

抖音“窗花剪剪”特效遭抄袭被判获赔20万元

失散十几年 3组家庭终于团圆了

2021年度十大网络用语发布

北京天文馆向未成年人免费开放

2021北京百个网红打卡地发布

世界今亮点！知乎大模型“知海图AI”来了，要与GPT-4掰掰手腕

资源

课程

“居家学习”遇见教育数字化转型 教师如何保证教学质量?

仓储物流“成渝圈”如何乘势而上？

时隔三千年的再次相遇！两件西周青铜簋成功配对

“医保砍价”不是一个人在战斗

“购物成瘾”真的是一种病……何种程度算成瘾？

稻城海拔4000多米无人区 辅警通宵搜救失联男子

追凶15年！成都警方破获部督特大命案积案

一批反映南京大屠杀历史的新书发布

电影《亲爱的》里面没有的结局，在我眼前“上映”

睡眠障碍成现代人健康隐患 57%失眠人听助眠音乐

老年教育面临缺口：老年大学常常“一座难求”

孙海洋被拐14年儿子如何找到的？线索来自另一起案件

北京天文馆、圆明园将对未成年人免费开放

今年全国粮食总产量再创新高 连续7年保持在1.3万亿斤以上

血管里的“垃圾”分类 赶快学起来！

没人应该被放弃！医保目录公布那天，好多家长哭了

抖音“窗花剪剪”特效遭抄袭 被判获赔20万元

失散十几年 3组家庭终于团圆了

2021年度十大网络用语发布

北京天文馆向未成年人免费开放

2021北京百个网红打卡地发布

“居家学习”遇见教育数字化转型教师如何保证教学质量?

稻城海拔4000多米无人区辅警通宵搜救失联男子

今年全国粮食总产量再创新高连续7年保持在1.3万亿斤以上

血管里的“垃圾”分类赶快学起来！

抖音“窗花剪剪”特效遭抄袭被判获赔20万元