<html> <body> <div> <h1>è¿ˆå‘ ChatGPT 时代 - 技术篇</h1> <p>最近关于 AIGC,ChatGPT ç‰æ–¹é¢çš„消æ¯å’Œæ–‡ç« éžå¸¸å¤šï¼Œæ— 论是从没了解过机器å¦ä¹ 的圈外人士,还是æ¯å¤©è·Ÿæ¨¡åž‹æ‰“交é“çš„ä¸“ä¸šä»Žä¸šè€…ï¼Œéƒ½æ— ä¸è¢« ChatGPT çš„èƒ½åŠ›éœ‡æƒŠã€‚å‡ å¹´åŽæ¥å›žé¡¾è¿™ä¸ªäº‹ä»¶ï¼Œåº”该会æˆä¸ºé€šå‘通用人工智能/技术奇点的一个关键里程碑。这两个月我也ä¸èƒ½å…ä¿—åˆ·äº†å¾ˆå¤šç›¸å…³æ–‡ç« å’Œè§†é¢‘ï¼Œè¿‡ç¨‹ä¸å‘现了ä¸å°‘é¢ è¦†æˆ‘åŽŸæœ‰è®¤çŸ¥çš„ä¿¡æ¯ã€‚è¿™ç¯‡æ–‡ç« ä¸»è¦æ˜¯ç«™åœ¨â€œå·¨äººä»¬çš„肩膀上â€ï¼Œä»Žå„个角度æ¥èŠèŠæˆ‘的收获和一些æ€è€ƒã€‚ </p> <p>这也是我第一次å°è¯•ä»˜è´¹æ–‡ç« çš„å½¢å¼ï¼Œçœ‹çœ‹æŽ¥å—度如何 :) 本文的内容大致会分æˆæŠ€æœ¯ï¼Œå•†ä¸šåŒ–å’Œæå‡ä¸ªäººç”Ÿäº§åŠ›ä¸‰ä¸ªè§’度æ¥å±•å¼€ï¼Œæ¯ä¸ªéƒ¨åˆ†ä¸»è¦å†…容都是个人的 key takeaways å’Œæ€è€ƒï¼ŒåŒæ—¶æŠŠæˆ‘ç›®å‰çœ‹åˆ°çš„比较好的å‚è€ƒæ–‡ç« åˆ—å‡ºæ¥ã€‚éžå¸¸æ¬¢è¿Žæœ‰ä¸åŒæƒ³æ³•çš„åŒå¦æ¥ä¸€èµ·æŽ¢è®¨ã€‚从å—众角度,应该比较适åˆï¼š</p> <ol> <li>AI 领域从业者,想了解 LLM å’Œ AGI 的最新进展以åŠå¯¹è‡ªå·±å·¥ä½œçš„å½±å“。但ä¸å¤ªé€‚åˆé‚£ç§å·²ç»çœ‹äº†å‡ å篇 LLM é¢†åŸŸè®ºæ–‡çš„ä¸“ä¸šå¤§ä½¬ï¼Œé‚£æ ·çš„è¯æˆ‘è¿™è¾¹å†™çš„å†…å®¹åº”è¯¥ä½ éƒ½å¾ˆç†Ÿæ‚‰äº†ã€‚</li> <li>平时用 Google,知乎ç‰ç½‘站比较多的知识型工作者(尤其是软件工程师),对于 <a href="https://zhuanlan.zhihu.com/p/366187306">生产力工具</a> éžå¸¸æ„Ÿå…´è¶£çš„åŒå¦ï¼Œè¿™ç¯‡æ–‡ç« 应该也会比较åˆä½ 胃å£ã€‚</li> <li>有创业或者相关领域投资方é¢æƒ³æ³•çš„åŒå¦ï¼Œä½†è¿™æ–¹é¢çš„ä¸ç¡®å®šæ€§å¾ˆå¼ºï¼Œä¸ªäººè§è§£ä»…ä¾›å‚考。</li> <li>想了解通用人工智能对我们的工作,å¦ä¹ ,生活的å„ç§å½±å“的其他åŒå¦ï¼Œå¦‚æžœä½ ä¸ç¼ºè¿™å‡ å—é’±çš„è¯ :)</li> </ol> <p>好了,è¯ä¸å¤šè¯´ï¼Œå…ˆè®©æˆ‘们æ¥çœ‹ä¸‹ ChatGPT 背åŽçš„神奇技术与 OpenAI 的远大 vision。</p> <h2>技术</h2> <p>这部分先推è一篇æ¥è‡ªå¼ ä¿Šæž—è€å¸ˆçš„æ–‡ç« <a href="https://zhuanlan.zhihu.com/p/597586623">é€šå‘ AGI 之路:大型è¯è¨€æ¨¡åž‹ï¼ˆLLM)技术精è¦</a>。一般æ¥è¯´ï¼Œå¼ è€å¸ˆå¦‚果在æŸä¸ªé¢†åŸŸå†™äº†ç¯‡æ–‡ç« ,在很长一段时间里我都ä¸ä¼šè€ƒè™‘å•ç‹¬å†™è¿™ä¸ªè¯é¢˜äº†ï¼Œè´¡çŒ®éžå¸¸æœ‰é™ 。这部分会快速列举一些我之å‰ä¸çŸ¥é“的或者令人æ„外的信æ¯å’Œæ€è€ƒè§’度。</p> <h3>新范å¼ï¼šç”Ÿæˆä¸€åˆ‡</h3> <p>如果去读一些ç»å…¸çš„机器å¦ä¹ æ•™æ,我们会å‘现大多数的算法建模任务都是以“输入信æ¯ï¼Œè¾“出判别â€çš„å½¢å¼æ¥æ€è€ƒçš„。例如给定一å¥è¯ï¼Œå¸Œæœ›æ¨¡åž‹æ¥åˆ¤æ–è¿™å¥è¯è¡¨è¾¾çš„是æ£é¢è¿˜æ˜¯è´Ÿé¢çš„情感,这就是一个ç»å…¸çš„分类问题。而在 NLP ä¸ï¼Œåˆæœ‰å¾ˆå¤šâ€œç”Ÿæˆâ€æ€§è´¨çš„问题。例如æ一个问题,希望模型给出ç”案。这ç§ä»»åŠ¡ä¸Šçš„å¤šæ ·æ€§ï¼Œå¯¼è‡´ä»¥å¾€æˆ‘ä»¬éœ€è¦é’ˆå¯¹æ¯ä¸€ä¸ªä»»åŠ¡æ¥åˆ†åˆ«è®¾è®¡æ•°æ®æ”¶é›†ï¼Œæ¨¡åž‹è®ç»ƒæµç¨‹ï¼Œå¾ˆéš¾è¿›è¡Œå¤ç”¨ã€‚当年 BERT 模型推出时,令我å°è±¡æœ€æ·±åˆ»çš„也是它对于多任务统一的巧妙设计。</p> <p>但到了以 GPT 为代表的大è¯è¨€æ¨¡åž‹é˜¶æ®µï¼Œä¸€ä¸ªæ˜¾è‘—çš„æ€ç»´æ–¹å¼å˜åŒ–是我们其实å¯ä»¥é€šè¿‡â€œç”Ÿæˆâ€æ¥è§£å†³ä¸€åˆ‡é—®é¢˜ã€‚例如还是上é¢çš„情感分类问题,我们å¯ä»¥ç›´æŽ¥æŠŠè¯å¥è¾“入给模型,并æ问“这å¥è¯è¡¨è¾¾çš„是æ£é¢è¿˜æ˜¯è´Ÿé¢çš„情绪â€ï¼Œç„¶åŽè®©æ¨¡åž‹å¯¹äºŽä¸Šé¢çš„一整串输入,去生æˆä¸€ä¸ªè¾“出回ç”ã€‚è¿™æ ·æ— è®ºæ˜¯åˆ†ç±»ï¼Œå›žå½’ï¼Œè¿˜æ˜¯ç”Ÿæˆç±»ä»»åŠ¡ï¼Œéƒ½å¯ä»¥ç»Ÿä¸€åˆ°ä¸€ç§æ¡†æž¶ä¸‹æ¥å®žçŽ°äº†ï¼Œä¹Ÿå°±å¯ä»¥ä½¿ç”¨ç»Ÿä¸€çš„预è®ç»ƒæ¨¡åž‹æ¥å¤„ç†ï¼Œéžå¸¸ä¼˜é›…。这个生æˆä¸€åˆ‡çš„æ€ç»´è½¬å˜ï¼Œä¹Ÿå½±å“到了åŽé¢æˆ‘们会æ到的从 fine tune æ€è·¯åˆ° prompt engineering çš„æ€ç»´è½¬å˜ç‰ã€‚</p> <p>回过头æ¥çœ‹ï¼Œç”Ÿæˆå¼çš„范å¼çš„确是很自然的想法,但在大多数领域我们目å‰éƒ½è¿˜åšä¸åˆ°è¿™ç‚¹ã€‚比如我们能å¦è¾“入一连串历å²å¤©æ°”ä¿¡æ¯ï¼Œè®©æ¨¡åž‹è‡ªåŠ¨åŽ»ç”Ÿæˆæœªæ¥å‡ 天的天气预报;输入用户的历å²æµè§ˆã€è´ç‰©ä¿¡æ¯ï¼Œç”Ÿæˆå‡ºå¯èƒ½æ„Ÿå…´è¶£çš„商å“ï¼›è¾“å…¥ä¸€å¼ å›¾ç‰‡ï¼Œç”Ÿæˆå‡ºå›¾ç‰‡ä¸çš„物体å称åŠä½ç½®ä¿¡æ¯ç‰ç‰ã€‚如果这些任务都能以生æˆå¼çš„æ–¹å¼åŽ»åšï¼Œæˆ–许未æ¥èƒ½è¿›ä¸€æ¥å½¢æˆå¤šæ¨¡æ€çš„预è®ç»ƒæ¨¡åž‹ï¼Œè§£å†³æ›´å¤šé¢†åŸŸçš„实际问题。 </p> <h3>自监ç£</h3> <p>GPT 背åŽçš„模型原ç†å‡ºå¥‡çš„简å•ï¼Œå°±æ˜¯é€šè¿‡ä¸€ç³»åˆ—输入文本,去预测åŽé¢ä¼šå‡ºçŽ°çš„文本是什么。大佬 Andrej Karpathy 在这个视频里 <a href="https://link.zhihu.com/?target=https%3A//www.bilibili.com/video/BV1E14y1M75n/">æ‰‹æŠŠæ‰‹æ•™ä½ å¦‚ä½•ä»Žå¤´å®žçŽ° GPT</a>,如果对实现细节感兴趣的åŒå¦å¯ä»¥å‚考。这ç§è‡ªç›‘ç£çš„模å¼ä½¿å¾—我们能以较低æˆæœ¬èŽ·å–æµ·é‡çš„è®ç»ƒæ•°æ®ï¼Œä¾‹å¦‚ Wikipedia,出版书ç±ï¼Œæ–°é—»ï¼Œå„ç§å…¬å¼€ blog,Stack Overflow,GitHub ç‰ç‰ã€‚而å‰é¢æ到的一些其他类型的如图åƒ/视频ç†è§£ä¹‹ç±»çš„问题,我们就比较难获å–类似数é‡å’Œè´¨é‡çš„è®ç»ƒæ•°æ®äº†ã€‚</p> <p>当然也æ£æ˜¯ç”±äºŽ GPT 背åŽçš„æ€æƒ³å¦‚æ¤çš„简å•ï¼Œå¾ˆå¤šäººï¼ˆåŒ…括我在内)在一开始都觉得深度å¦ä¹ 的本质并没有什么çªç ´ï¼Œä»ç„¶æ˜¯åœ¨ä¸€å †æ•°æ®ä¸åŽ»æ‹Ÿåˆä¸€ä¸ªæ¦‚率分布,åŽç»åœ¨â€œç”Ÿæˆâ€æ—¶åšä¸ªé‡‡æ ·è€Œå·²ã€‚åƒå„ç§çŸ¥è¯†æ¦‚念,逻辑推ç†ç‰ï¼Œéƒ½æ˜¯æ— 法从当å‰çš„技术路线ä¸äº§ç”Ÿçš„,需è¦èžåˆåƒçŸ¥è¯†å›¾è°±ï¼Œç¬¦å·æŽ¨ç†ç‰æ‰‹æ®µæ‰è¡Œã€‚但在用过 ChatGPT 之åŽï¼Œç›¸ä¿¡å¤§å¤šæ•°äººéƒ½å¼€å§‹è§‰å¾—è¿™ç§ç®€å•çš„自回归模型或许真的能够带我们在通用人工智能的这æ¡è·¯ä¸Šèµ°å¾—很远。</p> <h3>éµå¾ªè‡ªç„¶è¯è¨€æŒ‡ä»¤</h3> <p>沿ç€ç”Ÿæˆä¸€åˆ‡çš„æ€è·¯ï¼Œä¸€ä¸ªè‡ªç„¶çš„想法就是让模型能够“å¬æ‡‚â€äººç±»çš„指令,并åšå‡ºæœŸæœ›çš„å馈回ç”。OpenAI å’Œ Google 都在这个方å‘上åšäº†ä¸å°‘ç ”ç©¶å·¥ä½œï¼Œç•¥è¿‡æŠ€æœ¯ç»†èŠ‚ï¼Œè¿™äº›ç ”ç©¶çš„ç›®æ ‡æ˜¯èƒ½å¤Ÿè¾¾åˆ°ï¼š</p> <ul> <li>让模型ç†è§£ç”¨æˆ·çš„æ„图是什么,而ä¸åªæ˜¯ç®€ç®€å•å•åšæ–‡æœ¬çš„“ç»å†™â€è¾“出。</li> <li>对于模型没有è§è¿‡çš„问题,也能很好地ç†è§£ä¸Žå›žç”(zero-shot)。</li> <li>符åˆäººç±»çš„价值观,例如输出的内容ä¸åº”该éµå¾ªäº‹å®žï¼Œè¯æ°”å‹å¥½ï¼Œå‡å°‘“有害â€å†…容ç‰ã€‚这一点 ChatGPT åšå¾—æ ¼å¤–å¥½ï¼Œå¾ˆå¤šäººéƒ½è§‰å¾—è¿™æ˜¯ä¸€ä¸ªå¯ä»¥è®©è‡ªå·±å©å与之交谈å¦ä¹ çš„èŠå¤©æœºå™¨äººã€‚很多其它大厂产å“在这å—都å—到了很大的挑战。</li> </ul> <p>具体å¯ä»¥å‚考 <a href="https://link.zhihu.com/?target=https%3A//openai.com/blog/instruction-following/%23moon">OpenAI è¿™ç¯‡æ–‡ç« ä¸çš„一些例å</a>。</p> <figure><img src="https://pic4.zhimg.com/v2-d3b1b81f60c3fdbf4267c2d6e0d95ca7_b.jpg"></figure> <p>打一个ä¸å¤ªç²¾ç¡®çš„比方,åªç”¨è‡ªç›‘ç£è®ç»ƒå½¢æˆçš„大è¯è¨€æ¨¡åž‹ç›¸å½“于把互è”网上所有的高质é‡æ–‡æœ¬ä¿¡æ¯éƒ½çœ‹äº†ä¸€é,拥有了大é‡çš„知识,并且å¯ä»¥æ¨¡ä»¿äººç±»çš„æ–¹å¼æ¥ç»å†™æ–‡æœ¬ï¼Œä½†å®ƒä»Žæ¥æ²¡æœ‰è·ŸçœŸå®žçš„äººäº¤äº’è¿‡ï¼Œå› æ¤ä¹Ÿæ— 法ç†è§£äººç±»çš„交互æ„图。通过人类指令和期望回ç”æ–¹é¢çš„å¦ä¹ ,模型在“ç»å†™â€èƒ½åŠ›ä¸Šå¢žåŠ 了“ç†è§£åŠ›â€ï¼Œä»Žè€Œæˆä¸ºä¸€ä¸ªçœŸæ£å¯ç”¨çš„多任务通用模型。 </p> <h3>强化å¦ä¹ </h3> <p>在åšä¸Šè¿°çš„人类指令å¦ä¹ æ–¹é¢ï¼ŒInstructGPT/ChatGPT å¼•å…¥äº†äººå·¥æ ‡æ³¨ä¸Žå¼ºåŒ–å¦ä¹ 技术(RLHF)。从技术细节上æ¥çœ‹ï¼Œæœ‰å‡ 个比较有æ„æ€çš„点å¯ä»¥è®¨è®ºã€‚</p> <p>å¦‚æžœè®©ä½ æ¥åšäººç±»æŒ‡ä»¤çš„å¦ä¹ ï¼Œä½ ä¼šæ€Žä¹ˆå®žçŽ°å‘¢ï¼Ÿä¸€ä¸ªæœ€ç›´è§‚çš„æ€è·¯è‚¯å®šæ˜¯ç»™å®šä¸€äº›é—®é¢˜ï¼Œç„¶åŽç”±äººå·¥æ¥æ’°å†™å›žç”,将这部分数æ®ä½œä¸ºç›‘ç£å¦ä¹ çš„æ ·æœ¬æ”¾åˆ°æ¨¡åž‹ä¸åŽ»è®ç»ƒã€‚从 ChatGPT 的模型使用方å¼æ¥çœ‹ï¼Œä¹Ÿå¹¶ä¸æ˜¯åƒä¸‹æ£‹ä¸€æ ·è·Ÿäººå¯¹å¼ˆï¼Œæ²¡æœ‰åƒå…¸åž‹çš„强化å¦ä¹ é‚£æ ·æœ‰â€œæ ¹æ®çŽ¯å¢ƒæ”¹å˜ç–ç•¥â€çš„æ“ä½œã€‚æ‰€ä»¥å¾ˆå¤šäººåº”è¯¥è·Ÿæˆ‘ä¸€æ ·ï¼Œéƒ½è§‰å¾—è¿™é‡Œå…¶å®žä¸ç”¨å¼ºåŒ–å¦ä¹ 也å¯ä»¥è¾¾åˆ°ç±»ä¼¼çš„效果。</p> <p>但åŽæ¥ä»”ç»†çœ‹äº†ä¸€ä¸‹ä»–ä»¬åš RLHF 的过程,å‘çŽ°æœ‰å‡ ä¸ªç›¸å¯¹äºŽç›´æŽ¥åšæœ‰ç›‘ç£ tuning çš„æå‡çš„å¯èƒ½å‡ºå‘点:</p> <ul> <li>直接写问题的ç”案,相比æ¥è¯´å¯¹äºŽäººå·¥æ ‡è®°å‘˜çš„æ°´å¹³è¦æ±‚和时间开销å¯èƒ½æ›´é«˜ï¼Œå¦ä¹ 到的指令ç†è§£å¯èƒ½ä¹Ÿæ›´åå‘äºŽæ ‡è®°äººå‘˜çš„å–å‘ã€‚è€Œå¦‚æžœè®©æ ‡è®°å‘˜å¯¹æ¨¡åž‹ç”Ÿæˆçš„若干个回ç”åšä»Žå¥½åˆ°å的排åºç›¸å¯¹æ¥è¯´æ›´å®¹æ˜“一些,形æˆçš„ reward model 有更高的å¤ç”¨æ€§ï¼Œå¤§å¤§æå‡æ•ˆçŽ‡ã€‚</li> <li>对于排åºä¿¡æ¯çš„åˆ©ç”¨ä¹Ÿæœ‰ä¸€äº›å° trick,相当于åšäº†ä¸€å®šçš„æ•°æ®å¢žå¼ºã€‚这部分论文里有很详细的æè¿°ï¼ŒåŒ…æ‹¬æ€Žä¹ˆæ‹›æ ‡è®°å›¢é˜Ÿç‰ï¼Œå‡ 乎å¯ä»¥ç›´æŽ¥æ‹¿æ¥ä½¿ç”¨ã€‚</li> <li>他们在强化å¦ä¹ çš„ loss ä¸åšäº†ä¸€äº›ç‰¹æ®Šè®¾è®¡ï¼Œä½¿å¾—模型能符åˆäººç±»é¢„期,åŒæ—¶åœ¨ in context learning 和模型任务上ä¸ä¼šæŸå¤±å¤ªå¤šæ€§èƒ½ã€‚ä¸è¿‡è¿™ä¸€ç‚¹åº”该在有监ç£ä¸ä¹Ÿå¯ä»¥åšåˆ°ï¼Œä¸çŸ¥é“具体效果有多大差别。</li> <li>强化å¦ä¹ çš„æµç¨‹æ›´ç¬¦åˆäº§å“人机交互的形æ€ï¼Œä¾¿äºŽåŽç»è¿ä»£ã€‚ä¾‹å¦‚å½“å‰ ChatGPT 输出的回ç”,我们是å¯ä»¥æä¾›æ£é¢æˆ–者负é¢å馈的,这些信æ¯å°±ç›¸å½“于在给模型输出åšæŽ’åºï¼ŒåŽé¢å¯ä»¥ç»§ç»ç”¨åœ¨åŒæ ·çš„框架里优化模型。这一点对于产å“化æ¥è¯´éžå¸¸é‡è¦ï¼Œå½“å‰ä¸€äº¿çš„用户é‡èƒ½å¤Ÿæ供的å馈数æ®é‡ç»å¯¹æ˜¯ä¸€å¤§äº§å“å£åž’。 </li> <li>强化å¦ä¹ 作为通用范å¼ï¼Œæœªæ¥æœ‰æ›´å¤§çš„想象空间,把在时间维度上åšè¿žç»å†³ç–的能力也用上。例如èŠå¤©è¿‡ç¨‹ä¸ä¸ºäº†æ›´å¥½åœ°è¾¾æˆç”¨æˆ·æ»¡æ„度(å¯ä»¥çµæ´»é€‰æ‹© objectiveï¼‰çš„ç›®æ ‡ï¼Œå¯ä»¥å…ˆä¸»åŠ¨è¯¢é—®å’Œæ¾„清问题,å†åŽ»åšå›žç”;模型生æˆçš„代ç 也å¯ä»¥åœ¨çœŸå®žçŽ¯å¢ƒåŽ»è¿è¡Œï¼Œç”Ÿæˆ reward signal,继ç»ä¼˜åŒ– reward 模型和 policy 模型。这与 OpenAI å‘展通用人工智能的设想是高度一致的。</li> </ul> <p>所以总结æ¥çœ‹ï¼Œè¿™é‡Œå¹¶ä¸åªæ˜¯ä¸ºäº†ç‚«æŠ€è€Œä½¿ç”¨å¼ºåŒ–å¦ä¹ ,而是有其背åŽæ·±å±‚的设计考é‡çš„。从自回归的“模仿å¦ä¹ â€å†åˆ°ä¸ŽçœŸå®žçŽ¯å¢ƒäº¤äº’的“强化å¦ä¹ â€ï¼Œæˆ–许就是 OpenAI 对于 AGI 的整体路线设计。</p> <h3>从“微调â€åˆ°â€œæ示è¯â€ä¼˜åŒ–</h3> <p>å‰é¢æ到的让模型éµå¾ªè‡ªç„¶è¯è¨€æŒ‡ä»¤ï¼Œæžå¤§åœ°æ”¹å˜äº†æˆ‘们使用模型的方å¼ã€‚以往的常è§æ€è·¯æ˜¯æˆ‘们一般会有一个基于公开数æ®è®ç»ƒçš„模型,然åŽé’ˆå¯¹äºŽç‰¹å®šé¢†åŸŸçš„任务,我们å†æ”¶é›†ä¸€æ³¢â€œé¢†åŸŸä¸“用â€æ•°æ®ï¼Œç„¶åŽåšä¸€ä¸‹æ¨¡åž‹å¾®è°ƒï¼ˆfine tune)。就有点åƒæˆ‘们有了一个å„æ–¹é¢èƒ½åŠ›è¿˜è¿‡å¾—去的普通人,然åŽè®ç»ƒå®ƒä¸€ä¸‹ï¼Œè®©å®ƒæ›´æ“…é•¿åšæŸç§å…·ä½“的任务(医å¦è¯Šæ–,气象云图分æžï¼Œè‡ªåŠ¨é©¾é©¶ä¹‹ç±»ï¼‰ã€‚这个æ€è·¯çœ‹èµ·æ¥å¾ˆç¾Žå¥½ï¼Œä½†ä¹Ÿä¼šç¢°åˆ°å¾ˆå¤šæŒ‘战:</p> <ul> <li>领域的新数æ®æŒç»äº§ç”Ÿï¼Œéœ€è¦æŒç»çš„微调与部署,有较大计算æˆæœ¬ã€‚</li> <li>微调本身改å˜äº†æ¨¡åž‹å‚数,å¯èƒ½å¯¼è‡´â€œç¾éš¾æ€§é—忘â€ã€‚事实上 InstructGPT 就在æå‡ç†è§£èƒ½åŠ›çš„基础上,æŸå¤±äº†ä¸€äº›ä»»åŠ¡çš„性能,被称为“对é½ç¨Žâ€ã€‚</li> <li>过程ä¸æ¨¡åž‹æ€§èƒ½ä¼šæŒç»ä¸‹é™ï¼Œç‰åˆ°ä¸‹ä¸€æ¬¡å¾®è°ƒå†æå‡å›žæ¥ï¼Œæœ‰ä¸€å®šçš„滞åŽæ€§ã€‚</li> <li>微调数æ®å¯èƒ½ä¸ŽåŽŸæœ‰è®ç»ƒæ•°æ®çš„分布差别较大,导致模型的泛化性é™ä½Žã€‚这也ä¸å¤ªåƒäººç±»çš„å·¥ä½œæ–¹å¼ :)</li> </ul> <p>所以在 OpenAI 的一系列工作ä¸ï¼Œéƒ½éžå¸¸çªå‡º zero-shot/few-shot æ–¹å‘的能力优化。简å•æ¥è¯´ï¼Œå°±æ˜¯åœ¨ç¢°åˆ°ä¸€ä¸ªæ–°é¢†åŸŸçš„问题时,我是å¦å¯ä»¥ä¸å¾®è°ƒæ¨¡åž‹ï¼Œè€Œæ˜¯æ”¹å˜ä¸€ä¸‹æˆ‘问问题的方å¼ï¼Œå°±èƒ½è®©æ¨¡åž‹åšå‡ºæ¯”较好的回ç”。Zero-shot,指的是我完全ä¸ç»™ä»»ä½•ä»»åŠ¡ç›¸å…³çš„例å,就希望模型æ¥å›žç”,有时候也被称为 prompt/instruct 的设计/调优。Few-shot,则是我在问题ä¸ç»™å‡ºå‡ 个例å,然åŽå†è®©æ¨¡åž‹æ¥å›žç”,有时候也被称为 in context learning。但ä¸ç®¡æ€Žä¹ˆè¯´ï¼Œè¿™ä¸ªæ€è·¯éƒ½æ˜¯ä»¤äººéœ‡æ’¼çš„,相当于我没有改å˜ä»»ä½•æ¨¡åž‹çš„å‚数,仅仅通过ä¸åŒçš„æ问方å¼ï¼Œå°±èƒ½è®©å®ƒçŸ¥é“应该怎么回ç”。</p> <h3>“问一个好的问题â€</h3> <p>知é“ç”案ä¸é‡è¦ï¼Œèƒ½é—®å‡ºå¥½çš„问题æ‰æ˜¯æ ¸å¿ƒèƒ½åŠ›ã€‚è¿™å¥è¯æ”¾åœ¨å½“å‰çš„大è¯è¨€æ¨¡åž‹ä¸ŠçœŸæ˜¯å†åˆé€‚ä¸è¿‡äº†ã€‚这里有éžå¸¸å¤šç¥žå¥‡çš„现象,我们分别æ¥çœ‹ä¸€ä¸‹ã€‚</p> <h3>Chain of Thought</h3> <p>人们在使用 GPT 这类模型ä¸å‘现,一个原始的问题,模型å¯èƒ½æ²¡æ³•æ£ç¡®å›žç”,但是åªè¦åœ¨æé—®ä¸åŠ 一å¥â€œè®©æˆ‘们一æ¥ä¸€æ¥æ¥æ€è€ƒâ€ï¼Œæˆ–è€…å¯¹äºŽç»™å‡ºæ ·ä¾‹çš„é—®é¢˜ä¸ï¼ŒåŒæ—¶ç»™å‡ºä¸€äº›æŽ¨ç†è¿‡ç¨‹ï¼Œé‚£ä¹ˆæ¨¡åž‹å°±èƒ½å¤§å¹…度æå‡å›žç”的准确率。第一次看到这个å‘çŽ°ï¼Œæˆ‘ç›¸ä¿¡å¾ˆå¤šäººè„‘æµ·é‡Œéƒ½ä¼šå‡ºçŽ°ä¸€å †â€œé»‘äººé—®å·â€çš„表情……看起æ¥æ¨¡åž‹å·²ç»æ‹¥æœ‰äº†å¼ºå¤§çš„推ç†èƒ½åŠ›ã€‚ </p> <h3>Few-shot Prompt</h3> <p>在一些模型没有è§è¿‡çš„任务上,我们å¯ä»¥ç»™å‡ºä¸€äº›æ ·ä¾‹ï¼Œæ¯”如我们在åšæ–°äº§å“的头脑风暴,å¯ä»¥æ述一下大概想è¦çš„å‡ ç§åˆ›æ„,然åŽè®©æ¨¡åž‹æ¥ç”Ÿæˆæ›´å¤šã€‚这里比较有æ„æ€çš„在于,å‡è®¾æˆ‘们举的例å是一系列 f(x) = y çš„æ•°æ®å¯¹ï¼Œè¿™ä¸ª y 的值是å¦å‡†ç¡®å¹¶ä¸é‡è¦ï¼Œè€Œåªè¦ y 的总体分布符åˆçœŸå®žåˆ†å¸ƒå°±å¯ä»¥ã€‚这跟两个真实的人交谈很åƒï¼Œâ€œæˆ‘举个例åâ€ï¼Œè¿™ä¸ªä¾‹ååªè¦å½¢å¼ä¸Šæ£ç¡®å°±è¡Œï¼Œå…·ä½“数值是å¦ç²¾ç¡®å¹¶ä¸å¦¨ç¢å¦å¤–一个人对 context çš„ç†è§£ã€‚</p> <p>这一点å¯ä»¥è¯´ä¸Žä¼ 统的 fine tune çš„æ€ç»´å‘生了巨大的转å˜ï¼Œæˆ‘们现在完全å¯ä»¥å‘一个固定的模型去æ问,在问题ä¸åŒ…å«ä¸€äº›â€œè®ç»ƒæ ·æœ¬â€ï¼Œæ¨¡åž‹å°±èƒ½åœ¨ä¸æ”¹å˜ weights 的情况下,实时å¦ä¹ 到这些内容,并产生我们想è¦çš„输出。简å•æ¥è¯´å°±æ˜¯ï¼Œamazingï¼</p> <p>从技术角度分æžï¼Œè¿™ç¯‡ <a href="https://link.zhihu.com/?target=https%3A//arxiv.org/abs/2212.10559">Why Can GPT Learn In-Context?</a> æ–‡ç« ç»™å‡ºäº†ä¸€ä¸ªå¾ˆæœ‰æ„æ€çš„解释,in context learning å¯ä»¥ç‰ä»·äºŽåœ¨åšä¸€ä¸ªå°‘é‡æ ·æœ¬çš„ fine tune。</p> <h3>å¤æ‚的组åˆåº”用</h3> <p>我们å¯ä»¥è¿›ä¸€æ¥æŠŠé—®é—®é¢˜ä¸²è”èµ·æ¥ï¼Œå®Œæˆå¤æ‚任务。比如:</p> <ul> <li>å¯ä»¥ç»™æ¨¡åž‹ä¸€äº›æ ·ä¾‹ï¼Œè®©å®ƒæ¥ç”Ÿæˆé—®é¢˜æŒ‡ä»¤ï¼ˆsoft prompting),然åŽå†ä»¥è¿™ä¸ªé—®é¢˜åŽ»é—®æ¨¡åž‹ã€‚</li> <li>å¯ä»¥å¯¹ä¸€ä¸ªé—®é¢˜æ供多ç§æ€è·¯ï¼Œåˆ†åˆ«æ¥é—®æ¨¡åž‹ï¼Œæœ€åŽå†é›†æˆèµ·æ¥è®©æ¨¡åž‹è‡ªå·±åšä¸ªæ€»ç»“之类。</li> <li>å¯ä»¥æŠŠæ¨¡åž‹çš„回ç”å†è¾“å…¥ç»™æ¨¡åž‹ï¼Œé—®å®ƒâ€œä½ è§‰å¾—ä¸Šé¢çš„回ç”是å¦ä¸å¤Ÿå‹å¥½/å«æœ‰æ§è§†ï¼Œæ˜¯å¦å¯ä»¥æ”¹è¿›â€ç‰ï¼Œè¿›è€Œæå‡æ¨¡åž‹çš„安全性。</li> <li>å¯ä»¥æŠŠä¸€ä¸ªé—®é¢˜æ‹†è§£æˆå¤šä¸ªå问题,一个一个问,然åŽå†æŠŠé—®é¢˜å’Œå›žç”作为 context,组åˆèµ·æ¥é—®æœ€ç»ˆçš„问题,实现分而治之。</li> <li>è¿˜æœ‰åƒ <a href="https://link.zhihu.com/?target=https%3A//arxiv.org/abs/2212.10560">Self-Instruct</a> è¿™æ ·çš„åº”ç”¨ï¼Œè®©æ¨¡åž‹è‡ªå·±æ¥ç”Ÿæˆæ•°æ®â€œè®ç»ƒâ€è‡ªå·±ï¼</li> </ul> <figure><img src="https://pic2.zhimg.com/v2-4b8f9118dfc992439cfb11ad9e102615_b.jpg"></figure> <h3>æ¿€å‘模型能力</h3> <p>从上é¢è¿™äº›ä¾‹åå¯ä»¥çœ‹å‡ºï¼Œå¤§è¯è¨€æ¨¡åž‹æ‹¥æœ‰éžå¸¸ç±»ä¼¼äºŽäººçš„æ€ç»´èƒ½åŠ›ï¼Œåªæ˜¯éœ€è¦é€šè¿‡æ£ç¡®çš„指令æ¥è¿›è¡Œæ¿€å‘。就如å‰é¢æ‰€è¯´ï¼Œæ¨¡åž‹å·²ç»å¦ä¹ 了互è”网上的所有文本,具有了éžå¸¸ä¸°å¯Œçš„知识和潜在的推ç†èƒ½åŠ›ï¼ˆåŽç»ä¼šè¯¦ç»†è§£é‡Šï¼‰ã€‚但这个模型是没有与真实世界的感知连接的。比如真实的两个人在交谈时,现在的时间,地点,环境ç‰ç‰æƒ…境信æ¯ï¼Œæˆ‘们都是å¯ä»¥é€šè¿‡çœŸå®žçš„æ„ŸçŸ¥èŽ·å¾—çš„ï¼Œå› æ¤åœ¨å¯¹è¯ä¸åŒæ–¹éƒ½æœ‰è¿™éƒ¨åˆ†çš„预设信æ¯ã€‚而对于模型æ¥è¯´ï¼Œç®€å•çš„一个问题å¯èƒ½å¹¶æ²¡æœ‰åŠžæ³•è®©å®ƒç†è§£å½“å‰çš„情境和æ问者的æ„图,是想让我åšåˆ›æ„想象,还是åšé€»è¾‘推ç†ï¼Œè¿˜æ˜¯æŸ¥è¯¢äº‹å®žçŸ¥è¯†ç‰ã€‚这些信æ¯éƒ½ä¾èµ–于指令本身æ¥æ供,而好的指令能够激å‘模型,选择其相应的“记忆â€ä¸Žâ€œèƒ½åŠ›â€ï¼Œå®Œæˆå…·ä½“任务。 </p> <p>更通俗æ¥è¯´ï¼Œå³ä½¿æ˜¯åŒä¸€ä»¶äº‹æƒ…,我们在åšå·¥ä½œæ±‡æŠ¥æ—¶çš„æ€ç»´ä¸Žè¡¨è¾¾æ–¹å¼ï¼Œå’Œè·ŸåŒäº‹åƒé¥æ—¶é—²èŠçš„æè¿°çš„æ–¹å¼ï¼Œéƒ½ä¼šæœ‰å¾ˆå¤§çš„ä¸åŒã€‚对于模型æ¥è¯´æ›´æ˜¯å¦‚æ¤ã€‚å› æ¤è¯¦ç»†çš„问题情境æ述能够把让模型把特定的“æ€è€ƒæ–¹å¼â€è°ƒç”¨å‡ºæ¥ï¼Œå®žçŽ°èƒ½åŠ›çš„æ¿€å‘。这也是神奇的 in context learning 的一ç§ç›´è§‚ç†è§£æ–¹å¼ã€‚</p> <h3>ChatGPT 的能力从何而æ¥</h3> <p>对于上述æ到的 ChatGPT 的神奇能力,大家应该都很好奇到底是从何而æ¥ã€‚好åƒä¸éœ€è¦çŸ¥è¯†å›¾è°±ï¼Œç¬¦å·ä¸»ä¹‰çš„那套方法,模型也能记ä½å„ç§çŸ¥è¯†å’Œå®ƒä»¬ä¹‹é—´çš„å…³è”,并åšä¸€äº›ç®€å•çš„逻辑推ç†ã€‚这里有一篇éžå¸¸å¥½çš„æ–‡ç« ï¼ŒæŽ¨æ–了 <a href="https://link.zhihu.com/?target=https%3A//yaofu.notion.site/How-does-GPT-Obtain-its-Ability-Tracing-Emergent-Abilities-of-Language-Models-to-their-Sources-b9a57ac0fcf74f30a1ab9e3e36fa1dc1%23c45fd4df87a349028ade2d9dbeb1188f">GPT 系列模型ä¸å„ç§èƒ½åŠ›çš„æ¥æº</a>。</p> <figure><img src="https://pic2.zhimg.com/v2-2551c51bd2bd3f58ee70da59b9199901_b.jpg"></figure> <p>简å•æ€»ç»“æ¥è¯´ï¼š</p> <ul> <li>大é‡æ–‡æœ¬æ•°æ®ï¼ˆä¸‡äº¿çº§åˆ« token æ•°é‡ï¼‰åšé¢„è®ç»ƒï¼šè¯è¨€ç”Ÿæˆèƒ½åŠ›ï¼ŒåŸºç¡€çš„世界知识,in context learning 的基础。</li> <li>足够大的模型规模(åƒäº¿çº§åˆ«å‚数):大é‡çŸ¥è¯†çš„记忆与获å–能力。</li> <li>在代ç æ•°æ®ä¸Šè®ç»ƒï¼šå¤æ‚推ç†èƒ½åŠ›ï¼Œé•¿è·ç¦»ä¾èµ–关系的å¦ä¹ 。这也是最令人ç€è¿·çš„一点。</li> <li>有监ç£çš„指令微调:å“应人类问题并泛化到没有è§è¿‡çš„问题(zero-shot)上。å‡å¼±äº† in context learning 的能力。目å‰ä»Žè®ºæ–‡ä¸çœ‹ï¼ŒæŒ‡ä»¤å¾®è°ƒå’Œ RLHF è¿™å—ç”¨åˆ°çš„æ‰“æ ‡æ•°æ®é‡çº§å¹¶ä¸å¤§ï¼ˆå万æ¡ä»¥å†…),相比自监ç£éƒ¨åˆ†çš„æ•°æ®é‡å¯è°“是沧海一粟。</li> <li>RLHF:总体让回ç”æ›´åŠ ä¸°å¯Œå…·ä½“ï¼Œä¹Ÿå¢žå¼ºäº†ä¸Žäººç±»æœŸæœ›çš„ä¸€è‡´æ€§ï¼ˆzero-shot,价值观,内容安全,é¿å…胡说),但会é™ä½Žæ¨¡åž‹åœ¨ä»»åŠ¡ä¸Šçš„性能。比较有æ„æ€çš„是都用了 RLHF,text-003 模型也跟 ChatGPT 有ä¸åŒçš„能力侧é‡ï¼Œå¯æƒœç›®å‰æ²¡æœ‰è®ºæ–‡é€éœ²å…¶ä¸çš„细节。</li> </ul> <p>如果在代ç æ•°æ®ä¸Šè®ç»ƒèƒ½å¤ŸèŽ·å–到一定的推ç†èƒ½åŠ›ï¼Œè¿™é‡Œå°±èƒ½å»¶å±•å‡ºä¸€äº›å…¶å®ƒæƒ³æ³•ï¼Œä¾‹å¦‚:</p> <ul> <li>是å¦åœ¨è®ºæ–‡ï¼Œæ•°å¦ç±»çš„æ•™ææ–‡ç« ä¸ä¹Ÿèƒ½èŽ·å–逻辑推ç†èƒ½åŠ›ï¼Ÿ</li> <li>ä¸åŒçš„编程è¯è¨€å¯¹äºŽæŽ¨ç†èƒ½åŠ›çš„帮助是å¦ä¼šæœ‰ä¸åŒï¼Œä¾‹å¦‚ Haskell,Coq 这类。</li> <li>是å¦è¿˜æœ‰å…¶å®ƒå½¢å¼çš„æ•°æ®ï¼Œèƒ½å¤Ÿå¯¹å¢žå¼ºæŽ¨ç†èƒ½åŠ›å¾ˆæœ‰å¸®åŠ©ï¼Ÿ</li> </ul> <h3>知识的获å–与修改</h3> <p>ä¸è¿‡ç›®å‰ ChatGPT 类模型也是有显著局é™æ€§çš„,比较çªå‡ºçš„一点是大家在试用时ç»å¸¸å‘现的,它所å¦ä¹ çš„ä¿¡æ¯æ¥æºæˆªæ¢äºŽ 2021 å¹´ï¼Œå› æ¤åŽç»çš„ä¿¡æ¯éƒ½æ— 法获å–准确的ç”案。虽然我们的确å¯ä»¥é€šè¿‡ instruct 去实时地“修改â€ä¸€äº›çŸ¥è¯†ï¼Œä½†è¿™ä¸ªä¿¡æ¯å¹¶ä¸ä¼šè¢«â€œæŒä¹…化â€ã€‚åœ¨å¼ ä¿Šæž—è€å¸ˆçš„æ–‡ç« ä¸ï¼Œæ到了很多大è¯è¨€æ¨¡åž‹æ˜¯å¦‚何å˜å‚¨å’ŒèŽ·å–知识的原ç†ï¼Œä¹Ÿæ到了未æ¥å¦‚何去高效修改这些知识的一些方å‘探索。如果我们在模型使用上已ç»å®žçŽ°äº†è‡ªç„¶è¯è¨€æŽ¥å£ï¼Œé‚£ä¹ˆæ˜¯å¦èƒ½è¿›ä¸€æ¥åŽ»å®žçŽ°æ¨¡åž‹è®ç»ƒçš„自然è¯è¨€æŽ¥å£ï¼ˆinstruct training)呢?这或许也会是迈å‘通用人工智能的é‡è¦ä¸€æ¥ï¼Œå½“然也需è¦æœ‰å¾ˆå¤šå®‰å…¨æ–¹é¢çš„考é‡ã€‚</p> <h3>多模æ€</h3> <p>迈å‘通用人工智能,å¦å¤–一个比较显而易è§çš„ç›®æ ‡æ˜¯å°†è¿™ç±»ç”Ÿæˆå¼èŒƒå¼åº”用到多模æ€ä¸Šã€‚比如去年å¦å¤–一个很ç«çš„ AIGC 领域就是以 Stable Diffusionã€Dall-E 2ã€Midjourney ç‰äº§å“为代表的文生图应用。如果我们找到了多模æ€ä¸Šçš„大模型之路,或许就能实现通过自然è¯è¨€ç»™ AI 一个æ述,它就能自动生æˆå‡ºæž„é€ é›¶ä»¶å’Œç»„è£…çš„ 3D 设计图,看到这个设计图,就能自动生æˆå‡ºæµæ°´çº¿/机器人的一系列动作把真实的产å“æž„é€ å‡ºæ¥ã€‚甚至 AI å¯ä»¥æ ¹æ®éœ€æ±‚先构建机器人,å†é€šè¿‡è¿™äº›æœºå™¨äººåŽ»æž„建å„ç§çœŸå®žä¸–界的产å“ï¼Œé‚£æ ·çš„ç”Ÿäº§æˆæœ¬å¤§å¹…下é™çš„未æ¥ä¼šæ˜¯ä½•ç‰æ™¯è±¡çœŸæ˜¯éš¾ä»¥æƒ³è±¡ã€‚</p> <p>åƒè‡ªåŠ¨é©¾é©¶ä¹Ÿæ˜¯ä¸€ä¸ªå¾ˆå…¸åž‹çš„领域。如果仅仅从视觉æ¥â€œç”Ÿæˆâ€é©¾é©¶åŠ¨ä½œï¼Œéš¾åº¦æ˜¯éžå¸¸å¤§çš„。而我们真实人类在开车过程ä¸ï¼Œä¸€å®šæ˜¯ç»¼åˆç»“åˆäº†è§†è§‰ï¼Œå£°éŸ³ï¼Œä»¥åŠå¾ˆå¤šâ€œå†…心独白â€ï¼ˆè¯è¨€å½¢å¼çš„æ€è€ƒï¼‰ä½œå‡ºç›¸åº”的决ç–动作。整åˆå¤šæ¨¡æ€çš„输入信æ¯ä¼šå¯¹å®žçŽ°ç›¸åº”的场景能力有很大的促进作用。 </p> <p>但结åˆæˆ‘们å‰é¢æ到的当å‰å¤§è¯è¨€æ¨¡åž‹çš„å„ç§èŒƒå¼æ¥è¯´ï¼Œå¤šæ¨¡æ€çš„æ•°æ®å¾ˆå¤šéƒ½è¿˜æ²¡æ‰¾åˆ°ç±»ä¼¼çš„实现路径,例如文本数æ®æˆ‘们天然å¯ä»¥åšç”¨å‰æ–‡é¢„测åŽä¸€ä¸ªå•è¯çš„自监ç£è®ç»ƒï¼Œä½†ç”¨å›¾ç‰‡/视频生æˆæ–‡æœ¬è¿™ç±»æ•°æ®å°±æ˜¾ç„¶å°‘了很多。æ¤å¤–ä¸åŒæ¨¡æ€æ˜¯å¦èƒ½å¾ˆå¥½åœ°èžåˆåœ¨ä¸€ä¸ªæ¨¡åž‹é‡Œä¹Ÿæ˜¯ä¸ªé—®é¢˜ï¼Œç›´è§‚上æ¥çœ‹è¯è¨€æ˜¾ç„¶æ˜¯ä¸€ä¸ªå¾ˆç‰¹åˆ«çš„å˜åœ¨ï¼Œè€Œå›¾ç‰‡è§†é¢‘这类的数æ®å½¢æ€ï¼Œåˆ†å¸ƒï¼Œä¿¡æ¯å¯†åº¦ä¸Šä¼šæœ‰å¾ˆå¤§çš„ä¸åŒã€‚所以当å‰å¤šæ¨¡æ€æ¨¡åž‹ä¸Šçš„å°è¯•ï¼Œæ¯”如 ALBEF,VLMo ç‰éƒ½éœ€è¦åœ¨å¤šæ¨¡æ€ä¸Šåšå¾ˆå¤šä¸“门的模型结构设计。当然也有一些很有æ„æ€çš„å‘现,例如在 VLMo å’Œ BeiTv3 里都对多模æ€å…±äº«äº†æ³¨æ„力层,期待未æ¥ä¼šæœ‰æ›´å¤šæœ‰æ„æ€çš„èžåˆç»Ÿä¸€ã€‚</p> <p>å¦å¤–一个值得æ€è€ƒçš„点在于,å„ç§æ¨¡æ€å¯¹äºŽå½¢æˆâ€œæ™ºèƒ½â€çš„é‡è¦æ€§å¦‚何,更多的模æ€æ˜¯å¦ä¼šæœ‰ä¿ƒè¿›ä½œç”¨ã€‚一个比较广泛的观点是è¯è¨€è¿˜æ˜¯äººç±»æ™ºèƒ½ä¸æœ€ä¸ºç‰¹æ®Šçš„载体,动物类的智能也有用,但一般我们所说的通用人工智能指å‘的还是能够通过图çµæµ‹è¯•çš„类人智能。而且å³ä½¿æ˜¯é‚£äº›å¤©ç”Ÿæ²¡æœ‰è§†è§‰ã€å¬è§‰çš„æ®‹éšœäººå£«ï¼Œå…¶èƒ½å¤Ÿè¾¾åˆ°çš„æ™ºèƒ½æ°´å¹³ä¹Ÿä¸Žæ™®é€šäººæ¯«æ— å·®åˆ«ï¼Œé‚£æ˜¯å¦è¯´æ˜Žå…¶å®ƒæ¨¡æ€çš„æ•°æ®æ²¡æœ‰é‚£ä¹ˆé‡è¦å‘¢ï¼Ÿè¿˜æ˜¯è¯´æ®‹éšœäººå£«å®žé™…是通过触觉ç‰è¡¥è¶³äº†è¿™æ–¹é¢çš„能力缺陷?知乎上的这篇 <a href="https://zhuanlan.zhihu.com/p/606364639">ä»‹ç» BLIP2 çš„æ–‡ç« </a> ä¸ç»™å‡ºäº†ä¸€äº›å¾ˆæœ‰è¶£çš„æ€è·¯ï¼ŒæŠŠ LLM 作为一个éžå¸¸æ ¸å¿ƒçš„“处ç†å™¨â€ï¼Œå®žçŽ°äº†éžå¸¸æƒŠè‰³çš„效果。åŽé¢åœ¨æ•°æ®è§’度的讨论ä¸æˆ‘们也会å†å›žåˆ°è¿™ä¸ªè¯é¢˜ä¸Šã€‚</p> <h3>连接真实世界</h3> <p>我们在使用 ChatGPT 时很容易碰到的一个局é™æ˜¯å®ƒæœ‰æ—¶å€™ä¼šç”Ÿæˆå‡ºé”™è¯¯çš„回ç”,但å´è¨€ä¹‹å‡¿å‡¿çš„æ ·å,毕竟 ChatGPT 是一个被ç¦é”¢åœ¨æœåŠ¡å™¨ä¸Šçš„模型,目å‰å”¯ä¸€ä¸ŽçœŸå®žä¸–界的触点都æ¥è‡ªä¸Žç”¨æˆ·çš„对è¯äº¤äº’å’Œå馈,å¯è°“是“ä¸é—»çª—外事â€ã€‚一个很自然的改进æ€è·¯å°±æ˜¯æŠŠæ¨¡åž‹ä¸Žä¸€äº›å·²æœ‰çš„外部系统连接起æ¥ï¼Œä¾‹å¦‚一些知识性的问题å¯ä»¥å€ŸåŠ©æœç´¢å¼•æ“Žæ¥ä½è¯ï¼ˆåŽé¢ä¼šæ到类似技术和产å“),一些ç†å·¥ç§‘相关的计算推ç†é—®é¢˜å¯ä»¥å€ŸåŠ© Wolfram Alpha,生æˆçš„代ç å¯ä»¥ç›´æŽ¥åœ¨çœŸå®žçŽ¯å¢ƒç¼–译执行并检验效果ç‰ã€‚</p> <p>这里有个通用的æ€è€ƒèŒƒå¼ï¼Œä»¥å¾€æˆ‘们需è¦åŽ»è¿žæŽ¥å¤šä¸ªç³»ç»Ÿæ—¶ï¼Œéœ€è¦äº’相约定好比较特定的 API æ ¼å¼ã€‚如果我们把è¯è¨€æ¨¡åž‹å½“åšä¸€ä¸ªè¾“入是文本输出也是文本的“转æ¢å™¨â€ï¼Œé‚£ä¹ˆè¿™ä¸ªè½¬æ¢å™¨å°±å¯ä»¥ä¸Žå…¶å®ƒè½¬æ¢å™¨å¾ˆæ–¹ä¾¿çš„去串è”(回想一下å‰é¢æ到的问题串è”的玩法)。例如æœç´¢å¼•æ“Žå°±æ˜¯è¾“入查询文本,返回网页文本的转æ¢å™¨ï¼Œå¤§è¯è¨€æ¨¡åž‹ä¹Ÿæ˜¯è¾“入文本(prompt),生æˆæ–°çš„文本(回ç”),这两者就å¯ä»¥è¿›è¡Œä¸²è”。例如用æœç´¢å¼•æ“ŽåŽ»æœç´¢é—®é¢˜ç›¸å…³çš„文本信æ¯ï¼ŒæŠŠæ–‡æœ¬ä¿¡æ¯ä½œä¸ºèƒŒæ™¯ï¼Œç»“åˆé—®é¢˜å†ç»™åˆ°è¯è¨€æ¨¡åž‹åŽ»è¾“出ç”案。甚至这个循环å¯ä»¥å¤šåšå‡ æ¥ï¼Œé—®é¢˜ -> 网页文本 -> 更好的问题 -> 更多的网页文本 -> 多个问题åŒæ—¶è¾“入到è¯è¨€æ¨¡åž‹ -> å†åš summary ç‰ã€‚未æ¥å¯èƒ½å°±ä¼šåœ¨æ¤åŸºç¡€ä¸Šæ¼”化出很多领域特定的模型 pipeline æ¥æ›´å¥½çš„解决å¤æ‚问题,例如最近 Meta çš„ <a href="https://link.zhihu.com/?target=https%3A//arxiv.org/abs/2302.04761">Toolformer</a> 采用的就是类似æ€è·¯ã€‚</p> <figure><img src="https://pic4.zhimg.com/v2-5772e843cff49e330fad918b9576f02b_b.jpg"></figure> <p>如果从更长远æ¥çœ‹ï¼Œå¦‚果模型的输出能够直接形æˆå¤–部系统的动作,åŽç»åˆèƒ½å°†ç›¸å…³ç»“果返回到模型,从而去è¿ä»£æ¼”化其知识与行为ç–略,那就éžå¸¸æŽ¥è¿‘强人工智能的终æžå½¢æ€äº†ã€‚当然我们是å¦è¦å¾€é‚£ä¸ªæ–¹å‘å‘å±•æ˜¯ä¸ªé—®é¢˜ï¼Œå› ä¸ºæ¶‰åŠçœŸå®žä¸–界的决ç–就会有更多安全方é¢çš„诉求考é‡ã€‚当å‰æ¨¡åž‹åœ¨è¿™å—çš„ä¿éšœè¿˜å¾ˆå°‘,例如ç»å¸¸å¯ä»¥çœ‹åˆ°ä¾‹å,通过一些指令引导,å¯ä»¥è®©æ¨¡åž‹ç»™å‡ºå±é™©çš„回ç”æ¥ã€‚如果往那个方å‘å‘展,AI çš„ reward 函数应该如何设计,是å¦ä¸Žæ„识的产生相关,也都是需è¦æ·±å…¥æ€è€ƒçš„。</p> <p>结åˆå¤šæ¨¡æ€ä¸ŽçœŸå®žä¸–界决ç–问题,已ç»æœ‰ç±»ä¼¼çš„ç ”ç©¶é¡¹ç›®å†å¾€è¿™ä¸ªæ–¹å‘å‰è¿›äº†ï¼Œä¾‹å¦‚ <a href="https://link.zhihu.com/?target=https%3A//minedojo.org/">MineDojo</a> 项目,æœé›†äº†å„ç§ Minecraft 游æˆç›¸å…³çš„ YouTube 视频,Wiki æ–‡ç« ï¼ŒReddit 讨论,期望能è®ç»ƒä¸€ä¸ªæ¨¡åž‹èƒ½é€šè¿‡è¿™äº›æ•°æ®æ¥å¦ä¼šå¦‚何在一个开放游æˆçŽ¯å¢ƒä¸å®Œæˆå„ç§æŽ¢ç´¢ä¸Žä»»åŠ¡ã€‚</p> <figure><img src="https://pic2.zhimg.com/v2-2f916cc61613b68e50b43898be17e881_b.jpg"></figure> <h3>æ€è€ƒâ€œå¤§åŠ›å‡ºå¥‡è¿¹â€</h3> <p>回到 GPT 这类大è¯è¨€æ¨¡åž‹çš„è¯žç”Ÿï¼Œæˆ‘è·Ÿå¾ˆå¤šäººä¸€æ ·ï¼Œæ—©æœŸåªæ˜¯è§‰å¾—è¿™æ˜¯ä¸€ä¸ªå¤§åŠ›å‡ºå¥‡è¿¹çš„äº§ç‰©ï¼Œå †äº†å¾ˆå¤šæ•°æ®ï¼Œç®—力,è®ç»ƒå‡ºäº†å·¨å¤§çš„模型,但好åƒæ²¡æœ‰ä»€ä¹ˆç‰¹åˆ«çš„创新之处。但现在æ¥çœ‹ï¼Œè¿™ä¸ªç»“论显然是ä¸å¤Ÿæ·±å…¥çš„,从å‰é¢ä¸€ç³»åˆ—关于 AGI 路线的设想也能略窥一斑。之å‰åœ¨ç¾¤é‡Œè®¨è®ºæ—¶ä¹Ÿæœ‰æœ‹å‹æ出,如果说数æ®å’Œç®—力是最é‡è¦çš„å› ç´ ï¼Œé‚£ä¹ˆä¸ºä½•ä¸æ˜¯æ‹¥æœ‰æœ€å¤šæ•°æ®å’Œç®—力的大公å¸ä»¬ï¼Œæˆ–者拥有产出最多算力基础设施的显å¡åŽ‚商们æžå‡ºäº† ChatGPTï¼Œè€Œæ˜¯è¿™æ ·ä¸€å®¶å°å°çš„创业公å¸å‘¢ï¼Ÿ</p> <p>å†æ·±å…¥åŽ»çœ‹è¿™äº›ç ”究人员在设计è®ç»ƒç–略时的åšæ³•ï¼Œä¹Ÿæœ‰å¾ˆå¤šæœ‰è¶£çš„å‘现。例如数æ®é‡ï¼Œæ¨¡åž‹å‚æ•°é‡å’Œè®ç»ƒè½®æ¬¡æ˜¯å†³å®šè®¡ç®—资æºéœ€æ±‚çš„å‡ ä¸ªè¦ç´ ,那么如何进行é…比能让模型在最少资æºéœ€æ±‚的情况下达到最好的效果呢?是更多的数æ®æ›´é‡è¦ï¼Œè¿˜æ˜¯æ›´å¤§çš„模型更é‡è¦ï¼Œè¿˜æ˜¯è®ç»ƒæ›´å¤šä¸ª epoch æ›´é‡è¦ï¼Ÿç›®å‰çœ‹å¯èƒ½æœ€é‡è¦çš„还是高质é‡æ›´å¤§é‡çš„æ•°æ®ï¼Œå¹¶ä¸”与模型å‚æ•°ç‰å½¢æˆä¸€ä¸ªæ¯”例关系æ¥ä¸€èµ·ç¼©æ”¾ï¼Œä¹Ÿå°±æ˜¯æ‰€è°“çš„ scaling law。</p> <p>这类大模型还有一个比较有æ„æ€çš„现象,就是å¤æ‚系统ä¸ç»å¸¸æ到的“涌现â€ã€‚在模型规模较å°æ—¶ï¼Œå‘现其在很多任务上的表现基本跟瞎猜差ä¸å¤šï¼Œä½†ç‰åˆ°æ¨¡åž‹è§„模çªç ´ä¸€ä¸ªé˜ˆå€¼ä¹‹åŽï¼Œå…¶ç›¸å…³èƒ½åŠ›ä¼šå¤§å¹…度地上å‡ï¼Œçªç„¶å°±å¯ä»¥å®Œæˆè¿™ç±»ä»»åŠ¡äº†ã€‚这里é¢ä¸€ä¸ªå¯èƒ½çš„å…³é”®å› ç´ å°±æ˜¯ä¹‹å‰æ到的 chain of thought 能力,在å¤æ‚任务的å„个环节的ç†è§£èƒ½åŠ›éƒ½é€æ¸è¾¾åˆ°äº†ä¸€ä¸ªæ°´å¹³åŽï¼Œæ•´ä¸ªé“¾è·¯æ‰å¾—以打通,就çªç„¶å¯ä»¥åšå¤æ‚的推ç†é—®é¢˜ï¼ˆin context learning)之类了。å¦å¤–人类知识体系的å¤æ‚性也导致了必须掌æ¡å¤§éƒ¨åˆ†çš„知识,æ‰èƒ½åŽ»ç†è§£ä¸€ä¸ªéžå¸¸ç»†å°çš„行为。</p> <p>è¿‡åŽ»å‡ å¹´æˆ‘çš„å¾ˆå¤šæ€è·¯éƒ½æ›´å€¾å‘于 data-centric AI 里那ç§ç”¨å°‘é‡é«˜è´¨é‡çš„æ•°æ®åŽ»æž„建和完善特定领域模型,大è¯è¨€æ¨¡åž‹åœ¨è¿™ä¸€ç‚¹ä¸Šçš„特质的确让我打开了视野。如果人类å¯ä»¥è¯†åˆ«å’Œå¤„ç†è„æ•°æ®ï¼Œé‚£ä¹ˆè¶³å¤Ÿå¤æ‚的大模型是å¦ä¹Ÿèƒ½è‡ªåŠ¨å¤„ç†å‘¢ï¼Ÿ</p> <p>最åŽï¼Œå¾ˆå¤šäººä¼šè§‰å¾—巨大的模型è®ç»ƒï¼ŒæŽ¨ç†æˆæœ¬ä¼šè®©å¾ˆå¤šå®žé™…åº”ç”¨å› ä¸ºæˆæœ¬é—®é¢˜æ— 法è½åœ°ã€‚这一点我倒是éžå¸¸ä¹è§‚,从工业é©å‘½å¼€å§‹æŠ€æœ¯å’Œè®¡ç®—能力方é¢çš„æ‘©å°”å®šå¾‹åŸºæœ¬å°±æ²¡æœ‰å¤±æ•ˆè¿‡ã€‚å› ä¸ºæ‹…å¿ƒç®—åŠ›æˆæœ¬è€Œæ”¾å¼ƒäº§å“化探索,或者过多地把技术å£åž’建立在硬件资æºçš„节约上å¯èƒ½å而比较有风险。当然如果本身就是åšåº•å±‚基础设施的厂商,能够契åˆè¿™ç§â€œæŒ‡æ•°å¢žé•¿â€è¶‹åŠ¿çš„技术肯定就是巨大的优势了。这方é¢åƒç¨€ç–åŒ–çš„å¤§æ¨¡åž‹ï¼Œç»“åˆ retrieval 技术ç‰éƒ½æ˜¯å¾ˆæœ‰æ„æ€çš„ç ”ç©¶å‘展方å‘。</p> <h3>æ•°æ®ç”¨å°½ï¼Ÿ</h3> <p>å‰é¢å·²ç»æ到,当å‰é˜¶æ®µå½±å“大模型能力的最é‡è¦çš„å› ç´ å°±æ˜¯é«˜è´¨é‡çš„æ•°æ®ã€‚ç›®å‰å¾ˆå¤šè¯è¨€æ¨¡åž‹å·²ç»ç”¨äº†æ•´ä¸ªå› 特网上能够获å–到的 10%é‡çº§çš„æ•°æ®äº†ï¼Œåœ¨å¯è§çš„å°†æ¥å¾ˆå¯èƒ½ä¼šå‡ºçŽ°â€œæ•°æ®ç”¨å°½â€çš„é—®é¢˜ã€‚å¯¹äºŽè¿™ä¸€ç‚¹ï¼Œä¸ªäººæœ‰å‡ ä¸ªæ–¹é¢çš„æ€è€ƒã€‚ </p> <p>首先数æ®çš„é‡è¦æ€§å¾ˆå¯èƒ½åœ¨ä¸€æ®µæ—¶é—´å†…都会æˆä¸ºç›¸å…³äº§å“竞争之间的一个é‡è¦å·®å¼‚åŒ–å› ç´ ï¼ˆæ¨¡åž‹æœ¬èº«åè€Œæ¯”è¾ƒç±»ä¼¼ï¼‰ï¼Œå› æ¤åœ¨è®¾è®¡ç›¸å…³äº§å“时,相应的“数æ®é£žè½®â€è®¾è®¡éœ€è¦é‡ç‚¹è€ƒè™‘。这个方é¢ä¹Ÿè®¸ä¼šæ¶ŒçŽ°å‡ºä¸€äº›ç›¸å…³æŠ€æœ¯å’ŒåŽ‚商的机会æ¥ï¼Œä¾‹å¦‚专èŒäºŽåšäººå·¥/自动化数æ®ç”Ÿæˆï¼Œäººç±»å馈数æ®æ”¶é›†çš„ç›¸å…³æŠ€æœ¯æ ˆç‰ã€‚ </p> <p>å¯¹äºŽç›®å‰ ChatGPT 生æˆçš„回å¤ä¿¡æ¯ï¼Œå¾ˆå¤šä¹Ÿæ˜¯å…¨æ–°çš„,从未出现过的文å—组åˆã€‚对于这ç§è¾“出,是å¦æ˜¯ä¸€ç§æœ‰æ•ˆçš„“è®ç»ƒæ•°æ®â€å‘¢ï¼Ÿå¦‚æžœä¸æ˜¯çš„è¯ï¼Œé‚£ä¹ˆæœ‰äººç±»å‚与的“有效è®ç»ƒæ•°æ®â€ä¸Žå…¶æœ¬è´¨åŒºåˆ«æ˜¯ä»€ä¹ˆï¼Ÿè¿™ä¹Ÿç±»ä¼¼äºŽé—®æ¨¡åž‹ç›®å‰ç»™å‡ºçš„回ç”,是ä¸æ˜¯ä¸€ç§â€œåˆ›æ–°â€ï¼Ÿ </p> <p>上述问题或许有些哲å¦æ„味,æ¢ä¸€ç§è¯´æ³•ï¼Œæˆ‘们å¯ä»¥æŠŠæ–°çš„ä¿¡æ¯çš„生æˆåˆ†ä¸ºä¸¤ç±»ï¼Œä¸€ç±»æ˜¯å«ä¹‰/事实/ç»éªŒåž‹çš„æ•°æ®ï¼Œç›¸å½“于世界上å‘生的å„ç§æ–°äº‹ä»¶ã€‚这类数æ®åªéœ€è¦ä»¥ç±»ä¼¼æœç´¢å¼•æ“Žæ›´æ–°æ•°æ®åº“çš„æ–¹å¼åŽ»æ›´æ–°æ¨¡åž‹åº”该就å¯ä»¥ï¼ˆçŽ°åœ¨çš„ prompt 也能解决一部分)。å¦ä¸€ç±»åˆ™æ˜¯é€»è¾‘/系统类的数æ®ï¼Œä½“现的是信æ¯ä¹‹é—´å…³ç³»çš„æ¼”å˜ï¼Œä¾‹å¦‚出现了新的系统或组织,实体间的关è”关系ç‰ã€‚但åŽè€…这类信æ¯çš„更新速度仅由人类æ¥æŽ¨åŠ¨çš„è¯ï¼Œæˆ–许是éžå¸¸ç¼“æ…¢çš„ã€‚è¿™ä¹Ÿæ˜¯ä¸ºä½•æœ‰â€œå¤ªé˜³åº•ä¸‹æ— æ–°äº‹â€çš„说法å˜åœ¨ã€‚è¿™ç§ç±»åž‹çš„ä¿¡æ¯æ›´æ–°ï¼Œæˆ–许æ‰æ˜¯æˆ‘们本质上需è¦åŽ»æ供相关数æ®ï¼Œå¢žé‡è®ç»ƒæ¨¡åž‹çš„出å‘点。我们å¯ä»¥çœ‹åˆ°åƒ WebGPTã€Sparrow è¿™ç±»å·¥ä½œï¼Œä»¥åŠ perplexity.aiã€æ–°ç‰ˆçš„ Bing ç‰äº§å“都开始体现了 LLM 能够利用实时检索信æ¯çš„能力,而ä¸æ˜¯ä»»ä½•çš„新知识都需è¦è®ç»ƒæ¨¡åž‹æ›´æ–°å‚数。</p> <p>å¦ä¸€ä¸ªæ›´åŠ 实际的æ€è€ƒä¹Ÿæ˜¯å¾€å¤šæ¨¡æ€æ–¹å‘演进,æ€è€ƒæœªè¢«â€œæ–‡æœ¬åŒ–â€çš„知识主è¦åœ¨å“ªã€‚例如人类日常ä¸æœ‰éžå¸¸å¤šçš„è¯è¨€æ–‡å—交æµæ˜¯ä»¥å£å¤´å½¢å¼å®Œæˆçš„,那么å„ç§é¢è¯•ï¼Œä¼šè®®ï¼Œæ’客访谈,日常èŠå¤©ï¼Œç”šè‡³è‡ªè¨€è‡ªè¯ç‰æ˜¯å¦éƒ½å¯ä»¥è®°å½•ä¸‹æ¥ï¼Œå½¢æˆæ›´å¤šæ›´ä¸°å¯Œçš„æ–‡æœ¬èµ„æ–™ï¼Ÿä¾‹å¦‚åƒ <a href="https://link.zhihu.com/?target=https%3A//www.rewind.ai/">rewind</a> è¿™æ ·çš„äº§å“就已ç»åœ¨åšä¸€äº›ç±»ä¼¼å½¢å¼çš„å°è¯•äº†ï¼Œè¯´ä¸å®šä¼šæˆä¸ºä¸€ç§è¶‹åŠ¿ã€‚</p> <p>如果大模型有了与真实世界更多的交互能力,那么新数æ®çš„生æˆæˆ–许也真的ä¸å†å—é™äºŽäººç±»äº§ç”Ÿæ•°æ®çš„速度了。但这个方å‘也是有很大风险的。å³ä½¿ä»…考虑文å—输出,例如有些人å¯ä»¥é€šè¿‡æŽ§åˆ¶ä¸€ç³»åˆ—çš„ <a href="https://link.zhihu.com/?target=https%3A//github.com/yaroslav-n/tweetGPT">twitter bot</a>,生æˆç‰¹å®šçš„社交媒体信æ¯ï¼Œè¾¾åˆ°æ“控舆论导å‘的目的。å‰é˜µå Stack Overflow ç¦æ¢ä½¿ç”¨ ChatGPT æ’件æ¥å›žç”问题,也是担心其产生的错误回ç”å½±å“社区整体的信æ¯è´¨é‡ã€‚如果模型能åšæ›´å¤šç±»åž‹çš„决ç–,其安全风险必然更大。</p> <p>æ•°æ®å®‰å…¨ï¼Œéšç§ç‰æ–¹é¢ä¹Ÿæ˜¯ä¸€ä¸ªç»•ä¸è¿‡åŽ»çš„è¯é¢˜ã€‚尤其是当å‰çš„大è¯è¨€æ¨¡åž‹æžåº¦ä¾èµ–于数æ®ï¼Œè°æŽ§åˆ¶äº†è®ç»ƒï¼ˆåŒ…括 instruct tuning ç‰ï¼‰æ•°æ®ï¼Œè°å°±æŽ§åˆ¶äº†æ¨¡åž‹çš„“价值å–å‘â€ã€‚这在模型开始得到更广泛规模的使用时就显得æžä¸ºé‡è¦ã€‚虽然å‰é¢ä¹Ÿè®¾æƒ³äº†ä¸€ä¸‹æ˜¯å¦èƒ½å¤Ÿå®žçŽ°é€šè¿‡æŒ‡ä»¤æ¥åšå®žæ—¶å¢žé‡è®ç»ƒï¼Œä½†æ˜¾ç„¶æ¨¡åž‹å®‰å…¨æ–¹é¢æ˜¯ä¸ªéœ€è¦å…ˆè€ƒè™‘解决的å‰ææ¡ä»¶ã€‚ç›®å‰ä¹Ÿæœ‰ä¸€äº›å·¥ä½œåœ¨å¾€è¿™ä¸ªæ–¹å‘å‘展,例如 <a href="https://link.zhihu.com/?target=https%3A//github.com/mit-han-lab/offsite-tuning">Offsite-Tuning</a> ç‰ã€‚</p> <h3>å¯è§£é‡Šæœºå™¨å¦ä¹ </h3> <p>在大è¯è¨€æ¨¡åž‹çš„框架下,许多之å‰çš„ç ”ç©¶éƒ½å¯ä»¥é‡æ–°æ¥å®¡è§†å’Œæ€è€ƒï¼Œè¿™é‡Œä»…以å¯è§£é‡Šæœºå™¨å¦ä¹ æ¥ä¸¾ä¸ªä¾‹å。</p> <figure><img src="https://pic3.zhimg.com/v2-2bfa8690e6d6ad1c37148b9c6198c37e_b.jpg"></figure> <p>上图是当å‰ä¸»æµçš„ xai çš„æ€è€ƒæ¡†æž¶ï¼Œä»Žäººå’Œæ¨¡åž‹ä¸¤æ–¹çš„知识范围,工作原ç†ç‰è§’度出å‘,通过ä¸åŒçš„路径去扩大两者的交集,促进沟通ç†è§£ã€‚从æŸç§ç¨‹åº¦ä¸Šæ¥è¯´ï¼Œinstruct tuning 或许也是一ç§æ–°çš„å½¢æˆå¯è§£é‡Šæœºå™¨å¦ä¹ çš„æ–¹å¼ã€‚通过自然è¯è¨€æŒ‡ä»¤å’Œå¤šè½®å¯¹è¯ï¼Œæˆ‘们å¯ä»¥åå¤ç¡®è®¤æ¨¡åž‹ç»™å‡ºé¢„测背åŽå‚考的信æ¯ï¼ŒæŽ¨æ¼”逻辑ç‰ï¼Œè¿™å°±ä¸Žæˆ‘们ç†è§£çœŸå®žäººç±»çš„想法éžå¸¸æŽ¥è¿‘了。在这个è¯é¢˜ä¸Šæ˜¯å¦è¿˜éœ€è¦åŽ»äº†è§£äººå·¥ç¥žç»ç½‘络的底层原ç†å’Œç‰¹æ€§å¯èƒ½å°±ä¸é‚£ä¹ˆé‡è¦äº†ã€‚ </p> <h3>AGI éšæƒ³</h3> <p>å‰é¢å·²ç»æ到了很多跟通用人工智能相关的æ€è€ƒä¸Žé想,例如从监ç£å¦ä¹ ,到模仿å¦ä¹ å†åˆ°å¼ºåŒ–å¦ä¹ 的路线;通过自然è¯è¨€æŽ¥å£ï¼Œè¿žæŽ¥çœŸå®žçŽ¯å¢ƒæ¥è¾¾åˆ°â€œçŸ¥è¡Œåˆä¸€â€çš„独立智能体;通过多模æ€çš„æ•°æ®åŽ»å¢žå¼ºè¯è¨€æ¨¡åž‹çš„ä¿¡æ¯äº¤äº’和“涌现â€èƒ½åŠ›ï¼Œå®žçŽ°é€»è¾‘推ç†ï¼Œå®Œæˆå¤æ‚任务ç‰ç‰ã€‚ä¸è¿‡åœ¨å¼ºäººå·¥æ™ºèƒ½æ–¹å‘,一个绕ä¸è¿‡åŽ»çš„è¯é¢˜æ˜¯æœºå™¨èƒ½å¦æœ‰æ„识,或者说我们是å¦è¦åŽ»åˆ›é€ æ„识?人类在æ€è€ƒä¸Žå†³ç–上的很多“缺陷â€ï¼ˆå¦‚《æ€è€ƒï¼Œå¿«ä¸Žæ…¢ã€‹ä¸æ到的那些),是ä¸æ˜¯ä¹Ÿæœ‰ä¸å°‘是由æ„è¯†å’Œæƒ…æ„Ÿè¿™äº›å› ç´ äº§ç”Ÿçš„ã€‚å¦‚æžœæˆ‘ä»¬æƒ³æž„å»ºä¸€ç§ä¸Žæˆ‘们互补的“工作伙伴â€ï¼Œæˆ–许æ„识并ä¸æ˜¯å¿…需的。但如果我们想è¦è®©è¿™ç±»æ™ºèƒ½ä½“在宇宙ä¸åŽ»å»¶ç»äººç±»æ–‡æ˜Žï¼Œé‚£ä¹ˆæ„识å¯èƒ½å°±æ¯”较关键了(还è¦é˜²æ¢è‡ªæˆ‘æ¯ç)。 </p> <p>å¦å¤–å‰é¢æ到的一个设想,如果通用智能åŽç»èƒ½å¤Ÿè‡ªè¡Œå®Œæˆç‰©å“çš„ç”Ÿäº§å»ºé€ ï¼Œç”šè‡³è¿žæœºå™¨äººä¹Ÿéƒ½æ˜¯è‡ªåŠ¨åŒ–å»ºé€ å‡ºæ¥çš„,那么整个社会的商å“æˆæœ¬éƒ½ä¼šæžå¤§ä¸‹é™ã€‚如果我们把想象更进一æ¥ï¼ŒChatGPT 是å¦å¦ä¹ 过自己的代ç ?它能å¦é€šè¿‡å½“å‰æ¨¡åž‹åœ¨ä¸–界上的å馈表现去自动更新这部分的代ç 并ä¸æ–è¿ä»£ï¼Œç”šè‡³ä¸ºè‡ªå·±åˆ›é€ 出更利于自我生å˜çš„“æ„识â€æ¥ï¼Ÿè¿™æ˜¯å¦ä¼šè·Ÿäººç±»ä¿®æ”¹åŸºå› ä¸€æ ·ï¼Œä¹Ÿæ¶‰åŠåˆ°â€œæœºå™¨äººä¼¦ç†â€é—®é¢˜ï¼Ÿ:)</p> <hr> <p>本系列的åŽç»æ–‡ç« :</p> <div><a href="https://zhuanlan.zhihu.com/p/607127757">å—èŠ‚ï¼šè¿ˆå‘ ChatGPT 时代 - 商业篇</a></div> </div> </body> </html>