那天站在第九届区块链全球峰会的讲台上,我其实有点忐忑。作为一个专攻人工智能十几年的"老人",面对Web3.0这个新兴领域,反而像个刚入学的小学生。但在大模型这个话题上,我想我有足够的发言权。
模型的进化:一场没有终点的马拉松
记得2007年我刚入行时,AI还是个"小众爱好"。那时候我们还在用CPU跑小模型,谁能想到十几年后会迎来大模型的爆发?2019年在Google工作时,我们团队的大模型表现远优于GPT2,当时还有点"瞧不上"OpenAI。现在看来,这份傲慢让我错失了很多洞察的机会。
模型规模的增长趋势让我想起一个有趣的比喻:这就像人类追求更高建筑的过程。从1950年代的平房,到现在的摩天大楼,模型参数的增长速度远超人们的想象。2018年到2021年初,模型规模每18个月就能增长数百倍。虽然现在增速放缓了些,但这场"高楼竞赛"远未结束。
有人担心GPT-4这样的万亿参数模型太烧钱,但我认为这种担心是多余的。2020年GPT-3训练一次要400万美元,到2022年就降到了40万。这让我想起2000年代买一部手机的价钱,现在可能只够买杯咖啡。
通用vs垂直:谁主沉浮?
业内一直在争论:是做通用大模型还是深耕行业垂直模型?这个问题让我想起当年智能手机刚普及时的场景。iPhone证明了通用设备的可行性,但后来各种专业App也让垂直市场大放异彩。
GPT-1的出现对我来说是个转折点。它证明了单个模型可以处理多种任务,就像瑞士军刀一样多功能。现在的大模型虽然还不能直接解决所有复杂问题,但只要稍加"拆解",就能展现出惊人的能力。比如GPT-4直接解24点游戏的准确率只有7.3%,但经过简单任务分解后就能提升到74%。
在实际应用中,我看到Duolingo这样的语言学习平台因为整合ChatGPT实现了42%的营收增长。Copilot更是成为了程序员的新宠。这些案例都在告诉我:AI正在改变知识工作者的工作方式。
情商:AI的下一个前沿
现在大家都在比拼模型的"智商",但我更关注"情商"这个维度。当前的AI就像个智商超高但情商欠费的天才,回答虽然专业但总少了点人情味。
这让我想起搜索引擎的发展历程。早期的搜索引擎都是千人一面,现在的搜索结果却越来越个性化。Character.ai这家公司的案例很有趣:他们把个性化做到极致,用户交互时长达到了OpenAI的7倍。这说明人们渴望更有温度的AI互动。
在我的实验室里,我们一直在探索如何在保持高智商的同时提升情商。2020年我们就推出了一个写作能力媲美GPT-3.5的模型。现在我们的产品已经服务了200多位个人用户和100多家企业客户,其中包括星巴克、支付宝等行业巨头。
AI+Web3.0:生产力与生产关系的共舞
说到与Web3.0的结合,我认为这就像生产力和生产关系的辩证关系。大模型提升了生产力,但需要新的生产关系来适配。当前行业面临三个主要痛点:
首先是高昂的训练成本让小公司难以参与。这就好比让每个人都自建芯片工厂一样不现实。其次是推理成本居高不下,GPT-4每次对话要0.6元,比我演讲贵多了。最后是数据隐私问题,三星的教训提醒我们要谨慎对待敏感数据。
Web3.0或许能提供解决方案。比如通过公链激励模型开源,利用分布式算力降低推理成本,用区块链技术保障数据安全。虽然前路充满挑战,但我相信这会是场值得期待的变革。
站在技术变革的十字路口,我始终相信大模型的终极目标不是取代人类,而是成为每个人的贴心助手和智慧伙伴。这条路或许漫长,但值得我们一起探索。
顶: 6踩: 2
评论专区