Web3 101不是AI 101,但我们必须聊聊最近一些火热的AI产品(如OpenRouter、Hermes Agent)背后的Web3血缘。这是个例的巧合,还是加密原住民自带的基因优势?
我们深度拆解Hermes Agent开发团队Nous Research和OpenRouter的前世今生,探寻Stability AI和加密矿企在AI算力战中的隐秘贡献,去理解两个极具冒险精神的行业之间,正在发生怎样的人才与思想交融。
【主播】
刘锋,BODL Ventures合伙人,前链闻总编辑
熊浩珺Jack,律动BlockBeats副主编,《Web3无名说》主播
【嘉宾】
王超,科技投资人
【你将听到】
00:21 Web3 101不是AI 101,但要聊聊最近热门AI产品背后的Web3血缘
03:07 Hermes Agent开发团队Nous Research的起源
05:52 Nous的CEO曾是归零MEV项目Eden Network的CTO
06:22 从捍卫用户主权的Hermes模型,到YaRN架构,再到成功挑战405B参数模型的微调
17:15 分布式训练框架DisTrO
24:05 爆火的智能体Hermes Agent之暗线:背后潜藏着分布式强化学习(RL)数据收集网络,未来极可能演变为去中心化数据市场
29:31 OpenRouter创始人Alex曾是最大NFT市场OpenSea核心成员(CTO)
33:06 OpenRouter商业逻辑:异构数据的聚合,从聚合NFT到数据到聚合/路由大模型API的商业逻辑迁移
36:45 为什么从Web3出来的团队能在AI的世界里面大放异彩?这是普遍现象吗(bushi)?
40:08 Moltbook创始人也是币圈老人
40:26 Stability AI的开源先声:创始人Emad从币圈来,又回到币圈去
45:48 从FTX Future Fund走出来的AI新星:Leopold Aschenbrenner(OpenAI/态势感知基金)、Avital Balwit(Anthropic)
47:46 加密矿企无心插柳成为AI算力中心
52:23 终极拷问:Web3人才流向AI,我们该伤感吗?
55:44 放下伤感,尊重技术浪潮,让人才流向创新最密集的领域
【词汇表】
本期提到的Web3及AI词汇
OpenRouter
Hermes Agent
Nous Research
Moltbook
Stability AI
FTX Future Fund
Leopold Aschenbrenner
Avital Balwit
【延伸阅读和相关术语】
GPTeacher:2023年春,Teknium在看到斯坦福大学的Alpaca论文(展示了用GPT-3.5蒸馏出训练数据来微调小模型)后,决定使用能力更强的GPT-4来生成更高质量的指令数据。这成为开源界最早且最知名的基于GPT-4生成的模型微调数据集之一,为早期开源模型的进化提供了原始数据支撑。
Hermes系列模型:2023年6月首发。在早期极度缺乏资金的支持下,由社区成员利用业余时间拼合计算资源完成,目前已演进至Hermes 4系列。证明了小型开源团队能在基础推演性能上达到极高水准,并在业界确立了反说教审查的“中性对齐”产品理念。
YaRN:一种基于旋转位置编码 (RoPE) 的底层数学架构改进机制。 2023年8月,Nous团队在早期为解决LLaMA原生模型仅有4000 token上下文导致无法处理长文档的痛点,针对性研发的架构。该方案后续被Meta 的 Llama 3.1和DeepSeek等核心大厂直接应用,成为行业的底层通用方案。
WorldSim:以网页命令行形式构筑的沙盘推演产品,底层调用大模型API来探索和生成平行的连续文本世界,2024年推出,引起了市场关注。但由于触发风控被Anthropic切断 API。
Hermes 3 405B:基于千亿级的Llama 3.1 405B巨型模型基础,Nous Research进行极其复杂的全参数微调而推出的开源模型。
DisTrO (Distributed Training Over-The-Internet):一种极其高效的分布式通信压缩算法机制,将不同物理机器节点间的网络通信数据量压缩至原始的近千分之一。
DeMo算法论文:初步完成DisTrO通信压缩技术后,由多方外围作者合作对核心底层原理进行的学术化总结与联合发表。深度学习领军人物、Adam优化器发明者Durk Kingma在审读后参与了合作署名。
Psyche Newtork:属于DisTrO压缩技术的直接系统落地,通过社区自发贡献闲散普通GPU并进行模型联合训练的网络。底层依托Solana区块链进行节点间的派单任务协调,实现了物理去中心化分布的大模型网络训练主网。
Teknium:Nous Research联合创始人,匿名。最初独立发觉并开发出初代Hermes模型与GPTeacher的先行实施者。
Karan Malhotra:Nous Research联合创始人,本科就读于宗教与哲学,在其履历中曾作为研究人员供职于斯坦福大学脑刺激边缘实验室。直接主导了WorldSim等非标项目的立项。
Jeffrey Quesnelle:Nous Research联合创始人及CEO,曾任Eden Network的首席工程师。
Alex Atallah:OpenSea CTO + OpenRouter创始人。
【后期】
AMEI
【运营】
朱婕
【BGM】
Mumbai - Ooyy
【在这里找到我们】
收听渠道:苹果|小宇宙
海外用户:Apple Podcast|Spotify|Google Podcast|Amazon Music
联系我们:[email protected]
Special Guest: 王超.
Weitere Episoden von „Web3 101“



Verpasse keine Episode von “Web3 101” und abonniere ihn in der kostenlosen GetPodcast App.








