过去几个月的 AI 突破解锁了一波新的创业机会。我们过去每年最多发布一次创业项目需求,但这次我们决定在上一次发布仅 3 个月后就发布这个清单,以帮助创业者找到刚刚出现的创意空间。
你可能已经关注了这些想法背后的最新进展。通过 Operator 和 Computer Use,AI 系统现在可以使用计算机。像 OpenAI 的 o1/o3 和 Deepseek R1 这样的推理模型使构建能够匹配甚至超越人类的 AI 系统成为可能。它们也需要新的计算基础设施。而 DeepSeek R1 向世界展示了低层次优化中存在巨大的未开发潜力。
这些是我们认为现在值得投入的想法。
我们希望在你的电脑或手机上有一个新型的 AI 应用商店和操作系统层。它应该:
想象一个擅长找航班的旅行 AI,它知道你通常和你那个喜欢看窗外的九岁孩子一起旅行,或者一个 AI 助手,当你在阅读文章或书籍时,它能推荐某个想法最初出现的文本。建立在这个应用商店上的应用只能访问你(用户)允许的那一小部分数据。我们需要这样一个系统,让 AI 既强大又私密。
有人可能会说主要的大型科技公司会建造这个,但现在正是你可能实现它的时机。
如果做得对,这将为创业公司和创始人创造更多机会:他们的应用将通过共享记忆变得更智能,这将转变为一个解决分发和变现问题的新市场。
我们需要更多能够更快、更低成本建设的数据中心来支持 AI 发展所需的基础设施。大规模数据中心项目需要数年时间才能完成,考虑到当前的兴趣和资金,我们需要新公司和更创新的解决方案来加速这一建设进程——无论是在电力基础设施、冷却、材料采购还是项目管理方面。
我们可以设想未来是什么样子:软件将处理规划和建设新数据中心或仓库的各个方面,从选址和施工到安装和持续管理。这些应用将实现「无人值守」,机器人全天候自主运行,无需人工干预。
我们希望为新创业公司提供资金,帮助实现这一愿景。
在美国和欧洲,将近 400 万人(约占整个劳动力的 1%)从事合规和审计工作。而合规成本只会不断上升。从 GDPR 到多德-弗兰克法案,从金融反洗钱/了解你的客户(AML/KYC)到 ESG 报告——监管环境不断扩大。
传统的合规任务需要阅读密集的法规、核对内部政策和程序文件、手动抽样检查一线工作并生成重复的报告。审计人员经常需要筛查大量非结构化数据来发现问题。这些手动、耗时的工作流程亟需自动化。
LLM 在这方面表现出色。它们可以解析监管文件、企业政策或财务报表并突出显示问题,节省人工审查时间。这些工具将自动完成审计人员目前手动完成的大部分测试工作:发现数据异常、识别不完整记录或突出显示相互矛盾的政策。
模型经过良好训练后,无需抽样少量文件,就能同时查看所有内容——对世界上的每家公司进行「持续审计」。
每天,需要电子签名的复杂文件都会给人们的商业和个人生活带来摩擦:想想税务表格、销售协议、抵押贷款、雇佣合同、保密协议、贷款申请、保险申请等等。
在使用现今的 DocuSign 或类似产品时,以下操作都很困难:
我们希望创始人在 AI 驱动的世界中重新思考文档应该如何创建和分发以供签名。
想象一套新工具可以:
AI 代理现在可以浏览网页和使用桌面应用程序。OpenAI 的 Operator 和 Anthropic 的 Computer Use 展示了这是可能的,还有许多优秀的开源选择。
让 AI 代理使用网络就像给一个装在罐子里的大脑装上了手。它现在可以做事了。
这意味着每个网站和每个应用程序现在实际上都有了 API。这意味着人们可以在计算机上完成的任何工作流程都可以实现自动化。
这可能会让 AI 代理的可用场景增加 10 倍。我们迫不及待地想看看人们用它来构建什么。
软件是一种行之有效的方式,可以让每个人都享受到以前只有富人才能负担得起的服务。就在 2009 年,世界上只有最富有的人才能负担得起私人司机,但如今,优步,甚至 Waymo,已经让所有人都能享受这项服务。另一个例子:当我第一次开始研究后来成为 Google Photos 的项目时,我惊讶地发现富人会雇佣真人来浏览他们所有的照片并进行编辑、标记和整理。我们为数十亿人构建了 AI 来自动化完成这项工作。
尽管过去十年软件出现了爆炸式增长,富人仍然雇用大量人力来提供个人服务。这些包括税务会计师、私人律师和理财经理,还有私人教练、私人导师,甚至私人医生。这样的清单还可以继续列下去。为什么只有富人才负担得起?因为软件无法取代这些类型的个性化知识工作任务......直到现在。
在接下来的几年里,我们预计 AI 将变得足够好,能够完成大部分这些工作。因此,如果你正在努力为地球上的每个人带来这种「个人 AI 员工团队」的某个部分,我们很想听听你的想法。
在过去的 2 年里,我们资助了许多使用 AI 来颠覆传统企业的创业公司。
现在我们正在见证下一波浪潮的出现:AI 代理不仅仅是协助人类,还能自主做出决策。随着 o1 的发布,以及即将到来的 o3,这些代理在推理方面正变得明显更好,使它们能够完全复制甚至改进人类执行的任务。
AI 代理将在各个行业和我们的日常生活中变得无处不在。想象一个世界,每个人都得到一个专业 AI 代理团队的支持,这些代理在后台无缝工作,以提升他们的生产力和创造力。
为了加速这个未来的到来,我们正在寻求资助构建 AI 代理开发工具 的创业公司。这些可以包括:
语言模型现在已经可以比大多数人写出更好的代码。这将使构建软件的成本降低到零。
那么,代理是否会取代软件开发者的工作?不会!我们在未来需要更多的人类软件工程师,因为软件将运行几乎所有事物。
这些人不会直接写很多代码。相反,他们将管理为他们构建软件的代理团队。除了编写代码外,代理还将执行构建软件所需的大多数其他专业任务:QA、部署、安全与合规审计、翻译、运营等。
开源和开源创业公司有一个模式。首先我们有专有的 Unix,然后有了 Linux,接着有了 RedHat。首先我们有 BitKeeper,然后有了 Git,接着有了 Github 和 Gitlab。
在构建为人们使用开源 AI 提供支持和服务的创业公司方面存在巨大机会。
发布开源代码的组织不想专注于提供商业支持的情况并不罕见。例如,谷歌和 Facebook 开源了许多工具,但并不总是提供商业支持供企业使用这些工具——这为创业公司创造了机会。
开源 AI 领域将会有许多赢家,但 DeepSeek 的发布应该为创始人提供充足的新领域,他们可能想要覆盖这些领域来帮助企业利用这些系统。
AI 硬件仍然受到软件的限制。英伟达之所以主导市场,很大程度上是因为 CUDA 的手工优化代码被用于 AI 模型。竞争对手的硬件——AMD、定制芯片——表现不佳,不仅是因为芯片性能较差,还因为编写系统级代码(内核、驱动程序)非常困难,而且没有足够的软件工程师在从事这项工作。
然而,现在有了像 Deepseek R1 或 OpenAI o1 和 o3 这样的推理模型,它们可以生成能够与人工编写的 CUDA 代码相媲美——甚至超越——的硬件优化代码。
我们希望看到更多创始人致力于开发 AI 生成的内核,使更多硬件替代方案能够用于 AI。
互联网流量的相当大一部分由非人类抓取和寻找信息组成。这些程序经常需要伪装成人类来填写表格或寻找变化,大多数人构建网站时都考虑的是人类用户而不是爬虫。
随着 AI 和代理的出现,构建软件和服务时积极支持和记录「代理作为客户」而不是将其视为边缘情况似乎是个好主意。
例如,帮助代理支付托管费用、预订旅行或与其他方签订合同的 API。在股票市场上,众所周知人类和程序一起交易,在未来这种情况只会增加。
从 2005 年到 2020 年,交互式 Web 应用程序的发明推动了 B2B SaaS 公司的一波巨大浪潮。超过 100 家 B2B SaaS 独角兽公司成立,近一半的风险投资都投向了这个类别。
在接下来的十年里,我们很可能会看到一波构建垂直领域 AI 代理的平行浪潮。
什么是垂直领域 AI 代理?它是建立在 LLM 之上的软件,经过精心调整,能够自动化某种真实、重要的工作。在最近几批中,我们有 YC 公司构建了 AI 税务会计师、AI 医疗账单处理员、AI 电话支持代理、AI 合规代理、AI 质量保证测试员。
如果你阅读 DeepSeek 论文并试图理解其突破,似乎很明显,在有限的硬件资源中获得最大收益的才能工程师是至关重要的。
由于资源限制而专注于从有限硬件中获得最大收益是计算历史上的一个普遍主题,这包括创始人本身对这种痴迷般的专注。
谷歌的创始人痴迷于让他们的基础设施在商用 x86 服务器和 Linux 这样的开源工具上运行。这带来了完全不同的方法,并为他们的公司带来了好处。
能够理解和创新整个软件栈可以成为创业创始人的不公平优势。
直到最近,计算支出都投入到预训练基础模型中。但现在有了 Deepseek R1 和 OpenAI o1 和 o3,出现了一个新的扩展趋势,表明当 AI 应用实际使用这些模型时,我们在推理时需要更多的计算能力。
随着 AI 应用对复杂推理模型的 API 调用次数增加 10 倍甚至 100 倍,基础设施成本将成为一个真正的问题。
这就是新创业公司的机会所在。这里有重建技术栈的空间:更好的推理层工具软件、处理 GPU 工作负载的更便宜方法,以及让 AI 应用扩展而不会耗尽资金的优化。