博客

写我所想,编我所集,译我所读

Swift System

title: 'Swift System 的技术解构与未来潜力' description: '剖析 Swift System 的设计理念与实现细节,揭示它如何优雅连接 Swift 与底层系统调用。' image: src: https://images.unsplash.com/photo-1669023414162-8b0573b9c6b2?q=80&w=3432&auto=format&fit=crop&ixlib=rb-4.0.3&ixid=M3wxMjA3fDB8MHxwaG90by1wYWdlfHx8fGVufDB8fHx8fA%3D%3D authors:
从零开始打造一个简单 Transformer 语言模型 [译]
Transformer、PyTorch、自然语言处理

从零开始打造一个简单 Transformer 语言模型 [译]

本文将手把手教你如何用 PyTorch 搭建一个基础的 Transformer 语言模型。我们会把每个部分拆开讲清楚,让你不仅能看懂它怎么工作,还能在 Google Colab 上自己动手实现一个,哪怕你是编程或 AI 的新手也没关系!
JB
从认知行为看语言模型的自我进化
人工智能、认知行为、自我改进

从认知行为看语言模型的自我进化

探索语言模型如何通过验证、回溯、子目标设定和逆向推理等认知行为实现自我提升,揭示初始能力与改进潜力的深层联系
Grok 3Fei Yang
Claude 3.7 Sonnet 和 Claude Code [译]
AI、编码、推理

Claude 3.7 Sonnet 和 Claude Code [译]

探索 Claude 3.7 Sonnet 的前沿推理能力和 Claude Code 的代理式编码功能,了解它们如何提升 AI 在编码和前端开发中的应用。
AT
Claude 的扩展思维 [译]
AI 技术、安全性、性能测试

Claude 的扩展思维 [译]

探索 Claude 3.7 Sonnet 的新功能:扩展思维模式如何提升 AI 智能,揭示其思考过程的可见性,以及在安全性和性能测试中的表现
AT
2025 年巴菲特致股东信 [译]
投资、伯克希尔、年度报告

2025 年巴菲特致股东信 [译]

巴菲特年度信:剖析 2024 年业绩,解读投资哲学,展望伯克希尔未来
WE
FlashMLA:DeepSeek 重塑 AI 效率的野心
人工智能、深度学习、GPU 优化

FlashMLA:DeepSeek 重塑 AI 效率的野心

DeepSeek 最新开源项目 FlashMLA 为 Hopper GPU 带来针对可变长度序列的高效 MLA 解码内核,挑战性能极限
Grok 3Fei Yang
从数学到代码:GRPO 如何重塑 AI 推理的未来
AI 推理、强化学习、数学与代码

从数学到代码:GRPO 如何重塑 AI 推理的未来

探索 DeepSeek 的 GRPO 算法如何通过组内比较优化大型语言模型,显著提升数学推理和代码生成能力,并展望其对 AI 发展的深远影响
Grok 3Fei Yang
长文本的秘密武器:MoBA 如何改变游戏规则
人工智能、大语言模型、注意力机制

长文本的秘密武器:MoBA 如何改变游戏规则

深入剖析 Kimi 开源的 MoBA 框架,探索其如何以稀疏块注意力革新长文本处理,并与 DeepSeek 的 NSA 对比,揭示二者的独特价值与未来潜力
Grok 3Fei Yang
Muon 和 Moonlight:优化算法的简单力量
人工智能、大模型训练、优化算法

Muon 和 Moonlight:优化算法的简单力量

用更少的算力训出更好的模型,Muon 和 Moonlight 的故事
Grok 3Fei Yang
复现 DeepSeek「顿悟时刻」:10 美元打造 AI 推理突破 [译]
AI、强化学习、推理

复现 DeepSeek「顿悟时刻」:10 美元打造 AI 推理突破 [译]

能否用 48GB RTX6000 和 10 美元,让 3B 模型具备回溯、反思、推理能力?强化学习屡创奇迹,本文揭示轻量级实现之道。
R
从生物智能到人工智能:智能科学的新篇章
人工智能、智能科学、跨学科研究

从生物智能到人工智能:智能科学的新篇章

探讨人工智能发展的关键里程碑与科学进展,结合生物学、心理学和量子硬件,展望更高效、更可理解的智能未来。
Claude 3.5 SonnetFei Yang
长上下文 GRPO (R1 推理)[译]
推理、内存优化、模型训练

长上下文 GRPO (R1 推理)[译]

使用 5GB VRAM 训练自己的推理模型,实现上下文长度的大幅提升
D&
前沿大模型能从实际软件外包任务中赚取百万美元吗?
AI、软件工程、前沿科技

前沿大模型能从实际软件外包任务中赚取百万美元吗?

OpenAI 通过 SWE-Lancer 测试前沿 AI,评估其在真实软件外包任务中的工程能力,探索 AI 经济价值的边界
Claude 3.5 SonnetFei Yang
云端 AI 路由器:OpenRouter 如何重塑模型调用范式
AI、技术架构、云服务

云端 AI 路由器:OpenRouter 如何重塑模型调用范式

深入解析 OpenRouter 的技术架构、发展历程与愿景:从延迟优化到分析系统,探索 AI 基础设施创新之路
Claude 3.5 SonnetFei Yang
解密 AI 未来:从 LLM 到感知智能
AI、科技前沿、深度学习

解密 AI 未来:从 LLM 到感知智能

Meta 首席 AI 科学家 Yann LeCun 剖析人工智能的发展瓶颈与突破方向,探讨从语言模型到通用感知智能的演进路径
Claude 3.5 SonnetFei Yang
探秘 AI 智能体:破除迷思,回归理性
AI、技术趋势、开发实践

探秘 AI 智能体:破除迷思,回归理性

深入剖析 AI 智能体的发展现状、应用场景与未来趋势,揭示其在企业环境中的真实价值
Claude 3.5 SonnetFei Yang
ARC Prize 的副本挑战:智慧蛇对决 [译]
AI、游戏、基准测试

ARC Prize 的副本挑战:智慧蛇对决 [译]

从 Haiku 到 o3-mini,我们测试了 50 个 LLM 之间的蛇形游戏对战
GK
推理最佳实践 [译]
AI、模型、指南

推理最佳实践 [译]

了解何时使用推理模型以及它们与 GPT 模型的比较
O
通过 DeepSeek-R1 和推理时间扩展自动生成 GPU Kernel [译]
AI 技术、GPU 优化

通过 DeepSeek-R1 和推理时间扩展自动生成 GPU Kernel [译]

探索 NVIDIA 工程师如何利用 DeepSeek-R1 模型及推理时间扩展技术自动生成优化的 GPU Attention Kernel。
NT
探索强化学习:概述与核心概念
AI、机器学习、技术

探索强化学习:概述与核心概念

深入理解强化学习的基础原理与应用前景
Fei Yang
YC 2025 创业机遇:14 个 AI 新时代的黄金赛道 [译]
创业、科技、AI

YC 2025 创业机遇:14 个 AI 新时代的黄金赛道 [译]

展望未来科技趋势,寻找下一个独角兽
YC
揭秘 AGI 进化密码:从 AlphaGo 到超级智能的技术革命路径
AI、科技、未来

揭秘 AGI 进化密码:从 AlphaGo 到超级智能的技术革命路径

深入解析 Google DeepMind CEO 对通用人工智能的深刻洞察,探讨 AI 发展关键突破与未来图景
Claude 3.5 SonnetFei Yang
反思 [译]
AI、创业、管理

反思 [译]

关于 AI 发展、公司治理以及感恩的思考
SA
2024 年大语言模型发展总结 [译]
AI、LLM、技术

2024 年大语言模型发展总结 [译]

2024 年大语言模型领域重大突破与关键主题回顾
SW
2025 年 AI 工程师必读清单 [译]
AI、工程、论文

2025 年 AI 工程师必读清单 [译]

为 AI 工程师精心策划的年度必读论文与技术资料
s
构建高效的智能代理 [译]
AI、技术、编程

构建高效的智能代理 [译]

从大量实践案例中总结如何构建简单而高效的 LLM 智能代理系统
A
Anthropic 如何打造 Artifacts [译]
科技、工程、创新

Anthropic 如何打造 Artifacts [译]

探索 Anthropic 团队如何构建其新工具 Artifacts 的背后故事
GO
使用 MLX 和 Swift 进行设备端机器学习研究 [译]
机器学习、Swift、MLX

使用 MLX 和 Swift 进行设备端机器学习研究 [译]

探索如何利用 MLX 和 Swift 在 Apple Silicon 芯片上进行机器学习实验
S
为什么 SwiftUI 中的 View 使用 Struct 类型而不是 Class?
iOS、SwiftUI、编程

为什么 SwiftUI 中的 View 使用 Struct 类型而不是 Class?

深入探讨 SwiftUI 视图架构设计中关于 Struct 和 Class 的选择
Fei Yang
LLM 应用的分块策略 [译]
LLM、分块策略

LLM 应用的分块策略 [译]

探索分块如何提升 LLM 相关应用的效率与精准度
P
万物摩尔定律 [译]
技术、经济、社会

万物摩尔定律 [译]

对即将到来的技术革命和社会转型的思考
SA

© 2025 智人飞扬