GPT-4.1、提示工程、AI 开发GPT-4.1 提示指南 [译]深入了解如何通过精准的提示工程充分利用 GPT-4.1 的强大功能,包括代理工作流、长上下文处理、思维链推理及指令遵循的最佳实践O2025年4月15日
Transformer、PyTorch、自然语言处理从零开始打造一个简单 Transformer 语言模型 [译]本文将手把手教你如何用 PyTorch 搭建一个基础的 Transformer 语言模型。我们会把每个部分拆开讲清楚,让你不仅能看懂它怎么工作,还能在 Google Colab 上自己动手实现一个,哪怕你是编程或 AI 的新手也没关系!JB2025年3月6日
AI、编码、推理Claude 3.7 Sonnet 和 Claude Code [译]探索 Claude 3.7 Sonnet 的前沿推理能力和 Claude Code 的代理式编码功能,了解它们如何提升 AI 在编码和前端开发中的应用。AT2025年2月25日
AI 技术、安全性、性能测试Claude 的扩展思维 [译]探索 Claude 3.7 Sonnet 的新功能:扩展思维模式如何提升 AI 智能,揭示其思考过程的可见性,以及在安全性和性能测试中的表现AT2025年2月25日
人工智能、深度学习、GPU 优化FlashMLA:DeepSeek 重塑 AI 效率的野心DeepSeek 最新开源项目 FlashMLA 为 Hopper GPU 带来针对可变长度序列的高效 MLA 解码内核,挑战性能极限2025年2月24日
AI 推理、强化学习、数学与代码从数学到代码:GRPO 如何重塑 AI 推理的未来探索 DeepSeek 的 GRPO 算法如何通过组内比较优化大型语言模型,显著提升数学推理和代码生成能力,并展望其对 AI 发展的深远影响2025年2月24日
人工智能、大语言模型、注意力机制长文本的秘密武器:MoBA 如何改变游戏规则深入剖析 Kimi 开源的 MoBA 框架,探索其如何以稀疏块注意力革新长文本处理,并与 DeepSeek 的 NSA 对比,揭示二者的独特价值与未来潜力2025年2月23日
AI、强化学习、推理复现 DeepSeek「顿悟时刻」:10 美元打造 AI 推理突破 [译]能否用 48GB RTX6000 和 10 美元,让 3B 模型具备回溯、反思、推理能力?强化学习屡创奇迹,本文揭示轻量级实现之道。R2025年2月22日
AI、软件工程、前沿科技前沿大模型能从实际软件外包任务中赚取百万美元吗?OpenAI 通过 SWE-Lancer 测试前沿 AI,评估其在真实软件外包任务中的工程能力,探索 AI 经济价值的边界2025年2月19日
AI、技术架构、云服务云端 AI 路由器:OpenRouter 如何重塑模型调用范式深入解析 OpenRouter 的技术架构、发展历程与愿景:从延迟优化到分析系统,探索 AI 基础设施创新之路2025年2月18日
AI、科技前沿、深度学习解密 AI 未来:从 LLM 到感知智能Meta 首席 AI 科学家 Yann LeCun 剖析人工智能的发展瓶颈与突破方向,探讨从语言模型到通用感知智能的演进路径2025年2月17日
AI 技术、GPU 优化通过 DeepSeek-R1 和推理时间扩展自动生成 GPU Kernel [译]探索 NVIDIA 工程师如何利用 DeepSeek-R1 模型及推理时间扩展技术自动生成优化的 GPU Attention Kernel。NT2025年2月13日
AI、科技、未来揭秘 AGI 进化密码:从 AlphaGo 到超级智能的技术革命路径深入解析 Google DeepMind CEO 对通用人工智能的深刻洞察,探讨 AI 发展关键突破与未来图景2025年1月25日
机器学习、Swift、MLX使用 MLX 和 Swift 进行设备端机器学习研究 [译]探索如何利用 MLX 和 Swift 在 Apple Silicon 芯片上进行机器学习实验S2024年2月20日
iOS、SwiftUI、编程为什么 SwiftUI 中的 View 使用 Struct 类型而不是 Class?深入探讨 SwiftUI 视图架构设计中关于 Struct 和 Class 的选择2023年12月25日