<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>软件开发 on My AI Research Blog</title>
    <link>https://blog.xiaohanweb.com/tags/%E8%BD%AF%E4%BB%B6%E5%BC%80%E5%8F%91/</link>
    <description>Recent content in 软件开发 on My AI Research Blog</description>
    <generator>Hugo -- 0.149.0-DEV</generator>
    <language>en-us</language>
    <lastBuildDate>Fri, 01 Aug 2025 10:00:00 +0800</lastBuildDate>
    <atom:link href="https://blog.xiaohanweb.com/tags/%E8%BD%AF%E4%BB%B6%E5%BC%80%E5%8F%91/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>AI原生应用构建实录 (下)：从“感觉编码”到“可行代码”，用Agentic工作流驱动开发</title>
      <link>https://blog.xiaohanweb.com/posts/second-article/</link>
      <pubDate>Fri, 01 Aug 2025 10:00:00 +0800</pubDate>
      <guid>https://blog.xiaohanweb.com/posts/second-article/</guid>
      <description>在上一篇我们绘制了AI英语导师应用的宏伟蓝图后，本篇将聚焦于‘如何’高效、高质量地实现它。本文深入对比了IDE助手与Agentic CLI两种AI编码范式，提出了一套名为‘Vibe to Viable’的规约驱动开发框架，并展示了如何使用Roocode等前沿工具，将模糊的开发构想系统性地转化为结构清晰、可维护的软件产品。</description>
    </item>
    <item>
      <title>架构师与实习生：一套利用现代大语言模型进行完整项目开发的全新工作流</title>
      <link>https://blog.xiaohanweb.com/posts/fifth-article/</link>
      <pubDate>Sun, 27 Jul 2025 10:00:00 +0800</pubDate>
      <guid>https://blog.xiaohanweb.com/posts/fifth-article/</guid>
      <description>&lt;h2 id=&#34;引言ai增强软件工程的新范式&#34;&gt;引言：AI增强软件工程的新范式&lt;/h2&gt;
&lt;p&gt;软件开发行业正处在一个关键的拐点。我们已经超越了仅将AI工具视为代码自动补全助手的时代，例如初代的GitHub Copilot。随着以Anthropic的Claude 3.5 Sonnet为代表的新一代大型语言模型（LLM）的出现，以及像Cursor这样“代码库感知”（codebase-aware）的AI原生IDE的成熟，我们正在见证一场根本性的变革 [1]。Claude 3.5 Sonnet在推理能力、代码质量和生成速度上均表现出卓越的性能，这使得它不再仅仅是一个辅助工具，而是一个有能力的协作者 [3]。这种模型能力与开发环境的深度融合，首次使得通过人机协作构建完整、复杂的应用程序成为一个现实且可行的目标 [7]。&lt;/p&gt;
&lt;p&gt;本报告的核心论点是：开发者的角色正在从代码的“执行者”（doer）转变为AI协作流程的“指挥官”（director）或“架构师”（architect）[9]。在这个新范式中，最有价值的技能不再仅仅是编码的熟练度，而是将复杂问题分解为可执行任务、为AI提供精确上下文、批判性地评估其输出，以及做出高层次架构决策的能力。&lt;/p&gt;
&lt;p&gt;为了清晰地展示当前的技术格局，下表对几款领先的AI编码模型进行了比较分析。这些数据揭示了，新一代模型并非简单的渐进式改进，而是在推理、编码和速度等关键维度的组合上实现了质的飞跃，这正是它们能够胜任复杂多步开发任务的基础 [4]。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;表1：顶尖AI编码模型能力对比&lt;/strong&gt;&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th style=&#34;text-align: left&#34;&gt;特性&lt;/th&gt;
          &lt;th style=&#34;text-align: left&#34;&gt;Anthropic Claude 3.5 Sonnet&lt;/th&gt;
          &lt;th style=&#34;text-align: left&#34;&gt;OpenAI GPT-4o&lt;/th&gt;
          &lt;th style=&#34;text-align: left&#34;&gt;Google Gemini 1.5 Pro&lt;/th&gt;
          &lt;th style=&#34;text-align: left&#34;&gt;数据来源&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;&lt;strong&gt;编码能力 (HumanEval)&lt;/strong&gt;&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;&lt;strong&gt;64%&lt;/strong&gt; (内部代理测试)&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;被Claude 3.5超越&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;落后于Claude 3.5&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;[4]&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;&lt;strong&gt;研究生水平推理 (GPQA)&lt;/strong&gt;&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;设立新基准&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;被Claude 3.5超越&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;落后于Claude 3.5&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;[4]&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;&lt;strong&gt;上下文窗口&lt;/strong&gt;&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;200K Tokens&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;128K Tokens&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;高达 1M-2M Tokens&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;[3]&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;&lt;strong&gt;速度&lt;/strong&gt;&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;比Claude 3 Opus快2倍&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;N/A (通常很快)&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;N/A (很快)&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;[4]&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;&lt;strong&gt;成本 (每1M tokens)&lt;/strong&gt;&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;$3 输入 / $15 输出&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;(变动，但有竞争力)&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;~$1.25 输入 (128K内)&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;[4]&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;&lt;strong&gt;核心优势&lt;/strong&gt;&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;极简、整洁的代码；推理能力&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;通用性强，创造性任务&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;超大上下文，多模态能力&lt;/td&gt;
          &lt;td style=&#34;text-align: left&#34;&gt;[3]&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;hr&gt;
&lt;h2 id=&#34;第一部分基本原则与现代开发者的思维模式&#34;&gt;第一部分：基本原则与现代开发者的思维模式&lt;/h2&gt;
&lt;p&gt;在深入探讨具体的工作流程之前，我们必须首先建立一套全新的思维模式。这套思维模式是驾驭这些强大但仍有缺陷的AI工具的“游戏规则”。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
