跳到主要内容

使用商业 AI

商业 AI 工具是当前能力最强、迭代最快的选择。本文档覆盖获取路径(注册、订阅、付款)和使用方式(选型、配置、工作流)两块。

通用获取路径

商业 AI 工具大多对中国大陆用户存在访问与支付限制。下面是 2026 年初验证过仍可走通的样本。

使用前提与时效性

  • 第三方接码、礼品卡、VPN 服务变更频繁,路径随时可能失效
  • 路径依赖具体服务商的地区策略和支付通道,与政策环境强相关
  • 涉及 VPN 和跨境支付,请遵守当地法规,本文不构成任何推荐
  • 若某一步卡住,先确认服务是否还在运营、是否调整了流程,再考虑是否继续

路径

  1. 网络环境:登录、订阅、模型调用全程都需要稳定的海外出口,部分场景需要稳定的住宅 IP(oixcloud.com / fenghost.net
  2. 登录入口:通过 Google / Apple 等方式登录 Claude Code / Codex
  3. 短信验证:部分服务强制要求非中国大陆手机号,第三方接码比租用海外号便宜、即时(hero-sms.com
  4. 礼品卡:在 Pockyt 等平台购买 App Store & iTunes 礼品卡,外卡申请门槛高、汇率损失大,礼品卡一次性买断金额灵活,且不暴露长期可被风控的卡号(shop.pockyt.io
  5. 充值:在 App Store 个人中心选择「兑换充值卡或代码」
  6. 订阅:在 iOS 上打开对应 App 选择订阅,使用 Apple 账户余额支付——海外服务的网页订阅对中国大陆信用卡普遍拒收,App Store 礼品卡绕开了卡组织风控,是最稳定的支付通道

商业 AI 选型

把厂商、订阅、API 三块信息拆成 2 张窄表:一张专门比订阅价、一张专门比 API 价。差异点用列表单独放,避免在格子里塞太多。

订阅价(个人付费档,每档列核心权益)

厂商档 1(最低付费)档 2档 3档 4(最高)
ClaudePro $20/月
Chat + Projects + 全部模型
Max $200/月
5× 额度 + Extended Thinking + 优先访问
Team(另议)
协作 + 集中计费 + 管理控制
Enterprise(另议)
SSO + 合规 + 定制
OpenAIPlus $20/月
ChatGPT 完整 + 高级模型
Pro $200/月
无限消息 + Operator + o1 pro
Team(另议)
团队空间 + 共享工作区
Enterprise(另议)
SSO + SCIM + 合规
GeminiAI Pro $20/月
Gemini 全系 + Workspace 整合
Ultra(另议)
最高级模型 + 优先访问 + 独家功能
QwenToken Plan 标准 ¥198/月(25K Credits)
全模型 + 多模态 + 数据安全
高级 ¥698/月(100K Credits)
适配主流编程工具和 Agent
尊享 ¥1,398/月(250K Credits)
多用户隔离 + 预算可控
KimiAndante ¥49/月
Kimi Code 可调用
Moderato ¥99/月
2× Agent + Kimi Code 4× + 集群
Allegretto ¥199/月
4× Agent + Kimi Code 20× + 专属 Kimi Claw
Allegro ¥699/月
10× Agent + Kimi Code 60× + 高峰优先
GLMLite ¥49/月
3× Claude Pro 额度 + 逐步开放旗舰 + Claude Code 等 20+ 编程工具
Pro ¥149/月
5× Lite 额度 + 优先体验旗舰 + 精选 MCP 工具 + 更快生成
Max ¥469/月
20× Lite 额度 + 首发旗舰 + 高峰期资源优先
MiniMaxPlus ¥49/月(6 亿+ M3 token)
1M 上下文 + 多模态输入
Max ¥119/月(18 亿+ token)
视频生成 3 条/日
Ultra ¥469/月(71 亿+ token)
视频生成 5 条/日 + 多用户隔离

API 价(所有模型,每百万 tokens,按厂商分组、组内按输入价从高到低)

厂商模型上下文输入输出缓存命中缓存写入
ClaudeOpus 4.81M$5$25$0.50
ClaudeSonnet 4.61M$3$15$0.30
ClaudeHaiku 4.51M$1$5$0.10
OpenAIGPT-5.5$5$30
OpenAIGPT-5.4$2.50$15
OpenAIGPT-5.4 mini$0.75$4.50
Gemini3.1 Pro>200K$4$18
Gemini3.1 Pro<200K$2$12
Gemini3.5 Flash$1.50$9
Gemini3.1 Flash-Lite$0.25$1.50
QwenQwen3.7-Max (5 折)¥6¥18¥0.60
KimiK2.6 多模态 (1M)¥6.50(缓存未命中)¥27¥1.10
GLMGLM-5.1 [新品]32K+¥8¥28¥2.00
GLMGLM-5.1 [新品]≤32K¥6¥24¥1.30
GLMGLM-5-Turbo32K+¥7¥26¥1.80
GLMGLM-5-Turbo≤32K¥5¥22¥1.20
GLMGLM-532K+¥6¥22¥1.50
GLMGLM-5≤32K¥4¥18¥1.00
MiniMaxM2.7-highspeed¥4.2¥16.8¥0.42¥2.625
MiniMaxM3512K~1M¥4.2¥16.8¥0.84
MiniMaxM2.7¥2.1¥8.4¥0.42¥2.625
MiniMaxM3≤512K¥2.1¥8.4¥0.42

国内 ¥、海外 $。批量 API 通常 50% 折扣,Prompt Caching 通常 90% 命中率折扣。数字会调整,付款前以官方页为准。

Claude

Claude 是 Anthropic 开发的大语言模型系列,核心设计目标是安全、诚实和有帮助三者兼顾。Constitutional AI 训练方式让它在边界模糊的任务上更倾向于给出理由而非简单拒绝,在需要判断的场景中更少奉承、更愿意坚持正确答案。

模型系列

Claude 按能力和成本分为三个层级,每一代都会同时更新三个层级:

  • Haiku:响应最快、成本最低,适合高频调用、实时交互和对延迟敏感的场景。最新版 Haiku 4.5
  • Sonnet:能力与成本的平衡点,是大多数实际任务的首选,也是 Claude Code 的默认模型。最新版 Sonnet 4.6(2026 年 2 月)——在长期编码评估中已能匹配 Opus 4.5 的表现,且 token 消耗更少
  • Opus:能力最强,适合复杂推理、长文档分析和高价值低频任务。最新版 Opus 4.8(2026 年 5 月),具备自适应思考(adaptive thinking)能力,能根据任务复杂度动态调整思考深度

当前一代全系支持百万级 token 上下文窗口(1M),覆盖完整代码库、长篇文档、会议记录、多轮历史等场景。

版本演进路径:Claude 1 → Claude 2(长上下文)→ Claude 3(多模态,三档齐发)→ Claude 3.5(Sonnet 大幅提升,推出 Computer Use)→ Claude 3.7(Extended Thinking 正式发布)→ Claude 4(Opus 4、Sonnet 4,推理和 Agent 能力显著增强)→ Claude 4.5 → Claude 4.6 / 4.7 / 4.8(持续滚动迭代)。

核心能力

百万级上下文:当前 Claude 全系支持 1M token 上下文窗口,可以处理完整代码库、长篇文档、会议记录和多轮历史记录。实际使用时需注意"迷失在中间"问题——关键信息放在开头或结尾比放在中间更可靠。

Hybrid Reasoning + Adaptive Thinking:Claude 3.7 起支持"先思考再回答"与"即时回答"两种模式,Opus 4.8 进一步引入自适应思考,能根据任务复杂度自动决定思考深度。手动 Extended Thinking 在数学、代码调试、复杂逻辑推断等需要多步骤推演的任务上有显著优势。Thinking 消耗额外 token,适合对质量要求高、对速度和成本不敏感的场景。

代码能力:Claude 在代码生成、调试、重构和理解上表现突出,尤其在需要跨文件理解依赖关系和上下文的任务上。SWE-Bench 数据显示 Claude 系列在真实软件工程任务中持续领先。Sonnet 4.6 在长期编码任务上已能匹配 Opus 4.5,意味着用 Sonnet 跑大部分编码项目已经足够。

多模态:支持图像、PDF、文档输入,可以理解截图、图表、界面设计和技术架构图。Computer Use 功能允许 Claude 直接操作计算机界面,通过截图→分析→鼠标键盘操作完成任务。

Prompt Caching:API 端支持缓存重复前缀,显著降低长上下文场景下的成本——对于反复引用同一份系统提示、代码库或文档的用法几乎是必备。

产品形态

Claude.ai:网页和 App 形式的对话界面,支持 Projects(持久记忆和文档上传)、Artifacts(代码和内容预览)和多种模型切换。适合日常问答、写作、研究和原型验证。

Claude API:面向开发者的 API 接入,支持 Prompt Caching(降低重复内容成本 90%)、流式输出、工具调用(Function Calling)和 Vision。是构建 Claude 驱动产品的基础设施。

Claude Code:终端内的编程 Agent,直接在开发环境中运行,可以读写文件、执行命令、运行测试、查看报错并迭代修复。不只是代码补全,而是把 Claude 放进真实工作区参与完整开发任务。

Claude Projects 的高效配置

大多数人把 Projects 当作带标签的对话框,发布一个项目、起个名字、可能在系统提示里写一两句话、上传一个文件,然后开始聊天,输出却和普通对话一样——这不是项目,是带标签的对话。 高效 Projects 的关键在于让 Claude 在你打字之前就理解你的声音、受众、工作流和"高质量"的定义。

Projects 失败有三个常见原因:系统提示太模糊、知识文件为空、项目想做太多事情。一个叫"工作"的 Projects 同时处理邮件、内容、策略、研究、代码、分析——所有任务都只得到平均水平。应该按工作流拆分项目,每个项目只做一件事,做到极致。

六部分蓝图

每个高效 Project 都有六个组件,缺一不可:

1. 身份块(Identity Block):系统提示的开头,告诉 Claude 它在这个项目里是谁。不是"你是 helpful assistant",而是具体到角色、年限、受众和风格:

你是我合作两年的高级内容策略师和写作者。你深入理解我的声音、受众和质量标准。

在这个项目里,你的职责是为我的 25 万关注者(他们是 AI 工具初学者)研究、规划、起草和编辑长篇文章。

你直接、具体、从不使用填充词。每一句话都要有存在的理由,否则就删掉。

身份越具体,Claude 越倾向给出自信、具体的输出,而不是通用、安全的输出。

2. 规则块(Rules Block):Claude 必须永远做和永远不做的事——这是系统提示里最重要的部分。

ALWAYS:

  • 短段落,每段最多 3 句
  • 用具体数字代替模糊表述(不要"许多"或"一些",给出具体数)
  • 每个 section 加粗关键洞察,方便扫读
  • 开头用 hook 创造读者已有认知与真相的落差
  • 结尾用 CTA 制造紧迫感但不要过度推销

NEVER:

  • 使用 "leverage" "utilize" "streamline"
  • 任何句子以 "In today's" 或 "It's important to note" 开头
  • 使用 em dash
  • 写能套用到任何人的通用建议,每条都要具体可执行
  • 加免责声明或"取决于"不立即跟具体依赖

约束就是强制车道。 每次你纠正 Claude 的输出,那个纠正就该变成一条规则。一个月后你的规则列表就是一台精密度极高的仪器。

3. 流程块(Process Block):告诉 Claude 怎么思考——不是产出什么,是怎么工作:

  1. 写任何东西之前,先用一段思考读者对这一话题已有的认知,你的开头必须挑战它
  2. 写出完整大纲,发给我审核通过后再写
  3. 一口气写完初稿,不自我审查
  4. 对照我的规则检查,修复违规
  5. 检查每个论断是否有具体数字或例子支撑
  6. 把自己当作手机滑动的忙人重读整篇,删掉任何让人停下来的部分

没有流程块,Claude 跳到输出;有流程块,Claude 走结构化工作流,质量稳定得多。 "把自己当作手机滑动的忙人重读"这一句对内容质量的提升比其他所有指令都大。

4. 输出格式块(Output Format Block):精确定义成品长什么样。

  • 标题:[数字] + [Claude 相关话题] + [排除性 hook]
  • 长度:2000-3500 字
  • 结构:加粗对比开头(2 段)→ 背景 section → 编号主体内容 → 强结尾 CTA
  • 子标题:加粗,写作让人想读下去的 hook
  • 结尾:斜体一行 + 加粗斜体一行,使用"多数人会 X / 那些 Y 的人"对照结构

当 Claude 在开始前就知道精确格式,它会正确分配精力。没有格式块,细节会集中前段、结尾草草收场;有格式块,每段获得比例匹配的注意力。

5. 知识文件(Knowledge Files):让 Project 获得真正的智能。Claude 在每个对话里都会引用这些文件:

  • 风格指南(必须):至少 3 篇你最好的作品,Claude 模式匹配你的声音。没有这个文件,Claude 用默认风格;有这个文件,Claude 用你的风格。
  • 受众画像(必须):读者是谁、已经知道什么、什么让他们挫败、想达成什么、需要多深的技术。一页纸即可。
  • 竞品分析(推荐):你不想重复的话题、过度使用的角度。上传你想"不一样于"的内容样本。
  • 绩效数据(推荐):哪篇效果最好、什么标题最吸引人、什么话题有共鸣。Claude 用这些数据做更好的策略决策。
  • 模板库(推荐):你最好的格式作为可复用模板。文章结构、邮件框架、报告布局。Claude 用这些作为起点框架,而不是每次从零发明结构。

6. 入职消息(Onboarding Message):在新对话里发的第一条消息。把它当作你给员工的每日简报。

今天我们要做 [任务]。

背景:[我需要什么以及为什么]

参考我的风格指南调声音,参考我的受众画像定目标,参考我的绩效数据做战略决策。

开始前告诉我:

  1. 什么角度能让这个内容从已存在的内容中脱颖而出?
  2. 读者已有的认知是什么,我们可以挑战什么?
  3. 一句话 hook 是什么?

一旦我批准角度,你继续写完整大纲。

这条消息激活所有五个知识文件、设定任务上下文、强制 Claude 战略思考后再写。没有它,Claude 立刻开始生成;有它,Claude 先计划再执行,效果更好。

五个 Projects 的最小集

不需要 20 个 Projects,5 个就够,每个处理一个核心工作流:

  • 内容生产:写作声音、受众、内容标准的系统提示 + 风格指南、最佳作品、受众画像、内容日历
  • 研究与分析:研究结构、信任来源、分析深度的系统提示 + 研究方法论、过往分析样本、评估标准
  • 沟通:邮件和消息风格、专业语气、与不同受众关系的系统提示 + 优秀邮件样本、常见消息类型模板
  • 策略与规划:商业背景、目标、约束、决策方式的系统提示 + 商业计划、竞品数据、市场研究、战略框架
  • 代码与技术工作:技术栈、编码规范、架构偏好、质量标准的系统提示 + CLAUDE.md 内容、架构决策记录、首选模式的代码示例

Claude Code 的使用方式

Claude Code 和其他 AI Coding 工具的核心区别在于工作区深度:它不需要手动复制粘贴代码,而是直接在终端读写你的项目文件、运行命令、看输出,形成完整的任务闭环。

基础配置

  • CLAUDE.md 文件:在项目根目录写 CLAUDE.md,说明项目结构、常用命令、编码规范和禁止操作,让 Claude Code 每次进入项目都有完整上下文
  • 任务粒度:一次任务聚焦一个清晰的目标,完成后验证,再进入下一个。避免一次性交代十个需求
  • 人在关键节点:对于删除、发布、数据库操作等不可逆步骤,在任务描述里明确要求"执行前先告诉我将要做什么"
  • 模型选择:日常开发用 Sonnet,遇到复杂架构问题或难以排查的 bug 切换 Opus 或开启 Extended Thinking

Plan-first 工作流:脑子里冒出想法后,第一反应永远不是写代码,而是写计划。一个想法、一个 bug 报告、一条终端报错,都先扔进 Claude Code,让它先出结构化的 plan.md(问题是什么、什么方案、动哪些文件、验收标准)。然后 Claude 按计划执行,拆任务、写代码、跑测试、逐条勾掉验收项。计划文件作为永远不会丢的存档点,新会话指向同一份计划就能继续。

传统开发是 80% 写代码、20% 规划,plan-first 把这个比例完全反过来。 思考发生在计划里,执行交给机器。计划写得越清楚,执行的效率就越高,返工的概率就越低。

并行会话:同时开四到六个终端窗口,每个跑一个独立会话。一个写计划,一个根据另一份计划构建代码,一个做调研,一个修 bug。每个窗口有独立上下文,避免单会话过长导致的注意力稀释。

为支持并行工作

  • 配置文件里放开所有权限确认,让每个会话完全自主运行
  • 设置完成时播放提示音,听到声音回来看结果
  • 编辑器每 500 毫秒自动保存,Claude 改了文件编辑器立刻可见
  • 通过 Telegram 或 tmux 远程操控 Mac Mini 上的会话,会话跑在远端机器、笔记本只是窗口,飞机上 WiFi 断了再连上会话还在

语音输入:当接收方从一个死板的文字处理器变成一个能理解上下文的 AI,语音转录不需要完美——Claude 能猜出麦克风没听清的部分。说话、跑题、重新起头都无所谓。语音到 LLM 这种交互解锁了全新的人机协作方式:可以像跟同事说话一样跟 AI 交流,不用字斟句酌。

上下文复利:每一份写过的战略文档、每一个做过的技术决策、每一次积累的经验,如果都以结构化方式存下来,就会成为 AI 做下一次决策时的参考依据。时间越长,积累越多,AI 给出的建议就越精准。 这就是上下文的复利效应——前期看不出差别,但时间会放大差距。

费用策略:高强度使用 Opus 会话很快烧完套餐。可以并行使用不同模型订阅,让擅长思考的负责规划,让擅长执行的负责重度代码实现,互补组合而不是单一套餐过载。