使用商业 AI
商业 AI 工具是当前能力最强、迭代最快的选择。本文档覆盖获取路径(注册、订阅、付款)和使用方式(选型、配置、工作流)两块。
通用获取路径
商业 AI 工具大多对中国大陆用户存在访问与支付限制。下面是 2026 年初验证过仍可走通的样本。
使用前提与时效性
- 第三方接码、礼品卡、VPN 服务变更频繁,路径随时可能失效
- 路径依赖具体服务商的地区策略和支付通道,与政策环境强相关
- 涉及 VPN 和跨境支付,请遵守当地法规,本文不构成任何推荐
- 若某一步卡住,先确认服务是否还在运营、是否调整了流程,再考虑是否继续
路径
- 网络环境:登录、订阅、模型调用全程都需要稳定的海外出口,部分场景需要稳定的住宅 IP(oixcloud.com / fenghost.net)
- 登录入口:通过 Google / Apple 等方式登录 Claude Code / Codex
- 短信验证:部分服务强制要求非中国大陆手机号,第三方接码比租用海外号便宜、即时(hero-sms.com)
- 礼品卡:在 Pockyt 等平台购买 App Store & iTunes 礼品卡,外卡申请门槛高、汇率损失大,礼品卡一次性买断金额灵活,且不暴露长期可被风控的卡号(shop.pockyt.io)
- 充值:在 App Store 个人中心选择「兑换充值卡或代码」
- 订阅:在 iOS 上打开对应 App 选择订阅,使用 Apple 账户余额支付——海外服务的网页订阅对中国大陆信用卡普遍拒收,App Store 礼品卡绕开了卡组织风控,是最稳定的支付通道
商业 AI 选型
把厂商、订阅、API 三块信息拆成 2 张窄表:一张专门比订阅价、一张专门比 API 价。差异点用列表单独放,避免在格子里塞太多。
订阅价(个人付费档,每档列核心权益)
| 厂商 | 档 1(最低付费) | 档 2 | 档 3 | 档 4(最高) |
|---|---|---|---|---|
| Claude | Pro $20/月 Chat + Projects + 全部模型 | Max $200/月 5× 额度 + Extended Thinking + 优先访问 | Team(另议) 协作 + 集中计费 + 管理控制 | Enterprise(另议) SSO + 合规 + 定制 |
| OpenAI | Plus $20/月 ChatGPT 完整 + 高级模型 | Pro $200/月 无限消息 + Operator + o1 pro | Team(另议) 团队空间 + 共享工作区 | Enterprise(另议) SSO + SCIM + 合规 |
| Gemini | AI Pro $20/月 Gemini 全系 + Workspace 整合 | Ultra(另议) 最高级模型 + 优先访问 + 独家功能 | — | — |
| Qwen | Token Plan 标准 ¥198/月(25K Credits) 全模型 + 多模态 + 数据安全 | 高级 ¥698/月(100K Credits) 适配主流编程工具和 Agent | 尊享 ¥1,398/月(250K Credits) 多用户隔离 + 预算可控 | — |
| Kimi | Andante ¥49/月 Kimi Code 可调用 | Moderato ¥99/月 2× Agent + Kimi Code 4× + 集群 | Allegretto ¥199/月 4× Agent + Kimi Code 20× + 专属 Kimi Claw | Allegro ¥699/月 10× Agent + Kimi Code 60× + 高峰优先 |
| GLM | Lite ¥49/月 3× Claude Pro 额度 + 逐步开放旗舰 + Claude Code 等 20+ 编程工具 | Pro ¥149/月 5× Lite 额度 + 优先体验旗舰 + 精选 MCP 工具 + 更快生成 | Max ¥469/月 20× Lite 额度 + 首发旗舰 + 高峰期资源优先 | — |
| MiniMax | Plus ¥49/月(6 亿+ M3 token) 1M 上下文 + 多模态输入 | Max ¥119/月(18 亿+ token) 视频生成 3 条/日 | Ultra ¥469/月(71 亿+ token) 视频生成 5 条/日 + 多用户隔离 | — |
API 价(所有模型,每百万 tokens,按厂商分组、组内按输入价从高到低)
| 厂商 | 模型 | 上下文 | 输入 | 输出 | 缓存命中 | 缓存写入 |
|---|---|---|---|---|---|---|
| Claude | Opus 4.8 | 1M | $5 | $25 | $0.50 | — |
| Claude | Sonnet 4.6 | 1M | $3 | $15 | $0.30 | — |
| Claude | Haiku 4.5 | 1M | $1 | $5 | $0.10 | — |
| OpenAI | GPT-5.5 | — | $5 | $30 | — | — |
| OpenAI | GPT-5.4 | — | $2.50 | $15 | — | — |
| OpenAI | GPT-5.4 mini | — | $0.75 | $4.50 | — | — |
| Gemini | 3.1 Pro | >200K | $4 | $18 | — | — |
| Gemini | 3.1 Pro | <200K | $2 | $12 | — | — |
| Gemini | 3.5 Flash | — | $1.50 | $9 | — | — |
| Gemini | 3.1 Flash-Lite | — | $0.25 | $1.50 | — | — |
| Qwen | Qwen3.7-Max (5 折) | — | ¥6 | ¥18 | ¥0.60 | — |
| Kimi | K2.6 多模态 (1M) | — | ¥6.50(缓存未命中) | ¥27 | ¥1.10 | — |
| GLM | GLM-5.1 [新品] | 32K+ | ¥8 | ¥28 | ¥2.00 | — |
| GLM | GLM-5.1 [新品] | ≤32K | ¥6 | ¥24 | ¥1.30 | — |
| GLM | GLM-5-Turbo | 32K+ | ¥7 | ¥26 | ¥1.80 | — |
| GLM | GLM-5-Turbo | ≤32K | ¥5 | ¥22 | ¥1.20 | — |
| GLM | GLM-5 | 32K+ | ¥6 | ¥22 | ¥1.50 | — |
| GLM | GLM-5 | ≤32K | ¥4 | ¥18 | ¥1.00 | — |
| MiniMax | M2.7-highspeed | 全 | ¥4.2 | ¥16.8 | ¥0.42 | ¥2.625 |
| MiniMax | M3 | 512K~1M | ¥4.2 | ¥16.8 | ¥0.84 | — |
| MiniMax | M2.7 | 全 | ¥2.1 | ¥8.4 | ¥0.42 | ¥2.625 |
| MiniMax | M3 | ≤512K | ¥2.1 | ¥8.4 | ¥0.42 | — |
国内 ¥、海外 $。批量 API 通常 50% 折扣,Prompt Caching 通常 90% 命中率折扣。数字会调整,付款前以官方页为准。
Claude
Claude 是 Anthropic 开发的大语言模型系列,核心设计目标是安全、诚实和有帮助三者兼顾。Constitutional AI 训练方式让它在边界模糊的任务上更倾向于给出理由而非简单拒绝,在需要判断的场景中更少奉承、更愿意坚持正确答案。
模型系列
Claude 按能力和成本分为三个层级,每一代都会同时更新三个层级:
- Haiku:响应最快、成本最低,适合高频调用、实时交互和对延迟敏感的场景。最新版 Haiku 4.5
- Sonnet:能力与成本的平衡点,是大多数实际任务的首选,也是 Claude Code 的默认模型。最新版 Sonnet 4.6(2026 年 2 月)——在长期编码评估中已能匹配 Opus 4.5 的表现,且 token 消耗更少
- Opus:能力最强,适合复杂推理、长文档分析和高价值低频任务。最新版 Opus 4.8(2026 年 5 月),具备自适应思考(adaptive thinking)能力,能根据任务复杂度动态调整思考深度
当前一代全系支持百万级 token 上下文窗口(1M),覆盖完整代码库、长篇文档、会议记录、多轮历史等场景。
版本演进路径:Claude 1 → Claude 2(长上下文)→ Claude 3(多模态,三档齐发)→ Claude 3.5(Sonnet 大幅提升,推出 Computer Use)→ Claude 3.7(Extended Thinking 正式发布)→ Claude 4(Opus 4、Sonnet 4,推理和 Agent 能力显著增强)→ Claude 4.5 → Claude 4.6 / 4.7 / 4.8(持续滚动迭代)。
核心能力
百万级上下文:当前 Claude 全系支持 1M token 上下文窗口,可以处理完整代码库、长篇文档、会议记录和多轮历史记录。实际使用时需注意"迷失在中间"问题——关键信息放在开头或结尾比放在中间更可靠。
Hybrid Reasoning + Adaptive Thinking:Claude 3.7 起支持"先思考再回答"与"即时回答"两种模式,Opus 4.8 进一步引入自适应思考,能根据任务复杂度自动决定思考深度。手动 Extended Thinking 在数学、代码调试、复杂逻辑推断等需要多步骤推演的任务上有显著优势。Thinking 消耗额外 token,适合对质量要求高、对速度和成本不敏感的场景。
代码能力:Claude 在代码生成、调试、重构和理解上表现突出,尤其在需要跨文件理解依赖关系和上下文的任务上。SWE-Bench 数据显示 Claude 系列在真实软件工程任务中持续领先。Sonnet 4.6 在长期编码任务上已能匹配 Opus 4.5,意味着用 Sonnet 跑大部分编码项目已经足够。
多模态:支持图像、PDF、文档输入,可以理解截图、图表、界面设计和技术架构图。Computer Use 功能允许 Claude 直接操作计算机界面,通过截图→分析→鼠标键盘操作完成任务。
Prompt Caching:API 端支持缓存重复前缀,显著降低长上下文场景下的成本——对于反复引用同一份系统提示、代码库或文档的用法几乎是必备。
产品形态
Claude.ai:网页和 App 形式的对话界面,支持 Projects(持久记忆和文档上传)、Artifacts(代码和内容预览)和多种模型切换。适合日常问答、写作、研究和原型验证。
Claude API:面向开发者的 API 接入,支持 Prompt Caching(降低重复内容成本 90%)、流式输出、工具调用(Function Calling)和 Vision。是构建 Claude 驱动产品的基础设施。
Claude Code:终端内的编程 Agent,直接在开发环境中运行,可以读写文件、执行命令、运行测试、查看报错并迭代修复。不只是代码补全,而是把 Claude 放进真实工作区参与完整开发任务。
Claude Projects 的高效配置
大多数人把 Projects 当作带标签的对话框,发布一个项目、起个名字、可能在系统提示里写一两句话、上传一个文件,然后开始聊天,输出却和普通对话一样——这不是项目,是带标签的对话。 高效 Projects 的关键在于让 Claude 在你打字之前就理解你的声音、受众、工作流和"高质量"的定义。
Projects 失败有三个常见原因:系统提示太模糊、知识文件为空、项目想做太多事情。一个叫"工作"的 Projects 同时处理邮件、内容、策略、研究、代码、分析——所有任务都只得到平均水平。应该按工作流拆分项目,每个项目只做一件事,做到极致。
六部分蓝图
每个高效 Project 都有六个组件,缺一不可:
1. 身份块(Identity Block):系统提示的开头,告诉 Claude 它在这个项目里是谁。不是"你是 helpful assistant",而是具体到角色、年限、受众和风格:
你是我合作两年的高级内容策略师和写作者。你深入理解我的声音、受众和质量标准。
在这个项目里,你的职责是为我的 25 万关注者(他们是 AI 工具初学者)研究、规划、起草和编辑长篇文章。
你直接、具体、从不使用填充词。每一句话都要有存在的理由,否则就删掉。
身份越具体,Claude 越倾向给出自信、具体的输出,而不是通用、安全的输出。
2. 规则块(Rules Block):Claude 必须永远做和永远不做的事——这是系统提示里最重要的部分。
ALWAYS:
- 短段落,每段最多 3 句
- 用具体数字代替模糊表述(不要"许多"或"一些",给出具体数)
- 每个 section 加粗关键洞察,方便扫读
- 开头用 hook 创造读者已有认知与真相的落差
- 结尾用 CTA 制造紧迫感但不要过度推销
NEVER:
- 使用 "leverage" "utilize" "streamline"
- 任何句子以 "In today's" 或 "It's important to note" 开头
- 使用 em dash
- 写能套用到任何人的通用建议,每条都要具体可执行
- 加免责声明或"取决于"不立即跟具体依赖
约束就是强制车道。 每次你纠正 Claude 的输出,那个纠正就该变成一条规则。一个月后你的规则列表就是一台精密度极高的仪器。
3. 流程块(Process Block):告诉 Claude 怎么思考——不是产出什么,是怎么工作:
- 写任何东西之前,先用一段思考读者对这一话题已有的认知,你的开头必须挑战它
- 写出完整大纲,发给我审核通过后再写
- 一口气写完初稿,不自我审查
- 对照我的规则检查,修复违规
- 检查每个论断是否有具体数字或例子支撑
- 把自己当作手机滑动的忙人重读整篇,删掉任何让人停下来的部分
没有流程块,Claude 跳到输出;有流程块,Claude 走结构化工作流,质量稳定得多。 "把自己当作手机滑动的忙人重读"这一句对内容质量的提升比其他所有指令都大。
4. 输出格式块(Output Format Block):精确定义成品长什么样。
- 标题:[数字] + [Claude 相关话题] + [排除性 hook]
- 长度:2000-3500 字
- 结构:加粗对比开头(2 段)→ 背景 section → 编号主体内容 → 强结尾 CTA
- 子标题:加粗,写作让人想读下去的 hook
- 结尾:斜体一行 + 加粗斜体一行,使用"多数人会 X / 那些 Y 的人"对照结构
当 Claude 在开始前就知道精确格式,它会正确分配精力。没有格式块,细节会集中前段、结尾草草收场;有格式块,每段获得比例匹配的注意力。
5. 知识文件(Knowledge Files):让 Project 获得真正的智能。Claude 在每个对话里都会引用这些文件:
- 风格指南(必须):至少 3 篇你最好的作品,Claude 模式匹配你的声音。没有这个文件,Claude 用默认风格;有这个文件,Claude 用你的风格。
- 受众画像(必须):读者是谁、已经知道什么、什么让他们挫败、想达成什么、需要多深的技术。一页纸即可。
- 竞品分析(推荐):你不想重复的话题、过度使用的角度。上传你想"不一样于"的内容样本。
- 绩效数据(推荐):哪篇效果最好、什么标题最吸引人、什么话题有共鸣。Claude 用这些数据做更好的策略决策。
- 模板库(推荐):你最好的格式作为可复用模板。文章结构、邮件框架、报告布局。Claude 用这些作为起点框架,而不是每次从零发明结构。
6. 入职消息(Onboarding Message):在新对话里发的第一条消息。把它当作你给员工的每日简报。
今天我们要做 [任务]。
背景:[我需要什么以及为什么]
参考我的风格指南调声音,参考我的受众画像定目标,参考我的绩效数据做战略决策。
开始前告诉我:
- 什么角度能让这个内容从已存在的内容中脱颖而出?
- 读者已有的认知是什么,我们可以挑战什么?
- 一句话 hook 是什么?
一旦我批准角度,你继续写完整大纲。
这条消息激活所有五个知识文件、设定任务上下文、强制 Claude 战略思考后再写。没有它,Claude 立刻开始生成;有它,Claude 先计划再执行,效果更好。
五个 Projects 的最小集
不需要 20 个 Projects,5 个就够,每个处理一个核心工作流:
- 内容生产:写作声音、受众、内容标准的系统提示 + 风格指南、最佳作品、受众画像、内容日历
- 研究与分析:研究结构、信任来源、分析深度的系统提示 + 研究方法论、过往分析样本、评估标准
- 沟通:邮件和消息风格、专业语气、与不同受众关系的系统提示 + 优秀邮件样本、常见消息类型模板
- 策略与规划:商业背景、目标、约束、决策方式的系统提示 + 商业计划、竞品数据、市场研究、战略框架
- 代码与技术工作:技术栈、编码规范、架构偏好、质量标准的系统提示 + CLAUDE.md 内容、架构决策记录、首选模式的代码示例
Claude Code 的使用方式
Claude Code 和其他 AI Coding 工具的核心区别在于工作区深度:它不需要手动复制粘贴代码,而是直接在终端读写你的项目文件、运行命令、看输出,形成完整的任务闭环。
基础配置:
- CLAUDE.md 文件:在项目根目录写 CLAUDE.md,说明项目结构、常用命令、编码规范和禁止操作,让 Claude Code 每次进入项目都有完整上下文
- 任务粒度:一次任务聚焦一个清晰的目标,完成后验证,再进入下一个。避免一次性交代十个需求
- 人在关键节点:对于删除、发布、数据库操作等不可逆步骤,在任务描述里明确要求"执行前先告诉我将要做什么"
- 模型选择:日常开发用 Sonnet,遇到复杂架构问题或难以排查的 bug 切换 Opus 或开启 Extended Thinking
Plan-first 工作流:脑子里冒出想法后,第一反应永远不是写代码,而是写计划。一个想法、一个 bug 报告、一条终端报错,都先扔进 Claude Code,让它先出结构化的 plan.md(问题是什么、什么方案、动哪些文件、验收标准)。然后 Claude 按计划执行,拆任务、写代码、跑测试、逐条勾掉验收项。计划文件作为永远不会丢的存档点,新会话指向同一份计划就能继续。
传统开发是 80% 写代码、20% 规划,plan-first 把这个比例完全反过来。 思考发生在计划里,执行交给机器。计划写得越清楚,执行的效率就越高,返工的概率就越低。
并行会话:同时开四到六个终端窗口,每个跑一个独立会话。一个写计划,一个根据另一份计划构建代码,一个做调研,一个修 bug。每个窗口有独立上下文,避免单会话过长导致的注意力稀释。
为支持并行工作:
- 配置文件里放开所有权限确认,让每个会话完全自主运行
- 设置完成时播放提示音,听到声音回来看结果
- 编辑器每 500 毫秒自动保存,Claude 改了文件编辑器立刻可见
- 通过 Telegram 或 tmux 远程操控 Mac Mini 上的会话,会话跑在远端机器、笔记本只是窗口,飞机上 WiFi 断了再连上会话还在
语音输入:当接收方从一个死板的文字处理器变成一个能理解上下文的 AI,语音转录不需要完美——Claude 能猜出麦克风没听清的部分。说话、跑题、重新起头都无所谓。语音到 LLM 这种交互解锁了全新的人机协作方式:可以像跟同事说话一样跟 AI 交流,不用字斟句酌。
上下文复利:每一份写过的战略文档、每一个做过的技术决策、每一次积累的经验,如果都以结构化方式存下来,就会成为 AI 做下一次决策时的参考依据。时间越长,积累越多,AI 给出的建议就越精准。 这就是上下文的复利效应——前期看不出差别,但时间会放大差距。
费用策略:高强度使用 Opus 会话很快烧完套餐。可以并行使用不同模型订阅,让擅长思考的负责规划,让擅长执行的负责重度代码实现,互补组合而不是单一套餐过载。