首页 / CC成长营 / Claude Code 实战 · 第 2 讲

大模型 API 是怎么回事

要造 AI 产品，第一个必须搞懂的概念就是 API——你的程序就是通过它来"使唤"大模型的。这一讲不堆术语，把原理讲到你能用大白话复述出来。

设想一下：你在对话框里跟 AI 聊天，是"人"在用它。但这个翻译应用得让"程序"自动去用它——用户提交一段文字，程序在后台把这段文字发给大模型、拿回译文。程序和大模型之间这条"打电话"的通道，就是 API。

API 是什么：一句话版本

API 就是一个程序向另一个服务"下单"的标准方式。你按规定的格式发去一个请求（request），对方按规定的格式返回一个结果（response）。点外卖时你按菜单格式下单、商家按订单出餐——API 就是程序世界的"菜单 + 下单 + 出餐"。

一次大模型 API 调用，到底发生了什么

环节	内容
① 你发过去	你的提示词（prompt） + 一些设置（用哪个模型、温度等）+ 你的 API Key（身份凭证）
② 模型处理	模型读入你的文字，生成回应
③ 给你返回	生成的文本结果 + 用量信息（花了多少 token）

关键概念：token（令牌）

模型不是按"字数"算，而是按 token 算。token 是文本被切成的小块，大致：英文里约几个字符一个 token，中文里约一个字一两个 token。你发进去的（输入）和它吐出来的（输出）都按 token 计费。这就是为什么"prompt 写得越长、让它输出越多，越贵"。

钱花在哪：成本的基本盘 每次调用的成本 ≈ 输入 token × 输入单价 + 输出 token × 输出单价。所以造产品时，控制成本的两个抓手就是：① 别把无用的内容塞进 prompt（省输入）；② 让它只输出你要的、别长篇大论（省输出）。不同模型单价差很多——这是下一讲"选型"的关键变量。

几个你会反复遇到的设置

model：用哪个模型（决定能力、速度、价格）。
system prompt（系统提示）：给模型设定的"工作守则/角色"，对整段对话生效（第 4 讲细讲）。
temperature（温度）：控制随机性。低=稳定、可复现（适合翻译、抽取这类要准的任务）；高=有创意、有变化（适合头脑风暴、文案）。
max tokens：限制最多输出多少，防止它失控狂写、也是控成本的闸。

跟我做一遍：第一次"用程序"调用大模型

不用你写代码——让 Claude Code 带你跑通第一个调用，并把原理对照着看。

第一步 · 准备 API Key（身份凭证）

到你要用的大模型平台申请一个 API Key。它就像你的"消费账号 + 密码"，千万别外泄、别写死在代码里（第 10 讲讲安全保管）。

第二步 · 让 Claude Code 跑通最小调用

复制

我想第一次用程序调用大模型 API，做个最小验证。
帮我写一个最简单的脚本：发一句"把'你好'翻译成英文"给模型，打印返回结果，
同时打印这次用了多少输入/输出 token。
API Key 我会用环境变量传入，不要写死在代码里。先跑给我看。

第三步 · 改设置，观察变化（理解原理）

动手感受 temperature / 输出长度

把 temperature 调到 0 再跑三次，看结果是否每次都一样；
再调到 1 跑三次，看是否有变化。
然后给我解释：为什么翻译这种任务适合用低 temperature。

✓ 你刚刚搞懂的 一次 API 调用 = 带着凭证，把 prompt+设置发过去，拿回文本+用量。你还亲眼看到了 temperature 对稳定性的影响、token 怎么计量。这些原理，是后面选型、调优、控成本的地基。

⚠ API Key 是钱和责任 API Key 一旦泄露，别人能拿你的额度疯狂消费，甚至产生大额账单。绝不写进代码、不上传到公开仓库、用环境变量或密钥管理来存。这是造产品的第一条安全纪律。

这一讲记住什么

API = 程序向大模型"下单"的标准方式：发 prompt+设置，收文本+用量。
计费按 token：输入和输出都算钱，prompt 越长、输出越多越贵。
关键设置：model、system prompt、temperature、max tokens。
API Key 是钱和责任，绝不外泄、不写死在代码里。

← 上一讲从「用 AI」到「造 AI 产品」下一讲 →模型选型：没有最好，只有最合适