大模型 API 是怎么回事
要造 AI 产品,第一个必须搞懂的概念就是 API——你的程序就是通过它来"使唤"大模型的。这一讲不堆术语,把原理讲到你能用大白话复述出来。
设想一下:你在对话框里跟 AI 聊天,是"人"在用它。但这个翻译应用得让"程序"自动去用它——用户提交一段文字,程序在后台把这段文字发给大模型、拿回译文。程序和大模型之间这条"打电话"的通道,就是 API。
API 是什么:一句话版本
API 就是一个程序向另一个服务"下单"的标准方式。你按规定的格式发去一个请求(request),对方按规定的格式返回一个结果(response)。点外卖时你按菜单格式下单、商家按订单出餐——API 就是程序世界的"菜单 + 下单 + 出餐"。
一次大模型 API 调用,到底发生了什么
| 环节 | 内容 |
|---|---|
| ① 你发过去 | 你的 提示词(prompt) + 一些设置(用哪个模型、温度等)+ 你的 API Key(身份凭证) |
| ② 模型处理 | 模型读入你的文字,生成回应 |
| ③ 给你返回 | 生成的文本结果 + 用量信息(花了多少 token) |
关键概念:token(令牌)
模型不是按"字数"算,而是按 token 算。token 是文本被切成的小块,大致:英文里约几个字符一个 token,中文里约一个字一两个 token。你发进去的(输入)和它吐出来的(输出)都按 token 计费。这就是为什么"prompt 写得越长、让它输出越多,越贵"。
钱花在哪:成本的基本盘
每次调用的成本 ≈ 输入 token × 输入单价 + 输出 token × 输出单价。所以造产品时,控制成本的两个抓手就是:① 别把无用的内容塞进 prompt(省输入);② 让它只输出你要的、别长篇大论(省输出)。不同模型单价差很多——这是下一讲"选型"的关键变量。
几个你会反复遇到的设置
- model:用哪个模型(决定能力、速度、价格)。
- system prompt(系统提示):给模型设定的"工作守则/角色",对整段对话生效(第 4 讲细讲)。
- temperature(温度):控制随机性。低=稳定、可复现(适合翻译、抽取这类要准的任务);高=有创意、有变化(适合头脑风暴、文案)。
- max tokens:限制最多输出多少,防止它失控狂写、也是控成本的闸。
跟我做一遍:第一次"用程序"调用大模型
不用你写代码——让 Claude Code 带你跑通第一个调用,并把原理对照着看。
第一步 · 准备 API Key(身份凭证)
到你要用的大模型平台申请一个 API Key。它就像你的"消费账号 + 密码",千万别外泄、别写死在代码里(第 10 讲讲安全保管)。
第二步 · 让 Claude Code 跑通最小调用
复制
我想第一次用程序调用大模型 API,做个最小验证。
帮我写一个最简单的脚本:发一句"把'你好'翻译成英文"给模型,打印返回结果,
同时打印这次用了多少输入/输出 token。
API Key 我会用环境变量传入,不要写死在代码里。先跑给我看。
第三步 · 改设置,观察变化(理解原理)
动手感受 temperature / 输出长度
把 temperature 调到 0 再跑三次,看结果是否每次都一样;
再调到 1 跑三次,看是否有变化。
然后给我解释:为什么翻译这种任务适合用低 temperature。
✓ 你刚刚搞懂的
一次 API 调用 = 带着凭证,把 prompt+设置发过去,拿回文本+用量。你还亲眼看到了 temperature 对稳定性的影响、token 怎么计量。这些原理,是后面选型、调优、控成本的地基。
⚠ API Key 是钱和责任
API Key 一旦泄露,别人能拿你的额度疯狂消费,甚至产生大额账单。绝不写进代码、不上传到公开仓库、用环境变量或密钥管理来存。这是造产品的第一条安全纪律。
这一讲记住什么
- API = 程序向大模型"下单"的标准方式:发 prompt+设置,收文本+用量。
- 计费按 token:输入和输出都算钱,prompt 越长、输出越多越贵。
- 关键设置:model、system prompt、temperature、max tokens。
- API Key 是钱和责任,绝不外泄、不写死在代码里。