Cloudflare Workers AI 使用指南
Cloudflare 不仅能加速网站,现在还能跑 AI。**Workers AI** 是 Cloudflare 推出的 Serverless AI 推理服务。它的惊人之处在于:代码运行在全球边缘节点,离用户最近,且**免费额度极高**。
5分钟
2025-12-26
部署运维服务器Cloudflare
Cloudflare Workers AI 使用指南
Cloudflare 不仅能加速网站,现在还能跑 AI。Workers AI 是 Cloudflare 推出的 Serverless AI 推理服务。它的惊人之处在于:代码运行在全球边缘节点,离用户最近,且免费额度极高。
1. 核心优势
- 真正的 Serverless:不需要买服务器,不需要装 Docker,写个 JS 函数就能跑 Llama 3。
- 全球边缘:你的 AI 跑在 Cloudflare 全球 300+ 个城市的数据中心,延迟极低。
- 免费额度:目前 Workers AI 每天提供约 10,000 个神经元(Neurons)的免费推理,对于个人开发者绰绰有余。
2. 部署流程
你需要安装 wrangler 命令行工具。
2.1 初始化
npm create cloudflare@latest my-ai-app
# 选择 "Hello World" Worker
cd my-ai-app
2.2 配置 AI Binding
修改 wrangler.toml 文件,添加 AI 绑定:
[ai]
binding = "AI"
2.3 编写代码 (Worker.js)
import { Ai } from '@cloudflare/ai';
export default {
async fetch(request, env) {
const ai = new Ai(env.AI);
const response = await ai.run('@cf/meta/llama-3-8b-instruct', {
messages: [
{ role: 'system', content: '你是我的 AI 助手' },
{ role: 'user', content: '给我讲个笑话' }
]
}
);
return new Response(JSON.stringify(response));
},
};
2.4 本地测试与发布
# 远程调试(因为需要连接 CF 的 GPU)
npx wrangler dev --remote
# 发布到全球
npx wrangler deploy
3. 支持的模型
Cloudflare 托管了很多热门模型,不需要你上传权重:
- 文本:
@cf/meta/llama-3-8b-instruct - 语音:
@cf/openai/whisper - 生图:
@cf/stabilityai/stable-diffusion-xl-base-1.0
如果你想做一个低成本、高可用的 AI 小程序(如翻译插件、每日摘要 Bot),Cloudflare Workers AI 是目前最优雅的架构选择。