我是如何使用大语言模型的

一份从入门到精通的实战应用指南，揭示LLM在日常与工作中的真正潜力。

百花齐放的LLM生态系统

从行业巨头到创新新星，众多模型共同构成了丰富多样的选择。

ChatGPT

OpenAI (行业标杆)

Gemini

Google

Claude

Anthropic

Grok

xAI

Copilot

Microsoft

Meta AI

核心揭秘：LLM如何“思考”？

理解两个核心阶段与一个关键概念，是高效使用的第一步。

LLM的构成

🧠

预训练 (Pre-training) = 知识

将海量互联网数据压缩成一个庞大的神经网络，形成关于世界的广泛知识。这是模型的知识基础，但有“知识截止日期”。

😊

后训练 (Post-training) = 人格

通过高质量的对话数据进行微调，让模型学会以“乐于助人的助手”身份进行交流。这是模型的沟通风格。

核心交互：共建上下文窗口

用户提问

写一首关于LLM的俳句

↓

Token化

写一首关于 LLM...

↓

模型回应

词语如溪流，无尽回响...

整个对话都被装在一个叫做上下文窗口 (Context Window) 的“工作记忆”中，模型基于其中的所有内容进行回应。

能力阶梯：从基础到高阶的应用光谱

掌握不同层级的能力，才能在各种场景下游刃有余。

基础层：知识问询与文本创作

LLM是出色的“知道分子”和“笔杆子”，但需要甄别信息。

✅ 适用场景

常见、非时效性知识（一杯美式咖啡因含量？）
文本创作与润色（写诗、邮件、简历）
头脑风暴与旅行建议

⚠️ 注意事项

对高风险领域（医疗、金融）信息进行事实核查
模型可能“幻觉”，编造不存在的事实
及时开启新对话，保持上下文窗口的“清洁”

进阶层：“思考模式”与深度研究

通过强化学习，模型学会了“三思而后行”，能处理更复杂的问题。

开启“思考模式” (Thinking Mode)

对于复杂的数学、编程和推理问题，开启此模式能显著提升准确率。模型会花费更长时间（数分钟）进行“内心独白”式的推理。

执行“深度研究” (Deep Research)

结合“思考”与“搜索”，模型能用10-20分钟为你生成一份带引用的深度研究报告，适合产品对比、主题探索等任务。

复杂编程问题

思考模式：开启

模型正在分析代码... 检查依赖... 回溯假设... 耗时约1分钟

✅ 问题已解决

高级层：集成工具，释放全部潜能

让LLM连接外部世界和应用，能力呈指数级增长。

🌐

互联网搜索

获取最新资讯

📄

文件上传

分析PDF/文档

📈

数据分析

执行代码与绘图

</>

代码/应用生成

构建网站与工具

示例：使用数据分析工具绘制OpenAI估值增长趋势图

维度拓展：超越文本的多模态交互

LLM的感官正在被打开，你可以通过语音、图像甚至视频与它交流。

🎙️

音频 Audio

通过语音直接对话，模型能理解语气和情感，甚至能为你生成定制化的播客。

🖼️

图像 Image

上传图片让模型分析（营养成分表、血检报告），或让它为你生成独特的艺术作品。

🎥

视频 Video

通过手机摄像头实时分析所见之物，或根据一句话生成一段电影级短片。

终极形态：打造你的专属AI助理

通过个性化设置，让通用模型进化为真正懂你的私人助理。

记忆 (Memory)

让模型记住你的个人偏好、背景信息和常用习惯，使未来的对话更具相关性。

自定义指令 (Custom Instructions)

设定全局规则，定义你希望模型扮演的角色、回答风格和输出格式，一劳永逸。

自定义GPTs (Custom GPTs)

将常用的、复杂的指令流程封装成一个独立的“应用”，一键调用，极大提升特定任务的效率。

总结：我的LLM使用心法

明辨模型：了解你正在使用的模型及其能力和价格，为不同任务选择合适的“大脑”。

善用思考：当遇到难题时，果断切换到“思考模式”，用时间换取更高的准确性。

拥抱工具：别让模型“闭门造车”。大胆使用搜索、数据分析和文件上传等工具，拓展其能力边界。

持续个性化：利用记忆、自定义指令和GPTs，将通用模型调教成独一无二的、最高效的个人伙伴。