🏷️ 分类: 技术 人工智能
🔖 标签: #大语言模型 #LLM #AI工具 #深度学习 #自然语言处理

我是如何使用大语言模型

一份从入门到精通的实战应用指南,揭示LLM在日常与工作中的真正潜力。

百花齐放的LLM生态系统

从行业巨头到创新新星,众多模型共同构成了丰富多样的选择。

ChatGPT

OpenAI (行业标杆)

Gemini

Google

Claude

Anthropic

Grok

xAI

Copilot

Microsoft

Meta AI

Meta

DeepSeek

深度求索

Le Chat

Mistral AI

核心揭秘:LLM如何“思考”?

理解两个核心阶段与一个关键概念,是高效使用的第一步。

LLM的构成

🧠

预训练 (Pre-training) = 知识

将海量互联网数据压缩成一个庞大的神经网络,形成关于世界的广泛知识。这是模型的知识基础,但有“知识截止日期”。

+
😊

后训练 (Post-training) = 人格

通过高质量的对话数据进行微调,让模型学会以“乐于助人的助手”身份进行交流。这是模型的沟通风格。

核心交互:共建上下文窗口

用户提问

写一首关于LLM的俳句

Token化

一首 关于 LLM...

模型回应

词语如溪流,无尽回响...

整个对话都被装在一个叫做上下文窗口 (Context Window) 的“工作记忆”中,模型基于其中的所有内容进行回应。

能力阶梯:从基础到高阶的应用光谱

掌握不同层级的能力,才能在各种场景下游刃有余。

基础层:知识问询与文本创作

LLM是出色的“知道分子”和“笔杆子”,但需要甄别信息。

✅ 适用场景

  • 常见、非时效性知识(一杯美式咖啡因含量?)
  • 文本创作与润色(写诗、邮件、简历)
  • 头脑风暴与旅行建议

⚠️ 注意事项

  • 对高风险领域(医疗、金融)信息进行事实核查
  • 模型可能“幻觉”,编造不存在的事实
  • 及时开启新对话,保持上下文窗口的“清洁”

进阶层:“思考模式”与深度研究

通过强化学习,模型学会了“三思而后行”,能处理更复杂的问题。

开启“思考模式” (Thinking Mode)

对于复杂的数学、编程和推理问题,开启此模式能显著提升准确率。模型会花费更长时间(数分钟)进行“内心独白”式的推理。

执行“深度研究” (Deep Research)

结合“思考”与“搜索”,模型能用10-20分钟为你生成一份带引用的深度研究报告,适合产品对比、主题探索等任务。

复杂编程问题

思考模式:开启

模型正在分析代码... 检查依赖... 回溯假设... 耗时约1分钟

✅ 问题已解决

高级层:集成工具,释放全部潜能

让LLM连接外部世界和应用,能力呈指数级增长。

🌐

互联网搜索

获取最新资讯

📄

文件上传

分析PDF/文档

📈

数据分析

执行代码与绘图

</>

代码/应用生成

构建网站与工具

示例:使用数据分析工具绘制OpenAI估值增长趋势图

维度拓展:超越文本的多模态交互

LLM的感官正在被打开,你可以通过语音、图像甚至视频与它交流。

🎙️

音频 Audio

通过语音直接对话,模型能理解语气和情感,甚至能为你生成定制化的播客。

🖼️

图像 Image

上传图片让模型分析(营养成分表、血检报告),或让它为你生成独特的艺术作品。

🎥

视频 Video

通过手机摄像头实时分析所见之物,或根据一句话生成一段电影级短片。

终极形态:打造你的专属AI助理

通过个性化设置,让通用模型进化为真正懂你的私人助理。

记忆 (Memory)

让模型记住你的个人偏好、背景信息和常用习惯,使未来的对话更具相关性。

自定义指令 (Custom Instructions)

设定全局规则,定义你希望模型扮演的角色、回答风格和输出格式,一劳永逸。

自定义GPTs (Custom GPTs)

将常用的、复杂的指令流程封装成一个独立的“应用”,一键调用,极大提升特定任务的效率。

总结:我的LLM使用心法

1

明辨模型:了解你正在使用的模型及其能力和价格,为不同任务选择合适的“大脑”。

2

善用思考:当遇到难题时,果断切换到“思考模式”,用时间换取更高的准确性。

3

拥抱工具:别让模型“闭门造车”。大胆使用搜索、数据分析和文件上传等工具,拓展其能力边界。

4

持续个性化:利用记忆、自定义指令和GPTs,将通用模型调教成独一无二的、最高效的个人伙伴。