Context Engineering: Kỹ Thuật Phân Tách AI Agent Giỏi Khỏi Agent Xuất Sắc
Khám phá Agent Skills for Context Engineering — bộ công cụ mã nguồn mở được viện dẫn trong nghiên cứu học thuật, dạy bạn cách quản lý context window như một kỹ sư AI chuyên nghiệp.
Bạn đã nghe về prompt engineering. Nhưng những kỹ sư đang triển khai AI agent cho production vào năm 2025 lại đang nói về điều gì đó sâu hơn: context engineering.
Repository Agent-Skills-for-Context-Engineering của Muratcan Koylan là một bộ sưu tập mở toàn diện các Agent Skill có cấu trúc — đã được viện dẫn trong nghiên cứu học thuật từ Đại học Bắc Kinh — dạy nghệ thuật và khoa học của việc quản lý những gì đưa vào context window của mô hình để tối đa hóa hiệu quả của agent.
Phần 1: Nền Tảng — Mô Hình Tư Duy
Prompt Engineering vs. Context Engineering
Hầu hết developer dừng lại ở prompt engineering: viết hướng dẫn thông minh để định hướng hành vi của mô hình. Điều đó cần thiết, nhưng chỉ là một mảnh ghép.
Context engineering là kỷ luật quản lý tất cả mọi thứ mà language model có thể chú ý đến tại thời điểm inference:
- System prompts
- Định nghĩa tool
- Tài liệu được truy xuất
- Lịch sử hội thoại
- Kết quả tool outputs
Giới hạn cơ bản không phải là dung lượng token thô — mà là cơ chế attention. Khi độ dài context tăng, mô hình thể hiện các mẫu xuống cấp có thể dự đoán được: hiện tượng “lạc giữa đường”, đường cong attention hình chữ U, và sự khan hiếm attention. Mục tiêu là tìm tập hợp token có tín hiệu cao nhỏ nhất tối đa hóa xác suất đạt được kết quả mong muốn.
Hãy nghĩ context window của mô hình như bảng điều tra của thám tử. Một thám tử giỏi không ghim mọi mẩu báo lên bảng — họ chỉ chọn lọc những bằng chứng quan trọng nhất. Context engineering chính là nghệ thuật làm trợ lý cho người thám tử đó.
Agent Skill là gì?
Repository này triển khai đặc tả Agent Skills — một cách có cấu trúc để đóng gói hướng dẫn cho AI agent. Mỗi skill tuân theo định dạng chuẩn:
skill-name/
├── SKILL.md # Bắt buộc: hướng dẫn + metadata
├── scripts/ # Tùy chọn: code thực thi
└── references/ # Tùy chọn: tài liệu bổ sung
Thiết kế tuân theo progressive disclosure (tiết lộ dần dần): khi khởi động, agent chỉ tải tên và mô tả skill. Nội dung đầy đủ chỉ tải khi skill được kích hoạt cho task liên quan. Điều này giữ cho agent nhanh trong khi vẫn có thể truy cập chuyên môn sâu khi cần.
Phần 2: Khảo Sát — Kiến Trúc Skill
13 Skill Trên 5 Danh Mục
Bộ sưu tập tổ chức 13 skill thành một lộ trình học tập mạch lạc:
| Danh mục | Các Skills |
|---|---|
| Nền tảng | context-fundamentals, context-degradation, context-compression |
| Kiến trúc | multi-agent-patterns, memory-systems, tool-design, filesystem-context, hosted-agents |
| Vận hành | context-optimization, evaluation, advanced-evaluation |
| Phát triển | project-development |
| Nhận thức | bdi-mental-states |
Tích Hợp Plugin Claude Code
Điều khiến bộ sưu tập này độc đáo là tích hợp trực tiếp với marketplace plugin của Claude Code:
# Đăng ký marketplace
/plugin marketplace add muratcankoylan/Agent-Skills-for-Context-Engineering
# Cài đặt các gói plugin cụ thể
/plugin install context-engineering-fundamentals@context-engineering-marketplace
/plugin install agent-architecture@context-engineering-marketplace
/plugin install agent-evaluation@context-engineering-marketplace
Skill tự động kích hoạt dựa trên ngữ cảnh task — không cần cấu hình thủ công.
Phần 3: Phân Tích — Thực Sự Làm Được Gì Cho Developer
3.1 Giải Phẫu Context (từ context-fundamentals)
Skill context-fundamentals phân tích những gì thực sự tồn tại trong context của mô hình:
| Thành phần | Đặc điểm |
|---|---|
| System prompts | Tải một lần, tồn tại suốt session |
| Định nghĩa tool | Được serialize gần đầu context; mô tả định hướng hành vi |
| Tài liệu truy xuất | Tải theo just-in-time qua RAG |
| Lịch sử tin nhắn | Tăng tuyến tính; chiếm ưu thế trong các task chạy dài |
| Tool outputs | Có thể đạt tới 83,9% tổng context trong các agent trajectory |
Insight chính: context phải được coi là tài nguyên hữu hạn với lợi nhuận cận biên giảm dần. Mỗi token mới làm cạn kiệt ngân sách attention.
Ví dụ thực tế — tổ chức system prompt với ranh giới phần rõ ràng:
<BACKGROUND_INFORMATION>
Bạn là chuyên gia Python hỗ trợ team phát triển.
Dự án hiện tại: Pipeline xử lý dữ liệu bằng Python 3.9+
</BACKGROUND_INFORMATION>
<INSTRUCTIONS>
- Viết code Python sạch, đúng idiom
- Bao gồm type hints cho function signatures
- Thêm docstrings cho public functions
</INSTRUCTIONS>
<TOOL_GUIDANCE>
Dùng bash cho shell operations, python cho code tasks.
File operations nên dùng pathlib để đảm bảo đa nền tảng.
</TOOL_GUIDANCE>
3.2 Các Mẫu Xuống Cấp Context (từ context-degradation)
Đây là nơi mọi thứ trở nên hấp dẫn về mặt thực nghiệm. Skill ghi lại 5 chế độ hỏng hóc riêng biệt:
1. Lạc Giữa Đường (Lost-in-the-Middle) — Thông tin ở giữa context nhận được độ chính xác thu hồi thấp hơn 10-40% so với thông tin ở đầu hoặc cuối. Đây không phải lỗi; đây là hệ quả của cơ chế attention.
2. Đầu Độc Context (Context Poisoning) — Một ảo giác hoặc kết quả tool sai lầm đi vào context và nhân lên qua các tham chiếu lặp đi lặp lại. Khôi phục đòi hỏi cắt bỏ context đến trước điểm bị đầu độc.
3. Phân Tâm Context (Context Distraction) — Ngay cả một tài liệu không liên quan cũng giảm hiệu suất. Hiệu ứng không tỷ lệ; nó là hàm bước nhảy.
4. Nhầm Lẫn Context (Context Confusion) — Khi context chứa nhiều loại task, mô hình có thể áp dụng ràng buộc từ task sai.
5. Xung Đột Context (Context Clash) — Nhiều thông tin chính xác nhưng mâu thuẫn nhau tạo ra hướng dẫn trái chiều.
Ngưỡng xuống cấp theo model (từ dữ liệu tham khảo của skill):
| Model | Xuống cấp bắt đầu | Xuống cấp nặng |
|---|---|---|
| GPT-5.2 | ~64K tokens | ~200K tokens |
| Claude Opus 4.5 | ~100K tokens | ~180K tokens |
| Claude Sonnet 4.5 | ~80K tokens | ~150K tokens |
| Gemini 3 Pro | ~500K tokens | ~800K tokens |
Giảm thiểu thực tế — chiến lược Four-Bucket:
# Write: lưu context ra ngoài cửa sổ
scratchpad: "Ghi kết quả trung gian vào filesystem"
# Select: chỉ kéo context liên quan vào
retrieval: "Lọc tài liệu trước khi tải"
# Compress: giảm token nhưng giữ thông tin
summarization: "Thay thế output dài dòng bằng tham chiếu ngắn gọn"
# Isolate: chia cho sub-agent
partition: "Cho mỗi agent một context mới mẻ, tập trung"
3.3 Multi-Agent Patterns (từ multi-agent-patterns)
Skill multi-agent tiết lộ một insight quan trọng: sub-agent tồn tại chủ yếu để cô lập context, không phải để mô phỏng cơ cấu tổ chức.
Thực tế kinh tế token:
| Kiến trúc | Hệ số nhân Token |
|---|---|
| Chat với single agent | 1× |
| Single agent có tools | ~4× |
| Hệ thống multi-agent | ~15× |
Mặc dù chi phí cao hơn, cách tiếp cận multi-agent mở khóa khả năng song song hóa. Nghiên cứu về đánh giá BrowseComp cho thấy lượng token sử dụng giải thích 80% phương sai hiệu suất — xác nhận rằng phân phối công việc qua các agent với context window riêng biệt xứng đáng với chi phí bỏ ra.
Vấn Đề Trò Chơi Điện Thoại — một cạm bẫy nghiêm trọng trong kiến trúc supervisor:
Benchmark LangGraph phát hiện kiến trúc supervisor ban đầu hoạt động kém hơn 50% so với phiên bản tối ưu vì supervisor diễn giải lại phản hồi của sub-agent một cách sai lệch. Giải pháp là tool forward_message:
def forward_message(message: str, to_user: bool = True):
"""
Chuyển tiếp phản hồi sub-agent trực tiếp đến user mà không qua tổng hợp của supervisor.
Dùng khi:
- Phản hồi sub-agent đã hoàn chỉnh
- Supervisor tổng hợp sẽ mất chi tiết quan trọng
- Định dạng phản hồi phải được giữ nguyên
"""
if to_user:
return {"type": "direct_response", "content": message}
return {"type": "supervisor_input", "content": message}
3.4 Các Ví Dụ Thực Tế Được Đính Kèm
Repo đi kèm 5 ví dụ cấp production thể hiện cách các skill kết hợp trong thực tế:
| Ví dụ | Minh họa gì |
|---|---|
digital-brain-skill | Hệ điều hành cá nhân cho founder — 6 module, 4 automation script, bộ nhớ JSONL ghi một chiều |
x-to-book-system | Pipeline multi-agent theo dõi tài khoản X → tạo sách tổng hợp hàng ngày |
llm-as-judge-skills | Công cụ đánh giá LLM bằng TypeScript — 19 test pass, so sánh theo cặp, giảm thiểu bias |
book-sft-pipeline | Fine-tune mô hình 8B theo phong cách bất kỳ tác giả với tổng chi phí 2 USD |
interleaved_thinking | Minh họa kiến trúc nhận thức |
Phần 4: Giải Pháp — Cách Sử Dụng
Cho Người Dùng Claude Code
Con đường nhanh nhất:
# 1. Đăng ký marketplace
/plugin marketplace add muratcankoylan/Agent-Skills-for-Context-Engineering
# 2. Cài đặt gói bạn cần
/plugin install context-engineering-fundamentals@context-engineering-marketplace
# Bao gồm: context-fundamentals, context-degradation, context-compression, context-optimization
Skill tự kích hoạt khi bạn dùng các cụm từ kích hoạt:
| Cụm từ kích hoạt | Skill được kích hoạt |
|---|---|
| ”compress context” | context-compression |
| ”implement LLM-as-judge” | advanced-evaluation |
| ”design multi-agent system” | multi-agent-patterns |
| ”build background agent” | hosted-agents |
Cho Cursor / Codex / IDE Bất Kỳ
Copy nội dung SKILL.md liên quan vào file .rules hoặc thư mục hướng dẫn dự án của bạn. Các skill được thiết kế không phụ thuộc nền tảng một cách có chủ ý.
Lộ Trình Học Tập Được Khuyến Nghị
- Bắt đầu với
context-fundamentals— xây dựng mental model - Học
context-degradation— hiểu cách mọi thứ sai lệch - Áp dụng
context-compressionvàcontext-optimization— phòng ngừa vấn đề - Mở rộng sang các skill kiến trúc theo nhu cầu hệ thống của bạn
Mental Model Cuối Cùng
Tóm tắt Context Engineering
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
LÀ GÌ: Bộ sưu tập có cấu trúc gồm 13 agent skill để xây dựng
hệ thống AI cấp production qua quản lý context
TẠI SAO: Context window có giới hạn. Attention khan hiếm.
Nhiều token hơn ≠ hiệu suất tốt hơn.
THẾ NÀO: Progressive disclosure + Chiến lược Four-Bucket
(Write → Select → Compress → Isolate)
INSIGHT CHÍNH:
Sub-agent tồn tại để cô lập context, không phải mô phỏng sơ đồ tổ chức.
Đặt thông tin quan trọng ở ĐẦU hoặc CUỐI context, không bao giờ ở giữa.
Chỉ một tài liệu không liên quan cũng làm giảm hiệu suất rõ rệt.
TÁC ĐỘNG:
Được viện dẫn trong nghiên cứu Đại học Bắc Kinh về agentic skill evolution.
13 skill bao phủ từ nền tảng → kiến trúc → vận hành.
5 ví dụ production hoàn chỉnh với code thực.
NỀN TẢNG: Claude Code · Cursor · Codex · Mọi agent framework
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
Dù bạn đang xây dựng AI agent đầu tiên hay tối ưu hóa hệ thống multi-agent cho production, bộ sưu tập này cung cấp từ vựng, mental model, và các pattern cụ thể để thực hiện context engineering đúng cách.
Repository: Agent-Skills-for-Context-Engineering
Tác giả: Muratcan Koylan
Bài viết liên quan
-
Bên Trong Hộp Đen: Những System Prompt Bị Rò Rỉ Tiết Lộ Gì Về Cách Các AI Tool Thực Sự Hoạt Động
Phân tích chuyên sâu bộ sưu tập system prompt bị rò rỉ lớn nhất từ Cursor, Manus, Windsurf, Devin, v0 và hơn 30 công cụ AI khác — khám phá kiến trúc cốt lõi, thiết kế công cụ và triết lý agent của chúng.
-
Superpowers: Quy Trình Dạy Agents AI Thành Người Kỉ Luật
Superpowers bắt agents chậm lại, hỏi câu hỏi, viết kế hoạch, test trước. Kết quả: code chậm hơn lúc đầu, nhưng lại đáng tin cậy hơn nhiều.
-
BitNet: Kỷ nguyên LLM 1-bit Cuối cùng đã Bắt đầu
Khám phá bitnet.cpp, framework chính thức của Microsoft dành cho các LLM 1-bit, giúp thay thế phép nhân bằng phép cộng để tăng tốc độ xử lý vượt trội.
-
Khoj: Bộ Não AI Thứ Hai Mã Nguồn Mở Mà Bạn Có Thể Tự Cài
Khoj là ứng dụng AI cá nhân mã nguồn mở đóng vai trò như bộ não thứ hai của bạn — chat với bất kỳ LLM nào, tìm kiếm tài liệu bằng AI ngữ nghĩa, tạo agent tùy chỉnh, và tự cài đặt hoàn toàn trên máy của mình.