Hello-Agents: Cách Datawhale Hướng Dẫn Bạn Xây Dựng Agent AI Cấp Sản Xuất Từ Con Số Không

GitHub Stars: 45,600+ | Tăng trưởng hàng ngày: 1,162 stars | Forks: 5,500+ | Repository: datawhalechina/hello-agents

Năm 2025 được công nhận rộng rãi là “Năm của Agent AI.” Từ Operator của OpenAI đến giao thức A2A của Google, từ MCP của Anthropic đến UI-TARS của ByteDance, toàn bộ ngành công nghệ đang chuyển mình sang các hệ thống thông minh tự chủ có khả năng nhận thức, lập kế hoạch và hành động thay mặt người dùng. Tuy nhiên đối với hầu hết các lập trình viên, khoảng cách giữa việc sử dụng chatbot và xây dựng một agent thực thụ vẫn còn rất lớn. Trong bối cảnh đó, Hello-Agents đã ra đời — một dự án giáo dục từ cộng đồng Datawhale nổi tiếng của Trung Quốc, đã đạt được hơn 45,600 sao trên GitHub và trở thành điểm khởi đầu uy tín nhất cho bất kỳ ai muốn chuyển đổi từ “người dùng mô hình lớn” sang “người xây dựng hệ thống agent.”

Khác với các bài viết kỹ thuật rời rạc hoặc tài liệu framework giả định bạn đã có kiến thức nền tảng, Hello-Agents cung cấp một chương trình giảng dạy hoàn chỉnh gồm 16 chương, bao gồm lý thuyết nền tảng về agent, các mô hình kinh điển, nền tảng low-code, framework chuyên nghiệp, hệ thống bộ nhớ nâng cao, giao thức truyền thông, học tăng cường và các dự án thực tế tổng hợp. Mỗi chương đều có mã nguồn có thể chạy được, và toàn bộ nội dung được cung cấp miễn phí dưới dạng sách trực tuyến, tài liệu cục bộ và PDF có thể tải xuống.

Trong bài đánh giá chuyên sâu này, chúng ta sẽ khám phá điều gì làm cho Hello-Agents trở thành tài nguyên giáo dục agent có giá trị nhất trên GitHub hiện nay, cách chương trình giảng dạy có cấu trúc của nó đẩy nhanh hành trình của bạn từ người mới bắt đầu đến nhà phát triển agent cấp sản xuất, và tại sao sự kết hợp giữa lý thuyết, lập trình thực hành và dự án thực tế tạo ra một trải nghiệm học tập mà không trại huấn luyện trả phí nào có thể sánh bằng.


Hello-Agents là gì?

Hello-Agents là một hướng dẫn mã nguồn mở có hệ thống để xây dựng agent AI từ đầu, được tạo ra bởi cộng đồng Datawhale — một trong những tổ chức giáo dục AI mã nguồn mở có ảnh hưởng nhất tại Trung Quốc. Dự án được phát hành theo giấy phép Apache 2.0 và lưu trữ trên GitHub tại repository datawhalechina/hello-agents.

Hướng dẫn này chính xác lấp đầy một khoảng trống thị trường quan trọng: mặc dù có vô số bài giới thiệu về cách sử dụng ChatGPT và rất nhiều tệp README framework, nhưng hầu như không có tài nguyên nào dạy một cách có hệ thống cách agent thực sự hoạt động bên trong — từ kiến trúc Transformer điều khiển chúng, đến các mô hình suy luận hướng dẫn chúng, đến các giao thức truyền thông kết nối chúng, và đến học tăng cường huấn luyện chúng.

Hello-Agents lấp đầy khoảng trống này thông qua năm phần chính:

  1. Nền tảng Agent & Mô hình ngôn ngữ lớn — Hiểu agent là gì, lịch sử của chúng, và các mô hình ngôn ngữ điều khiển chúng
  2. Xây dựng Agent LLM đầu tiên của bạn — Triển khai các mô hình kinh điển, sử dụng nền tảng low-code, làm việc với framework chuyên nghiệp
  3. Mở rộng kiến thức nâng cao — Hệ thống bộ nhớ, kỹ thuật ngữ cảnh, giao thức agent, Agentic RL và đánh giá
  4. Nghiên cứu tổng hợp nâng cao — Trợ lý du lịch thông minh, agent DeepResearch, mô phỏng thị trấn ảo
  5. Đồ án tốt nghiệp & Triển vọng tương lai — Xây dựng ứng dụng thông minh hoàn chỉnh từ đầu đến cuối

Chương trình giảng dạy cốt lõi: Lộ trình học tập 16 chương

Trái tim của Hello-Agents là chương trình giảng dạy gồm 16 chương được thiết kế tỉ mỉ, nhằm đưa một lập trình viên từ kiến thức zero đến khả năng xây dựng và triển khai các hệ thống agent cấp sản xuất.

Phần 1: Nền tảng Agent & Mô hình ngôn ngữ lớn

Chương 1: Lần đầu làm quen với Agent Chương này thiết lập nền tảng khái niệm. Nó định nghĩa agent AI là gì (một hệ thống tự chủ có thể nhận thức môi trường, đưa ra quyết định và thực hiện hành động để đạt được mục tiêu), truy ngược sự tiến hóa từ AI biểu tượng đến agent được điều khiển bởi mô hình ngôn ngữ lớn, và giới thiệu các mô hình chính chi phối lĩnh vực ngày nay. Khi kết thúc, bạn sẽ hiểu tại sao năm 2025 trở thành “Năm của Agent” và điều gì phân biệt một agent thực thụ với một lớp wrapper chatbot đơn giản.

Chương 2: Lịch sử phát triển Agent Một chuyến tham quan lịch sử từ các hệ thống dựa trên quy tắc sớm, qua các agent học tăng cường như AlphaGo, đến kỷ nguyên hiện tại của các hệ thống tự chủ được cung cấp bởi LLM. Bối cảnh lịch sử này là điều cần thiết vì nhiều mô hình agent hiện đại là sự tái phát minh các ý tưởng từ hàng thập kỷ trước — hiểu lịch sử giúp bạn tránh lặp lại những sai lầm cũ.

Chương 3: Nền tảng mô hình ngôn ngữ lớn Trước khi bạn có thể xây dựng một agent, bạn cần hiểu động cơ. Chương này bao gồm kiến trúc Transformer, cơ chế attention, các kỹ thuật prompting (zero-shot, few-shot, chain-of-thought) và những hạn chế của các mô hình ngôn ngữ hiện tại mà các hệ thống agent phải khắc phục. Nó cũng khảo sát bối cảnh LLM chủ đạo, từ GPT-4 và Claude đến các lựa chọn thay thế mã nguồn mở.

Phần 2: Xây dựng Agent LLM của bạn

Chương 4: Xây dựng các mô hình agent kinh điển Đây là nơi việc lập trình bắt đầu một cách nghiêm túc. Bạn triển khai ba mô hình agent nền tảng từ đầu:

  • ReAct (Lý luận + Hành động) — Mô hình cung cấp năng lượng cho nhiều agent hiện đại, trong đó mô hình xen kẽ các dấu vết suy nghĩ với các lệnh gọi công cụ trong một vòng lặp liên tục cho đến khi tác vụ hoàn thành.
  • Plan-and-Solve (Lập kế hoạch và Giải quyết) — Một cách tiếp cận hai pha trong đó agent trước tiên tạo ra một kế hoạch từng bước, sau đó thực hiện có hệ thống từng bước.
  • Reflection (Phản chiếu) — Một mô hình tự cải thiện trong đó agent đánh giá đầu ra của chính mình, xác định lỗi và tinh chỉnh phản hồi một cách lặp đi lặp lại.

Mỗi mô hình được triển khai bằng mã Python sạch sẽ sử dụng OpenAI API, vì vậy bạn có thể thấy chính xác vòng lặp hoạt động như thế nào mà không bị che khuất bởi ma thuật của framework.

Chương 5: Xây dựng agent trên nền tảng low-code Không phải mọi agent đều cần mã tùy chỉnh. Chương này dạy bạn cách xây dựng các agent chức năng bằng cách sử dụng ba nền tảng low-code chính:

  • Coze (ByteDance) — Một công cụ xây dựng agent trực quan với hệ sinh thái plugin phong phú
  • Dify — Một nền tảng phát triển ứng dụng LLM mã nguồn mở
  • n8n — Một công cụ tự động hóa quy trình làm việc có thể được mở rộng với khả năng AI

Bạn học khi nào chọn low-code (tạo mẫu nhanh, nhóm phi kỹ thuật) so với các phương pháp dựa trên mã (logic tùy chỉnh, quy mô, tích hợp).

Chương 6: Thực hành phát triển Framework Khi bạn vượt quá khả năng của các nền tảng low-code, bạn cần các framework chuyên nghiệp. Chương này cung cấp kinh nghiệm thực hành với:

  • AutoGen (Microsoft) — Một framework đàm thoại đa agent trong đó các agent có thể trò chuyện với nhau để giải quyết vấn đề
  • AgentScope — Một nền tảng agent linh hoạt với hỗ trợ mạnh mẽ cho các agent không đồng nhất
  • LangGraph (LangChain) — Một thư viện để xây dựng các ứng dụng đa tác nhân có trạng thái với LLM, được mô hình hóa dưới dạng đồ thị

Bạn xây dựng cùng một agent đơn giản trong cả ba framework, cho phép so sánh trực tiếp API, sự trừu tượng hóa và đánh đổi của chúng.

Chương 7: Xây dựng Framework Agent của riêng bạn Phần kết của Phần 2. Chỉ sử dụng OpenAI API và các thư viện Python tiêu chuẩn, bạn xây dựng một framework agent tối thiểu nhưng chức năng đầy đủ từ đầu. Bài tập này làm sáng tỏ mọi sự trừu tượng hóa mà bạn đã gặp trong AutoGen và LangGraph — bạn hiểu tại sao framework tồn tại, chúng giải quyết vấn đề gì, và khi nào bạn có thể hoàn toàn vượt quá chúng.

Phần 3: Mở rộng kiến thức nâng cao

Chương 8: Bộ nhớ & Truy xuất Một LLM không trạng thái không thể duy trì ngữ cảnh trong các cuộc trò chuyện dài hoặc hồi tưởng thông tin từ các phiên trước. Chương này dạy bạn cách xây dựng các hệ thống bộ nhớ:

  • Bộ nhớ ngắn hạn — Quản lý ngữ cảnh cuộc trò chuyện trong giới hạn token
  • Bộ nhớ dài hạn — Lưu trữ liên tục sở thích người dùng, sự kiện và lịch sử cuộc trò chuyện
  • RAG (Truy xuất tăng cường tạo sinh) — Kết nối các agent với cơ sở kiến thức bên ngoài thông qua cơ sở dữ liệu vector và tìm kiếm embedding

Bạn triển khai một pipeline RAG bằng cách sử dụng các mô hình embedding mã nguồn mở và kho vector, cho phép agent của bạn trả lời các câu hỏi dựa trên tài liệu riêng tư.

Chương 9: Kỹ thuật ngữ cảnh Ngữ cảnh là tài nguyên quý giá nhất trong các hệ thống agent — mỗi token dành cho thông tin không liên quan là một token không có sẵn cho việc suy luận. Chương này dạy quản lý ngữ cảnh nâng cao: chiến lược cửa sổ hóa, kỹ thuật tóm tắt, cấu trúc ngữ cảnh phân cấp, và tư duy “kỹ thuật ngữ cảnh” phân biệt các agent nghiệp dư với các agent chuyên nghiệp.

Chương 10: Giao thức truyền thông Agent Khi hệ sinh thái agent trưởng thành, các giao thức tiêu chuẩn đang nổi lên. Chương này cung cấp phân tích kỹ thuật sâu về:

  • MCP (Giao thức ngữ cảnh mô hình) — Tiêu chuẩn mở của Anthropic để kết nối các hệ thống AI với các nguồn dữ liệu và công cụ bên ngoài
  • A2A (Agent-to-Agent) — Giao thức của Google cho khả năng tương tác agent
  • ANP (Giao thức mạng agent) — Giao thức do cộng đồng thúc đẩy cho việc khám phá và truyền thông agent

Bạn triển khai các máy chủ và máy khách MCP cơ bản, cấp cho các agent của bạn khả năng gọi các công cụ bên ngoài theo cách tiêu chuẩn.

Chương 11: Agentic RL Đây là một trong những chương nâng cao nhất trong bất kỳ hướng dẫn agent nào có sẵn ngày nay. Nó dạy bạn cách đào tạo các mô hình ngôn ngữ cho hành vi agent bằng cách sử dụng học tăng cường:

  • SFT (Tinh chỉnh có giám sát) — Điểm khởi đầu cho bất kỳ mô hình tùy chỉnh nào
  • RLHF (Học tăng cường từ phản hồi của con người) — Kỹ thuật đằng sau sự căn chỉnh của ChatGPT
  • GRPO (Tối ưu hóa chính sách tương đối nhóm) — Phương pháp RL hiệu quả được phổ biến bởi DeepSeek

Bạn đi qua toàn bộ pipeline đào tạo, từ chuẩn bị dữ liệu đến đánh giá mô hình, sử dụng các công cụ mã nguồn mở có thể tiếp cận được.

Chương 12: Đánh giá hiệu suất Agent Làm thế nào để bạn biết agent của mình có tốt không? Chương này bao gồm các chỉ số đánh giá (tỷ lệ thành công tác vụ, hiệu quả, an toàn), bộ dữ liệu chuẩn (AgentBench, SWE-bench) và các framework để kiểm tra agent một cách có hệ thống. Bạn học cách xây dựng các pipeline đánh giá phát hiện hồi quy trước khi triển khai.

Phần 4: Nghiên cứu tổng hợp nâng cao

Chương 13: Trợ lý du lịch thông minh Một ứng dụng đa agent thực tế kết hợp gọi công cụ MCP, tìm kiếm web, API bản đồ và lập kế hoạch hành trình. Trợ lý du lịch chứng minh cách nhiều agent chuyên biệt (tìm kiếm chuyến bay, đặt phòng khách sạn, đề xuất hoạt động) có thể hợp tác thông qua một agent điều phối để cung cấp một dịch vụ hoàn chỉnh.

Chương 14: Agent nghiên cứu sâu tự động DeepResearch của OpenAI đã chứng minh rằng các agent có thể tự chủ tiến hành nghiên cứu nhiều bước trên web. Chương này hướng dẫn bạn sao chép khả năng đó: xây dựng một agent có thể tự động định hình các truy vấn tìm kiếm, duyệt kết quả, tổng hợp phát hiện và tạo một báo cáo nghiên cứu có cấu trúc — tất cả mà không cần sự can thiệp của con người.

Chương 15: Xây dựng thị trấn ảo Dự án sáng tạo nhất trong chương trình giảng dạy. Bạn xây dựng một thị trấn được mô phỏng có dân cư là các agent AI, mỗi agent có tính cách, mục tiêu và thói quen hàng ngày riêng. Lấy cảm hứng từ các dự án như Generative Agents của Stanford, nghiên cứu tình huống này dạy động lực xã hội đa agent, hành vi nổi lên và mô phỏng môi trường.

Phần 5: Đồ án tốt nghiệp & Tương lai

Chương 16: Đồ án tốt nghiệp Chương cuối cùng thách thức bạn thiết kế và xây dựng một ứng dụng agent thông minh hoàn chỉnh từ đầu, áp dụng mọi thứ đã học được trong 15 chương trước. Nó bao gồm hướng dẫn lập kế hoạch dự án, framework ra quyết định kiến trúc và các cân nhắc triển khai.


Đóng góp của cộng đồng và nội dung bổ sung

Ngoài 16 chương cốt lõi, Hello-Agents duy trì một hệ thống đóng góp cộng đồng hoạt động thông qua các thư mục Extra-ChapterCo-creation-projects. Nội dung cộng đồng đáng chú ý bao gồm:

  • Tổng hợp câu hỏi phỏng vấn Agent — Một bộ câu hỏi phỏng vấn kỹ thuật được chọn lọc và câu trả lời chi tiết cho các vị trí liên quan đến agent
  • Hướng dẫn tạo agent Dify cho người mới bắt đầu — Hướng dẫn từng bước xây dựng agent đầu tiên của bạn trong Dify
  • So sánh Agent Skills và MCP — Phân tích sâu so sánh hai cách tiếp cận chính cho việc tích hợp công cụ agent
  • Giới thiệu và thực hành GUI Agent — Khám phá các agent có thể tương tác với giao diện người dùng đồ họa
  • Agent Self-Evolution (Tự tiến hóa agent) — Các kỹ thuật nâng cao để xây dựng các agent có thể cải thiện khả năng của chính chúng thông qua học tập vòng kín

Với 71 người đóng góp và hoạt động pull request liên tục, dự án được hưởng lợi từ một cộng đồng sôi động giữ cho nội dung được cập nhật với bối cảnh agent đang phát triển nhanh chóng.


Hướng dẫn cài đặt và thiết lập học tập

Hello-Agents được thiết kế để có thể truy cập thông qua nhiều định dạng:

Đọc trực tuyến

Truy cập trang tài liệu chính thức tại https://datawhalechina.github.io/hello-agents/ để có hướng dẫn dựa trên web đầy đủ. Người dùng tại Trung Quốc có thể sử dụng một mirror được tối ưu hóa.

Thiết lập cục bộ

Clone repository và phục vụ tài liệu cục bộ:

git clone https://github.com/datawhalechina/hello-agents.git
cd hello-agents
# Làm theo hướng dẫn thiết lập môi trường trong Extra-Chapter/07

Tải xuống PDF

Một phiên bản PDF đầy đủ có sẵn miễn phí thông qua GitHub Releases hoặc trang web Datawhale. PDF bao gồm watermark Datawhale để ngăn chặn việc bán lại thương mại, trong khi vẫn hoàn toàn có thể sử dụng cho việc học tập cá nhân.

Môi trường mã

Thư mục /code chứa các triển khai có thể chạy cho mỗi chương. Ngôn ngữ chính là Python (72,5%), với các notebook Jupyter để khám phá tương tác. Môi trường được đề xuất:

  • Python 3.9+
  • Khóa API OpenAI hoặc quyền truy cập GitHub Models
  • Tùy chọn: Ollama để chạy mô hình cục bộ
  • Tùy chọn: Cơ sở dữ liệu vector (Chroma hoặc Weaviate) cho các chương RAG

Ví dụ mã: Xây dựng agent ReAct từ đầu

Để minh họa tính chất thực hành của hướng dẫn, đây là một phiên bản đơn giản hóa của agent ReAct mà bạn xây dựng trong Chương 4:

import openai
import json

# Định nghĩa các công cụ có sẵn
tools = [
    {
        "type": "function",
        "function": {
            "name": "search_web",
            "description": "Tìm kiếm thông tin trên web",
            "parameters": {
                "type": "object",
                "properties": {
                    "query": {"type": "string"}
                },
                "required": ["query"]
            }
        }
    },
    {
        "type": "function",
        "function": {
            "name": "calculate",
            "description": "Thực hiện phép tính toán học",
            "parameters": {
                "type": "object",
                "properties": {
                    "expression": {"type": "string"}
                },
                "required": ["expression"]
            }
        }
    }
]

# Triển khai công cụ đơn giản
def search_web(query):
    return f"Kết quả tìm kiếm: {query}"

def calculate(expression):
    return str(eval(expression))

# Vòng lặp ReAct
messages = [
    {"role": "system", "content": "Bạn là một trợ lý hữu ích. Sử dụng công cụ khi cần thiết."},
    {"role": "user", "content": "Dân số Tokyo chia cho 1000 là bao nhiêu?"}
]

for step in range(5):  # Tối đa 5 bước suy luận
    response = openai.chat.completions.create(
        model="gpt-4",
        messages=messages,
        tools=tools,
        tool_choice="auto"
    )
    
    message = response.choices[0].message
    messages.append(message)
    
    if message.tool_calls:
        for tool_call in message.tool_calls:
            function_name = tool_call.function.name
            arguments = json.loads(tool_call.function.arguments)
            
            if function_name == "search_web":
                result = search_web(**arguments)
            elif function_name == "calculate":
                result = calculate(**arguments)
            
            messages.append({
                "role": "tool",
                "tool_call_id": tool_call.id,
                "content": result
            })
    else:
        print("Câu trả lời cuối cùng:", message.content)
        break

Mô hình này — suy luận về công cụ nào cần gọi, thực hiện nó, quan sát kết quả, và suy luận lại — là vòng lặp cơ bản cung cấp năng lượng cho các agent chuyên nghiệp như Operator của OpenAI và Claude Computer Use của Anthropic.


Các trường hợp sử dụng thực tế và tác động nghề nghiệp

Dành cho kỹ sư AI tương lai

Hello-Agents cung cấp nền tảng có cấu trúc mà các bài đăng tuyển dụng cho vị trí “Kỹ sư Agent AI” hoặc “Nhà phát triển ứng dụng LLM” ngày càng yêu cầu. Các câu hỏi bổ sung cho phỏng vấn được trích trực tiếp từ các quy trình tuyển dụng thực tế tại các công ty AI lớn.

Dành cho đội ngũ sản phẩm

Các nhà quản lý sản phẩm và nhà thiết kế có thể sử dụng các chương low-code (Coze, Dify, n8n) để tạo nguyên mẫu nhanh các tính năng do agent cung cấp mà không cần chờ đợi tài nguyên kỹ thuật. Các chương về framework sau đó cung cấp kiến thức kỹ thuật cần thiết để hợp tác hiệu quả với các đội phát triển.

Dành cho các nhà nghiên cứu và học giả

Chương về Agentic RL (từ SFT đến GRPO) và chương đánh giá cung cấp đủ độ sâu để phục vụ như điểm khởi đầu cho các dự án nghiên cứu. Việc tái tạo DeepResearch đặc biệt có giá trị đối với các nhóm học thuật nghiên cứu truy xuất thông tin tự chủ.

Dành cho các nhà phát triển độc lập và nhà sáng lập

Cấu trúc đồ án tốt nghiệp và thư viện dự án do cộng đồng đóng góp cung cấp cảm hứng và các triển khai tham khảo cho việc phát hành các sản phẩm do agent cung cấp. Chương mô phỏng thị trấn ảo chứng minh cách các agent có thể tạo ra trải nghiệm người dùng hấp dẫn vượt ra ngoài giao diện trò chuyện đơn giản.


So sánh với các lựa chọn thay thế

Khả năngHello-AgentsTài liệu FrameworkBootcamp trả phíVideo hướng dẫn
Chương trình có cấu trúc16 chương tiến bộPhân mảnh, giả định kiến thứcThay đổiKhông có cấu trúc
Độ sâu lý thuyếtTừ Transformer đến RLChỉ framework cụ thểThường nông cạnThường nông cạn
Lập trình thực hànhMỗi chươngChỉ ví dụHạn chế bởi chi phíHiếm khi đầy đủ
Low-code + Code-nativeBao gồm cả haiChỉ codeThường một hoặc haiChất lượng hỗn hợp
Chủ đề nâng cao (RL, giao thức)Đầy đủ chươngHiếm khi đề cậpChỉ bản cao cấpHầu như không bao giờ
Dự án thực tế3 trường hợp tổng hợpThường không có1-2 dự ánHiếm khi cấp sản xuất
Cộng đồng & cập nhật71 người đóng góp, hoạt độngKiểm soát bởi nhà cung cấpKhôngKhông đáng tin cậy
GiáMiễn phí (Apache 2.0)Miễn phí500-5000 USDMiễn phí
Chuẩn bị phỏng vấnQ&A chuyên dụngKhôngĐôi khiHiếm khi

Hello-Agents chiếm một vị trí độc đáo: nó có độ sâu của một khóa học đại học, tính thực tiễn của một bootcamp, cộng đồng của một dự án mã nguồn mở, và giá của một tài liệu miễn phí.


Lợi thế cộng đồng Datawhale

Hello-Agents không phải là một dự án cô lập. Nó được sản xuất bởi Datawhale, một cộng đồng có nền tảng sâu sắc trong giáo dục AI mã nguồn mở tại Trung Quốc. Datawhale đã sản xuất nhiều repository được đánh giá cao và điều hành các nhóm học tập hoạt động, hackathon và chương trình cố vấn.

Sự hỗ trợ của cộng đồng này có nghĩa là:

  • Bảo trì liên tục — Dự án nhận được cập nhật thường xuyên khi bối cảnh agent phát triển
  • Kiểm soát chất lượng — Nội dung được đánh giá bởi các chuyên gia thực hành trước khi merge
  • Hiệu ứng mạng lưới — Người học tham gia một cộng đồng gồm hàng nghìn người, không chỉ đọc tài liệu một cách cô lập
  • Kết nối nghề nghiệp — Các quan hệ đối tác công nghiệp của Datawhale tạo ra các con đường từ học tập đến việc làm

Hạn chế và cân nhắc

Mặc dù Hello-Agents là đặc biệt, người học nên nhận thức được một số hạn chế:

  • Ngôn ngữ chính là tiếng Trung — Nội dung chính bằng tiếng Trung, mặc dù có README tiếng Anh và các bản dịch cộng đồng đang được thực hiện
  • Hệ sinh thái thay đổi nhanh chóng — Một số hướng dẫn nền tảng cụ thể (Coze, Dify) có thể trở nên lỗi thời khi các sản phẩm phát triển; các nguyên tắc cốt lõi vẫn hợp lệ
  • Yêu cầu phần cứng — Chương về Agentic RL được hưởng lợi từ quyền truy cập GPU để đào tạo; thực thi CPU là có thể nhưng chậm
  • Chi phí API — Thực hành tay đòi hỏi quyền truy cập OpenAI API hoặc tương đương; chi phí có thể tích lũy trong quá trình thử nghiệm chuyên sâu

Kết luận và bắt đầu

Hello-Agents là tài nguyên toàn diện nhất, dễ tiếp cận nhất và được cộng đồng hỗ trợ mạnh mẽ nhất để học phát triển agent AI hiện có. Với hơn 45,600 sao GitHub, chương trình giảng dạy 16 chương bao gồm từ nền tảng Transformer đến học tăng cường GRPO, và cộng đồng 71 người đóng góp liên tục mở rộng nội dung, nó đại diện cho một khoản đầu tư giáo dục không thể so sánh được — đặc biệt khi xét đến việc nó hoàn toàn miễn phí.

Nếu bạn là một nhà phát triển muốn vượt qua việc sử dụng ChatGPT và bắt đầu xây dựng các hệ thống có thể tự chủ lập kế hoạch, suy luận và hành động, Hello-Agents cung cấp lộ trình. Nếu bạn là một nhà lãnh đạo sản phẩm cần hiểu agent có thể làm gì và không thể làm gì, các chương nghiên cứu tình huống cung cấp nhận thức thực tế. Nếu bạn là một nhà nghiên cứu mới bước vào lĩnh vực agent, các chương nâng cao về giao thức và RL cung cấp đủ độ sâu để đẩy nhanh công việc của bạn.

Các bước tiếp theo:

  1. Truy cập repository tại github.com/datawhalechina/hello-agents
  2. Đọc tài liệu trực tuyến tại datawhalechina.github.io/hello-agents
  3. Tải xuống phiên bản PDF để học ngoại tuyến
  4. Clone thư mục /code và chạy triển khai ReAct trong Chương 4
  5. Tham gia thảo luận cộng đồng và khám phá các đóng góp Extra-Chapter

Cuộc cách mạng agent không phải là điều sắp đến — nó đã ở đây. Hello-Agents đảm bảo rằng bạn không chỉ là người quan sát. Bạn sẽ là người xây dựng.


Bài viết liên quan