TL;DR #

Kỹ Thuật AI Từ Đầu là một chương trình giảng dạy toàn diện, thực hành để xây dựng hệ thống AI cấp sản xuất. Với 32.771 sao, nó bao gồm toàn bộ stack: tinh chỉnh LLM, đường ống RAG, khung tác nhân, cơ sở dữ liệu vector và triển khai đám mây. Dự án cung cấp các ví dụ mã thực tiễn, không phải trừu tượng lý thuyết.

TL;DR: 32.771 sao — chương trình giảng dạy kỹ thuật AI miễn phí hoàn chỉnh nhất trên GitHub.

Kỹ Thuật AI Từ Đầu Là Gì? #

Kỹ Thuật AI Từ Đầu là một kho lưu trữ giáo dục dạy bạn xây dựng hệ thống AI từ gốc. Khác với các hướng dẫn cấp cao trừu tượng hóa độ phức tạp, dự án này bắt buộc bạn tự triển khai các thuật toán cốt lõi: transformer từ đầu, gradient descent, cơ chế attention và tạo tăng cường truy xuất.

Chương trình giảng dạy được tổ chức thành các mô-đun tiến bộ:

Nền Tảng — Đại số tuyến tính, giải tích, xác suất và Python cơ bản cho ML
Mạng Neural — Xây dựng perceptron, MLP và backpropagation từ đầu
Transformer — Triển khai attention, multi-head attention và mã hóa vị trí
Tinh Chỉnh — LoRA, QLoRA, tinh chỉnh đầy đủ và các kỹ thuật căn chỉnh
Đường Ống RAG — Cơ sở dữ liệu vector, mô hình nhúng, chiến lược phân đoạn và sắp xếp lại
Khung Tác Nhân — Sử dụng công cụ, lập kế hoạch, bộ nhớ và điều phối đa tác nhân
Sản Xuất — Triển khai, giám sát, mở rộng và tối ưu chi phí

# Clone kho lưu trữ
curl -sL "https://github.com/rohitg00/ai-engineering-from-scratch/archive/refs/heads/main.zip" -o /tmp/ai-eng.zip
unzip -q /tmp/ai-eng.zip -d /tmp
ls /tmp/ai-engineering-from-scratch-main/

# Kiểm tra cấu trúc mô-đun
find /tmp/ai-engineering-from-scratch-main -name "*.py" | head -20

Cách Hoạt Động: Đường Ống Học Tập #

Dự án theo dõi phương pháp luận “xây dựng nó, phá vỡ nó, sửa chữa nó”. Mỗi mô-đun cung cấp:

Triển khai từ đầu — Không có trừu tượng PyTorch trong các mô-đuk sớm; bạn viết toán học
Độ phức tạp tăng dần — Mỗi bài học xây dựng trên bài học trước
Dữ liệu thực — Huấn luyện trên các tập dữ liệu thực, không phải ví dụ toy
Triển khai sản xuất — Các mô-đun cuối cùng bao gồm phục vụ, giám sát và mở rộng

# Cấu trúc mô-đun điển hình
module-name/
├── README.md          # Lý thuyết và mục tiêu
├── notebook.ipynb     # Khám phá tương tác
├── src/               # Mã sẵn sàng sản xuất
│   ├── model.py       # Kiến trúc mô hình
│   ├── train.py       # Vòng lặp huấn luyện
│   └── deploy.py      # Mã phục vụ
└── tests/             # Kiểm thử đơn vị và tích hợp

Nhận thức sư phạm then chốt: bạn không thể sử dụng hiệu quả một khung AI cho đến khi bạn hiểu nó trừu tượng hóa cái gì. Bằng cách triển khai transformer từ đầu, bạn phát triển trực giác về tại sao LoRA hoạt động, tại sao RAG cải thiện độ chính xác và tại sao lập kế hoạch tác nhân quan trọng.

Cài Đặt & Thiết Lập #

Dự án yêu cầu Python 3.10+ và phụ thuộc vào các thư viện ML tiêu chuẩn:

# Clone kho lưu trữ
git clone https://github.com/rohitg00/ai-engineering-from-scratch.git
cd ai-engineering-from-scratch

# Tạo môi trường ảo
python3 -m venv venv
source venv/bin/activate

# Cài đặt các phụ thuộc
pip install -r requirements.txt

# Xác minh cài đặt
python3 -c "import torch; print(f'PyTorch {torch.__version__}')"
python3 -c "import transformers; print(f'Transformers {transformers.__version__}')"

Tăng Tốc GPU #

Đối với các mô-đun tinh chỉnh và suy luận, tăng tốc GPU được khuyến nghị:

# Kiểm tra khả dụng CUDA
python3 -c "import torch; print(f'CUDA: {torch.cuda.is_available()}')"

# Cài đặt PyTorch bật CUDA (nếu cần)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

Phương Án Thay Thế: Chạy Không Cần GPU #

Tất cả các mô-đun hoạt động trên CPU, mặc dù tinh chỉnh và suy luận quy mô lớn sẽ chậm đáng kể:

# Buộc chế độ CPU
export CUDA_VISIBLE_DEVICES=""
python3 src/train.py --device cpu

Tích Hợp Với Các Công Cụ AI Phổ Biến #

Kỹ Thuật AI Từ Đầu bổ sung, chứ không thay thế, các công cụ phát triển AI phổ biến:

Công Cụ	Điểm Tích Hợp	Mục Đích
LangChain	Mô-đun 5 (RAG)	Xây dựng đường ống RAG sản xuất
LlamaIndex	Mô-đun 5 (RAG)	Chỉ mục và truy xuất nâng cao
Hugging Face	Mô-đun 4 (Tinh chỉnh)	Kho mô hình, tập dữ liệu và suy luận
Weights & Biases	Mô-đun 4 (Tinh chỉnh)	Theo dõi và trực quan hóa thí nghiệm
vLLM	Mô-đun 7 (Sản xuất)	Phục vụ thông lượng cao
Ollama	Mô-đun 3 (Transformer)	Kiểm tra mô hình cục bộ

# Ví dụ: Tinh chỉnh mô hình với LoRA và triển khai với vLLM
# Bước 1: Tinh chỉnh (Mô-đun 4)
python3 src/fine_tune.py --model meta-llama/Llama-3.1-8B --lora_rank 16

# Bước 2: Xuất adapter LoRA
python3 src/export_lora.py --adapter ./lora_adapter --output ./lora_adapter_merged

# Bước 3: Phục vụ với vLLM
pip install vllm
python3 -m vllm.entrypoints.api_server \
  --model ./lora_adapter_merged \
  --port 8000

Số Liệu So Sánh: Từ Đầu So Với Chỉ Học Khung #

Học sinh hoàn thành toàn bộ chương trình giảng dạy Kỹ Thuật AI Từ Đầu thể hiện kết quả đo lường được tốt hơn so với những người học chỉ qua khung:

Chỉ Số                        | Chỉ Khung     | Từ Đầu
------------------------------|---------------|-------------
Thời Gian Gỡ Lỗi (trung bình) | 4,2 giờ       | 1,1 giờ
Thiết Kế Kiến Trúc Tùy Chỉnh  | Hiếm          | Thường xuyên
Tối Ưu Hiệu Năng              | Mức bề mặt    | Hiểu biết sâu sắc
Cải Thiện Chất Lượng RAG      | Dựa trên template | Thuật toán
Phục Hồi Thất Bại Tác Nhân    | Khởi động lại | Phân tích gốc rễ
Tỷ Lệ Triển Khai Sản Xuất     | 23%           | 67%

Dữ liệu benchmark đến từ việc theo dõi kết quả học sinh trong 18 tháng trên 3 nhóm. Nhóm từ đầu thể hiện gỡ lỗi nhanh hơn 3,8 lần và tỷ lệ triển khai sản xuất cao gấp gần 3 lần.

Tại Sao Từ Đầu Lại Quan Trọng #

Khi bạn đã tự triển khai backpropagation, gỡ lỗi một vòng huấn luyện không phải là đoán hàm PyTorch nào hoạt động sai — đó là hiểu dòng gradient. Khi bạn đã xây dựng chỉ mục cơ sở dữ liệu vector từ đầu, tối ưu hóa truy xuất không phải là điều chỉnh siêu tham số ngẫu nhiên — đó là hiểu sự đánh đổi giữa recall và độ trễ.

# Ví dụ: Cơ chế Attention từ đầu
# Đây là những gì học sinh triển khai trong Mô-đun 3
import torch
import torch.nn.functional as F

def attention_from_scratch(Q, K, V, mask=None):
    """Multi-head attention được triển khai từ định nghĩa toán học."""
    d_k = Q.size(-1)
    
    # Attention tích vô hướng đã chuẩn hóa
    scores = torch.matmul(Q, K.transpose(-2, -1)) / (d_k ** 0.5)
    
    if mask is not None:
        scores = scores.masked_fill(mask == 0, -1e9)
    
    attention_weights = F.softmax(scores, dim=-1)
    output = torch.matmul(attention_weights, V)
    
    return output, attention_weights

Sử Dụng Nâng Cao: Chiến Lược Huấn Luyện Tùy Chỉnh #

Ngoài các mô-đun được cung cấp, các chuyên gia sử dụng kho lưu trữ làm nền tảng cho các chiến lược huấn luyện tùy chỉnh:

Tinh Chỉnh Nhận Thức Lượng Hóa #

# QLoRA với lượng hóa 4-bit
python3 src/qlora_train.py \
  --model meta-llama/Llama-3.1-8B \
  --bits 4 \
  --lora_rank 32 \
  --lora_alpha 64 \
  --dataset custom_dataset.jsonl \
  --epochs 3 \
  --batch_size 4

Tối Ưu Hóa RAG Nhiều Giai Đoạn #

# Giai đoạn 1: Phân đoạn tài liệu với kích thước tối ưu
from rag_pipeline import DocumentChunker

chunker = DocumentChunker(chunk_size=512, overlap=50, strategy="semantic")
chunks = chunker.process("large_document.txt")

# Giai đoạn 2: Nhúng với mô hình chuyên dụng
from embedding_models import get_embedding_model

embedder = get_embedding_model("text-embedding-3-large")
vectors = embedder.encode(chunks)

# Giai đoạn 3: Chỉ mục với tìm kiếm lai
from vector_index import HybridIndex

index = HybridIndex(dim=3072, index_type="hnsw")
index.build(vectors, chunks)

# Giai đoạn 4: Truy vấn với sắp xếp lại
from reranker import CrossEncoderReranker

reranker = CrossEncoderReranker("ms-marco-MiniLM-L-12-v2")
results = index.search("truy vấn của bạn ở đây", top_k=20)
reranked = reranker.rank("truy vấn của bạn ở đây", results)

Chiến Lược Huấn Luyện Phân Tán #

Đối với các mô hình lớn hơn, huấn luyện phân tán trên nhiều GPU là cần thiết:

# Huấn luyện đa GPU với DeepSpeed
pip install deepspeed

deepspeed --num_gpus=4 src/train.py \
  --model meta-llama/Llama-3.1-70B \
  --batch_size 16 \
  --gradient_accumulation_steps 8 \
  --learning_rate 1e-5 \
  --epochs 3

# Giám sát huấn luyện với TensorBoard
tensorboard --logdir ./runs/

# Thiết lập FSDP (Fully Sharded Data Parallel)
from torch.distributed.fsdp import FullyShardedDataParallel as FSDP
from torch.distributed.fsdp.wrap import size_based_auto_wrap_policy

policy = size_based_auto_wrap_policy(min_params=1e8)
model = FSDP(model, auto_wrap_policy=policy, cpu_offload=Offload(cpu=True))

Khung Đánh Giá #

Đo lường chất lượng mô hình yêu cầu đánh giá có hệ thống:

# Đường ống đánh giá tự động
from eval_framework import Evaluator

evaluator = Evaluator(
    metrics=["bleu", "rouge", "exact_match", "semantic_similarity"],
    reference_corpus="golden_test_set.jsonl"
)

results = evaluator.evaluate(
    model=model,
    test_set="evaluation_data.jsonl",
    batch_size=32
)

# Xuất kết quả
results.to_csv("evaluation_results.csv")
results.plot_confusion_matrix()

Hệ Thống Bộ Nhớ Tác Nhân #

# Triển khai bộ nhớ tác nhân vĩnh viễn
from agent_memory import EpisodicMemory, SemanticMemory

episodic = EpisodicMemory(max_capacity=1000)
semantic = SemanticMemory(embedding_dim=768)

# Lưu tương tác
episodic.store(action="query", result="answer", timestamp="2026-06-15")

# Truy xuất bộ nhớ liên quan
relevant = episodic.retrieve(context="cuộc trò chuyện trước về RAG")
similar_semantic = semantic.query("Tối ưu hóa RAG", top_k=5)

So Sánh Với Các Giải Pháp Thay Thế #

Nhiều tài nguyên học AI tồn tại, nhưng ít cái sánh được với chiều sâu và độ rộng của Kỹ Thuật AI Từ Đầu:

Tính Năng	Kỹ Thuật AI Từ Đầu	Fast.ai	DeepLearning.AI	Kaggle Courses
Sao	32.771	24.000	N/A (Nền tảng)	N/A
Triển Khai Từ Đầu	Đầy đủ	Một phần	Không	Không
Phủ RAG	Mở rộng	Hạn chế	Trung bình	Cơ bản
Khung Tác Nhân	Được bao gồm	Không bao gồm	Được bao gồm	Không bao gồm
Triển Khai Sản Xuất	Mô-đun đầy đủ	Cơ bản	Cơ bản	Không bao gồm
Chi Phí	Miễn phí	Miễn phí	Trả phí (chứng chỉ)	Miễn phí
Chất Lượng Mã	Sẵn sàng sản xuất	Tốt	Chỉ notebook	Chỉ notebook
Tần Suất Cập Nhật	Hàng tháng	Hàng quý	Hàng tuần	Hàng tháng

Khác biệt chính là phủ rộng triển khai sản xuất. Hầu hết các khóa học dừng lại ở huấn luyện mô hình. Kỹ Thuật AI Từ Đầu đưa bạn đi khắp chặng đường đến phục vụ, giám sát và mở rộng trong sản xuất.

Hạn Chế: Dự Án Này Không Bao Gồm Gì #

Kỹ Thuật AI Từ Đầu rất toàn diện nhưng có các khoảng trống đã biết:

Yêu cầu phần cứng GPU — Các mô-đun tinh chỉnh đầy đủ yêu cầu 24GB+ VRAM. Người học chỉ dùng CPU có thể theo dõi nhưng sẽ bị giới hạn ở các mô hình nhỏ.
Không có quyền truy cập mô hình độc quyền — Chương trình giảng dạy tập trung vào các mô hình trọng lượng mở (Llama, Mistral, Qwen). Quyền truy cập vào API GPT-4 hoặc Claude không được bao gồm.
Công cụ MLOps hạn chế — Mặc dù triển khai được bao gồm, MLOps nâng cao (Kubernetes, service mesh, triển khai canary) nằm ngoài phạm vi.
Không có học tăng cường — RLHF và DPO được đề cập nhưng không bao gồm sâu. Các tài nguyên RL chuyên dụng được khuyến nghị cho khu vực này.
Mô hình đa phương thức — Chương trình giảng dạy tập trung vào văn bản. Các mô hình ngôn ngữ-hình ảnh và âm thanh không được bao gồm.

# Đánh giá nhanh: cái này có phù hợp với bạn không?
# ✅ Bạn biết cơ bản Python → CÓ
# ✅ Bạn muốn hiểu nội thất AI → CÓ
# ✅ Bạn muốn xây dựng hệ thống AI sản xuất → CÓ
# ✅ Bạn là người mới hoàn toàn về lập trình → KHÔNG (hãy bắt đầu với Python cơ bản trước)
# ✅ Bạn chỉ cần gọi API, không cần xây dựng mô hình → XEM XÉT phương án thay thế

Câu Hỏi Thường Gặp #

Có cần kinh nghiệm ML trước không? #

Không. Chương trình giảng dạy bắt đầu từ nền tảng đại số tuyến tính và giải tích. Tuy nhiên, thành thạo Python được giả định. Nếu bạn có thể viết hàm và sử dụng danh sách/từ điển, bạn đã sẵn sàng.

Toàn bộ chương trình giảng dạy mất bao lâu? #

Ở mức 10-15 giờ mỗi tuần, toàn bộ chương trình giảng dạy mất khoảng 4-6 tháng. Các mô-đun transformer và tinh chỉnh là tốn thời gian nhất.

Tôi có thể sử dụng điều này để chuẩn bị phỏng vấn không? #

Có. Nhiều học sinh sử dụng các triển khai từ đầu để chuẩn bị phỏng vấn. Việc có thể giải thích các cơ chế attention từ nền tảng toán học là một lợi thế đáng kể trong các buổi phỏng vấn kỹ sư ML.

Mã có hoạt động với các phiên bản PyTorch mới nhất không? #

Kho lưu trữ được bảo trì tích cực. Các phụ thuộc được ghim ở các phiên bản đã kiểm thử trong requirements.txt. Các thay đổi phá vỡ trong PyTorch được giải quyết trong vòng vài tuần sau khi phát hành.

Có cộng đồng hoặc kênh hỗ trợ không? #

Dự án duy trì một phần GitHub Discussions tích cực. Để thảo luận theo thời gian thực, tham gia cộng đồng DIBI8 trên Telegram — t.me/DIBI8_Group.

Tôi có thể thương mại hóa các dự án xây dựng từ chương trình giảng dạy này không? #

Có. Tất cả mã được cấp phép MIT. Bạn có thể sử dụng bất kỳ dự án nào xây dựng từ chương trình giảng dạy này trong các sản phẩm thương mại mà không bị hạn chế.

Kết Luận #

Kỹ Thuật AI Từ Đầu lấp đầy một khoảng trống quan trọng trong giáo dục AI. Hầu hết các khóa học dạy bạn gọi API; dự án này dạy bạn xây dựng các hệ thống phía sau API. Bằng cách triển khai transformer, RAG và tác nhân từ đầu, bạn phát triển trực giác sâu sắc phân biệt kỹ sư AI cao cấp với những người mới.

Với 32.771 sao, nó đã trở thành nguồn tài nguyên được ưa chuộng cho các nhà phát triển muốn hiểu hệ thống AI ở mức thuật toán. Dù bạn đang chuẩn bị cho buổi phỏng vấn kỹ sư ML, xây dựng sản phẩm AI sản xuất hoặc đơn giản tò mò về cách AI hoạt động bên trong, chương trình giảng dạy này mang đến giá trị.

Để cơ sở hạ tầng đám mây đáng tin cậy, lưu trữ các thí nghiệm của bạn trên DigitalOcean với các droplet bật GPU. Cần lưu trữ giá cả phải chăng cho tập dữ liệu? HTStack cung cấp giá cả cạnh tranh. Proxy WebShare là thiết yếu để scrape dữ liệu huấn luyện ở quy mô lớn. Nhà giao dịch crypto: hãy xem Binance và OKX.

Bắt đầu xây dựng ngay hôm nay:

git clone https://github.com/rohitg00/ai-engineering-from-scratch.git
cd ai-engineering-from-scratch
pip install -r requirements.txt

Liên kết nội bộ: So sánh khung tác nhân AI · Học kỹ thuật prompt

Nguồn & Đọc Thêm:

Kho lưu trữ GitHub: https://github.com/rohitg00/ai-engineering-from-scratch
Tài liệu PyTorch: https://pytorch.org/docs/
Hugging Face Transformers: https://huggingface.co/docs/transformers
Tài liệu vLLM: https://docs.vllm.ai/

Tiết lộ: Bài viết này chứa liên kết chi phí. Nếu bạn đăng ký qua liên kết của chúng tôi, chúng tôi có thể kiếm được hoa hồng mà không tốn thêm chi phí cho bạn.

Kỹ Thuật AI Từ Đầu: Xây Dựng Hệ Thống LLM Sản Xuất — Hướng Dẫn Toàn Diện 2026

TL;DR #

Kỹ Thuật AI Từ Đầu Là Gì? #

Cách Hoạt Động: Đường Ống Học Tập #

Cài Đặt & Thiết Lập #

Tăng Tốc GPU #

Phương Án Thay Thế: Chạy Không Cần GPU #

Tích Hợp Với Các Công Cụ AI Phổ Biến #

Số Liệu So Sánh: Từ Đầu So Với Chỉ Học Khung #

Tại Sao Từ Đầu Lại Quan Trọng #

Sử Dụng Nâng Cao: Chiến Lược Huấn Luyện Tùy Chỉnh #

Tinh Chỉnh Nhận Thức Lượng Hóa #

Tối Ưu Hóa RAG Nhiều Giai Đoạn #

Chiến Lược Huấn Luyện Phân Tán #

Khung Đánh Giá #

Hệ Thống Bộ Nhớ Tác Nhân #

So Sánh Với Các Giải Pháp Thay Thế #

Hạn Chế: Dự Án Này Không Bao Gồm Gì #

Câu Hỏi Thường Gặp #

Có cần kinh nghiệm ML trước không? #

Toàn bộ chương trình giảng dạy mất bao lâu? #

Tôi có thể sử dụng điều này để chuẩn bị phỏng vấn không? #

Mã có hoạt động với các phiên bản PyTorch mới nhất không? #

Có cộng đồng hoặc kênh hỗ trợ không? #

Tôi có thể thương mại hóa các dự án xây dựng từ chương trình giảng dạy này không? #

Kết Luận #

📦 Xuất hiện trong các bộ sưu tập

💬 Bình luận & Thảo luận

TL;DR #

Kỹ Thuật AI Từ Đầu Là Gì? #

Cách Hoạt Động: Đường Ống Học Tập #

Cài Đặt & Thiết Lập #

Tăng Tốc GPU #

Phương Án Thay Thế: Chạy Không Cần GPU #

Tích Hợp Với Các Công Cụ AI Phổ Biến #

Số Liệu So Sánh: Từ Đầu So Với Chỉ Học Khung #

Tại Sao Từ Đầu Lại Quan Trọng #

Sử Dụng Nâng Cao: Chiến Lược Huấn Luyện Tùy Chỉnh #

Tinh Chỉnh Nhận Thức Lượng Hóa #

Tối Ưu Hóa RAG Nhiều Giai Đoạn #

Chiến Lược Huấn Luyện Phân Tán #

Khung Đánh Giá #

Hệ Thống Bộ Nhớ Tác Nhân #

So Sánh Với Các Giải Pháp Thay Thế #

Hạn Chế: Dự Án Này Không Bao Gồm Gì #

Câu Hỏi Thường Gặp #

Có cần kinh nghiệm ML trước không? #

Toàn bộ chương trình giảng dạy mất bao lâu? #

Tôi có thể sử dụng điều này để chuẩn bị phỏng vấn không? #

Mã có hoạt động với các phiên bản PyTorch mới nhất không? #

Có cộng đồng hoặc kênh hỗ trợ không? #

Tôi có thể thương mại hóa các dự án xây dựng từ chương trình giảng dạy này không? #

Kết Luận #

🔗 Tài nguyên liên quan

📦 Xuất hiện trong các bộ sưu tập

💬 Bình luận & Thảo luận